Pac-Mannel kutatják az intelligenciát az ELTE-n
További Tudomány cikkek
A Pac-Man az egyik legsikeresebb videojáték, 1980-as megjelenése óta rengeteg folytatás és klón készült belőle, a legtöbb konzolon és kézikonzolon újra kiadták, netes mutációja is ismert. A játék kiadója szerint a programmal több mint tízmilliárdszor játszottak a 20. században. Japánban új százjenes érméket kellett verni, mert a Pac-Man (és egy hasonlóan népszerű játék, a Space Invaders) a játéktermi gépekbe szippantotta a meglevő érméket – a legenda szerint egy időben a japán játékbarlangokban százötven jenért adták a százjeneseket.
Ehhez a játékipari klasszikushoz (illetve egész pontosan a folytatásához, az első résztől alig különböző Ms Pac-Manhez) készített olyan algoritmust az ELTE-n az NIPG két kutatója, Lőrincz András és Szita István, ami legalább olyan jól játszik a programmal, mint egy átlagos ember. Az algoritmusról a Journal of Artificial Intelligence Research című szaklapban közöltek publikációt, de a New Scientist is írt a magyarok eredményéről.
Egészen emberi
Valószínűtlen, hogy az Index olvasója ne látott volna a Pac-Mant, de régen volt, amikor még Atarin szórakoztunk a játékkal, ezért elevenítsük fel röviden. A címszereplő főhős egy sárga körcikk, aminek pontokat kell ennie egy egyszerű labirintusban, miközben szellemek üldözik. A pálya négy sarkában található egy-egy olyan pont, amitől Pac-Man rövid ideig sérthetetlen lesz – ekkor a szellemek menekülnek előle, mert a félelmetes síkidom ilyenkor őket is meg tudja enni. A cél az összes pont feltakarítása, amihez az ügyességen kívül némi taktikai érzék is szükséges. A játékban 255 pálya található, de Pac-Mannek csak három élet áll rendelkezésére.
Az algoritmus megalkotásakor Lőrincz és Szita lehetséges helyzeteket és akciókat definiált. Ilyen helyzet például a "szellem van a közelben" vagy a "szellemölő pont van a közelben", akció pedig a "menekülj" vagy a "öld meg a közeli szellemet". Az algoritmus sokféle viselkedéskombinációt kipróbál, amiknek a legtöbbje meglehetősen bugyuta: "ha szellemet látsz a közelben, akkor kezdj el pontokat gyűjteni", vagy "ha közel van egy ehető szellem, akkor menj a legközelebbi kereszteződés felé". Ha valamelyik szabálykombináció véletlenül kicsit sikeresebb a többinél, akkor azt gyakrabban fogja alkalmazni. Néhány százezer játszma – körülbelül egyórányi tanulás – után összeáll egy egyszerű, de ügyes stratégia.
Az algoritmus önállóan megtanulja, hogy Pac-Man számára mindig a saját épsége (tehát a szellemek elkerülése) a legfontosabb szempont, második helyen áll az éppen megehető szellemek üldözése. Ezen túl, ha több irányba is lehet mozogni, a körcikk nem fordul vissza addig, amíg egy adott irányban meg nem ette az összes pontot. A tesztek során a magyar kutatók algoritmusa picit jobban teljesített, mint az átlagos emberek (persze a legjobb Pac-Man-játékosokat nem tudná felülmúlni: akad olyan, aki az összes pályát végigjátszotta egyetlen élet elvesztése nélkül).
Tanulni, tanulni, tanulni
Az algoritmus vizsgálata azonban csak kis része egy nagyobb kutatásnak. A projektben az NIPG a Segítő Kommunikáció Módszertani Központtal működik együtt, céljuk intelligens környezet kialakítása fogyatékkal élő gyerekek számára. Ennek részeként azt próbálják elérni, hogy a környezetet vezérlő számítógép a gyerekek mosolyát, szemmozgását és hasonló jelzéseket felismerve segíthessen a gyermekeknek. A probléma egyik kulcsmozzanata a megerősítéses tanulás, a célorientált tanulási algoritmusokat pedig olyan feladatokon próbálják ki a kutatók, mint például a Pac-Man.
"Ebből a szempontból érdekesek a számítógépes játékok, mert valamit mondanak a természetes intelligenciáról, aminek még ma sincs elfogadott, pontos definíciója" – fogalmaz Lőrincz. Egy viszonylag egyszerű játéknál a hiányosságok is szembetűnőbbek: a gépi algoritmus magától nem fejleszt ki olyan taktikákat, mint az emberek. A Pac-Man esetében például arra ugyan rájött, hogy akkor érdemes megenni a szellemölő pontot, ha közel van egy szellem, de arra nem, hogy több szellemet is érdemes odacsalogatnia.
Nem ez az első játék, amit a kutatók vizsgálnak: tavaly a Tetrishez készítettek olyan algoritmust, ami minden korábbinál okosabban tetrisezik. Egy Finnországban rendezett nemzetközi szakkonferencia szervezői külön versenyfelhívást írtak ki: keresik azt az algoritmust, ami meg tudná verni a magyarok munkáját. "Egy ilyen probléma megoldásánál két dolgot teszünk egyszerre: egyrészt mérnöki módon megtervezzük, milyen jellemzőket, feltételeket ismer a gép a környezetről, másrészt fejlesztünk egy tanulóalgoritmust, ami megpróbál a megadott környezetben egyre jobb eredményt elérni" – mondja Lőrincz. "Meg vagyok győződve arról, hogy az egész algoritmus annál jobb, minél kevesebb a készen kapott jellemző, és minél többet tud tanulni a program."
A módszer bonyolultabb játékokban is működik: a kutatók ígéretes eredményeket értek el számítógépes szerepjátékokban, és Szita tervei között szerepel az is, hogy valósidejű stratégiai játékra és táblás társasjátékra (olyanokra, mint például a Catan telepesei) tanítsa a számítógépet.
Gépi asszociációk
Az említett projektben a játékok addig érdekesek, amíg a tesztelt eszközöket, algoritmusokat nem tudják integrálni a környezet intelligenciájába, ezen túl a kutatás igen messzire vezet. "Távoli, meseszerű célunk, hogy a számítógép úgy kommunikáljon a felhasználóval, hogy felismeri annak emócióit, szinte kitalálja a gondolatait" – magyarázza a kutató. Ennek első lépéseként most olyan eszközt fejlesztenek, aminek segítségével a fogyatékkal élők fej- vagy szemmozgással irányíthatják a számítógép kurzorát. "Ebben az esetben a fejmozgás és a szemmozgás követésének kalibrálása, valamint a tekintet irányának becslése olyan feladat, ami kapcsolódhat a játékokhoz, elképzelhető, hogy a jövőben valamilyen repülés-szimulátor játékot is bevonunk ebbe" – fogalmaz Lőrincz.
Az NIPG egyébként nagyobb európai projektekben is részt vesz, amelyekben a képfeldolgozás szakértőivel, pszichológusokkal, emóciókutatókkal és neurobiológusokkal is együtt dolgoznak. A Drezdai Műszaki Egyetem vezetésével azt kutatják, hogy ha festményt nézünk, mi vonzza először a tekintetünket, hova nézünk másodszor, milyen érzések jönnek létre bennünk, milyen kontextusát vizsgáljuk a művészeti alkotásnak.. Az eredményt több területen is szeretnék hasznosítani, például szakértők tudását kívánják értékelni röntgenképek vizsgálata során. Az intézet egy másik projektben egy hollandiai egyetem partnere: ebben egyaránt kutatják az evolúciós tanulás, az egyéni tanulás, és a társas tanulás folyamatát.
Az NIPG harmadik nagy vállalkozását pedig az amerikai légierő informatikai igazgatósága finanszírozza: a kutatásban az vizsgálják, hogyan kerülhetne összhangba gép és felhasználó. "Megpróbáljuk elérni, hogy a gépnek hasonló asszociációs képzetei legyenek, mint az embernek" – mondja a kutató. "Ha a program fel tudja mérni a felhasználó érdeklődési irányát és asszociációit például az internetes böngészés során, akkor a rendelkezésre álló hatalmas adatbázisból gépi asszociációs eszközökkel információt gyűjthet és munkájában segítheti a felhasználót. Különösen fontos lehet ez fogyatékkal élő gyermekeknél, akiknek még sok tanulnivalójuk lenne, de nehezen jutnak információhoz."