Mikor győzi le az embert a program góban?

2005.01.08. 15:56
A backgammon és a sakk után vajon a szintén versenysport go csúcsprogramja is legyőzi a nagymestereket? Aligha, de legalábbis nem mostanában. A jelenlegi programok még a gyenge amatőrökkel se bírnak. Sokkal komplexebb játék, más mechanizmusok érvényesülnek benne.

Vallás, tudomány, művészet

Eredetét illetően megoszlanak, ellentmondásosak a vélemények. Az elfogadott álláspont szerint valamikor a Krisztus előtti második évezred és ötödik század között, Kínában kezdték el játszani. Az egyik legenda alapján két hajótörött találta ki, egy másik legenda pedig arról számol be, hogy az uralkodó fiának logikai képességeit pallérozandó, Csan császár valamelyik udvari tudósa ötölte ki. A legvalószínűbb azonban, hogy jóseszközként használták. Körülbelül ezerháromszáz éve került át Japánba.

Go Több egyszerű logikai játéknál: a távol-keleti vallások, politika és az üzleti élet szerves része. Művészek, tudósok, katonák egyaránt előszeretettel űzték, szamurájok között gyakran élet-halál volt a tét. Sors- és életfilozófia, táblaképei szemet gyönyörködtetnek. Japánban gónak, Kínában vei-csinek, Koreában baduknak hívják.

Játékszabályai hiába egyszerűek, s tanulhatók meg tíz perc alatt, végtelenek a benne rejlő lehetőségek.

A négyzethálós játéktábla mérete általában 19x19 hosszanti és keresztirányú vonal. A fekete és fehér lencse alakú figurákat (köveket) a vonalak metszéspontjaira helyezik el. Üres táblán indul a játék. A két játékos felváltva rakja le a köveket. Az nyer, aki több metszéspontot - területet - birtokol. A letett kövek nem mozdíthatók el, ellenfelünkét viszont leüthetjük.

A legtöbb távol-keleti sporthoz hasonlóan, a go művelőit is két fokozatba minősítik: dan (mester) és kju (tanuló). (Harminc és egy kju közötti az amatőr, egy és kilenc dan közötti a profi szint.)

Valószínűség a bizonytalanságban

"A számítógépes go a mesterségesintelligencia-kutatás egyik nagy kihívása" - nyilatkozta a mesterszintű Thore Graepel, a Microsoft Gépi Tanulás és Érzékelés csoportjának (Cambridge) kutatója. "Az ötvenes évek óta a sakk töltött be hasonló szerepet, de miután az IBM Deep Blue-ja legyőzte Kaszparovot, sokakat nem érdekel már."

Graepel és két Cambridge-ben dolgozó munkatársa - David MacKay és David Stern - "intelligens" goprogramon dolgoznak. Más, mint a sakk: utóbbinál definiálni kell egy függvényt, ami megmondja, mennyire jó az adott állás az egyik játékos számára. Utána pontosítani kell a következő lépés és ellenlépés adta lehetőségeket. A számítógép a lehetséges állásokat kiértékelve dönt az ideális lépésről.

Ugyanez nem működik a góban - lépésenként két-háromszáz lehetőség közül kell választanunk. A játék annyira komplex, hogy például a Deep Blue-nak nem kevesebb, mint másfél évig kellene "gondolkodnia" egyetlen lépésen. Nem elegendő a számítási kapacitás a játékfa kiértékeléséhez, mert túl sok a bizonytalansági tényező.

Graepelék a nem-determinisztikus rendszerekben, például az időjárás-előrejelzésnél, vagy szerencsejátékoknál alkalmazott valószínűség-elmélettel kezelnék a bizonytalanságot. Csakhogy a go teljesen determinisztikus.

Huszonkétezer játszma és a végeredmény

"A játék kimenete a fekete és a fehér területek közti különbségtől függ" - magyarázza a kutató. "Ha a játszma adott pillanatában ezt fel tudnánk becsülni, megoldanánk az állások kiértékelésének problémáját, aztán a sakkhoz hasonló technikákat használhatnánk. Mivel nem tudjuk pontosan meghatározni, mely pontok lesznek feketék vagy fehérek, ezért a valószínűségüket igyekszünk felmérni."

Egy adott konfiguráció valószínűségét modellezték, majd a huszonkétezer felvett - hivatásososok által megvívott - játszmát tartalmazó, a computeres go számára tökéletes adatbázishoz nyúltak. Például, ha egy játszma közepébe csöppenünk, az adott állást összevethetjük az ismert végeredménnyel. A tábla összes pontjáról tudjuk, mivé lettek. Ezeket az adatok a tanulás során hasznosítjuk (training data).

#alt#

"A nyitóállást az ismert végkimenettel párosítjuk, és megtanuljuk a modell paramétereit" - folytatja Graepel. "Modellünkbe tápláljuk a tanulási adatokat, és megnézzük, milyen előrejelzést készít minden egyes pontra. Ezt összehasonlítjuk a végeredménnyel, majd úgy adjuk hozzá a paramétereket, hogy a modell előrejelzése közelebb kerüljön a tényleges kimenetelhez." A huszonkétezer játszma ezzel az eljárással integrálható a rendszerbe. Az így létrejött modell új, korábban ismeretlen helyzetekre is alkalmazható, és képes meghatározni az összes pont valószínű színét a játszma végén. A valószínűségeket összegezve tudjuk meg, ki - a fekete, vagy a fehér - lesz a győztes. A várt végeredményt egy kiértékelő függvény építőelemeként hasznosíthatjuk a későbbiekben.

Graepel és társai ugyan még nem írták meg a kutatásaikon alapuló - működő - programot, de úgy vélik, megközelítésük hozzájárulhat ahhoz, hogy a majdani gépi rendszer esélyesként lépjen fel az emberrel (és ne csak az abszolút kezdőkkel) szemben.

Munkájukat finomítják, újabb, a go valamennyi aspektusára kiterjedő modulokon, illetve a bizonytalanság más területeken, például a számítógépes látásban történő alkalmazásain gondolkoznak.



  • Hírek
  • Hírek