Tekla
11 °C
18 °C
Index - In English In English Eng

Újabb mérföldkő: pókerben is legyőzte az embert a gép

2017.01.31. 15:55

A Libratus nevű mesterséges intelligencia húsz napnyi játék után legyőzött négy top hús-vér pókerjátékost egy Pittsburgh-i kaszinóban – írja a Wired.

Libratust a Carnegie Mellon Egyetem két kutatója, Tuomas Sandholm és tanítványa, Noam Brown tervezte. Ugyanők két éve már kihívtak az akkori MI-jükkel emberi játékosokat, de akkor még a gép maradt alul. Most nagyon nem: a 120 ezer leosztás alatt Libratus több mint 1,7 millió dollárral múlta felül az ellenfeleket.

Tanul a hibáidból, hogy jól elverjen

A Libratus latin szó, azt jelenti, egyensúly, ami a megvert emberi ellenfelek – Daniel McAulay, Dong Kim, Jason Les és Jimmy Chou – szerint találó név, mert az MI mindenből bedobott egy kicsit, tudta, mikor érdemes blöffölni, vagy éppen jó kártyákkal alacsony tétet tenni. és így tovább. Ha pedig kezdték úgy érezni, hogy rést találnak a játékán, másnap ehhez alkalmazkodott, tanulva az ellenfelek játékából.

A fejlesztők eddig nem sok mindent árultak el az új MI működéséről, de a győzelem után részleteket is megosztottak – írja a New Scientist. Eszerint a programjuk három fő részből áll:

  • Az első, amely lényegében nem változott a két évvel ezelőttihez képest, a játék elején kiszámolt egy hosszú listára való lehetséges stratégiát, amelyeket a gép bevethetett.
  • A második részt viszont teljesen újraírták, ez volt hivatott minden leosztás után finomítani a stratégián az ellenfelek hibáit számításba véve, hogy megjósolja az egyes leosztások eredményét.
  • A harmadik rész a gép saját hibáit igyekezett kiküszöbölni a jövőbeli stratégiában, hogy az ellenfelek ne tudják újra kihasználni.

Kis lépés a gépnek, nagy lépés a gépeknek

Hol van már az az idő, amikor sakkjátszmákban és műveltségi vetélkedőkön tudtak csak nyerni a gépek! Bár a maga idejében minden ilyen mérföldkő hasonló szenzációnak számított, és mindegyik után voltak, akik az emberiség végét jövendölték, mindig volt egy következő, még fontosabb lépcső. A legutóbbi ilyen az volt, amikor éppen egy évvel ezelőtt a Google szárnyai alatt fejlesztett Alphago a világon először elvert egy profi emberi játékost a gó nevű táblajátékban

Minden ilyen győzelem egyre nagyobb fegyvertény az MI-kutatásban. A góban például sokkal több variáció van, mint a sakkban, ezért jóval intuitívabb játék, és így a matekben erős gépeknek nagyobb kihívást jelentett. A póker pedig azért van megint egy lépcsőfokkal feljebb, mert extrém sok benne a tökéletlen információ: nem tudni, az ellenfélnek milyen kártyái vannak, így soha nem lehetnek teljesen képben, a többiek játékát is figyelni kell, és folyamatosan alkalmazkodni hozzá.

Pláne, hogy a No Limit Texas Hold'Em nevű variációt játszották a résztvevők, amely a pókeren belül is különösen komplexnek számít. A játékosok nem feltétlenül akarnak minden kis jutalommal kecsegtető leosztást megnyerni, hanem az össznyereményre koncentrálnak, ezért olyan stratégia szerint kell játszaniuk, amely több tucat leosztáson átívelve hoz sikert. Ez nagyfokú intuíciót követel meg.

Ez egy igazán fontos mérföldkő az MI-nek. Ez olyan, mint a valóság. A való világ a tökéletlen információk játéka, ezért a póker megoldásával egy lépéssel közelebb kerültünk az általános mesterséges intelligenciához

mondta a New Scientistnek Georgios Yannakakis a Máltai Egyetemről.

Azt azért gyorsan tegyük hozzá, hogy még ezzel az újabb lépéssel is igen messze vagyunk attól, hogy ezt el is érjük.