Donát
1 °C
14 °C
Index - In English In English Eng

40 nap alatt szedett fel 3000 évnyi tudást a Google mesterséges intelligenciája

2017.10.18. 21:49

Tavaly márciusban a mesterségesintelligencia-fejlesztés igazi mérföldköveként ünnepelte a világ, amikor a Google MI-je, az AlphaGo legyőzte go játék emberi világbajnokát, a dél-koreai Lee Sedolt. A go az MI-fejlesztés szempontjából sokkal keményebb dió, mint a sakk, jóval nagyobb benne a variációk száma, és különösen fontos benne az intuíció és a kreativitás. Ezt jóval nehezebb leprogramozni, mint mondjuk a történelem összes sakkjátszmájából egy adatbázist gyártani, hogy az alapján válassza ki a gép a lépését.

A Google - pontosabban az MI-fejlesztéssel foglalkozó startup, a Deepmind, amit a Google 2014-ben félmilliárd dollárért vásárolt fel - most előállt a go-program új verziójával, a sokkal kifinomultabb AlphaGo Zeróval. A legfontosabb különbség az elődhöz képest, hogy míg annak feltöltötték az adatbázisát 100 ezer go-játszmával, hogy azok alapján kezdjen saját stratégiák kialakításába, a Zero, ahogy a neve is mutatja, a nulláról indult. Egyszerűen csak a játék szabályait adták meg neki, és az MI saját maga ellen játszva építette fel magának a tudásbázisát. Sok millió parti kellett neki, mire a véletlenszerű lépésektől eljusson oda, hogy a saját régi verziója ellen kiálljon. Mivel a számítási kapacitása elég brutális, ezt a sok millió játszmát pár nap alatt le is nyomta magában.

A tanulási folyamat harmadik napja után a Zero már olyan szinten túlnőtte az elődjét, hogy száz meccsből százszor megverte azt a szoftvert, ami korábban a legjobb emberi játékos legyőzésével lett híres. Persze az alap AlphaGo fejlesztése nem állt le Lee Sedol legyőzése után, a jelenlegi, másfél év plusz fejlesztéssel és tanulással felturbózott verzió még most is legyőzi néha a Zerót. Átlagosan tíz meccsből egyszer.

A Zerot 40 napnyi tanulás után a szakértők a történelem legjobb go-játékosának tartják, ami alig több mint egy hónap alatt több tudást szívott magába, mint amennyit 3000 év alatt halmoztak fel a játék mesterei.

Mivel nem használtunk alapként semmilyen emberi adatot, az AlphaGo Zerot nem korlátozza az emberi tudás

- mondta a Deepmind egyik programozója. Az MI érdekes módon először olyan játékvariációkat és stratégiákat talált ki teljesen magától, amelyeket az emberi játékosok is alkalmaznak, és csak ezután kezdett sosem látott manőverekkel előállni.

A Zero nemcsak erősebb játékos az elődjénél, de kisebb is a hardverigénye: a rendszer, amin fut, mindössze két speciális MI-processzort tartalmaz, ellenben az előddel, ami egy 48-processzoros gépet igényelt.

Persze a mesterséges intelligencia fejlesztésének nem az a központi célja, hogy egyre összetettebb logikai játékokban verje meg az emberi bajnokot. A Zero most kezdte el tanulmányozni a komplex fehérjék szerkezetét, és a kutatók azt remélik, hogy olyan felfedezéseket tesz majd, amelyek az Alzheimer- vagy a Parkinson-kór gyógyításához vezethetnek.