Elavul vagy szintet lép az emberi agy a mesterséges intelligenciával?

GettyImages-1518943738
2024.03.11. 08:08
Mik a tanulságai annak, ahogy az általunk alkotott gépek legyőznek minket a szellemi sportokban? Milyen jövőt vetít ez elénk, és mi az, ami már most látható ebből a jövőből? Szakértőket kérdeztünk.

A gepárd gyorsabban fut az embernél, az elefánt pedig fákat tép ki a földből, az emberiség mégsem tekinti őket fenyegető konkurenciának, mert az embert nem fizikai, hanem szellemi ereje emeli az állatvilág fölé. Ebből következően sokkal inkább aggódunk amiatt, hogy mi lesz, ha valaki vagy valami szellemi értelemben is leelőzi az embert.

A mesterséges intelligencia kutatása régen kezdődött. Majdnem harminc éve, hogy a Deep Blue legyőzte a sakkvilágbajnok Garri Kaszparovot. Az IBM gépe csak sakkozni tudott, így sokkal inkább gepárd volt. A nyelvi modellek és képgenerátorok 2023-ban induló forradalmával sokoldalú entitás jelent meg, ami egyfajta startpisztoly volt az általános mesterséges intelligencia megjelenéséhez.

A Google berkein belül létrehozott AlphaGo, amely a népszerű go játékban 2015 októberében először győzött le egy profi játékost, Fan Huit, 2016 márciusában legyőzte Lee Sedol 9 danos világbajnokot. Gepárd ide vagy oda, a mesterséges intelligencia érkezésében kitüntetett mozzanat, amikor az embert legyőzik az általa kitalált szellemi sportban.

„Ezek a szellemi sportok, és így a go és sakk is, nagyon jó lehetőséget biztosítanak arra, hogy az ember önmagával versenyezhessen, hiszen bármilyen algoritmust is hozunk létre, azt mi, emberek hozzuk létre. Amikor ez sikerül, akkor nem a gépeket értjük meg jobban, hanem az adott probléma új – eddig nem ismert – mélységeit. Azt hiszem, hogy az eredeti Nature-ben megjelent tudományos publikációban írják a szerzők, hogy az AlphaGo tanítása során, amikor bizonyos időnként játszottak a modell ellen, a stílusában látható volt a go játék kétezerötszáz éves történetének alakulása. Amikor a folyamat lezárult, egy olyan stílussal és stratégiai szemlélettel találkozhattunk, amihez egyszerűen még nem jutottunk el” – mondta Kővári Bálint, az Asura Technologies Machine Learning csapatának vezetője, a BME tudományos munkatársa.

A jó megoldáson túl

Vereség helyett tehát egy sporton túli eseményről van szó, mert az embert legyőző gép maga is emberi teljesítmény. De a számítástechnika evolúciójából vagy játékok nehézségéből fakad az, hogy ha a gép győzelmét nézzük, 18 év különbség van a sakk és a go között?

„A 18 év nem a hardverfejlődéssel áll kapcsolatban, sőt az AlphaGo előtt a go játék ilyen szintű megoldását még több mint 20 évig nem tartották lehetségesnek. Az, hogy ez létrejött, alapvetően a megerősítéses tanulás térnyerésének volt köszönhető. Érdekes az eredménnyel kapcsolatban, hogy az AlphaGo algoritmusnak van egy alapvető sarokköve, egy rendkívül hatékony keresőalgoritmus, a Monte-Carlo Tree Search. Ennek azt a komponensét, ami lényegében a keresést irányítja, magyar kutatók fejlesztettek ki még 2006-ban, és gyakorlatilag ennek az algoritmusnak a megerősítéses tanulással való kombinálása és összekapcsolása az AlphaGo” – mutatott rá Leginusz László, az Asura Technologies technológiai igazgatója.

„A képességeket tekintve a fő különbség az, hogy gyakorlatilag a Deep Blue-ban kizárólag keresés és különböző heurisztikák alapján történő helyzetkiértékeléseket alkalmaztak annak érdekében, hogy minden játékállás esetén képes legyen megtalálni az optimális döntést” – emelte ki Kővári Bálint. A mai mesterséges intelligenciák felügyelt módon tanulnak, vagyis a helyes megoldásokon tanítják őket. Az AlphaGo ezzel szemben egy új gépi tanulási módszert használt, amit megerősítéses tanulásnak neveznek. 

Honnan tudjuk, mi a tökéletes lépés egy kompetitív játék tetszőleges állapotában? A válasz az, hogy sehonnan, tehát ez a módszer nem minden probléma megtanulására alkalmas. Itt jön képbe a megerősítéses tanulás, mert itt nem úgy hozunk létre egy példát, hogy megmondjuk neki, hogy mi a jó döntés, hanem megvárjuk a folyamat végét, ahol látjuk, hogy nyertünk vagy vesztettünk. Ennek függvényében szerez belátást a modell arról, hogy egy köztes lépés milyen mértékben járulhatott hozzá a végkifejlethez 

– magyarázta Kővári, hozzátéve: „Ha belegondolunk, az életben is ez az egyik legjellemzőbb módja a tanulásnak az emberek esetében: egy adott helyzetben nem tudjuk, hogy mi a helyes döntés, hanem később értjük meg, hogy milyen hullámokat vertek a tetteink, és ennek köszönhetően vagyunk képesek egy hasonló helyzetben a későbbiekben jobb döntést hozni.”

Ahogy Garri Kaszparov sakkvilágbajnok azt mondta: 

Egy jó ember és egy gép a legjobb kombináció. 

Ha az életről magáról tanulhatunk meg új dolgokat, a jövő így inkább váratlanul érdekes, mintsem sötét.

Az én elképzelésemben az együttműködés maga az, ami várható. Ezek a modellek valójában eszközök az ember számára, aminek köszönhetően elmélyítheti a tudását valamilyen területen. Ezt pozitív felhasználásnak tekintem, mert mi magunk arra használjuk ezt az eszközt, hogy önmagunkat jobbá tegyük. A versengéssel sincs alapvetően probléma, mert a versengés az a desztillációs folyamat, ahol a kiválóság felé tartunk 

– vélekedett Leginusz. 

Ahhoz, hogy ez a szemlélet elterjedjen, nagyon fontos az oktatás és az ismeretterjesztés ezekkel az eszközökkel kapcsolatban. Például a nagy nyelvi modellek megjelenése óta az egyetemen egyre csábítóbb egy hallgató számára, hogy a számonkéréseknél használja ezeket az eszközöket. Mindig vannak olyan feladatok, amik nem igényelnek kreativitást, de ha a gépet arra használjunk, hogy nekünk ne kelljen gondolkodnunk egy problémán, akkor önmagunkat trenírozzuk arra, hogy kiválthatóvá váljanak a képességeink. Ez a negatív felhasználás, amikor az ember nem a saját javára, hanem önmaga ellen használja ezeket az eszközöket. Mert eltűnik az önálló problémamegoldás katartikus élménye, aminél jobb leckét nem is kaphatnánk az életben 

– szögezte le Kővári Bálint, hozzátéve: „A helyzetet továbbgondolva oktatói oldalról készíthetünk olyan kreatív feladatot, ahol nyugodtan megengedhetjük tetszőleges modell használatát, mert nem lesz képes a hallgató helyett megoldani, viszont egy olyan helyzetbe hozhatja az adott hallgatót, hogy próbálja meg vele együtt megoldani a kiadott feladatot.”

Ez a cikk az Asura Technologies együttműködésével jött létre.

(Borítókép:  Johannes Simon / Getty Images)