Mária
0 °C
3 °C
Index - In English In English Eng

Simán kirakja a Rubik-kockát az autodidakta MI robotkeze

820756396
2019.10.16. 10:25

A San Franciscó-i OpenAI kutatói új módszert dolgoztak ki arra, hogy átvigyék az összetett tárgykezelési készségeket a szimulálttól a valóságos helyzetekig: a mesterséges intelligencia (MI) fejlesztésén dolgozó profitorientált laboratóriumban egy olyan, robotkezet irányító MI-t sikerült megalkotni, ami képes egy Rubik-kockát úgy kirakni, hogy előtte önmagát tanította be a megoldáshoz vezető módszerre.

Az OpenAI egy évvel ezelőtt jelentette be, hogy figyelemreméltóan ügyes robotkezet raktak össze, amivel ki lehet rakni akár egy Rubik-kockát is. Ez műszakilag nem volt annyira forradalmi, láttunk már jó pár kockakirakó automata eszközt az elmúlt 10-20 évben, az MI-kutatások szempontjából viszont eléggé előremutató volt (még ha nem is teljes újdonság ez sem), mivel a robotkezet irányító algoritmus önmagát tanította be a kocka kirakásának trükkjeire: egyrészt rájött, hogyan működik a kocka, másrészt a szoftveres szimulációk során szerzett tapasztalatokat sikeresen ültette át a gyakorlatba.

Az OpenAI most friss kutatási eredményeket publikált a jövőben egyre ügyesebb ipari robotok kifejlesztésével kecsegtető kísérletekről. A Dactyl névre keresztelt robotkéz újabb lenyűgöző képességekre tett szert: most már képes egy kézzel kirakni a kockát, ami egészen új szintje a robotügyességnek.

A szimulációban és a valóságban is sikeresen teljesítő robotkéznek nem volt könnyű dolga, a kutatók többféle módon is feszegették ügyességének határait: volt, hogy gumikesztyűbe bújtatták, vagy összekötötték egyes ujjait, máskor letakarták egy takaróval vagy egy plüsszsiráffal zavarták a kirakás folyamatát.

A számítógépes szimulációból eljutni a fizikai folyamatig ezúttal is óriási kihívás volt, és a mérnökök szintet léptek ebben is: korábban általuk megadott paraméterek változtatásával tanították az algoritmust, egyre nehezebb feladatok elé állítva azt, a mostani MI már önmagát tréningezte, minden sikeresen teljesített szint után önmagának nehezítve a terepet a paraméterek randomizálásával.

Az OpenAI jelentése szerint a végeredmény egy minden eddiginél robusztusabb, önmegerősítő tanulásra képes algoritmus, ami változó körülmények között is sikeresen meg tudja oldani a kijelölt feladatokat, még akkor is, ha azokra korábban nem volt betanítva.

Az eredmények tehát kétségkívül látványosak, de vannak azért kritikus hangok is, amik szerint nem biztos, hogy erre vezet a jövő robotikájának útja: egy Rubik-kockát fél robotkézzel kirakni ugyanis elég specifikus programozói és mérnöki feladat, valós ipari vagy civil alkalmazásokban nem feltétlenül erre lesz szükség a jövőben, arról nem is beszélve, hogy az önmegerősítő tanulásnak rengeteg korlátja van a való életben. (MIT Technology Review)