Vilhelmina
11 °C
28 °C

A virtuális ember tekintete

2007.10.22. 11:10
Kifejezetten kellemetlenül érezzük magunkat, ha beszélgetőtársunk nem néz vagy éppenséggel túl hosszan néz a szemünkbe. Még zavaróbb, ha partnerünk robot, esetleg szintetikus karakter. Ezen az állapoton kíván változtatni egy új francia szoftver.

A Grenoble-i Nemzeti Műszaki Intézet GIPSA Laboratóriumában fejlesztett szoftver rendeltetése, hogy hatékonyabb interakciót folytassunk humanoid robotokkal és virtuális emberekkel, s ennek következtében jobban kötődjünk hozzájuk. Realisztikusabbak lesznek, általuk még többet megtudhatunk magunkról is.

Mentális térkép-készítés

Gérard Bailly

Az ember és az állatok merev fürkészés helyett folyamatos és gyors, tudatosnak nem nevezhető pillantásokat vetnek az eléjük táruló látványra. Tekintetünk szaggatottan működik, vizsgálódásának tárgya pillanatról pillanatra változik, miközben az adott jelenet legérdekesebb, leginformatívabb részeire is képesek vagyunk fókuszálni. Az agy ezekből a részletekből építi fel a későbbiekben fontos „mentális térkép”-et.

A GIPSA Laboratóriumban ágens-kommunikációval, kognitív folyamatokkal és beszédfelismeréssel foglalkozó Gérard Bailly és kollégái által létrehozott szoftver az emberi tekintetmintákat próbálja utánozni. Szintetikus karaktereik ugyanolyan szaggatottan követik a mozgó tárgyakat és élőlényeket, ugyanazokra a jegyekre és ugyanannyi ideig fókuszálnak, mint az ember.

A figyelem-modell

A szoftver elméleti megalapozását az emberi látás 2003-ban, a Dél-kaliforniai Egyetemen (Los Angeles) kidolgozott úttörő modellje jelentette. Az ott kutató Laurent Itti szerint a vizuális élményeket háromféleképpen kezeljük. Egyrészt a különlegeset, a látvány legmeglepőbb, másrészt legfontosabb, legrelevánsabb részeit keressük, harmadrészt, figyelmünket „lekapcsoljuk” a többé nem érdekes területekről.

Bailly több kiegészítő mechanizmussal bővítette a modellt: egy figyelem-modul az érdeklődésünket felkeltő részek rangsorolására vonatkozó tevékenységünket próbálja utánozni, míg egy másik modul rendeltetése gyakran látott objektumok, például arcok felismerése. Így valósulhat meg, hogy a szoftver meghatározott jelenet-részleteken, meghatározott időben az adott szintetikus karakter szemére fókuszál, az pedig követi beszélgetőpartnere szem- és szájmozgását.

A francia kutatók egy úgynevezett retinális szűrővel is kiegészítették Itti modelljét. A szűrő a perifériális látás és a nagyfelbontású információt összegyűjtő retina központja közötti különbséget szimulálja.

Szociális karakterek

Bailly és munkatársai emberekkel folytatott interakciók során tesztelték a szoftvert. Megállapították, hogy a robot/szintetikus karakter tekintetmintái hasonlóságot mutattak az ugyanazt a jelenetet szemlélő emberekével. Értékelésük szerint az új figyelem-modell fontos lépés afelé, hogy a gépek emberszerűbben mozogjanak, a jelenleginél lényegesen jobb kommunikációs képességekkel rendelkezzenek, azaz szociálisabbá váljanak.

„Ha ugyanúgy látnak, mint mi, ugyanazt az információt fogják kiemelni” – magyarázza Bailly. – „Ezeknek az ágenseknek képesnek kell lenniük azon jelenetek elemzésére, melyekkel interaktív viszonyt alakítottak ki.”

A szoftver azért is fontos, mert a karaktereket – az eddig felettébb „döcögő” – közösségi aspektussal egészíti ki, és idővel nemcsak elméletben, hanem a gyakorlatban is társas géplényekké válhatnak. Viszont új kérdéseket szintén felvet. Például, hogy miként modellezhető a különböző stimulusok (több arc, ellentétes érzelem-megnyilvánulások, stb.) versengése a vizuális figyelemért?