Mária
-6 °C
-2 °C

Gesztusokkal irányított számítógépek

2004.07.17. 16:58
Hogyan helyettesítsük a billentyűzetet, az egeret? Miként szabaduljunk meg a felesleges vezetékektől? Technológiai elemzők szerint a gesztusfelismerés lesz a közeljövő egyik nagy dobása. Kézmozdulatokra működnek majd a számítógépek, mint Tom Cruise-é a Különvéleményben.
Kézzel, fejjel, szemmel vezérelt számítógépek

David Kushner, a Technology Review szerzője az ezen a téren élenjáró Cybernet Systems Ann Arbori (Michigan) stúdiójában szerzett tapasztalatairól számol be. A meteorológusoknak szánt Gesture Storm időjárási térképkezelő rendszert próbálta ki: a szoftverinterfész biztosítja a computerizált vizuális effektusok kéz- és testmozgás általi kontrollját. Vezetékekre és nyomógombokra nincs szükség, a gesztusok töltik be az interfész szerepét.

A programot elsőként az orlandoi (Florida) WKMG tévéállomás vezette be 2003. decemberében.

A Cybernetet 1988-ban alapították: robotikai megoldásokra, az ember-gép interakcióra és orvosi termékekre szakosodtak. 1998 óta foglalkoznak gesztusfelismeréssel - akkori megbízójuk, az amerikai hadsereg ilyen jellegű számítógépes kiképzőrendszert rendelt tőlük: a kiképző különböző kézmozdulatokkal irányítja szimulált katonáit. A NASA szintén kapcsolatba lépett velük, ám a nagyközönségnek szánt gesztusalapú információs kioszk nem valósult meg.

Legújabb interfészük a teljes mértékben szemmozgásra épülő Navigaze: két klikk helyett két hunyorítás, és máris a világhálón navigálunk. Játéktechnológián szintén dolgoznak: a 2000-es Használd a fejedet (Use Your Head) feljavított változatában a kamera koponyánk mozgását követi. A monitoron látható képek fejünk irányváltozásaival szinkronban alakulnak át.

De hiába az időjárás-jelentés, vagy a hadászati kiképzés, a mindennapokban történő alkalmazásra várnunk kell még. "Nem tudom, mi lesz a gesztusfelismerés nagy durranása" - nyilatkozta Charles Cohen, a Cybernet kutatási és fejlesztési igazgatóhelyettese. A killer app egyelőre várat magára, sőt, az új technológia rendeltetése "nem feltétlenül a jó öreg egér és billentyűzet háttérbe szorítása, hanem inkább a kiegészítésük." Meglepő vélekedés, mert a gesztusfelismerés legtöbb szószólója pont az ellenkezőjét vallja.

Kungfu-szupersztár vagy táncoló díva?

A Sony 2003 nyarán dobta piacra a PlayStation2-periféria EyeToyt. Speciális szoftvert és digitális kamerát használva, az adott játékosról készült képet - mozdulataival hangsúlyban - a játék menetébe illeszti. Némi testmozgás - ugrálunk, meghajolunk, földhöz vágjuk magunkat, a levegőbe rúgunk stb. - és tetszés szerint kungfu-szupersztárrá, táncoló dívává, vagy éppen mániákus ablakmosóvá válunk. Az EyeToy egyelőre csak a mozgást detektálja, viszont már létezik a különböző színeket és arcokat beazonosító változat. A végcél, hogy csak a kezünket használjuk, semmi mást, árulta el Richard Marks, a Sony Computer Entertainment of America számítógépes látásra specializálódott projektmenedzsere.

A billentyűzet és a botkormány első olyan életképes alternatívája, ami a gesztusfelismerésen alapul, állítja Kushner. Joe Lászlóra, a New York-i Jupiter Research kutatócég elemzőjére hivatkozik: "mindenki egyetért abban, hogy a billentyűzet nem feltétlenül a legoptimálisabb interfész."

Virtuális billentyűzet?

A kaliforniai San Jose-i illetőségű Canesta legújabb fejlesztése digitális személyi asszisztensre viszi át gesztusainkat. Több mint ötven képkocka per másodperc sebességgel dolgozik, tehát a leggyorsabb gépelővel is felveszi a versenyt. Infravörös fényt használva, úgy tűnik, megoldja a Sony és a Cybernet egyik legfőbb problémáját: a változó fényviszonyok, vagy a mozgalmas háttér által akadályozott gesztusérzékelést. (Hasonló virtuális billentyűzettel kísérletezik a jeruzsálemi VKB is.)

A Leedsi Egyetem Interdiszciplináris Központjában a gesztusok háromdimenziós érzékelésén, "rögzítésén" dolgoznak. Kia Ng és társai szintén infravörös fényt alkalmaznak, a cél zeneszerzés, kézmozgásra. "Ahhoz, hogy egy gesztusnak értelme legyen, nemcsak azt kell tudnunk, hol volt, és hol van egy tárgy, hanem azt is, hogy hol lesz - magyarázza Ng. - A legnagyobb kihívást a mozgásokat előrelátó rendszer betanítása jelenti." Munkájukat 2005 végéig, élő koncerten szeretnék tesztelni.

Túl a billentyűzeten, játékokon, időjárás-jelentésen és a többin, a gesztusfelismerés alapjaiban változtathatja meg az ember-komputer interakciót. A Georgia Technológiai Intézetben és az MIT-n - például Rosalind Picard csoportja - már alapozzák a jövőt. "Ha be akarunk vezetni egy új felhasználói felületet, az egyszerűség és az intuitív jelleg a lényeg" - elmélkedik László. Jelenleg azonban még mindig a billentyűzet a leghatékonyabb.