Árpád
-2 °C
9 °C

Arcfelismerő számítógépek

2003.07.09. 09:52
Agyunk az arcokat, valamint az arckifejezéseket alakokról és mozgásokról szerzett információinak az összekapcsolásával ismeri fel, véli Aleix M. Martinez, az Ohio Állami Egyetem tanársegédje. A kutató erre alapozva fejleszt számítógépes arcfelismerő berendezést. A rendszer nemcsak a napszemüveget vagy szakállat viselő személyt azonosítja, hanem kedélyállapotát is felismeri.

Aleix M. Martinez
Arc- és hangulatfelismerő számítógépes rendszerek létrehozása a kísérletek célja. Nem törekszenek lehetetlenre, nem lebeg előttük a százszázalékos precizitás vágya, hiszen egy olyan adottság gépi elsajátítását tervezik, melyben az ember is jócskán vét hibát. Ám a computerek még többet - nyomatékosít Martinez.

Miként megy végbe az arcfelismerés? Milyen mechanizmusokat társít egymáshoz az agy, amikor a különböző kifejezések alapján megállapítja, hogy ugyanazt a személyt látjuk, vagy sem?

"Úgy tűnik, konszenzus alakult ki, mely szerint az arcfeldolgozás holisztikusan, és nem lokálisan történik" - írja a kutató. Viszont, az azonosításhoz szükséges információt illetően egyáltalán nem beszélhetünk konszenzusról.

Korábbi, a Purdue Egyetemen végzett tesztjét összehasonlította jelenlegi, agyunk eme tevékenységeit megjelenítő számítógépes modelljével; és az eredmények illettek a modellhez.

Arckifejezés-teszt

A Purdue-n lefotózott százhuszonhat önkéntest. A személyenként különböző (boldog, haragos, üvöltő, semleges kifejezésű, változó fényviszonyok, stb. mellett felvett) képek alapján létrehozott egy arc-adatbázist.

Két csoportnak mutatta meg a fotókat.
Az elsővel azt vizsgálta, milyen gyorsan állapítják meg, hogy egy semleges, illetve boldog/haragos/üvöltő arc ugyanaz a személy. A semleges-semleges azonosítás ment a leggyorsabban (átlagosan 0,8 másodperc), majd a semleges-haragos (majdnem 0,9 másodperc), a semleges-mosolygós (0,9 másodperc), és végül a semleges-ordító (kevéssel 1 másodperc felett).

A másodikkal az arckifejezés-felismerés gyorsaságát tesztelte. Örömteli (1,3 másodperc), semleges (1,5 másodperc), dühös (1,9 másodperc), üvöltő (majdnem 2 másodperc) volt a sorrend.

Martinez a modell segítségével magyarázta meg, miért ment gyorsabban a haragos arcokkal történő azonosítás az első csoportnál, továbbá miért a boldog tekintetek felismerése bizonyult legegyszerűbbnek a másodiknál. A válaszok: azért, mert néhány árnyalt részlet kivételével a dühödt ábrázatokat szinte semmi nem különbözteti meg a neutrálisaktól, illetve mert a boldogság egyértelműen az önfeledt mosollyal azonosítható.

A gépi modell

Martinez az egyre népszerűbb kutatási területnek számító computeres arcfelismerés négy főbb aspektusára fókuszál: arcmodellezésre, arcfelderítésre és lokalizációra, személyek arckép alapján történő azonosítására, arckifejezés-felismerésre. Eddigi kísérletei során azonban elsősorban az utóbbi kettőt vizsgálta.

Modellje segítségével sikerült bebizonyítania, hogy a két - agyunk más-más területén jelentkező - aktivitás ugyan közvetve, a mozgás megértését végző agyrész által, de összefügg egymással. Arcizom-mozgásokra vonatkozó "tudásunk" alapján (és "lelkiállapot-ábrázat" nélkül) azonosítunk be egy-egy baráti arcot, vagy nyugtázunk mosolyt, dühödt tekintetet.

Mindezzel a kognitív pszichológia egyik sokat vitatott, tudósokat megosztó kérdésére szintén választ igyekszik adni: kapcsolódik-e egymáshoz a két aktivitás, vagy sem? Sokak szerint minimális kapcsolódás sincs közöttük, teljesen eltérő mentális folyamatok, míg mások közvetlen összefüggéseket feltételeznek.

Hasonló eredmények

A modell az emberi képfeldolgozás egyszerűsített változatát írta le ugyan, viszont egy beépített modul az arcizommozgást mérte különböző érzések kifejezésekor, valamint azt, hogy például örömnél/bánatnál mennyivel gyorsabb/lassabb a mozgás. Ezt a számítási tevékenységet valószínűleg a mi agyunk is elvégzi, azt eredményezve, hogy - akárcsak a számítógép - némi (de egyező, vagy nagyon hasonló időtartamú) késéssel azonosít.

A computer reakcióidejét másodpercek helyett számítógépes ciklusokban és iterációkban mérték. Az arcokat és a kifejezéseket mégis ugyanabban a sorrendben ismerte fel, mint a tesztalanyok. A kevesebb mozgásból összeálló kifejezések azonosítása gépnek, embernek egyaránt könnyebben ment. Minél több volt a mozgás, annál nehezebben hajtották végre a feladatot.

Arcfelismerő számítógépek

Az eredményekre támaszkodva, Martinez és kutatótársai az arcokat videokamera input alapján felismerő computer építését tervezik. Hatékonyabbat, gyorsabbat, mint a működésben lévő rendszerek. Olyat, mely számtalan kép helyett akár egyetlen egy alapján elvégzi munkáját, és akkor se jön zavarba, ha több fotó esetén az illető más és más arckifejezéssel néz a nagyvilágba, különböző szögekből, eltérő megvilágításban kapták lencsevégre, vagy napszemüveget visel.

Az "ideális" arcfelismerő alkalmazása különböző (tudományos, oktatási, hétköznapi, stb.) területeken várható - az "intelligens" megfigyelőrendszerektől kezdve eltűnt gyerekek, vagy körözött bűnözők azonosításáig. Talán jelszóra se lesz szükségünk, mert azonnal ránk ismer a gép. Sőt, még az érzéseinkkel is tisztában lesz.

"El tudják képzelni, amikor a számítógép azt mondja: zaklatottnak tűnsz, miben segíthetek?" - ironizál Martinez.