Arcfelismerő számítógépek
További Tudomány cikkek
Aleix M. Martinez |
Miként megy végbe az arcfelismerés? Milyen mechanizmusokat társít egymáshoz az agy, amikor a különböző kifejezések alapján megállapítja, hogy ugyanazt a személyt látjuk, vagy sem?
"Úgy tűnik, konszenzus alakult ki, mely szerint az arcfeldolgozás holisztikusan, és nem lokálisan történik" - írja a kutató. Viszont, az azonosításhoz szükséges információt illetően egyáltalán nem beszélhetünk konszenzusról.
Korábbi, a Purdue Egyetemen végzett tesztjét összehasonlította jelenlegi, agyunk eme tevékenységeit megjelenítő számítógépes modelljével; és az eredmények illettek a modellhez.
Arckifejezés-teszt
A Purdue-n lefotózott százhuszonhat önkéntest. A személyenként különböző (boldog, haragos, üvöltő, semleges kifejezésű, változó fényviszonyok, stb. mellett felvett) képek alapján létrehozott egy arc-adatbázist.
Két csoportnak mutatta meg a fotókat.
Az elsővel azt vizsgálta, milyen gyorsan állapítják meg, hogy egy semleges, illetve boldog/haragos/üvöltő arc ugyanaz a személy. A semleges-semleges azonosítás ment a leggyorsabban (átlagosan 0,8 másodperc), majd a semleges-haragos (majdnem 0,9 másodperc), a semleges-mosolygós (0,9 másodperc), és végül a semleges-ordító (kevéssel 1 másodperc felett).
A másodikkal az arckifejezés-felismerés gyorsaságát tesztelte. Örömteli (1,3 másodperc), semleges (1,5 másodperc), dühös (1,9 másodperc), üvöltő (majdnem 2 másodperc) volt a sorrend.
Martinez a modell segítségével magyarázta meg, miért ment gyorsabban a haragos arcokkal történő azonosítás az első csoportnál, továbbá miért a boldog tekintetek felismerése bizonyult legegyszerűbbnek a másodiknál. A válaszok: azért, mert néhány árnyalt részlet kivételével a dühödt ábrázatokat szinte semmi nem különbözteti meg a neutrálisaktól, illetve mert a boldogság egyértelműen az önfeledt mosollyal azonosítható.
A gépi modell
Martinez az egyre népszerűbb kutatási területnek számító computeres arcfelismerés négy főbb aspektusára fókuszál: arcmodellezésre, arcfelderítésre és lokalizációra, személyek arckép alapján történő azonosítására, arckifejezés-felismerésre. Eddigi kísérletei során azonban elsősorban az utóbbi kettőt vizsgálta.
Modellje segítségével sikerült bebizonyítania, hogy a két - agyunk más-más területén jelentkező - aktivitás ugyan közvetve, a mozgás megértését végző agyrész által, de összefügg egymással. Arcizom-mozgásokra vonatkozó "tudásunk" alapján (és "lelkiállapot-ábrázat" nélkül) azonosítunk be egy-egy baráti arcot, vagy nyugtázunk mosolyt, dühödt tekintetet.
Mindezzel a kognitív pszichológia egyik sokat vitatott, tudósokat megosztó kérdésére szintén választ igyekszik adni: kapcsolódik-e egymáshoz a két aktivitás, vagy sem? Sokak szerint minimális kapcsolódás sincs közöttük, teljesen eltérő mentális folyamatok, míg mások közvetlen összefüggéseket feltételeznek.
Hasonló eredmények
A modell az emberi képfeldolgozás egyszerűsített változatát írta le ugyan, viszont egy beépített modul az arcizommozgást mérte különböző érzések kifejezésekor, valamint azt, hogy például örömnél/bánatnál mennyivel gyorsabb/lassabb a mozgás. Ezt a számítási tevékenységet valószínűleg a mi agyunk is elvégzi, azt eredményezve, hogy - akárcsak a számítógép - némi (de egyező, vagy nagyon hasonló időtartamú) késéssel azonosít.
A computer reakcióidejét másodpercek helyett számítógépes ciklusokban és iterációkban mérték. Az arcokat és a kifejezéseket mégis ugyanabban a sorrendben ismerte fel, mint a tesztalanyok. A kevesebb mozgásból összeálló kifejezések azonosítása gépnek, embernek egyaránt könnyebben ment. Minél több volt a mozgás, annál nehezebben hajtották végre a feladatot.
Arcfelismerő számítógépek
Az eredményekre támaszkodva, Martinez és kutatótársai az arcokat videokamera input alapján felismerő computer építését tervezik. Hatékonyabbat, gyorsabbat, mint a működésben lévő rendszerek. Olyat, mely számtalan kép helyett akár egyetlen egy alapján elvégzi munkáját, és akkor se jön zavarba, ha több fotó esetén az illető más és más arckifejezéssel néz a nagyvilágba, különböző szögekből, eltérő megvilágításban kapták lencsevégre, vagy napszemüveget visel.
Az "ideális" arcfelismerő alkalmazása különböző (tudományos, oktatási, hétköznapi, stb.) területeken várható - az "intelligens" megfigyelőrendszerektől kezdve eltűnt gyerekek, vagy körözött bűnözők azonosításáig. Talán jelszóra se lesz szükségünk, mert azonnal ránk ismer a gép. Sőt, még az érzéseinkkel is tisztában lesz.
"El tudják képzelni, amikor a számítógép azt mondja: zaklatottnak tűnsz, miben segíthetek?" - ironizál Martinez.