Diána
12 °C
27 °C

Videó az elfolyó szövegek helyett

2010.01.17. 10:32 Módosítva: 2010-01-17 10:32:24
Az emergens jelenségek észlelését nehéz számítógéppel reprodukálni, így nagyon jól alkalmazhatóak a felhasználók regisztrációjánál használt captchákban. A torzított videókat az emberek azonnal értelmezik, de gépi algoritmusokkal nem azonosítható mi történik a bejátszáson.

A webes felületeken gyakran találkozunk captchákkal (Completely Automated Public Turing test to tell Computers and Humans Apart, Teljesen automatizált nyilvános Turing-teszt a számítógép és az ember megkülönböztetésére). Egy netes szolgáltatásra való feliratkozás végén általában egy torzított felirat beírásával ellenőrizni szokták, hogy valóban ember-e a regisztrálni vágyó személy, vagy egy számítógépes program, ami csak információ gyűjtés vagy spammelés céljából jelentkezik be az adott oldalra.

Az automatikus karakterfelismerés fejlődésének következtében egyre bonyolultabb képeket kell készíteniük az oldalak üzemeltetőinek, és így az átlagfelhasználó gyakran csak a sokadik próbálkozásra képes eltalálni, hogy milyen girbegurba betűk láthatóak a zavaros háttér előtt. Egy izraeli, tajvani és szaúdi tudósokból álló nemzetközi kutatócsoport merőben más megközelítést kíván alkalmazni az emberek és gépek elkülönítése érdekében. A Danny Cohen-Or vezette csoport rövid videofelvételeket tenne a képek helyére, és elképzelésük szerint a filmben szereplő állat nevét kellene a felhasználónak beírni regisztrációkor.

Paripa a bozótban, nyuszi ül a fűben, ember lóhalálában
Paripa a bozótban, nyuszi ül a fűben, ember lóhalálában

Annak érdekében, hogy a filmfelvételre ne lehessen képfelismerő algoritmusokat alkalmazni, Cohenék eltorzítják az egyes kockákat oly módon, hogy azokból külön-külön semmilyen tárgyat, vagy állatot ne lehessen azonosítani. Az egymást követő mozgásfázisok alapján azonban minden ember azonosítani tudja, mi látható a képen.

Cohen az emberi észlelés ezen aspektusát egy emergens folyamatnak tekinti. A tárgy előbukkan a az egymás utáni képekből, amiknek tulajdonképpen egyik részlete, vonása sem hasonlít rá. Csupán az együtt mozgó pontok együttes értelmezése során jön létre az agyban a mozgó állat felismerése.

A kutató szerint az emergencia észlelése olyan speciálisan emberi tulajdonság, amire a mesterséges látás jelenleg nem képes. A gépi algoritmusok máshogy észlelik az egyes tárgyakat és Cohenék képen futtatva őket csak zajt látnak a képeken.