Néz és lát a gép
További Szoftver cikkek
A tárgyfelismerés minden, csak nem egyértelmű: agyunk elképesztő mennyiségű vizuális és más érzékszervi adatot gyűjt össze, állít keresztreferencia-rendszerbe az emlékezettel, majd ezek alapján végzi el a mentális dedukciót, melynek eredményeként például a gyertyákkal felaggatott díszes édességnyalábról bizonyossággal állítja, hogy nem más, mint egy születésnapi torta.
A folyamatsor abszolválása komoly probléma elé állítja a mai számítógépeket. A születésnapi torta felismeréséhez is tortákra vonatkozó általános adatokkal kellene rendelkezniük – lehetséges formák és méretek, milyen és mennyi gyertya és más díszítés helyezhető el rajta, elhelyezési módok, és így tovább. Ráadásul ugyanaz a tárgy másként látjuk, ha megváltozik a nézőpont, a körülötte lévő többi tárgy pozíciója, módosulnak a fényviszonyok (megvilágítás).
Magyarán, a számítógépeknek adatok, minták és variációk szinte lehetetlen sokaságát kellene feldolgozniuk, ami csak bonyolult, időigényes programozással lehetséges, és az eredmény akkor sem garantált.
Speciális tárgyfelismerés
Az európai uniós CLASS (Cognitive-Level Annotation Using Latent Statistical Structure, rejtett statisztikai szerkezetet használó kognitív-szintű annotáció) projekt keretében vizuálisan speciális objektumok, objektumcsoportok (például autó, illetve autók az utcán) felismerésére fejlesztenek technológiákat. Egy meghatározott tárgy felismerése természetesen sokkal, de sokkal könnyebb, mint egy tárgycsoporté: az utóbbihoz tartozók lényegesen eltérhetnek egymástól, nagy a variációs lehetőségek száma.
A CLASS előrelépés a hasonló jellegű eddigi próbálkozásokhoz, megoldásokhoz képest. Létrehoztak egy rendszert, melyben az objektumok leírása több eltérő, különálló apró folton alapul. Az ilyen lokalizált jegyek megadják a bőséges variációk hatásos kezeléséhez szükséges robusztusságot. Másik fontos vívmányuk az úgynevezett "hasznos közelítő szomszédság keresések" (efficient approximate neighbourhood searches) kidolgozása: ezeket alkalmazva hasonlítható össze egy kép, vagy egy tárgy nagyszámú referenciaképpel.
A CLASS speciális tárgyfelismerése máris büszkélkedhet kereskedelmi alkalmazással: a Svájci Szövetségi Technológiai Intézet által 2006-ban alapított, az Intézet Számítógépes Látás Laboratóriumával szoros kapcsolatban lévő kooaba (így, kis kezdőbetűvel) cég mobiltelefonokra adaptálja az új technológiát. Az előfizetők installálják a megfelelő szoftvert, majd a készülékükön található képekhez (épület, albumborító, poszter stb.) kapcsolódó releváns online információhoz jutnak.
A projekt vezetői sok újabb alkalmazásra, az alkalmazások gyors elterjedésére számítanak. Például a kooaba szoftverén kivitelezett interaktív városi, múzeumi túravezetésre, útikönyvekre.