Ambrus
-7 °C
3 °C

Beszélő fényképezőgép

2006.07.01. 10:10
Az Amerikai Vakok Szövetségével közösen az MI egyik apostola, Ray Kurzweil olyan szövegfelolvasó gépet szerkesztett, mely egy palmtop, egy fényképezőgép és egy szövegfelismerő ötvözete. Kurzweil már 30 éve is próbálkozott hasonló segédeszközzel, de annak inkább egy mosógéphez közelített a mérete.

A Wall Street Journal által "nyughatatlan zseninek" titulált Ray Kurzweil feltaláló, gondolkodó, futurológus. A XXI. század Edisonja, egyike az Amerikát az évszázadok során forradalmasító "tizenhatoknak". Rendkívül termékeny szerző, alighogy megjelent egy könyve, máris követi egy másik. Sorra alapítja a sikeresnél sikeresebb mesterséges intelligencia kutatás-fejlesztéssel foglalkozó vállalkozásokat.

Kurzweil régi álma volt, hogy egy olyan mindennapi életben is használható, kényelmesen hordozható szövegfelismerő rendszert szerkesszen, mely nagyban megkönnyítené a vakok és látássérültek mindennapi életét. A kutató első cégét, a Kurzweil Computer Products-ot 1974-ben alapította. Fő profiljuk a karakterfelismerő, és szöveget hanggá alakító (text to speach, TTS) rendszerek fejlesztése volt. A USA Today című amerikai napilapnak adott interjújában a kutató elmondta, hogy az első olyan komplex rendszer, mely felismerte az írott szöveget és azt hanggá is alakította akkora volt, mint egy mosógép. Mára sikerült a hardvert lecsökkenteni a tenyér-számítógépek méretére.

A most piacra dobott eszköz beépített kamera segítségével folyamatosan rögzíti, felismeri és hanggá alakítja az írásos anyagokat, legyen az könyv, újság, egyéb nyomtatott szöveg, vagy képernyőrészlet, weboldal, stb. Memóriájában több ezer oldalt tud eltárolni, és ezeket később le lehet menteni számítógépre is. A felolvasót az amerikai vakok szövetségének 500 tagja tesztelte óriási sikerrel. Még nem kapható, de már óriási iránta a kereslet, pedig nem éppen olcsó: 3.500 USD-be kerül, ami közel 800.000 Ft-nak felel meg.

Sajnos a célcsoportok mérete közti különbség miatt a magyar nyelvű TTS technológia még nincs azon a fejlettségi szinten, mint az angol. Így a magyar nyelven géppel felolvasott szövegek gyakran csak a laikusok számára élvezetesek, hisz akik órákon át kényszerülnek hallgatni, hamar elfáradnak a merev, monoton hangsúlyozású, fémes gépi hangtól. Idehaza a Budapesti Műszaki és Gazdaságtudományi Egyetem Távközlési és Médiainformatikai Tanszéken Németh Géza kutatócsoportja foglakozik TTS-sel. Pár évvel ezelőtt mobiltelefonokra írt SMS felolvasó programjuk nemzetközi szinten is nagy sikert aratott.