Vilma
-7 °C
4 °C

Szájról olvas az Intel új technológiája

2003.05.01. 11:27
Az Intel nyílt forráskódú licencfeltételekkel kiadott egy beszédfelismerő szoftvert, amely a korábbi megoldásokkal ellentétben a száj mozgása alapján értelmezi a szöveget.
Az Audio Visual Speech Recognition (AVSR) névre keresztelt szoftver az Intel OpenCV számítógépes látvány- és arcfelismerő kódkönyvtárának részét képezi. A program folyamatosan követi a beszélő szájmozgását az egyes betűk és szótagok képzése közben. Az Intel állítása szerint a technika sokkal pontosabb a hagyományos beszédfelismerő algoritmusoknál, amelyek képek helyett hangot elemeznek.

Önmagában nem működik tökéletesen

Azt nem lehet mondani, hogy az eredmények tökéletesek és az Intel állítása szerint a rendszer sokkal pontosabban működik arcfelismeréssel egybekötve, amely képes azonosítani a beszélőt. Valójában az Intel weboldala azt írja, hogy a legjobb eredményt a videó- és audiófelismerés keverésével lehet elérni: az egyik rendszer megerősíti a másik eredményeit. Ez különösen akkor számít, ha az erős háttérzaj megnehezíti a hangfelismerést.

Saját processzoraikat akarják eladni

A programot az Intel's Research leányvállalat fejlesztette ki, amely a számítógépek kapacitását kihasználó alkalmazásokat fejlesztésével foglalkozik. Magyarán az Intel olyan szoftverek kifejlesztésén fáradozik, amelyek újabb és erősebb processzorok megvásárlására ösztönzik a felhasználókat. A motivációik nem tűnnek igazán emberbarátnak, ugyanakkor az Intel kevés megszorítással engedélyezi programjainak felhasználását.