A hangfelismerés nehézkes
A hangfelismerő szoftverek többnyire a kiejtésen belül tapasztalható frekvenciaváltozást mérik, feldarabolva szavakká, és értelmes kifejezésekké alakítva. De túl sokszor megtörténik, hogy ezek a rendszerek tévednek, vagy kellemetlenül sokáig csócsálják az elhangzottakat - véli Igarashi. Így a kutató és munkatársai utánajártak annak, mit lehetne elérni a szavak használata nélkül.
Munka közben sokan nyögnek
A jövő hónapban a floridai Orlandóban tartott számítástechnikai konferencián bemutatandó rendszer a halk morgásra vagy röfögésre emlékeztető "ah" és "hmm" hangok lejtését és időtartamát méri. Ilyen hangokat munka közben sokan hallatnak.
Igarashi szerint a hangfeldolgozó rendszer kiváltképpen jól fog működni az asztali számítógéppel végzett folyamatos interakcióban. Ideális lehetne például egy dokumentum vagy egy online térkép görgetése és lapozása közben. A megfelelő paranccsal a CD-lejátszó átválthatna egy másik számra.
Hibára felszisszenve visszavonható lenne a művelet
Egy gyors felszisszenés például azonnali visszavonás paranccsal érne fel, vagyis gyorsabban visszalépne a dokumentum kezelésének előző fázisába, mintha az egérrel kellene kattintgatni.
A "mormogásos gyorsírással" fejlesztők kiválaszthatnák a hangok olyan készletét, melyeket a számítógép könnyen meg tud különböztetni egymástól - kommentálta az ötletet Tim Hazen, a MIT beszélt nyelvek rendszere csoportjának tagja.
De szerinte kérdéses, hogy az egy légterű munkahelyeken dolgozó felhasználók mennyire fogadnák szívesen, hogy a kollégáik előtt kell röfögve társalogniuk a gépükkel.