Az Egyesült Államok mintegy 233 millió felhasználójának nagy része sem tesz másként: beszélgetnek, rövid üzeneteket küldenek és fogadnak. Általános vélemény, hogy a bonyolult kezelés miatt nem szeretnek élni a más alkalmazások által nyújtott előnyökkel. Túl hosszú mondatokat kell bepötyögniük, nehézkes a keresés, a használati útmutatók gyakran érthetetlenek.
Vlingo
A megoldást a beszédfelismerő interfészek jelenthetik. Az MIT-ról ismert Massachusetts állambeli Cambridge-ben nemrég indult high tech cég, a Vlingo különböző alkalmazások esetében egyaránt funkcionáló, könnyen kezelhető interfészt javasol. Míg a legtöbb hasonló termék egy-egy alkalmazásra, például a címjegyzékben található nevek keresésére korlátozódik, addig az ő beszédfelismerő rendszerük nem ismeri az efféle korlátokat. Bármit mondhatunk neki, és – ugyan kisebb-nagyobb hibákkal – szinte bármit felismer.
A rendszer a beszédet szöveggé alakítja, és lehetősége nyílik arra, hogy a készülék – navigációs eszközeinek segítségével – tanuljon a hibákból. Így jön rá előbb-utóbb, hogy valószínűleg mit is akar mondani a felhasználó. Mivel a beszéd mobil internetkapcsolaton keresztül jut el a Vlingo szerveréhez, a telefonnak nem kell bonyolult és időigényes számításokat végeznie. Az átirat nem egész két másodperc múlva jelenik meg.
Schumann vagy Sean?
Természetesen azért még akadnak javítanivalók. Az egyik felhasználó arról számolt be, hogy Schumann Zongora Concertóját kereste. Vlingo gyors, de pontatlan választ adott: Schumannt Sean-nek hallotta. A Sean alternatíváiként pedig a „shine” és a „sign” szavakat adta meg. Ha valamelyik jó lett volna, semmi mást nem kellett volna tenni, csak rákattintani és a Sean helyére tenni.
Mivel egyik sem volt helyes, a felhasználó kézzel ütötte be a német zeneszerző nevét. A rendszernek meg kellett tanulnia, hogy az angol kiejtés alapján másként átírandó Schumann a képernyőn Schumannként is megjelenhet, és mindenképpen az egyik opciónak kell lennie. A javítás azt eredményezi, hogy Vlingo a jövőben több (és pontosabb) megoldást fog javasolni. (Arról nem is beszélve, hogy valószínűleg elég sokan keresik Schumann valamelyik művét.)
A beszédfelismerés és a keresőtechnológiák egyesítése komoly lehetőségeket villant fel, amire egyre több fejlesztő jött már rá. A Vlingo mellett például az AT & T Florham Park Laboratóriumában (New Jersey állam) szintén mobiltelefonokra alkalmazható beszédinterfészen dolgoznak.