További Net cikkek
Az MIT 2001-ben indította el OpenCourseWare (OCW, Nyílt Oktatási Anyagok) nevű projektjét azzal a céllal, hogy az elit intézmény oktatási anyagaihoz ne csak a borsos tandíjat megfizetni tudó diákok férhessenek hozzá. Az oldalon több mint 1800 egyetemi előadás kurzusleírását, oktatási segédanyagait, a diákok órai jegyzeteit és a legtöbb esetben az előadások videofelvételeit is megtalálhatjuk. Az egyetemi órák jó része le van fordítva kínaira és spanyolra, de a portugálul a thaiul beszélők is találnak maguknak tanulnivalót. Az MIT statisztikái szerint főként Észak-Amerikából és Ázsiából átlagosan egymillióan látogatnak el a weboldalra havonta.
A MIT Számítás Tudományi és Mesterséges Intelligencia Laboratóriuma (CSAIL) most egy újabb szolgaáltatással szeretné az OVW-t kibővíteni. A Regina Barzilay és James Glass vezette kutatócsoport egy olyan motort dolgozott ki, mellyel az előadások videofelvételeiben lehet keresni. A vizsgaidőszakban minden egyetemi hallgató rendszeresen átéli, hogy nem ért meg egy fogalmat, tételt, vagy jelenséget a tankönyvi definíció vagy leírás alapján. Ha nincsenek jegyzeteink, melyek segítenék a felidézést, vagy olyan barátaink, akik velünk ellentétben felfogták volna, hogy miről van szó, akkor döbbenünk rá miért is van még szükség előadásokra és tanárokra az oktatásban.
A CSAIL Előadás- Böngészője (Lecture Browser) az ilyen szituációkban nyújt segítséget a diákoknak. "A legtöbb tanár felteszi előadásának videofelvételét a netre, de ha csak egy bizonyos dologra vagy kíváncsi, akkor végül majdnem az egész órát végig kell nézned azért az öt percért" - nyilatkozta Barzilay az MIT News-nak. A most kifejlesztett rendszer elkészíti a videofájl szöveges átiratát úgy, hogy az egyes szavak elhangzásuk időpillanatához vannak kötve. A keresőbe a szokásos módon csak a kifejezéseket írjuk be és a találati listában megjelennek a releváns előadások megfelelő szakaszai. Ezekre kattintva a videó lejátszón megnézhetjük az adott részt az átirattal együtt.
Az CSAIL algoritmusai 80%-os pontossággal tudják az előadások szavait helyesen beazonosítani. Természetesen a videomegosztó szájtok virágzása idején, és a digitális televíziózás hajnalán jelentős igény mutatkozik a piacon az ilyen, és ehhez hasonló alkalmazások kifejlesztésére. Az MIT technológiáját mégsem lehet egy az egyben alkalmazni ezeken a területeken. A kereső nagy találati arányának egyik kulcsa az, hogy az egyetemi előadások hangfelvételei általában jó minőségűek, nincs aláfestő zene, vagy egyéb háttérzaj a szöveg alatt, és egyszerre csak egy ember beszél rajtuk.
Az átírás után az Előadás-Böngésző elemzője szöveg-bányászati módszerekkel megpróbálja azonosítani az előadás szegmenseinek kulcsszavait. Megkeresi azokat a fontosabb szavakat, kifejezéseket, melyek többször fordulnak elő egymás után a szöveg egyes részein. A fejlesztők távolabbi célja, hogy a program ne csupán átírja az elhangzott szöveget, de ki is jegyzetelje azt, értelmes kivonatot készítve az elhangzottakból. Ha már nem kell a hallgatóknak bejárni az előadásokra, jegyzetelni se kelljen. Vizsgázni viszont mindenképpen a diákoknak kell az elhangzottakból.