Árpád
3 °C
12 °C

Holt nyelveket támaszt fel egy algoritmus

2013.02.12. 12:24

A nyelv állandóan változik: a szavak átalakulnak, a hangzás megváltozik és új nyelvek születnek a régiekből. A változás folyamatát általában régi nyelvemlékek vizsgálatával és elemzésével követhetjük nyomon, de ez lassú munkát eredményez. Egy most fejlesztett, holt nyelveket rekonstruáló algoritmussal a számítógépet is bevonnák a munkába. A program ehhez azt az információt használná föl, amit a nyelv modern változatát beszélő emberektől hallana.

A vancouveri British Columbia Egyetem kutatásvezetője, Alexander Bouchard-Côté munkatársaival együtt fejlesztette ki a gépi tanulásra alkalmas algoritmust. A program felismeri a hangtani változásokból fakadó nyelvi divergenciát, és különbséget tesz az egyes szavakban használt hangok és hanglejtések között. Bouchard-Côté példaként az „about” (-ról, -ről) szót hozta föl, amit Kanadában inkább „aboot”-nak ejtenek – ez a lingvisztikai sajátosság is egy ismert nyelvi átalakulás, amit Canadian Shift néven emlegetnek.

A kutatócsoport az általuk fejlesztett algoritmust arra használja, hogy több ezer, az ausztronéz nyelvcsaládban használt szópárosítást elemezzenek vele. A rendszer azt is megbecsülheti, hogy egy ősi nyelvnek milyen hangzása lehetett és azt is azonosítani tudja, hogy melyik hangok változtak meg a legnagyobb valószínűséggel. Amikor a kutatók összehasonlították az eredményeket a nyelvészek munkájával, megállapították, hogy az algoritmus pontossága 85 százalék körül van. A szél szó megfelelője a modern fidzsi nyelvben például a „cagi”. Ezt, valamint a modern ausztronéz nyelvekben használt szót fölhasználva az algoritmus megbecsülte, hogy az eredeti szó a „beliu” lehetett, ami majdnem ugyanaz, mint a nyelvészprofesszorok által rekonstruált „bali”.