További Tudomány cikkek
- Megtalálták a másnaposság felelősét, de nem az, amire eddig gyanakodtak
- Ha nincs vérfrissítés, jönnek a bajok
- Magas rangú katonatiszt tűnt fel a világ legnagyobb hadseregében, de még mindig rejtély, ki irányítja őket
- Végre tényleg megoldódhatott Stonehenge rejtélye
- Még mindig mérgező az 1916-os verduni csata helyszíne
„Amikor európai netezők a fukusimai atomkatasztrófának az energetikai piacra gyakorolt hatásairól beszélgetnek a fórumon, akkor ezt jellemzően nyelvileg szeparált közösségekben teszik. Amit az internet összeköt, azt a használók nyelvi korlátai még mindig szétválasztják. Ez vajon mindig így lesz?” – teszi fel a kérdést A magyar nyelv a digitális korban című fehér könyv, melynek megjelenése volt az egyik apropója a magyar nyelv jövőjéről rendezett konferenciának.
A fentihez hasonló témákról beszélgettek a nyelvészek a magyar nyelv napja és a magyar tudomány ünnepe alkalmából a Magyar Tudományos Akadémia Nyelvtudományi intézetében rendezett konferencián. Az egybegyűltek között nem volt tökéletes egyetértés a fő témában: mi lesz a magyar nyelvvel a digitális korban? Volt, aki a lemaradást a nyelvhalálhoz hasonlította, mások szerint természetes folyamatról van szó, a nyelv életképességét pedig úgyis megőrzi a mögötte lévő közösség – vagy nem.
A nyelvészek szerint a digitális kultúrában is meghatározó elem marad az emberi nyelv mint a természetes emberi kommunikáció alapja, ahhoz azonban, hogy ez normálisan működjön, összetett technológiára van szükség, melynek jó része még az angol nyelv számára sem elérhető. Aki lemarad, az viszont kimarad: a világ hatezer nyelve közül a becslések szerint legalább kétezer nyelv kihal a digitális korban, a következő évszázadokban, mások pedig megmaradnak a családok és ismerősök közötti nyelvnek, elvesztik azonban szerepüket az üzleti életeben és a tudományos szférában.
A konferencián összegyűlt nyelvészek szerint a nyelvtechnológiának nevezett tudományág egyik központi feladata a nyelvi korlátok lebontásának támogatása, ez a digitális tartalmak létrehozásának segítését (például nyelvhelyesség-ellenőrzéssel) valamint a nyelvek közötti közvetítést (például gépi fordítással) jelenti. Ebben bőven elkél a támogatás az amúgy is kissé speciális helyzetben lévő magyar nyelvnek, amely a beszélők száma alapján nagynak számít, a befolyás tekintetében viszont kicsinek.
Mit ér a nyelv, ha magyar?
A becslések szerint a magyar nyelvet 13 millióan beszélik, ezzel a 12. helyen áll Európában. Legtöbb európai nyelv az indoeurópai nyelvcsaládba tartozik, a magyar viszont a nyelvtudomány mai állása szerint a finnugorba, legközelebbi rokonai pedig a hanti és a manysi.
A nyelvészek szerint a hétköznapi beszélgetésekben felmerülő, túlzott angol hatás miatti félelem viszonylag alaptalan, hiszen nyelvünk már több másik nyelv (latin, német) erőteljes hatását túlélte. Valójában nem az anglicizálódás miatt kell aggódnunk, hanem inkább attól félhetünk, hogy a magyar nyelv több területről kiszorul. Egy nyelv státusza pedig nemcsak attól függ, hányan beszélik, hanem attól is, mennyire van jelen modern világunkban, az interneten, a pc-s szoftverekben, vagy éppen a mobilappokon. A digitális funkcióvesztés pedig már érezhető.
Megmentőink a Wikipedia és az Apple
Kornai András, a Magyar Tudományos Akadémia Számítástechnikai és Automatizálási Kutatóintézetének (SZTAKI) tagja azokról az eszközökről beszélt, amelyek jó alapot adhatnak a nyelvek digitális túlélési esélyeinek becsléséhez. A szakember kutatási alapján csoportokba sorolta a nyelveket. A „biztos digitális jövőjű” nyelvek közé sorolta azokat, amelyeknek a beszélői szinte hátradőlhetnek.
A definíció alapját az Apple adta: Kornai úgy definiálta az ilyen nyelveket, mint amiket a cég támogat, mivel digitális térben ennek a cégnek a termékei presztízsértékűek. „Ha egyszer az Apple a nevét adja valamihez, az tényleg van" – fogalmazott a kutató. A kritériumok közé tartozik a teljes lokális támogatás, betűtípusok, helyesírási szótárak és beszédtechnológiai eszközök. Ezen a listán 17 nyelv található, a magyar nem.
Az „életképes nyelvek osztályát" a Wikipedián keresztül lehet megfogni. „Ha nincs Wikipedia, az maga a nyelvhalál" – fogalmazott a kutató. Azok a nyelvek, amelynek a beszélői olyan gyengék, és annyira távol vannak a világtól, hogy nem képesek egy Wikipediát összedobni, lényegében halottak.
Nem egyformák azonban a Wikipediák. A karakterszám nem megfelelő mérési eszköz, mivel a világon nem mindenhol hangjelelő írást használnak. Sőt, sok a hamis lap is, amely automatikus folyamatokkal generált szövegeket jelent ebben a vizsgálatban. A magyar nyelvvel egy szinten van például szócikkek számában a volapük mesterséges nyelv, azonban bejegyzéseinek többsége géppel létrehozott tartalom. Vannak ezen kívül határeset nyelvek is (90 darab), amelyekről az eddigi információk alapján nem lehet eldönteni, hogy túlélik-e a következő évszázadokat. Érdekesség, hogy több halott nyelvnek is fejlődő Wikipédiája van.
A szótár olyan, mint a lovaskocsi
Prószéky Gábor, a digitális nyelvi megoldásokat fejlesztő Morphologic ügyvezető igazgatója szerint a digitális kor egyik nagy problémája, hogy a szótárak még mindig olyan szinten mozognak, mint az első autók, amelyek gyakorlatilag annyiból álltak, hogy a lovaskocsi elejére, a lovak helyére Benz betette a motort.
Szerencsére már látható a fejlődés, amelyben Magyarországon egész jól áll, épp a Nyelvtudományi Intézetben folyik kutatás arról, hogy kell a webről szótári információt kinyerni. A fejlesztésekhez azonban pénz kell, ráadásul a kiadók még mindig a régi típusú szótáraknál tartanak. „A magyar nyelvet más rajtunk kívül nem fogja támogatni, mert ez egy kulturális kérdés” – véli Prószéky. Már most is látható, hogy nem adnak ki szótárakat kisebb nyelveken, mert üzletileg nem éri meg. Összességében a magyar nyelvről elmondható, hogy már kész egy egész jó technológia, a tartalom viszont kissé hiányos a digitális kor igényeihez – egyetlen hivatalos nyomtatott szótár sem követi például a szlenget.
A szótárazás mellett a másik fontos digitális nyelvet érintő terült a gépi fordítás. Az egész keveredik a szótárakkal, azok fordítanak: a statisztikai alapon működő fordítók egyelőre csak szavakat raknak egymás mellé, ezek csak nyersanyagnak használhatók. Szűk rétegekre, péládul csak a gyógyszeriparra jó fordítást adnak ezek a típusú programok, azonban az interneten nem lehet így szűkíteni. A szakterületeken kellene eladni, de inkább kivárnak, és nem támogatják az ilyen irányú fejlesztéseket.
Unokáink is magyarul neteznek majd?
Egy nyelv túlélése a digitális korszakban a szakemberek szerint nagyrészt attól függ, hogy mennyire képes kiszolgálni a digitális alkalmazásokat igénylő és használó társadalmat. A magyar nyelvet aktívan kell támogatni a digitális túlélés érdekében Nem kis feladatról van szó: meg kell teremteni digitális nyelvi erőforrások, például a nyelvtani és tartalmi elemző, jelentésfelismerő, gépi szövegfelolvasó, beszédfelismerő, dialógustervező rendszereket. Ezek nélkül egy nyelv nem képezhető le a társadalom új, digitális kommunikációs színtereibe.
Nem állunk azonban rosszul. Ugyan a húzótényezőnek tekintett Apple intelligens, viszont közel sem tökéletes beszédfelismerője nem támogatja a magyar nyelvet, de talán nem is vesztünk ezzel olyan sokat, hiszen a Google Android már egész szépen ért magyarul is. Elsők között támogatta nyelvünket a Google Translate, és magyar vezetéssel valósult meg az uniós fordítóprogram, az itranslate4.eu. Magyarország pedig átfogó nyelv- és beszédtechnológiai stratégiával rendelkezik, ezért, bár a megvalósítás akadozik kissé, bátran kijelenthetjük, hogy unokáink sem valamilyen közvetítőnyelven használhatják majd az internetet.