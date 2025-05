„A magyar nyelvű mesterségesintelligencia-rendszerek fejlesztése nemcsak technológiai kihívás, hanem nemzeti érdek” – mondta az Indexnek Palkovics László kormánybiztos arra reagálva, hogy példátlan kötelezettségvállalást ért el a Gazdasági Versenyhivatal a Microsofttal szemben; a techóriás 10 milliárd magyar szóból álló adatállományt készít mesterségesintelligencia-rendszereihez, amit más fejlesztők is szabadon használhatnak. Szűts Zoltán egyetemi tanár szerint ez a döntés kulturális mérföldkő is egyben.

Fontos, egészen messzire vezető bejelentést tett a Gazdasági Versenyhivatal (GVH), miután ismertette, hogy a magyar nyelv szempontjából történelmi léptékű kötelezettségvállalást ért el a Microsofttal szemben. Ehhez képest a GVH eljárása eredetileg annak vizsgálatára indult, hogy a szoftveróriás megfelelően tájékoztatta-e a magyar felhasználókat több mint két évvel ezelőtt, a 2023 februárjában elindított mesterségesintelligencia-alapú szolgáltatásáról.

A globális technológiai cég a nemzeti versenyhatóság fellépésének eredményeként egy átfogó kötelezettségvállalás végrehajtását kezdeményezte, amit a GVH versenytanácsa kötelezően elő is írt számára. Ennek lényege, hogy a Microsoft 10 milliárd magyar szón alapuló – megfelelően előkészített – adatállományon tanítja mesterségesintelligencia-alapú rendszereit, és az adatállományt más MI-rendszerek számára is felhasználhatóvá teszi. Alighanem kijelenthető, hogy ezzel az úttörő fejlesztéssel nagyságrendekkel javulhatnak a magyar nyelvű AI-alapú alkalmazások képességei.

Technológiai kihívás, ami nemzeti érdek

A magyar AI-mérföldkőként tekinthető GVH-tájékoztatás apropóján Palkovics László mesterséges intelligenciáért felelős kormánybiztost, illetve Szűts Zoltán egyetemi tanárt kérdeztük, aki az Eszterházy Károly Katolikus Egyetem Pedagógiai Karának dékánja, a Neveléstudományi Doktori Iskola, a Digitális Pedagógia modul és az Oktatási Innováció Tanszék vezetője.

A magyar nyelvű mesterségesintelligencia-rendszerek fejlesztése nemcsak technológiai kihívás, hanem nemzeti érdek. Ez a kérdés ugyanis túlmutat az informatikán: a digitális szuverenitásunk, a nyelvi kultúránk megőrzése, sőt gazdasági versenyképességünk is múlik rajta

– mondta az Indexnek Palkovics László. Kifejtette: a magyar nyelv komplex, kevesen beszéljük, a nagy nyelvmodellek fejlesztői nem erre optimalizálnak. Éppen ezért továbbra is fontosnak tartja, hogy saját nyelvi MI-képességeket építsünk ki. Bizonyítékaként annak, hogy mások is így gondolkodnak, Magyarországon több helyen történtek nyelvimodell-fejlesztések és megoldások, amelyekre kiemelt figyelmet fordítanak.

A kormánybiztos szerint a nemzeti adatvagyon – megfelelő szabályozás mellett – komoly versenyelőnyt jelenthet. Ehhez viszont nem elég a technológia: tudatos stratégia, hosszú távú gondolkodás és együttműködés is szükséges. Meggyőződése, hogy a mesterséges intelligencia nem veszélyforrás, hanem lehetőség – de csak akkor, ha az elérhető nemzetközi megoldások mellett van hozzá saját tudásunk, saját rendszerünk, saját nemzeti nyelvi modellünk is.

Palkovics felhívta a figyelmet: a kis nyelvek – így a magyar nyelv is – valós versenyhátrányban vannak a globális MI-fejlesztéseknél. A nagy nyelvi modellek elsősorban az elterjedten használt nyelvekre fókuszálnak, az ezeken elérhető adatokat használják a tanítás során, és ha nem cselekszünk tudatosan, a mesterséges intelligencia korszakából a magyar nyelv csak „fordításban” vesz majd részt. „Ez nemcsak a nyelvi komplexitásunkat érinti, de kihat a kultúránkra és történelmünkre is, hiszen a nagy nyelvi modelleknek az idegen nyelven rendelkezésre álló, az adott kultúrában elterjedt történelmi és társadalmi nézetet tanítják meg és azokat integrálják” – érvelt.

Az első és legfontosabb eszköz a nemzeti adatvagyon tudatos hasznosítása. A magyar nyelvű szövegek, hivatalos dokumentumok, tudományos anyagok, oktatási tartalmak mind-mind olyan kincs, amelyre saját nyelvi modelleket lehet építeni. A második kulcstényező: a regionális együttműködés. Mi, közép-európai országok, hasonló nyelvi helyzetben vagyunk: kisebb nyelvekkel, kevesebb adatforrással. Ezért további együttműködések és szinergiák feltérképezésére és kialakítására van szükség. A harmadik pedig a célzott támogatási programok – különösen a kutatás és innováció területén.

A kormánybiztos kiemelte: a magyar MI-stratégia keretében már elindítottak olyan kezdeményezéseket, amelyek közvetlenül támogatják a nyelvi technológia fejlesztését, nemcsak tudományos szinten, hanem alkalmazásorientált megközelítéssel is. „Ha nem építünk saját nyelvi MI-képességeket, akkor mások döntik el helyettünk, mit jelent a magyar nyelv és kultúra a digitális térben” – fűzte hozzá.

Gazdasági növekedés mesterséges intelligenciával

A magyar mesterségesintelligencia-stratégia lényege Palkovics László szerint világos: azt akarják elérni, hogy Magyarország a mesterséges intelligencia alkalmazásával érdemi gazdasági növekedést és társadalmi előnyt teremtsen, amely világosan kitűzi az elkövetkező időszak feladatait. Ezek központjában az alkalmazások, a mindenki számára használható és hasznos megoldások fejlesztése áll. „Az MI azért fontos, mert hatékonyabbá teszi a közigazgatást, az ipart, az oktatást, az egészségügyet. Ha jól használjuk, az MI nem vesz el munkahelyeket, hanem átalakítja azokat – és segít ott is, ahol munkaerőhiánnyal küzdünk” – fogalmazott a korábbi innovációs és technológiai, majd technológiai és ipari miniszter.

A stratégia három alappillérre épül:

A nemzeti adatvagyon tudatos hasznosítása – Magyarország adatban gazdag ország, de ez az érték akkor válik hasznossá, ha strukturáltan, jogilag rendezett módon használjuk fel a hazai MI-rendszerek fejlesztéséhez. A humán képességek fejlesztése – Az MI-vel kapcsolatos oktatást nem lehet elég korán kezdeni. Már az óvodai szinttől építeni kell az MI-értést, hogy a következő generációk ne féljenek ettől a technológiától, hanem értő módon használják. A technológiai infrastruktúra megerősítése – Magyarország ma már ott van a szuperszámítógépek nemzetközi térképén. Akár egy magyar kkv is hozzájuthat nagy számítási kapacitásokhoz – ez demokratizálja az innovációt.

Palkovics szerint olyan MI-megoldásokat kell fejlesztenünk, amelyek gyorsan és közvetlenül hasznosulnak: például a közlekedésirányításban, az egészségügyi területen, a közigazgatásban vagy akár a gyártásautomatizálásban. És még egy fontos elem a szabályozás és etika kérdése. A mesterséges intelligenciát csak akkor tudjuk fenntartható módon hasznosítani, ha világos keretek között, átláthatóan és felelősen működik. Ezért a stratégia kiemelten foglalkozik az etikai, jogi, társadalmi dimenzióval is. A kormánybiztos rámutatott: a magyar MI-stratégia célja az, hogy ne csak felzárkózzunk, hanem bizonyos területeken élen járjunk. „Megvannak az adottságaink, az intézményeink, a partnereink, célunk pedig, hogy a lehetőségeket eredményekké alakítsuk.”

Az aktuális Microsoft-ügyre szűkítve a kört Palkovics László úgy fogalmazott: a Gazdasági Versenyhivatal által elért kötelezettségvállalásoknak kulcsszerepe van abban, hogy a mesterséges intelligencia és más új technológiák alkalmazása átlátható módon történjen Magyarországon, és a nagy cégek az üzleti érdekeik képviselete mellett megjelenjenek a közösségi felhasználások támogatása területén is.

Erre már van jó példa az MI területén Magyarországon: az OTP egy korábbi állami támogatás kapcsán előremutató módon felajánlotta az általa kifejlesztett, jelenleg a legnagyobb magyar eredetű korpusszal rendelkező LLM-et térítésmentes közösségi – kutatási, oktatási, kulturális stb. – felhasználásra

– jegyezte meg a Széchenyi-díjas gépészmérnökből lett politikus, akinek meggyőződése, hogy a digitális korszakban a nemzeti érdekek nemcsak gazdaságilag, hanem technológiailag is érvényesíthetők – és ezt a GVH által elért vállalások előremutatóan bizonyítják. Az ilyen módon tett technológiai vállalások az egész közösség, így természetesen az érintett cégek számára is hosszú távú stratégiai előnyöket jelentenek, mivel jelentősen hozzájárulnak az MI-kultúra hatékony használatához és terjesztéséhez.

A Microsoft által vállalt intézkedéseket Palkovics úgy értékelte, hogy a 10 milliárdos szókészlettel rendelkező korpusz jelentősen hozzá fog járulni a magyar nyelv, a magyar kultúra, a hazai specifikumok nemzetközi és itthoni alkalmazásainak a fejlesztéséhez. A tény, hogy ezt az adatállományt a Microsofton kívül közösségi célú felhasználásra is rendelkezésre bocsátják, úttörő jelentőségű, hiszen a hazai MI-kutatóhelyek, egyetemek, nemzeti laborok a kutatásaikban szabadon használhatják. A hazai specifikus alkalmazásokon kívül ez az adatbázis már lehetőséget teremt arra is, hogy a magyar nyelv szerkezetében fellelhető pl. szemantikai egyediségeket más, ezeken túlmutató, nemzetközi kutatásokat is megalapozzon. A kormánybiztos szerint ez annak a jele, hogy nem követői, hanem alakítói is lehetünk a jövő digitális MI-re épülő világának.

Kihívás a magyar kulturális örökség megőrzése

Szűts Zoltán egyetemi tanár a Microsoft-kötelezettségvállalás apropóján arról beszélt az Indexnek, hogy a digitalizáció és a hálózatosodás az elmúlt 30 évben jelentős változásokat hozott a nyelvek ökoszisztémájában.

A digitális térben zajló kommunikáció sajátos nyelvi szókészletet és kreativitást is eredményez. A felhasználók folyamatosan nyelvi újításokkal élnek, ilyenek az egyedi szókészlet, a rövidítések, az emotikonok vagy éppen az emodzsihasználat. Ahogy egyre inkább kialakul egy digitális világfalú, a nagy nyelvek hatása egyre inkább érzékelhető. Az angol nyelv mind nagyobb teret nyer a kis nyelvek közösségeinek kommunikációjában, már csak azért is, mert az angol kifejezések használata könnyebbé teszi a megértést különböző anyanyelvű felhasználók között. Attól a folyamattól azonban, hogy a nyelv változik, nem kell megijednünk, gondoljunk csak a nyelvújításra, vagy az 1990-es évek informatikai kifejezéseket leíró változásaira.

Az Eszterházy Károly Katolikus Egyetem Pedagógiai Karának dékánja szerint a mesterségesintelligencia-rendszerek rohamos fejlődése a magyar kulturális örökség megőrzésében új, nagyon komoly kihívásokat okoz, miközben egyben lehetőséget is teremt arra, hogy a gépi tanulás eszközeinek köszönve rendszerében is könnyebben megismerhessük a magyar nyelvet.

Palkovics Lászlóhoz hasonlóan Szűts Zoltán is rávilágított, hogy a kis nyelvek komoly hátrányban vannak az angol szövegeken tanított MI-k korában, de nem csak a nyelvek, hanem a kultúrák, történelmek és nemzeti narratívák is. Úgy véli, az a mesterséges intelligencia, amely angol nyelvű szövegeken tanul, nemcsak szavakat, hanem az adott nemzet vagy birodalom szempontjából fontos világmagyarázatokat, narratívákat is magáévá teszi.

Éppen ezért hogyha egy magyar felhasználó a világban zajló geopolitikai vagy gazdasági folyamatok megértésében kér segítséget az MI-től, az angol nyelvű szövegekből, képekből és egyre inkább videókból kapott válasz nem a magyar közösség történelmébe vagy hagyományaiba lesz ágyazva. Példaként felhozta: a reformkort, a forradalom és szabadságharcot vagy a rendszerváltást egy amerikai vagy éppen kínai AI másképp értelmezi, mint egy magyar nézőponton oktatott intelligencia. Így nem csupán a magyar nyelv, de a kulturális örökség és a nemzeti hagyomány is versenyhátrányba kerülhet.

A mesterséges intelligencia támogatásával zajló, valós idejű gépi fordítás rövid távon kényelmes a felhasználók számára, és azonnal alkalmazható tudást jelent. Hosszú távon azonban ahhoz vezet, hogy a magyar nyelv elválik a kultúrától, művészettől, történelemtől. Hogyha csak az azonnali fordításon van a hangsúly, a magyar bor, a szecesszió vagy éppen a 20. század tudományát meghatározó »Marslakók« megismerése kimarad majd a nem magyar anyanyelvűek megismerési folyamatából

– mondta lapunknak az egyetemi tanár.

Hatalmas eredmény a Microsoft vállalása

Kitérve a GVH-eljárás eredményeire, a média és a digitális pedagógia területének kutatója szerint az, hogy a Microsoft ilyen hatalmas magyar szavakon alapuló adatállományon tanítja mesterségesintelligencia-alapú rendszereit, hatalmas eredmény. Nem csupán a felhasználók számára jelent majd segítséget akkor, amikor a géppel (mesterséges intelligenciával) beszélgetnek, vagy amikor az MI-t használják tudásszerzésre, hanem a döntés lehetővé teszi, hogy a magyar nyelvet ezen a hatalmas adatbázison keresztül archiválják a jövő számára.

Az 1990-es évek óta, amióta a világháló és a számítógépek beépültek a világunk alrendszerébe, a magyar kultúra és a nyelv számára kihívást jelent a nemzeti örökségünk archiválása. A magyar állami szervezetek ugyanis már csak az anyagi lehetőségeik miatt sem képesek felvenni a versenyt a nagyvállalatokkal. A most elért eredmény visszafordíthatja azt a folyamatot, amelynek során például a Google Translate vagy a Deepl nemcsak kiváltotta a magyar nyelvű fordítóprogramokat, hanem a fejlesztésüket is jelentősen visszavetette

– fogalmazott lapunknak Szűts Zoltán. Végezetül aláhúzta: a magyar nyelv megmaradásához és gazdagságához nem csupán magyarul beszélő, de magyarul gondolkodó Bingre, ChatGPT-re vagy Geminire van szükségünk.

A GVH-eljárás – és ami mögötte van

Érdemes felidézni, mindez onnan indult, hogy a szoftveróriás 2023 februárjában integrálta a – ChatGPT-hez hasonló – mesterséges intelligencián alapuló chatfunkciót Bing nevű keresőrendszerébe, ami a keresőfelületen segíti a kérdések megválaszolását, gépi tanulásához felhasználva a felhasználók által megosztott tartalmakat, adatokat és információkat is. A hazai versenyhivatal szerint azonban a cég vélhetően nem az észszerűen elvárható szakismerettel, illetve szakmai gondossággal tájékoztatta a fogyasztókat a szolgáltatással kapcsolatban.

A mostani kötelezettségvállalással a GVH úgy ért el érdemi eredményt, hogy közben sem jogsértést, sem annak hiányát nem állapította meg. A szolgáltatás szabályzatai, felhasználói tájékoztatói nagy terjedelműek, széttöredezettek és helyenként ellentmondásos tartalmúak voltak, egyes esetekben pedig csak angolul voltak elérhetőek, ugyanakkor a vállalkozás az eljárás tárgyát képező gyakorlatán az eljárás megindítását követően változtatott, időközben a mesterséges intelligenciával kapcsolatos fogyasztói ismeretek is bővültek, továbbá a vállalkozás egy komplex kötelezettségvállalási csomagot nyújtott be, amely tovább segíti a magyar nyelvű mesterséges intelligencia képességeit és az azzal kapcsolatos fogyasztói értelmezés közötti összhang megteremtését.

A kötelezettségvállalás keretében a Microsoft jelentősen bővíti, fejleszti a magyar nyelven elérhető, mesterségesintelligencia-alapú alkalmazásait.

A cég ehhez egy legalább 10 milliárd magyar szót tartalmazó adatbázist hoz létre, és azt a további felhasználást lehetővé tevő módon „előfőzi” (tisztítási, deduplikálási, formázási, szűrési és egyéb adatelőkészítési technikáknak veti alá), majd integrálja a különböző mesterségesintelligencia-alapú rendszereibe. Viszonyításképp: az OpenAI ChatGPT rendszere mintegy 120-130 millió magyar szóból tanult. A cég azt is vállalta, hogy a fentiek szerint előkészített adatállományt más rendszerek számára is elérhetővé teszi, így más fejlesztők is felhasználhatják azt magyar nyelvű mesterségesintelligencia-rendszereik tanítására. Ezek a fejlesztések hozzájárulhatnak a magyar nyelvű alkalmazások pontosságának, megbízhatóságának javításához, lehetővé téve a még sokoldalúbb felhasználást is.

A cég azt is vállalta, hogy a GVH eljárásának eredményeként végrehajtott intézkedéseit aktívan kommunikálja, illetve számos edukációs lépést tesz, például képzéseket szervez magyar köztisztviselők, illetve kis- és középvállalkozások, valamint fogyasztók számára. Az oktatások és az azokról készült, a Microsoft által közzéteendő felvételek elősegíthetik a mesterséges intelligencia és az MI-alapú alkalmazások által nyújtott lehetőségek és kockázatok jobb megismerését, megértését, ezáltal biztosítva, hogy a fogyasztók reálisabban ítélhessék meg a mesterséges intelligencia képességeit, értékeit, veszélyeit.

Nem a Microsoft az első lyuk a GVH övén, ami a nagy globális technológiai cégeket illeti. A versenyhivatal az elmúlt években többek között a Google, illetve a PayPal számára is előírt versenykorrekciós kötelezettségeket, az Apple és a Booking.com pedig jelentős versenyfelügyeleti bírságokat fizetett Magyarországon. Emlékezhetünk, a hatóság eljárás alá vonta a Wisht és a Vibert, de vizsgálta a TikTokot is.

(Borítókép: Németh Emília / Index)