Európa vesztésre áll a mesterséges intelligencia területén, de nem adja fel a harcot
További Tech-Tudomány cikkek
- Rongyként nyújtható és csavarható az LG új kijelzője
- Az élet keresése közben végezhetett a marslakókkal az amerikai szonda
- Itt a nagy dobás a 4iG-től: műholdakat állítanak Föld körüli pályára
- Minden eddiginél furább hibrid szörnyeteggel rukkolhat elő az Apple
- Hamarosan képtelenek leszünk kiszolgálni az adatközpontok energiaigényét
Az európaiak saját mesterségesintelligencia-chatbotjaik létrehozásán dolgoznak, hogy megakadályozzák, hogy az Egyesült Államokban gyártott technológia felfalja gazdaságukat, kultúrájukat és nyelvüket is – írja a Politico.
A lap kiemelte, hogy Madridtól Szófiáig az Európai Unió országai számos olyan kezdeményezést indítottak, amelyek célja olyan chatbotok létrehozása, amelyek valóban folyékonyan beszélik a helyi nyelveket.
A legújabb mesterségesintelligencia-technológiát támogató eszközök, mint például a ChatGPT, a nagy nyelvi modelleken, vagyis az LLM-en (large language modell) alapulnak.
Ezek olyan szisztémák, amelyek kísértetiesen emberszerű beszélgetésre képesek, ugyanis olyan mesterségesintelligencia-rendszerről beszélünk, amelyet hatalmas mennyiségű szöveges adaton – például könyveken, weboldalak tartalmán – tanítottak be, és képes nyelvi feladatokat, például szövegértést, generálást vagy fordítást végrehajtani.
Európa szerint Amerika mindent letarol
A 24 hivatalos nyelvvel rendelkező Európai Unió rájött arra, hogy mekkora lemaradásban állnak az Egyesült Államokkal szemben a mesterséges intelligenciában, így most arra törekszik, hogy a fellendülő és a mindennapokban egyre nagyobb szerephez jutó technológia a saját kulturális tartalmaival és anomáliáival gazdagodjon és működjön.
Mark Twainnak nem szabad kitörölnie Stendhalt
– mondta Bruno Le Maire francia gazdasági miniszter egy februári cannes-i technológiai rendezvényen.
„Nem akarunk megelégedni csak az angol nyelvvel. Továbbmenve, nem akarjuk, hogy nyelvünket gyengítsék az algoritmusok és az AI-rendszerek” – húzta alá.
A jelenlegi innovációs hullámot az Egyesült Államok vezeti a ChatGPT-t gyártó és a Microsoft támogatását magáénak tudható OpenAI-val, valamint a Google Gemini modelljével. Emellett az Anthropic, a Meta és Elon Musk xAI-ja úgyszintén versenyben van a vezető modellek megépítésében.
Európa megijedt, de teremhet még babér?
Az amerikai ipar sebessége megrémisztette az európai kormányokat, ugyanis attól félnek, hogy megismétlődik az amerikai cégek dominanciája, akárcsak annak idején a közösségi média és a Web 2.0 korában.
A kontinens azonban felvette a harcot, s az akadémiai vállalkozásoktól kezdve a kormány által szponzorált mesterterveken át a független kódolókig mindenki a kaliforniai techóriások ellen küzd. A Politico kutatása szerint csak az elmúlt egy évben 13 európai ország jelentett be konkrét eredményeket, vagy tett lépéseket a saját nyelvére összpontosító helyi modellek kidolgozása érdekében.
Ennek következtében többek között Svédország, Dánia, Finnország, Németország, Franciaország és Görögország állt elő konkrétumokkal, miközben Románia, Lengyelország és Olaszország több más ország társaságában még fejleszti a saját modelljének kialakítását. A közzétett ábra alapján Magyarország azon kisebbség táborát erősíti, ahol jelenleg nincs folyamatban semmilyen ilyen jellegű fejlesztés.
A meglévő vagy fejlesztés alatt álló projektek többsége nyílt forráskódú, hogy az önkéntes fejlesztők hatalmas közösségére támaszkodva pótolják az Egyesült Államokkal szembeni számítástechnikai és finanszírozási hiányosságokat. Ennek köszönhetően remény nyílt egy élénk helyi mesterségesintelligencia-gazdaság létrehozására.
Sokkal nagyobb a tét, mint sokan gondolják
Egyes országok, például Spanyolország esetében a saját nyelvű modellek segíthetnek növelni befolyásukat a világ kulturálisan és történelmileg összefüggő részein. Kiemelték, hogy Madrid, amely egy spanyolul beszélő LLM létrehozását finanszírozza a mesterséges intelligencia képzéséhez kiváló minőségű spanyol tartalom alapján, a feltörekvő technológiát a spanyol nyelvű amerikai országokkal való szorosabb együttműködés területeként tekinti.
A saját nyelvű LLM-ért folytatott tülekedés akkor következik be, amikor a kulturális ipar majd heves, kemény harcot folytat a technológiai cégekkel a kulturális tartalmakért, beleértve a filmforgatókönyveket, a médiaarchívumot, sőt a zeneművészek hanglenyomataival kapcsolatos szerzői jogokat is.
Eközben az amerikai cégek egyre agresszívabban nyomulnak előre. Az elmúlt hónapokban az OpenAI olyan nemzetközi médiamárkákkal kötött szerződéseket, mint az Axel Springer – a német nyelvű Bild és a Welt német lapok kiadója –, illetve a francia Le Monde napilap, annak érdekében, hogy kiváló minőségű „tanítási tartalmat” építsen fel külföldi nyelveken.
Franciaországban megkongatták a vészharangot
Az eset Franciaországban is megkongatta a vészharangot. Cannes-i beszédében Le Maire egy árszabályozott, európai egységes piac létrehozását javasolta a „tanítási adatok” számára, hogy megakadályozza, hogy az amerikai technológiai óriáscégek túllicitálják az európai mesterségesintelligencia-cégeket az értékes tartalom utolsó töredékéhez való hozzáférésért.
Franciaország élen járt az Alt-EDIC létrehozásában is, ami egy 12 országból álló EU-konzorcium, amely a blokkon belüli együttműködéssel foglalkozik az LLM-ek európai nyelveken történő fejlesztésével.
Hiába küzdenek azonban az európai országok az angol nyelv térhódítása ellen a mesterséges intelligenciában, ironikus módon ahhoz, hogy valóban versenyképesek lehessenek, az európai LLM-eknek továbbra is folyékonyan kell beszélniük az angol nyelvet, amely továbbra is a legtöbb tudományos közlemény nyelve a világon, és a világhálón található oldalak csaknem felének a nyelve.
A tanítási adatok mennyiségét és minőségét tekintve erő-kiegyensúlyozatlanság mutatkozik: nézzük csak meg, mekkora az angol Wikipédia a más más nyelvű verzióihoz képest
– mondta Sebastian Ruder, a kanadai székhelyű, többnyelvű mesterségesintelligencia-vállalat, a Cohere kutatója.
Veszteséges lenne minden modellt többnyelvűvé fejleszteni
Egyes USA-ban gyártott LLM-ek az angolon kívül más nyelveken is beszélnek, de nem mindig rendelkeznek a helyi felhasználók megfelelő kiszolgálásához szükséges jártassággal és árnyalati, jelentésbeli nüanszokkal.
Például megfelelő szintű udvariasságra van szüksége
– mondta Ruder, mindezt példával is illusztrálva. Szerinte a mesterséges intelligenciát meg kell tanítani az udvarias francia „vous” (ön) és az informális „tu” (te) névmások között különbséget tenni, hogy elkerüljék az idős francia felhasználók megsértését.
A chatbotok esetében, amelyeket arra terveztek, hogy teljes beszélgetéseket folytassanak mindenkivel, az ország polgáraitól a vállalat ügyfeleiig, ez problémákat okozhat. A University College London kutatóinak 2023. augusztusi „kulturális igazodási” értékelése megállapította, hogy az OpenAI és a Google LLM-modelljei többek között Kínában, Szaúd-Arábiában és Szlovákiában sem felelnek meg a kulturális normáknak.
Ahogy a mesterséges intelligencia beépül társadalmunk minden aspektusába, az ilyen kulturális összeütközések hatása jelentős lehet. Kris Shrishak, az Irish Council for Civil Liberties technológiai munkatársa szerint
egy amerikai technológiai vállalat megtaníthatja modelljét például litván nyelven, de ez veszteséges. Tehát általában angolul tanította, majd elvégzi a finomhangolást.
Ruder szerint a megoldás az, ha az európai mesterségesintelligencia-fejlesztők a saját nyelvükön és angolul is betanítják botjaikat, így az LLM anyanyelvén beszélve hozzáférhet az angol kódolású tudáshoz.