Mennyire veszélyes a ChatGPT és magyar testvére, a PULI?

További Tudomány cikkek

Prószéky Gábor nyelvésszel, programtervező matematikussal beszélgettünk a mesterséges intelligenciáról, a ChatGPT veszélyeiről és a nagy nyelvi modell magyar testvéréről, a PULI-ról.

Mindenki hallott már a ChatGPT-ről, a mesterséges intelligenciának titulált nagy nyelvi modellről, ami állítólag veszélyezteti munkahelyeinket, és átveszi az irányítást életünk felett. Könnyű ilyen apokaliptikus fantáziálásba sodródnunk, ha csak annyit tudunk, elkészült a „gép”, ami minden kérdésünkre választ ad, és úgy cseveg velünk, mint a szomszéd – aki, ha Einstein reinkarnációja, szinte minden kérdésünkre tudja a választ.

Veszélyes lenne? Korántsem. Tudatos? Dehogy. Érző? Kreatív? Nem és nem. A félreértések eloszlatása érdekében Prószéky Gáborhoz fordultunk, aki programtervező matematikus, nyelvész és a ChatGPT öccsének tekinthető magyar PULI-t kifejlesztő Nyelvtudományi Kutatóközpont vezetője.

Emberi modell

Amikor az OpenAI chatelőprogramja háromnegyed éve megjelent, senki sem gondolta, hogy ekkora siker lesz, és felrobbantja a mesterséges intelligenciáról és a számítógépekről, a robotokról alkotott korábbi véleményünket és tudásunkat. Ahogy Prószéky Gábor elmondja, „a ChatGPT2-t nem tették publikussá az álhírgeneráló képessége miatt, így többek közt ez a marketingfogás is segített megágyazni aztán a GPT3-ra épülő ChatGPT sikerének, ami igazi dialógusra képes az emberrel, és rengeteg ember bevonásával építették fel. Épp emiatt tud beszélgetni, mert igazi kommunikációs helyzetekben osztályozták a rendszer első reakcióit, amiket megtanult. Aztán az így okosított rendszer reakcióit ismét osztályozták, és így tovább...”

Egyre jobbak a modelljeink, de tőlünk tanulnak, alapvetően nem tudnak újat kitalálni, viszont nagyon jól alkalmazzák a megtanult mintákat, csak emberi értelemben nem intuitívak. Nincs szándékuk sem.

Ahogy Prószéky részletezi, akár a felhasználó is le tudja szűkíteni a témát, ilyenkor az az érzésünk, mintha tematikusan értené, amit akarunk, de nincs ebben semmi varázslat, csak egyetlen ember által felfoghatatlan mennyiségű adatról, szövegről van szó.

Valójában a szoftver nem „érti”, amit produkál, de amit létrehoz, az nagyon meggyőző, és azért is lehet népszerű, mert válaszaival „emberszerűen” segít. Gyakran felmerül, hogy a ChatGPT többek közt a fordítókat is nehéz helyzetbe hozta, hiszen talán már nem is lesz szükség rájuk, de Prószéky Gábor szerint ez tévedés.

Fordításnál is csak a mechanikus fordításban tud segíteni, műfordítást nem tud készíteni, mivel nem emberi módon kreatív. Jól dolgozik, de azért valakinek ellenőriznie kell ezeket a munkákat. A gépi fordítás tökéletesítése miatt az utóbbi időben az ún. utószerkesztést támogató, a szövegek hatékony javítását célzó, új típusú szoftvereszközök létrehozása felé tolódott el a hangsúly.

És ha már fordításról van szó, a fordítóképzésben érdekelt tanárok panaszkodnak, hogy nehéz kiszúrni, ember vagy a ChatGPT csinálja meg a leckét, de Prószéky azt mondja, szemléletváltással ez is orvosolható: adjon másmilyen feladatot a tanár, például a diákok keressék meg a ChatGPT fordítási hibáit, vagy legyen magasabban a léc, ha nem lehet kiküszöbölni a gép közreműködését.

Mi van a jogokkal?

Prószéky Gábor azt mondja, a plágium tudatos tevékenység, de itt nincs szó ilyesmiről. A létrejött szövegek, bármilyen furcsa, de egyediek: a ChatGPT textusait pontosan így soha nem írta még le senki. A rendszer ugyanis nem másolja a szöveget, mikor létrehozza őket.

A nagy nyelvi modellekben nincs egyáltalán szöveg, csak számok, rákövetkezési valószínűségek, amik azt jelzik, mekkora az esélye annak, hogy egy bizonyos szósorozat végén megjelenjen valamely újabb szó.

A legfrissebb hírt, miszerint a The New York Times beperelte az OpenAI-t az újság szövegeinek eltulajdonítása és felhasználása miatt, úgy kommentálta, hogy a ChatGPT nem direktben használja fel az újság szövegeit, csak a bennük levő nyelvi egységek lehetséges sorrendjeinek valószínűségeit változtathatja meg egy-egy újabb konkrét szöveg. „Minden szó máshonnan jön, minden szó önmaga jogán áll ott, és a szó utáni másik szó valószínűsége ugyanúgy nem védhető, ahogy maga a szó sem.”

Olykor kamuzik

A ChatGPT egész tudása a 2021 szeptembere előtti időszakra vonatkozik, mégis mindig válaszol.

Vicces látni, hogy tudjuk, a nyelvmodell adott esetben, mondjuk, egy mai jelenségre kérdezve nem tudja a választ, de akkor is kivágja magát. Magától számolni sem tud, de mehet neki az összeadás, ha arra példákon keresztül külön megtanítottuk.

Amit mond egy nyelvi modell, az nyelvi fordulatokból áll, azaz lehetséges nyelvi megnyilvánulásokat tud – igen magas szinten – újraalkotni, mást nem. Amikor azt mondjuk, hogy hallucinál a ChatGPT, az azért van, mert nekünk van egy világképünk, neki meg nincs, csak nyelvi, így nem tudhatja, mit is jelent az a való világban, amiről nyelvi állításokat tesz.

A mi kutyánk kölyke: PULI

Ahogy Prószéky elmondja, a nagy nyelvi modellek, mint a GPT vagy a PULI, a megtanult szövegek tartalmából egy nyelvi világot építenek fel. Ha a tanítóanyagban magyar szövegek is vannak, akkor abból a modell megismerheti a ragozásunkat vagy a magyar szórendet, ezért tud a ChatGPT magyarul is, de specifikus magyar tartalma, kulturális témái nincsenek. Így lehetett létjogosultsága a PULI-nak. „Nyelvi szinten az elérhető legnagyobb magyar szövegállományból tanult, de még nem »finomhangolták« a dialógushelyzetekre, ahogy a ChatGPT-t, viszont követve annak fejlesztési lépéseit, most már elég sok nyelvi instrukciót is tud, amit a PULI-alapmodell még nem tudott.”

A PULI komplex neurális hálózat, ami előtt most megnyílt a lehetőség, hogy »összebarátkozzon« hazánk legnagyobb szuperszámítógépével, a Komondorral. Hozzáférést kaptunk, így hamarosan létrejöhet egy újabb, nagyobb kapacitású PULI-változat is, hiszen a nagyobb gépen való modellépítés esetén a paraméterek nőnek, így gazdagabb tudású háló építhető.

Ahogy elmondja, a Komondoron szélesedik a paletta, az alap-PULI 30 milliárd szónyi folytonos szövegből tanult, most már 41 milliárd fölött járnak. És mivel a világismeretét bővítheti más nyelvű szöveg is, ezért tanították angol és kínai szövegen is, amiknek az együttes mennyisége 200 milliárd szó fölött van már, azaz „a PULI-GPTrio tanulóbázisa akkora, mint a ChatGPT-é volt. A mi rendszerünk még nem elég komplex, de a fenti méretek miatt igen nagy tudású: a PULI a tanítóanyagok szintjén beérte a nagyokat, ám magyartudás szintjén sokkal-sokkal jobb”.

(Borítókép: Prószéky Gábor. Fotó: Németh Kata / Index)

5 könyv
Több mint 600 meghökkentő, érdekes és tanulságos történet!

MEGVESZEM

Az oldalról ajánljuk

Külföld

Florida lazítana a gyerekmunkára vonatkozó törvényen

Ezzel szeretnék leváltani a papírokkal nem rendelkező munkavállalókat.

március 26., 08:15

Külföld

Nem tartott sokáig a fekete-tengeri tűzszünet, több ukrán drón is behatolt az orosz területekre

A rijádi megállapodás ellenére csaptak le.

március 26., 08:34

Kultúr

Mi van, ha a borzalom bennünk van, nem pedig odakint?

Az És miért, hogy az éjszaka lesújt, feldob és energetizál.

március 26., 07:45

Belföld

Meghalt Wachsler Tamás volt országgyűlési képviselő, a Kossuth tér megújításának irányítója

Az építész novemberben lett volna 60 éves.

március 26., 08:20

Külföld

Nem hagyja magára feleségét, J. D. Vance is Grönlandra látogat

A sziget biztonsági helyzetét vizsgálják.

március 26., 07:54

Belföld

Nem ért haza az iskolából egy 17 éves budafoki lány

A rendőrség jelenleg is keresi az eltűnt diákot.

március 26., 07:50

Kultúr

A két család csak néhány buszmegállóra lakott egymástól

Más okból, de mindkettő hallgatott.

22 perce

Külföld

Légitámadást intéztek egy amerikai hadihajó ellen a jemeni húszik

A támadásokkal nem fognak felhagyni addig, amíg a gázai háború véget nem ér.

március 26., 08:58

Külföld

Pataky Attila elmondta, mit gondol valójában Azahriah-ról

A rocker szerint a fiatal előadó nem figyelt a suliban, ezért keveri a diktatúrát és szabadságot.

március 26., 07:42

Külföld

Nagyszabású hekkertámadás érte az egyik legnagyobb orosz vállalatot, teljes a káosz a cégnél

március 26., 06:12

Belföld

Törvényjavaslattal tiltaná ki a középületekről a szivárványos zászlókat Novák Előd

A Mi Hazánk Mozgalom korábbi próbálkozása nem járt sikerrel.

március 26., 07:16

Külföld

Huszonkettőre emelkedett a dél-koreai erdőtűz halálos áldozatainak száma

Az oltást nehezíti az erős szél.

március 26., 06:45

Belföld

Steiner Kristóf: Nem hiszem, hogy ennek az országnak szüksége van rám

Hadházy Ákos: Követeljük, hogy ezt a mocskos törvényt visszavonják.

március 26., 09:23

Külföld

Donald Trump tanácsadója felelősséget vállalt a háborús tervek kiszivárogtatásáért

Nem csitul a botrány Mike Waltz körül.

március 26., 09:17

Tudomány

Magyarországon élő kannibál kígyót vizsgált egy új tanulmány

A rézsikló nem jelent fenyegetést a veszélyeztetett viperafajra.

március 26., 06:16

Forma-1

Döntött az F1-es Red Bull gyengélkedő pilótájának sorsáról

A címvédőnek sem tetszett az elhatározás.

március 26., 09:16

Belföld

Magyar Péter bizarr videóval küldött üzenetet kritikusainak

Vicces jelenet került ki az ellenzéki politikus közösségi oldalára.

március 26., 09:08

Külföld

Dániában a nők számára is bevezetik a sorkatonaságot

Az EU-ban eddig csak Svédországban volt hasonló.

március 26., 07:00

Külföld

Folytatódnak a törökországi tüntetések, már 1400 embert tartóztattak le

Több jogvédő csoport és az ENSZ is elítélte a rendőrök erőszakos fellépését.

március 26., 06:39

Külföld

Scotland Yard: nem bűncselekmény okozta a Heathrow repülőteret megbénító tüzet

A Heathrow-t 18 órára lezárták, és 63 ezer környékbeli lakás is áram nélkül maradt.

március 26., 06:23

Futball

Monumentális mészárlás a Monumentalban, Messi nélkül is szétszedték az ötszörös világbajnokot

Argentína már kijutott a jövő évi vb-re.

március 26., 06:30

Belföld

Jókedvet és esernyőket bekészíteni, borongós–esős időjárással kell dacolnunk

Napsütésre csak az ország északi, északnyugati részén lehet számítani.

március 26., 06:26

Belföld

Kamionról lehulló méretes jégtömbök okoztak kis híján balesetet az M7-es autópályán

Az eset könnyen okozhatott volna balesetet.

március 26., 06:19

Külföld

„Az orosz propaganda megpróbálja kihasználni a magyar politikai helyzetet”

A VOX Ukrajina ügyvezető igazgatóhelyettese nyilatkozott az Indexnek.

március 26., 06:19

Cinematrix

Megérkezett az egyik legjobban várt Star Wars-sorozat új évadának kedvcsinálója

Az Andor második, egyben utolsó évada is bővelkedni fog az izgalmakban.

március 26., 06:21

Belföld

Ideiglenesen szünetel a szülészeti ellátás a kisbéri kórházban

A „személyi feltételek átmeneti hiánya” miatt.

március 26., 06:18

Belföld

Lázár János utódja szerint Makón a libák őrzését sem bíznák Magyar Péterre

„Komolyan aggódom Hódmezővásárhelyért, ahol évek óta a gyűlölet uralkodik.”

március 26., 06:22

Belföld

Biztonsági őr akadályozta meg, hogy bejusson a rabbi a Kazinczy utcai zsinagógába

március 26., 08:46

Infó

Strapabíró kialakítás, időtálló teljesítmény

március 26., 00:02

Külföld

Dél-Koreában már legalább 22 halálos áldozata van az erdőtüzeknek

március 26., 06:25

Bookline

Daisy Wood
A windsori kastély könyvtárosa

5391 Ft

Tamara Rosier Phd
Másként huzalozva - Életvezetés és érzelemkezelés ADHD mellett

3951 Ft