
Mennyire veszélyes a ChatGPT és magyar testvére, a PULI?

További Tudomány cikkek
-
Öt M-osztályú napkitörést regisztráltak, mágneses viharok jöhetnek
- Ha ezeket a tüneteket tapasztalja, ön is krónikusfáradtság-szindrómában szenved
- Dán tudósok kiderítették, van-e kapcsolat a tetoválás és a rák kialakulása között
- Naponta vagyunk a holdudvarhatás áldozatai, és még élvezzük is
- Sárga minirobot az új magyar találmány, ami a vizeket járja
Mindenki hallott már a ChatGPT-ről, a mesterséges intelligenciának titulált nagy nyelvi modellről, ami állítólag veszélyezteti munkahelyeinket, és átveszi az irányítást életünk felett. Könnyű ilyen apokaliptikus fantáziálásba sodródnunk, ha csak annyit tudunk, elkészült a „gép”, ami minden kérdésünkre választ ad, és úgy cseveg velünk, mint a szomszéd – aki, ha Einstein reinkarnációja, szinte minden kérdésünkre tudja a választ.
Veszélyes lenne? Korántsem. Tudatos? Dehogy. Érző? Kreatív? Nem és nem. A félreértések eloszlatása érdekében Prószéky Gáborhoz fordultunk, aki programtervező matematikus, nyelvész és a ChatGPT öccsének tekinthető magyar PULI-t kifejlesztő Nyelvtudományi Kutatóközpont vezetője.

Emberi modell
Amikor az OpenAI chatelőprogramja háromnegyed éve megjelent, senki sem gondolta, hogy ekkora siker lesz, és felrobbantja a mesterséges intelligenciáról és a számítógépekről, a robotokról alkotott korábbi véleményünket és tudásunkat. Ahogy Prószéky Gábor elmondja, „a ChatGPT2-t nem tették publikussá az álhírgeneráló képessége miatt, így többek közt ez a marketingfogás is segített megágyazni aztán a GPT3-ra épülő ChatGPT sikerének, ami igazi dialógusra képes az emberrel, és rengeteg ember bevonásával építették fel. Épp emiatt tud beszélgetni, mert igazi kommunikációs helyzetekben osztályozták a rendszer első reakcióit, amiket megtanult. Aztán az így okosított rendszer reakcióit ismét osztályozták, és így tovább...”
Egyre jobbak a modelljeink, de tőlünk tanulnak, alapvetően nem tudnak újat kitalálni, viszont nagyon jól alkalmazzák a megtanult mintákat, csak emberi értelemben nem intuitívak. Nincs szándékuk sem.
Ahogy Prószéky részletezi, akár a felhasználó is le tudja szűkíteni a témát, ilyenkor az az érzésünk, mintha tematikusan értené, amit akarunk, de nincs ebben semmi varázslat, csak egyetlen ember által felfoghatatlan mennyiségű adatról, szövegről van szó.
Valójában a szoftver nem „érti”, amit produkál, de amit létrehoz, az nagyon meggyőző, és azért is lehet népszerű, mert válaszaival „emberszerűen” segít. Gyakran felmerül, hogy a ChatGPT többek közt a fordítókat is nehéz helyzetbe hozta, hiszen talán már nem is lesz szükség rájuk, de Prószéky Gábor szerint ez tévedés.
Fordításnál is csak a mechanikus fordításban tud segíteni, műfordítást nem tud készíteni, mivel nem emberi módon kreatív. Jól dolgozik, de azért valakinek ellenőriznie kell ezeket a munkákat. A gépi fordítás tökéletesítése miatt az utóbbi időben az ún. utószerkesztést támogató, a szövegek hatékony javítását célzó, új típusú szoftvereszközök létrehozása felé tolódott el a hangsúly.
És ha már fordításról van szó, a fordítóképzésben érdekelt tanárok panaszkodnak, hogy nehéz kiszúrni, ember vagy a ChatGPT csinálja meg a leckét, de Prószéky azt mondja, szemléletváltással ez is orvosolható: adjon másmilyen feladatot a tanár, például a diákok keressék meg a ChatGPT fordítási hibáit, vagy legyen magasabban a léc, ha nem lehet kiküszöbölni a gép közreműködését.

Mi van a jogokkal?
Prószéky Gábor azt mondja, a plágium tudatos tevékenység, de itt nincs szó ilyesmiről. A létrejött szövegek, bármilyen furcsa, de egyediek: a ChatGPT textusait pontosan így soha nem írta még le senki. A rendszer ugyanis nem másolja a szöveget, mikor létrehozza őket.
A nagy nyelvi modellekben nincs egyáltalán szöveg, csak számok, rákövetkezési valószínűségek, amik azt jelzik, mekkora az esélye annak, hogy egy bizonyos szósorozat végén megjelenjen valamely újabb szó.
A legfrissebb hírt, miszerint a The New York Times beperelte az OpenAI-t az újság szövegeinek eltulajdonítása és felhasználása miatt, úgy kommentálta, hogy a ChatGPT nem direktben használja fel az újság szövegeit, csak a bennük levő nyelvi egységek lehetséges sorrendjeinek valószínűségeit változtathatja meg egy-egy újabb konkrét szöveg. „Minden szó máshonnan jön, minden szó önmaga jogán áll ott, és a szó utáni másik szó valószínűsége ugyanúgy nem védhető, ahogy maga a szó sem.”
Olykor kamuzik
A ChatGPT egész tudása a 2021 szeptembere előtti időszakra vonatkozik, mégis mindig válaszol.
Vicces látni, hogy tudjuk, a nyelvmodell adott esetben, mondjuk, egy mai jelenségre kérdezve nem tudja a választ, de akkor is kivágja magát. Magától számolni sem tud, de mehet neki az összeadás, ha arra példákon keresztül külön megtanítottuk.
Amit mond egy nyelvi modell, az nyelvi fordulatokból áll, azaz lehetséges nyelvi megnyilvánulásokat tud – igen magas szinten – újraalkotni, mást nem. Amikor azt mondjuk, hogy hallucinál a ChatGPT, az azért van, mert nekünk van egy világképünk, neki meg nincs, csak nyelvi, így nem tudhatja, mit is jelent az a való világban, amiről nyelvi állításokat tesz.

A mi kutyánk kölyke: PULI
Ahogy Prószéky elmondja, a nagy nyelvi modellek, mint a GPT vagy a PULI, a megtanult szövegek tartalmából egy nyelvi világot építenek fel. Ha a tanítóanyagban magyar szövegek is vannak, akkor abból a modell megismerheti a ragozásunkat vagy a magyar szórendet, ezért tud a ChatGPT magyarul is, de specifikus magyar tartalma, kulturális témái nincsenek. Így lehetett létjogosultsága a PULI-nak. „Nyelvi szinten az elérhető legnagyobb magyar szövegállományból tanult, de még nem »finomhangolták« a dialógushelyzetekre, ahogy a ChatGPT-t, viszont követve annak fejlesztési lépéseit, most már elég sok nyelvi instrukciót is tud, amit a PULI-alapmodell még nem tudott.”
A PULI komplex neurális hálózat, ami előtt most megnyílt a lehetőség, hogy »összebarátkozzon« hazánk legnagyobb szuperszámítógépével, a Komondorral. Hozzáférést kaptunk, így hamarosan létrejöhet egy újabb, nagyobb kapacitású PULI-változat is, hiszen a nagyobb gépen való modellépítés esetén a paraméterek nőnek, így gazdagabb tudású háló építhető.
Ahogy elmondja, a Komondoron szélesedik a paletta, az alap-PULI 30 milliárd szónyi folytonos szövegből tanult, most már 41 milliárd fölött járnak. És mivel a világismeretét bővítheti más nyelvű szöveg is, ezért tanították angol és kínai szövegen is, amiknek az együttes mennyisége 200 milliárd szó fölött van már, azaz „a PULI-GPTrio tanulóbázisa akkora, mint a ChatGPT-é volt. A mi rendszerünk még nem elég komplex, de a fenti méretek miatt igen nagy tudású: a PULI a tanítóanyagok szintjén beérte a nagyokat, ám magyartudás szintjén sokkal-sokkal jobb”.
(Borítókép: Prószéky Gábor. Fotó: Németh Kata / Index)

Az oldalról ajánljuk
- Külföld
Florida lazítana a gyerekmunkára vonatkozó törvényen
Ezzel szeretnék leváltani a papírokkal nem rendelkező munkavállalókat.
március 26., 08:15
- Külföld
Nem tartott sokáig a fekete-tengeri tűzszünet, több ukrán drón is behatolt az orosz területekre
A rijádi megállapodás ellenére csaptak le.
március 26., 08:34
- Kultúr
Mi van, ha a borzalom bennünk van, nem pedig odakint?
Az És miért, hogy az éjszaka lesújt, feldob és energetizál.
március 26., 07:45
- Belföld
Meghalt Wachsler Tamás volt országgyűlési képviselő, a Kossuth tér megújításának irányítója
Az építész novemberben lett volna 60 éves.
március 26., 08:20
- Külföld
Nem hagyja magára feleségét, J. D. Vance is Grönlandra látogat
A sziget biztonsági helyzetét vizsgálják.
március 26., 07:54
- Belföld
Nem ért haza az iskolából egy 17 éves budafoki lány
A rendőrség jelenleg is keresi az eltűnt diákot.
március 26., 07:50
- Kultúr
A két család csak néhány buszmegállóra lakott egymástól
Más okból, de mindkettő hallgatott.
22 perce
- Külföld
Légitámadást intéztek egy amerikai hadihajó ellen a jemeni húszik
A támadásokkal nem fognak felhagyni addig, amíg a gázai háború véget nem ér.
március 26., 08:58
- Külföld
Pataky Attila elmondta, mit gondol valójában Azahriah-ról
A rocker szerint a fiatal előadó nem figyelt a suliban, ezért keveri a diktatúrát és szabadságot.
március 26., 07:42
- Külföld
Nagyszabású hekkertámadás érte az egyik legnagyobb orosz vállalatot, teljes a káosz a cégnél
március 26., 06:12
- Belföld
Törvényjavaslattal tiltaná ki a középületekről a szivárványos zászlókat Novák Előd
A Mi Hazánk Mozgalom korábbi próbálkozása nem járt sikerrel.
március 26., 07:16
- Külföld
Huszonkettőre emelkedett a dél-koreai erdőtűz halálos áldozatainak száma
Az oltást nehezíti az erős szél.
március 26., 06:45
- Belföld
Steiner Kristóf: Nem hiszem, hogy ennek az országnak szüksége van rám
Hadházy Ákos: Követeljük, hogy ezt a mocskos törvényt visszavonják.
március 26., 09:23
- Külföld
Donald Trump tanácsadója felelősséget vállalt a háborús tervek kiszivárogtatásáért
Nem csitul a botrány Mike Waltz körül.
március 26., 09:17
- Tudomány
Magyarországon élő kannibál kígyót vizsgált egy új tanulmány
A rézsikló nem jelent fenyegetést a veszélyeztetett viperafajra.
március 26., 06:16
- Forma-1
Döntött az F1-es Red Bull gyengélkedő pilótájának sorsáról
A címvédőnek sem tetszett az elhatározás.
március 26., 09:16
- Belföld
Magyar Péter bizarr videóval küldött üzenetet kritikusainak
Vicces jelenet került ki az ellenzéki politikus közösségi oldalára.
március 26., 09:08
- Külföld
Dániában a nők számára is bevezetik a sorkatonaságot
Az EU-ban eddig csak Svédországban volt hasonló.
március 26., 07:00
- Külföld
Folytatódnak a törökországi tüntetések, már 1400 embert tartóztattak le
Több jogvédő csoport és az ENSZ is elítélte a rendőrök erőszakos fellépését.
március 26., 06:39
- Külföld
Scotland Yard: nem bűncselekmény okozta a Heathrow repülőteret megbénító tüzet
A Heathrow-t 18 órára lezárták, és 63 ezer környékbeli lakás is áram nélkül maradt.
március 26., 06:23
- Futball
Monumentális mészárlás a Monumentalban, Messi nélkül is szétszedték az ötszörös világbajnokot
Argentína már kijutott a jövő évi vb-re.
március 26., 06:30
- Belföld
Jókedvet és esernyőket bekészíteni, borongós–esős időjárással kell dacolnunk
Napsütésre csak az ország északi, északnyugati részén lehet számítani.
március 26., 06:26
- Belföld
Kamionról lehulló méretes jégtömbök okoztak kis híján balesetet az M7-es autópályán
Az eset könnyen okozhatott volna balesetet.
március 26., 06:19
- Külföld
„Az orosz propaganda megpróbálja kihasználni a magyar politikai helyzetet”
A VOX Ukrajina ügyvezető igazgatóhelyettese nyilatkozott az Indexnek.
március 26., 06:19
- Cinematrix
Megérkezett az egyik legjobban várt Star Wars-sorozat új évadának kedvcsinálója
Az Andor második, egyben utolsó évada is bővelkedni fog az izgalmakban.
március 26., 06:21
- Belföld
Ideiglenesen szünetel a szülészeti ellátás a kisbéri kórházban
A „személyi feltételek átmeneti hiánya” miatt.
március 26., 06:18
- Belföld
Lázár János utódja szerint Makón a libák őrzését sem bíznák Magyar Péterre
„Komolyan aggódom Hódmezővásárhelyért, ahol évek óta a gyűlölet uralkodik.”
március 26., 06:22
- Belföld
Biztonsági őr akadályozta meg, hogy bejusson a rabbi a Kazinczy utcai zsinagógába
március 26., 08:46