GPT–3: robot-újságíró vagy kolosszális bullshit-gyár?
További Tech-Tudomány cikkek
- Rongyként nyújtható és csavarható az LG új kijelzője
- Az élet keresése közben végezhetett a marslakókkal az amerikai szonda
- Itt a nagy dobás a 4iG-től: műholdakat állítanak Föld körüli pályára
- Minden eddiginél furább hibrid szörnyeteggel rukkolhat elő az Apple
- Hamarosan képtelenek leszünk kiszolgálni az adatközpontok energiaigényét
2020 júliusában a „Nem érzed produktívnak magad? Talán állj le a túlgondolkodással!” című cikk megmászta a Hacker News híraggregátor toplistáját és első helyezett lett. Mint később kiderült, a cikket a GPT–3 algoritmus írta, amelynek egy Liam Porr nevű egyetemi hallgató körített blogot. A Hacker News népszerű és komoly oldal, az Alexa leglátogatottabb tízezer oldalának listájának középmezőnyében szerepel, és nagyon nem egyszerű rajta a legnépszerűbb cikké válni, így az egész tech sajtót bejárta, hogy egy robot becsapta a hírolvasó hackereket.
A lapok figyelmét elkerülték a kommentárok, amelyek részben a témával kapcsolatos egyéni érzületeket tárgyalták, részben pedig a címet, amit nem a robot, hanem maga Porr írt. Volt továbbá egy hozzászólás, amiben valaki kifejezetten a GPT–3 írásának vélte a cikket. Ezt leszavazták. A dolog tanulsága, hogy elképzelhető, hogy a Hacker News olvasói, nem mind olvassák a nekik tálalt cikkeket. Kérdés, hogy így marad-e ez.
Mindennek vége
Napjaink bitcoinja a GPT–3. A költészet vége. A GPT–3 maga a robotlázadás, mert a GPT–3 maga a Transformer. Ami mindebből bizonyosan igaz, az az, hogy a minden eddiginél erősebb szöveggeneráló mesterséges intelligencia rá fogja nyomni bélyegét az online világ elkövetkező pár évére.
Az OpenAI idén júliusban adta közre a Generative Pre-trained Transformer 3, röviden GPT–3 névre hallgató betanított nyelvi mesterséges intelligenciát. Az Elon Musk közreműködésével 2015-ben alapított cég új produktuma minden eddigi MI-n túltesz értelmes szövegek generálásában, így potenciálisan gyökeres változással fenyeget minden írással összefüggő emberi szakmát.
Megítélése egyébként érdekesen vegyes. Az első benyomás mindig az, hogy nagyon meggyőző. A technika részleteinek megismerése után azonban elkezdenek kibukni az ügyetlenségek és tévesztések.
Vegyesen szenzációs
A Transformer egy 2017-ben bemutatott neurális hálózati architektúra, amelyet nagy mennyiségű szövegen lehet betanítani, majd működését adott feladathoz finomítani. A GPT–3 újítása, hogy nagysága miatt teljesítménye a finomhangolt szöveggenerátorokhoz hasonlít.
Lényegében egy mérnöki csoda, a legnagyobb létező nyelvi modell, egy nagyságrenddel nagyobb, mint a legközelebbi vetélytársa: 175 milliárd paramétert (neuronok közötti kapcsolatot) kezel 96 rétegen, minden egyes szót 12288 dimenziós vektorként érzékel szövegkörnyezetében. Több száz milliárd szavas adatbázison tanult, aminek a teljes angol nyelvű Wikipédia nagyjából a fél százalékát képezi. A modell betanítása ötmillió dollárba került.
A GPT–3 kitalálja, mi lehet a következő szó egy értelmes mondatban, működését legegyszerűbben így szokás elmagyarázni: olyan, mint a mobilról ismerős automatikus szövegkiegészítő funkció nagyon felturbózott, önjáró változata.
A bemutató után induló cégek szállnak rá a friss applikáció programozói felületére, hogy a csevegőrobotokat, és egyéb hasznos alkalmazásokat fejlesszenek belőle (szöveghez hasonlóan kódot is generál). Fontos figyelembe venni, hogy amikor bármiről bármilyen szöveget termel, fogalma sincs mi az, ezért a GPT–3 egy kolosszális bullshit-gyár. Ez azt jelenti, hogy nem megbízható, mivel érzelemtől vagy erkölcsi skrupulustól mentesen állít bármilyen butaságot.
A marhaság áradása
Mi az a bullshit?
Eredeti definíciója szerint: üres szöveg, amelynek egyetlen célja a hallgatóság rábeszélése valamire. A hazugságtól az különbözteti meg, hogy a hazugnak tisztában kell lennie az igazsággal – a bullshitelő számára azonban mindegy, hogy igaz vagy nem amit mond, amíg meggyőzi hallgatóját.
Mindez azzal fenyeget, hogy az internetet, azon belül pedig a közösségi médiát elárasztja a géppel generált bullshit. Ugyancsak veszélyben van a közoktatás fogalmazással, esszével és tudományos dolgozatokkal működtetett része – mivel egy dolgozat előállítása pár gombnyomás lesz csupán.
Nemrég a brit Guardian pattant fel a mesterséges intelligencia szekerére és közölt GPT–3 által generált cikket, amely a robotok nevében üdvözölte az emberiséget. Mivel ezt nyolc különböző szövegből sikerült egy elfogadható szöveggé szerkeszteni, ez is olyan kisebbfajta szakmai siker lett, amiért az embereket illeti a babér.
A szóban forgó robot elődjén, a GPT–2-n és a fordító programok esetlenségein jól el lehetett hülyéskedni. A dolog mostanra jutott el odáig – az angol nyelvbe legalábbis biztosan –, hogy az emberi szövegírás és olvasásnak részévé kell váljon az író emberi mivoltának ellenőrzése. Ez nem másról szól, mint stilisztikai és nyelvi kreativitással kapcsolatos kifinomult jelzések kereséséről, a gépi bullshit felismeréséről, ami átértékelheti például a gépek által ki nem szorított emberek által termelt szövegekkel kapcsolatos minőségi követelményeket.