
Fél évszázados chatbot győzte le a ChatGPT-t
További Tech-Tudomány cikkek
-
Új szintre léphet az agy és a számítógép kapcsolata
- A kutatók is vakarják a fejüket attól, amit a Csendes-óceán mélyén találtak
- Óriási összeggel fejleszti mesterségesintelligencia- és felhőalapú infrastruktúráját az Alibaba
- Támadás alatt a bolygó: Kína és Európa is toborzásba kezdett
- Tudományos áttörés, még közelebb kerültünk a tényleges gondolatolvasáshoz
Különös eredmény született a UC San Diego kutatóinak online Turing-tesztjén: minden idők első csevegőrobotja, az ELIZA jobban szerepelt, mint a világot tavaly óta lázban tartó ChatGPT technikai alapját jelentő GPT-3.5 nagy nyelvi modell. Több oka is lehet, hogy a korszakos mesterséges intelligenciák nem szerepeltek jól a teszteken. A tudományos lapban még nem publikált kutatásról az Ars Technica adott hírt.
A Turing-tesztről tudni érdemes, hogy Alan Turing brit matematikus találta ki, aki a második világháború alatt a német Enigma-titkosítás feltörését vezette. Turing az általunk használt információtechnológia egyik alapító atyja, a tesztje pedig lényegében egy beszélgetés, amelyet vakon folytatnak. Az egyik szereplő egy ember, a másik pedig vagy ember vagy számítógép. A gondolkodó mesterséges intelligencia kritériuma, hogy a beszélgetés során az emberi partner számára megkülönböztethetetlen legyen a gép egy másik embertől.
A Turing-tesztet megkísérlő első program az MIT műszaki egyetem professzora, Joseph Weizenbaum által írt ELIZA volt. Weizenbaum 1964 és 1967 között írta a csevegőprogramot, amely rogeriánus pszichoterapeuta szerepfelfogást magára öltve, a partner szóhasználatát tükrözve kommunikált. A nácizmus elől Amerikába menekülő, 2008-ban elhunyt Weizenbaumról nevezték el az informatikai Nobelnek tekinthető díjat.
Az általa írt program nyelvi-pszichológiai működése miatt a mesterséges intelligencia fejlődésének fontos mérföldköve. Érdekes viszonyítási pont lehet, hogy a gép, amire az ELIZA íródott, a 103 flops teljesítményű IBM 7094 volt, a mai GPT-modellek 1030 teljesítményű rendszereken futnak, a különbség tízmilliárdszoros.
Mit tud egy mai telefon a régi szuperszámítógépekhez képest?
Százszor, ezerszer vagy milliószor erősebb az Apollo–11 fedélzeti számítógépénél?
Ezért meglepő, hogy a beszélgetés során a GPT-4 a tesztelők 41 százalékának tűnt emberinek, míg a GPT-3.5 csak 14 százaléknak, az ELIZA viszont 27 százalékos eredményt ért el. A Turing-teszt nem csak az okosságról szól, az emberek a beszélgetés során a társas-érzelmi működést és a nyelvi stílust értékelték, és az emberek 63 százalékát ismerték fel emberként, ami egyáltalán nem tűnik jó aránynak – de a gépek nem igazán tudták megközelíteni ezt a szintet sem.
Annyira rossz, hogy jó
Az eredmény értékeléséhez fontos tudni, hogy a UC San Diego kutatói Cameron Jones és Benjamin Bergen a turingtest.live nevű weboldalon, publikus környezetben végezték a teszteket. A nyílt online felületeknek lehetnek sajátos problémái, amit jól példáz a Megyeri híd esete, aminek a szavazáson előbb a Chuck Norris, utóbb a Stephen Colbert nevet kellett volna kapnia. A szóban forgó Turing-teszt eredménye akár ilyen módon is torzulhatott, de valószínűbb, hogy más is közrejátszott.
A Princeton szakértője, Arvind Narayan egy X-en közzétett bejegyzésben arra mutatott rá, hogy a ChatGPT-t nem arra hegyezték ki, hogy embernek adja ki magát, nagyon is hivataloskodó hangvételben kommunikál, és ezen az sem változtatott, hogy promptban kifejezetten csevegést kértek tőle.
Az ELIZA stílusa nagyon más volt, az ugyanis egy konzervatív, szűkszavú csevegőpartner, amiből teljesen hiányzik a GPT-re jellemző segítőkész, barátságos hozzáállás és a modern nyelvi modellekre jellemző polírozott nyelvhasználat. A tesztelők értékelései alapján úgy tűnt, ELIZA túl rossz volt ahhoz, hogy modern nyelvi modell legyen,
inkább egy lusta embernek gondolták.
Lényegében az a tragikomikus helyzet állt elő, hogy a régi csevegőrobotot az elavultsága tette emberivé.
A tesztek minőségéből és tudományos értékéből – a hidas példát leszámítva – az is levon, hogy a kérdezők nem kaptak semmilyen ösztönzést, hogy szigorúan és szakszerűen végezzék a feladatukat. A 652 résztvevő 1405 beszélgetésének egy része így valószínűleg csak tessék-lássék értékelést kapott.
A szóban forgó kutatás címe és fő kérdése egyébként az volt, hogy vajon a GPT-4 átmegy-e a Turing-teszten. Amint az a fentiekből kiderült, a véletlen 50-50 százalékos határát neki sem sikerült átugrani. Amint arra az Ars Technica szerzője, Benji Edwards felhívja fel a figyelmet, mindez nem ok arra, hogy elégedetten nyugtázzuk, hogy a gépek nem tudnak csőbe húzni minket – más tesztek szerint a grafikai generátorok képeinek szereplőit ma már nagyobb arányban látjuk igazinak, mint a valódi fotókon megjelenő valódi embereket.
Robotkabaré: átveszik egymás hülyeségeit a rivális chatbotok
A Bard szerint már bezárták, és ezt tőle tudta meg a ChatGPT.

Ehhez a cikkhez ajánljuk
- Tech-Tudomány
Robbanthatnának is mellettünk, azt sem hallanánk a Huawei fülhallgatójával
Memóriahabbal és extrém zajszűréssel támad a FreeBuds Pro 4. Megnéztük, mire képes.
február 20., 15:38
- Tech-Tudomány
Forradalmi áttörést rejt a Microsoft új kvantumchipje
Egy titokzatos részecskével stabilizálják a sérülékeny információkat.
február 21., 15:31
- Tech-Tudomány
Több mint 100 év után újabb ókori egyiptomi fáraó sírját sikerült feltárni
Tutanhamon után II. Thotmesz sírjába is betekintést nyerhetünk.
február 21., 06:04
- Mindeközben
A Cápák között vállalkozója magára tetováltatta a terméke logóját, annyira hisz annak sikerében
3 órája
- Mindeközben
Évek óta nem hallani az RTL egykori műsorvezetőjéről: „Máig felismernek az utcán, megkérdezik, hová tűntem”
4 órája
- Címlapon
Az orosz–amerikai tárgyalások miatt félő, hogy a történelem megismétli önmagát
A Szudéta-vidék átadása? Jalta 2.0? Amikor a nagyhatalmak a kelet-európaiak feje felett döntöttek a sorsukról.
3 órája
- Tech-Tudomány
Elon Musk megsemmisítené a Nemzetközi Űrállomást
Az eredeti tervek szerint még 2030-ig működhetne az objektum.
február 21., 13:53
- Tech-Tudomány
A következő járványért a világűrt is okolhatjuk, felturbózza a vírusokat
A Tanganyika-tó üledékében talált kémiai nyomok miatt fújtak riadót.
február 22., 17:13
- Tech-Tudomány
Támadás alatt a bolygó: Kína és Európa is toborzásba kezdett
Bizonyos becslések szerint 2032-ben aszteroida csapódhat a Földbe.
tegnap, 06:39
- Tech-Tudomány
Tudományos áttörés, még közelebb kerültünk a tényleges gondolatolvasáshoz
A technológia azonban egyre égetőbb kérdéseket is felvet.
február 23., 18:50
- Tech-Tudomány
A kutatók is vakarják a fejüket attól, amit a Csendes-óceán mélyén találtak
Nem tudjuk, honnan került nagy mennyiségű berilliumizotóp a tengerfenékre.
tegnap, 16:25
- Címlapon
Emmanuel Macront még soha nem alázták meg úgy, mint Donald Trump a Fehér Házban
Az orosz−ukrán háborúról egyeztettek a felek, amikor furcsa jelenet zajlott le.
8 órája
- Tech-Tudomány
Vajon elveszi a munkáját az első itthon is kapható humanoid robot és a kutyája?
Tanulni is tud, de az kétszer annyiba kerül.
február 18., 11:19
- Címlapon
Csaknem 700 milliárdot bukott eddig Magyarország a kohéziós alapból, de messze még a vége
Ha 2025-ben sem sikerül megállapodni, újabb százmilliárdok bánják.
2 órája
- Címlapon
Felrobbant egy Ukrajnának gyártott harckocsi Szlovákiában
A szlovák védelmi miniszter nem zárja ki egy harmadik fél beavatkozását.
54 perce
- Címlapon
Úgy szóltak be Orbán Viktornak, hogy ott sem volt
Az egyik felszólalást bekiabálás akasztotta meg.
6 órája
- Tech-Tudomány
Harmadjára emelte a NASA az egyik jelentős aszteroida becsapódásának esélyét, 2032-ben éri el a Földet
Az űrügynökségek megfigyelés alatt tartják az égitestet.
február 19., 16:25
- Tech-Tudomány
Új funkciót tesztel az Instagram, de ez sokaknak nem tetszik
Már a startgépben áll a lefelé mutató ujjacska.
február 18., 17:50
- Mindeközben
Opitz Barbi faképnél hagyta a Házasság első látásra Szabiját, csúnyán összekaptak egy luxusétteremben
5 órája
- Tech-Tudomány
Kínai kutatók forradalmi megoldással álltak elő az akkumulátoroknál
A gyógymód meghatszorozza az élettartamot.
február 19., 18:27
- Tech-Tudomány
Ikonikus ételek tűnhetnek el, a gouda sajt és a dijoni mustár is veszélyben van
Ketyeg az óra, több termék is érintett lehet.
február 20., 07:13