Bármi szabadon felhasználható az interneten a Microsoft-vezető szerint
További Tech-Tudomány cikkek
Darázsfészekbe nyúlt a Microsoft mesterséges intelligenciáért felelős igazgatója, Mustafa Suleyman a héten, amikor a CNBC műsorában, az Andrew Ross Sorkinnak adott interjújában azt mondta, hogy az interneten minden szabadon felhasználható.
A szíriai–angol Suleyman az Oxfordi Egyetemet hagyta ott az üzlet kedvéért, később a Google által felvásárolt Deepmind alapítója és vezetője lett, ahonnan 2019-ben az alkalmazottak zaklatásával kapcsolatos botrány miatt távozott. A The Economist gazdasági folyóirat kiadójának igazgatótanácsát megjárva 2022-ben egy újabb mesterségesintelligencia-vállalkozást alapított Inflection AI néven. Ezt a Microsoft idén áprilisban felvásárolta, és egyúttal a megavállalat mesterséges intelligenciáért felelős vezetőjévé emelte Suleymant, aki minden szempontból az MI-ipar legbefolyásosabb személyiségei közé tartozik.
Suleyman megszólalása azért kavart vihart, mert a Microsoft és szoros üzleti partnere, az OpenAI nem egy bírósági ügybe futott bele azzal, hogy a szerzők engedélye nélkül használt fel tartalmakat nagy nyelvi modellek betanításához. Ezek közül a legnagyobb és leginkább vérre menő az a per, amit a The New York Times indított, ahol gyakorlatilag azt követelik, hogy semmisítsék meg a GPT-3-at, amit a napilap cikkein tanítottak be.
Ami a tied, az az enyém is…
A vita háttere, hogy az MI-fejlesztőknek nincs sok választásuk, a generációnként nagységrendekkel több paramétert kezelő modellek betanításához minden elérhető szöveget felhasználnak a Reddit fórumaitól a régi gyűjteményeken át az illegális digitális könyvtárakig. A stratégia egyfajta előremenekülés, amelyben a szabályozatlanságra, az elévülésre/elavulásra és a piaci növekedésre hagyatkozva igyekeznek túllendülni a szerzői jogi vitákon.
Suleyman megszólalása ebben a környezetben egyfajta programbeszédként hatott.
Ami a nyílt webre felkerülő tartalmat illeti, a 90-es évek óta az a társadalmi szerződés, hogy az a méltányos felhasználás körébe esik. Bárki másolhatja, átalakíthatja, reprodukálhatja. Ha úgy tetszik, egyfajta »freeware« az én felfogásom szerint
– fogalmazott.
A szerzői jogot minden ország saját hatáskörben szabályozza, általában a szerzőnek az első pillanattól fogva különleges jogai fűződnek az alkotásához, amik nem szűnnek meg attól, hogy részben vagy egészben feltölti azt az internetre. Léteznek természetesen olyan esetek, amikor méltányosan vagy szabadon felhasználható egy alkotás, főként ha nem jár haszonszerzéssel, például hivatkozás céljából idézett részlet, az iskolai szemléltetést szolgálja, vagy átdolgozás (például paródia céljára), de ilyen a magáncélú biztonsági másolat készítése, azaz ha valaki jogosan szerzett példányt is birtokol.
Ez a fajta felhasználás szükséges az általunk ismert világ működéséhez, az internetes kereséshez, a szoftverekhez, a közösségi médiához és a sajtóhoz. Hogy egy mesterséges intelligencia betanítása ebbe a kategóriába esik-e, az a jövőt meghatározó elvi kérdés. A betanítás nem jogtalan közzététel, esetleg valamiféle átdolgozás lehet, a haszonszerzési szándék ugyanakkor egyértelműen megvan. Hol húzódik a határ egy internetes kereső és egy nyelvi modell között? Esetleg a szerzői jogokat csak öntudattal rendelkező természetes intelligenciáknak kell betartaniuk?
…de ami az enyém, ahhoz neked semmi közöd
Suleyman tehát belecsapott a lecsóba, és valószínűleg nem arra gondolt, amit a techsajtó helyenként tréfásan felvetett, hogy eszerint a Microsoft azt is freeware-nek tekinti, ha valaki virtuális platóról leesett Windows 11-et talál az interneten. Esetleg ilyen esetben nem számít, hogy mi a társadalmi közmegegyezés a 90-es évek óta? Az összkép mindenképpen bizarr.
Ha már a keresők szóba kerültek: a napokban derült ki, hogy a mesterséges intelligencia betanításához használt tartalom beszerzésénél minden cég figyelmen kívül hagyja az úgynevezett robots.txt fájlt. A robots.txt nem jogi dokumentum, csupán egy üzenet a keresőmotorok által használt felderítő programoknak. Az adott internetes hely olyan részeinek és oldalainak listája, amiket a webmester nem szeretne a keresőn viszontlátni technikai, történelmi, személyes vagy egyéb okból. Azzal, hogy ezt figyelmen kívül hagyják, az OpenAI és társai természetesen elkaszálják a magukat keresőmotorokkal rokonító fair use érveiket.
Mindez az évtizedet meghatározó vita kezdete csupán, de maga az ügy egyre furcsább, ha az érdeksérelmeket összevetjük a technikai produktummal, például a mesterséges intelligencia hallucinációival. Ahogy a Google esetét ironikusan összegezték (és lényegében a piac bármely szereplőjéről mondhatták volna): ellopták az egész internetet, és ebből lett egy olyan program, ami azt javasolja az embereknek, hogy ragasztóval rögzítsék a feltéteket a pizzán.