Saját művészeti stílust képes kifejleszteni a mesterséges intelligencia
További Tech-Tudomány cikkek
Az idei Sony World Photography Awards kreatív kategóriájának első díját áprilisban Boris Eldagsen kapta, aki két nő fekete-fehér, éteri, vintage stílusú portréjával nyűgözte le a zsűrit. Eldagsen azonban visszautasította a díjat, és elárulta, hogy képét nem fényképezőgép, hanem mesterséges intelligencia (MI) készítette. A német művész elmondta, hogy pimaszságból jelentkezett a versenyre, hogy lássa, sikerül-e becsapnia a zsűrit − írja a The Economist.
A generatív MI-modellek meggyőző képeket készítenek, akár vintage portrékat, akár modernebb képeket − például egy módosított fotót a pápáról egy valószínűtlen Balenciaga pufferdzsekiben, ami nemrég a fél Twittert átverte. Az eredeti munkák létrehozására való képességük azonban kevésbé egyértelmű. „Az MI-art eddig kivételesen triviális volt” − mondta nemrég a Art Newspaper egyik rovatvezetője. Természeténél fogva származtatott technológia, amely milliónyi feldolgozott adatra épül, amelyeket öntanuló rendszerükkel beleépítenek a tudástárukba.
A plágium az MI-folyamat jellemzője
− jelentette ki a Writers Guild of America, egyike a sok, kreatív iparban dolgozót tömörítő szakszervezetnek, amely a generatív MI-modelleket puszta másolóknak tekinti.
Talán így van. Mégis vannak arra utaló jelek, hogy az MI-modellek saját művészi stílust alakítanak ki − és nem csak az ötnél több ujjal ellátott kezek rajzolásában, ahogyan az a korai munkáikban gyakori volt. Azáltal, hogy a generatív modellek azonosítják és kiemelik a képzési adatokban látott mintákat, nem annyira a kortárs stílusok tükörképei, mint inkább nagyítólencséi. Lassan kialakulóban van egy robotikus művészeti iskola.
A számítógépek már jó ideje alkotnak művészetet. Öt évvel ezelőtt a Christie’s árverésre bocsátotta az első, mesterséges intelligencia által készített művet, az Edmond de Belamy címűt, egy 18. századi olajfestmény elmosódott közelítését. Annak ellenére, hogy az újdonság befejezetlen és kissé idegenszerű volt, 432 500 dollárt hozott. „Lehet, hogy nem egy púderezett parókás ember festette − mondta a Christie’s −, de ez pontosan az a fajta műalkotás, amelyet 250 éve árulunk.”
A technológia azóta sokat fejlődött. Az olyan nyílt platformok, mint a Midjourney és a DALL-E, egyszerű írásbeli utasítások alapján másodpercek alatt generálnak képeket. Nem szükséges művészi készség, bár a jó eredmény eléréséhez kell egy kis fortély.
Az általam készített kép nem az én munkám. Az én munkám a prompt
− mondja Nick St. Pierre, egy New York-i dizájner, aki tavaly kezdett el foglalkozni az MI-vel. A kép, amelyet a Midjourney segítségével készített, több száz iterációt igényelt, míg végül ezt a promptot kapta:
35 mm-es, 1990-es évekbeli akciófilm-állókép, közelkép egy szakállas férfiról, aki üvegek után kutat egy italboltban. VIGYÁZZATOK MAGATOK MÖGÖTT!!! (háttérakció történik)... egy fehér benz teherautó becsapódik egy üzlet kirakatába, és felrobban a háttérben... törött üveg repül mindenfelé, lángoló törmelék szikrázik a neon éjszakában, 90-es évek CGI, döbbenetes realizmus...
Az a képesség, hogy bármilyen képet bármilyen stílusban megrendelhetünk a 1990-es évek akciófilmjeitől a pápai paparazzifelvételekig, összeegyeztethetetlennek tűnik a megkülönböztető MI-megjelenés gondolatával. Mégis úgy tűnik, hogy bizonyos vonások dominálnak. Az egyik a nosztalgia. Az a képesség, hogy az MI-modellek újra tudják teremteni az elsajátított képek stílusát, képessé teszi őket a régi média megjelenésének szimulálására vagy néha a múlt eseményeinek modern köntösben történő újrateremtésére. Egy nemrégiben megjelent virális sorozat modern kor előtti időkben készült szelfiket képzelt el, vikingekkel vagy ősemberekkel, akik a kamerába vigyorogtak.
A művészet korábbi korszakaihoz hasonlóan az uralkodó témát az határozza meg, aki a művet megrendeli. A nyugati galériák tele vannak gazdag fehér férfiakról és vagyonukról készült képekkel, nem azért, mert olajfestékkel jól mutattak, hanem mert ezek a témák voltak a legkedvesebbek a mecénások szívének. A Midjourney termése ugyanebből az okból kifolyólag tele van anime harcos hercegnőkkel.
Úgy tűnik, hogy az MI-modellek is előnyben részesítenek bizonyos technikákat. Roland Meyer, a németországi Ruhr Egyetem Bochum kutatója az év elején a Midjourney által készített képeket vizsgálva észrevett egy közös vonást. Sokan közülük „ragyogtak és csillogtak, mintha belülről világítanának”. Ezt a jellegzetes megvilágítást olyan színpalettával kombinálták, amely a meleg földszíneket kék vagy zöld fémes tónusokkal állította szembe. Sokuknál megfigyelhető volt az is, amit a fotósok nagy dinamikatartománynak neveznek, ami azt jelenti, hogy a képen belül a fényszintek széles skálája változik, vannak mélyárnyékos területek, más területek pedig világosak.
Ezek a tulajdonságok nem véletlenek. Meyer a jellegzetes ragyogást annak tulajdonítja, ahogyan az MI-modell a világítást kezeli. Ahelyett, hogy olyan digitális művészeti technikákat használna, mint a sugárkövetés, amely során a számítógép kiszámítja, hogy egy adott szögből hogyan esik a fény egy tárgyra, az MI a tanulóadatokban szereplő képek alapján képzeli el, hogyan fognak kinézni a dolgok, amelyeket sok különböző szögből világítottak meg. Meyer szerint ezért még a fotórealisztikus MI-képek is inkább a festészethez, mint a naturalisztikus fényképezéshez hasonló módon vannak megvilágítva.
Festészet számokkal
A kedvelt színösszeállítások gyakran párosítják a teáskéket vagy a türkizkéket narancssárgával vagy magentával. Ez az Instagramon és onnan az egész interneten népszerűvé vált ízlést tükrözi, amely valószínűleg jól reprezentált a képzési adatokban. (A nagy dinamikatartományt a modern okostelefonos fényképezőgépek tették hasonlóan elterjedtté az interneten, ezek több, különböző expozíciójú kép készítésével és ezek összeillesztésével állítanak elő ilyen effektusokat.)
Az MI-modellek frissítéseivel együtt az életművük is változik. David Holz, a Midjourney alapítója és főnöke elutasítja azt az elképzelést, hogy létezik egyetlen MI-stílus. Szerinte a program legújabb, márciusban megjelent változata visszaszorította az előző változat néhány tendenciáját.
A képeink kinézete az elmúlt 12 hónap alatt már ötször változott radikálisan, és ez még jó ideig így is fog maradni. Az emberek változatosságot akarnak
− mondta Holtz.
Ahogy a modellek fejlődnek és javulnak, továbbra is az ember által készített képzési adatokra támaszkodnak. Egyetlen gyűjtemény sem semleges. A képarchívumok egy társadalom változó ideológiai befektetéseinek és politikai elkötelezettségének indexei. És bármilyenek is legyenek a képzési adatok, a végén egy olyan stílushoz jutunk, amely a művészet egyfajta legkisebb közös nevezője
− mondja James Coupe, a londoni Royal College of Art fotográfia tanszékének vezetője, aki egy MI-labort hoz létre. Az MI-generált képeket az 1990-es évekből egy orosz konceptuális művészpáros, Vitalij Komar és Alekszandr Melamid projektjéhez hasonlítja. Ők 14 országban mérték fel a közízlést, és az eredmények alapján készítettek műalkotásokat. Szinte mindenki a banális, 19. századi stílusú tájképeket választotta.
A generatív MI-modellek azáltal, hogy a képzési adatokban azonosítják és sűrítik az uralkodó stílusokat, hasonló szerepet játszanak. Meyer úgy véli, hogy a vizuális stílusok vagy korszakok összegzésére való képességük a művészettörténészek számára hatékony elemzési eszközzé teheti őket. Gyengeségük és erősségük is egyben az, hogy „klisék detektorai”.