
Weiler Péter képzőművész munkássága és portfóliója mesterséges intelligenciával fűszerezve.
MEGVESZEMA technológiai világ krémje már-már lélegzet-visszafojtva figyelte a Google éves fejlesztői konferenciáját, az I/O-t – annak ellenére ugyanis, hogy az új Android kinézete már hetekkel ezelőtt kiszivárgott, azt nem lehetett tudni, hogy a mesterséges intelligencia területén milyen dobásokkal készül a keresőóriás. A Google pedig nem okozott csalódást: hamarosan megváltozik, hogyan használjuk a világ legnépszerűbb keresőjét, de más projektek területén is hatalmasat fejlődtek. Megújul a Gemini és a Chrome, de a kép- és videógeneráló modellek is nagyot léptek előre. Mutatjuk, mi mindent jelentett be a Google a 2025-ös Google I/O-n.
Az Egyesült Államokban élők számára a Google tájékoztatása alapján már a héten megjelenik egy új funkció, ami újraírhatja azt, hogyan is használjuk a világ legnépszerűbb keresőjét. Az AI Mode-ot aktiválva tulajdonképpen úgy kereshetünk, mintha a Gemini chatbottal beszélgetnénk, emellett viszont más, AI-vezérelt újításokat is eszközölt a vállalat. Elméletben javították az AI-áttekintések pontosságát, így a normál keresések esetén pontosabb összefoglalást kaphatunk majd, illetve a Gemini mellett ide is kiterjesztették a Deep Search funkciót, ha átfogóbb, például kutatási projektekhez is használható információkat keresünk.
Ennél is érdekesebb a Google online vásárlások felturbózására tett próbálkozása. Az új kereső a vásárlással kapcsolatos kérésekre – például arra, hogy „egy közepes méretű hátizsákot keresek” – még pontosabb találatokat szolgáltat majd, konkrét ajánlatokkal. Sőt, ezeket akár virtuálisan fel is próbálhatjuk a Google Shopping Graph és a Gemini együttműködésének köszönhetően. Elég lesz csak egy képet feltöltenünk magunkról, a Google mesterséges intelligenciája pedig automatikusan a képre szerkeszti a kosarunkban lévő ruhákat és kiegészítőket – tulajdonképpen egy virtuális próbafülkét kreálva ezzel.
Jó hír továbbá, hogy a Google Gemini Live, a keresőóriás AI-alapú hangasszisztense mostantól ingyenesen elérhető Androidon és iOS-en egyaránt. A Geminivel akár magyarul is természetes nyelven kommunikálhatunk, sőt, a telefon kamerájával mutathatunk neki dolgokat, amelyekről információt szolgáltat; korábban ez csak a Google Pixel- és Samsung Galaxy S25-tulajok számára volt hozzáférhető. Megújul a Chrome böngésző is, amibe – végre – integrálva lesz a Gemini, így bármire rákérdezhetünk majd, amit a kijelzőnkön látunk, legyen szó egy recept átalakításáról vagy egy szöveg érthetőbbé tételéről.
A 2025-ös Google I/O-n debütáltak a Google új kép- és videógeneráló modelljei is, név szerint az Imagen 4 és a Veo 3. Utóbbi az elődhöz képest általánosságban jobb minőségű felvételeket generál majd, könnyebb lesz promptolni (utasításokat adni neki), és képes lesz egyszerre videót és hangot (beleértve a párbeszédet is) generálni. Emellett jobban megérti a hosszabb promptokat és helyesen kezeli a promptban szereplő események sorrendjét – derült ki az eseményen. Az Imagen 4 ugyancsak sokat fejlődött, a legjelentősebb előrelépést az AI által generált feliratok esetén vehetjük észre. Az Imagen 4 láthatóan jobban ír valódi szöveget a képeken gyakran megjelenő AI-halandzsa helyett, emellett pedig ezentúl már több formátumban való exportálásra is képes.
Mindezt egyszerre veszi igénybe a Google Flow, egy új AI-alapú eszköz, amely természetes nyelvű szöveges utasításokból képes kész jeleneteket generálni.
A Google szerint ezzel az eszközzel tulajdonképpen bárki filmrendezővé válhat. A felhasználók pillanatok alatt tesztelhetik ötleteiket anélkül, hogy drága forgatásokba kellene bocsátkozniuk. Hogy jelenleg pontosan mire is képes a Flow, azt alább veheti szemügyre:
Mindez ugyanakkor eltörpül amellett, amire a Google jelenleg csak Project Astraként hivatkozik – ez tulajdonképpen az a mesterséges intelligencia, amit az elmúlt 20 év sci-fi-filmjeiben láttunk. A helyzet annyiban más, hogy ezúttal ez már a valóság. Az Astra és a Google Action Intelligence képes átvenni az irányítást a telefonunk felett, kérésünkre keres a weben, a YouTube-on – vagy bármilyen weboldalon –, és folyamatos, természetes kommunikációt is folytat velünk. Egy YouTube-ra feltöltött demóban azt követhetjük végig, ahogy egy fiatal biciklis szerelés közben kéri az AI segítségét, ami telefonja kamerájának segítségével nemcsak megmutatja neki, hogy milyen alkatrészeket használjon, de a hiányzó darabokat még meg is rendeli egy közeli szaküzletből – telefonon. Astra ugyanis képes hangalapú hívásokat indítani, ahol ő maga beszél a másik féllel a felhasználó nevében.
A Project Astra egyelőre csak a regisztrált tesztelők számára elérhető, amint azonban kész lesz, a Gemini Live szolgáltatásban fog helyet kapni.
A Google emellett egy új, kegyetlenül drága előfizetési modellt is bejelentett: ez a Google AI Ultra, ami havi 250 dollárért, jelenlegi árfolyamon körülbelül 89 ezer forintért vehető igénybe. Cserébe a felhasználó korai hozzáférést kap a Google legújabb, legerősebb és legmodernebb AI-szolgáltatásaihoz, valamint olyan extrákat is kap, mint például 30 terabyte felhőalapú tárhely vagy YouTube Premium. Idővel az újítások valószínűleg mind elérhetők lesznek az ingyenes vagy olcsóbb előfizetői szinteken is – egyelőre viszont Mountain View-ban keményen megkérik az innováció árát.
(Borítókép: Pillanatkép a 2025-ös Google I/O-ból. / Fotó: Google)
Weiler Péter képzőművész munkássága és portfóliója mesterséges intelligenciával fűszerezve.
MEGVESZEM