Itt az Apple Intelligence, soha többet nem használjuk majd úgy az iPhone-t, mint korábban
További Tech-Tudomány cikkek
Hosszú várakozás után magyarországi idő szerint hétfő este hét órakor megtartotta a 2024-es Wordwide Developer Conference nyitóeseményét az Apple, minek keretén belül – ahogy azt várni lehetett – bemutatták az iOS, az iPadOS, a macOS, a watchOS, a tvOS és a visionOS új verzióit. Ezek már önmagukban elegek voltak ahhoz, hogy kitöltsék az átlagosan egyórás műsoridőt, az Apple azonban itt még nem áll meg: bemutatták az Apple Intelligence-t is, a saját mesterséges intelligenciájukat, amin éveken keresztül dolgoztak. Az Apple Intelligence – ahogy azt ugyancsak várni lehetett – olyan dolgokat tesz lehetővé az iPhone-okon, amihez foghatót még nem igazán tapasztalhattunk mobiltelefonon, ezzel teljesen új érát nyitva nemcsak az iPhone-ok, hanem az okostelefonok történelmében is.
Az Apple Intelligence megértése azonban nem egyszerű, egy annyira komplex fejlesztésről van szó, amiről maga az Apple is közel egy órán keresztül mesélt – ennek ellenére megpróbáljuk a lehető legegyszerűbben elmagyarázni, hogy miről is van szó.
Szerkeszt, fogalmaz és generál – pillanatok alatt
Az Apple Intelligence, ahogy írtuk is, az Apple saját mesterséges intelligenciája, ami ingyenesen elérhető lesz az iOS 18, az iPadOS 18 és a macOS Sequoia ősszel megjelenő változataiban – már amennyiben készülékünk kompatibilis vele; erről azonban később. Az Apple Intelligence négy fő felhasználási területtel rendelkezik, amik már önmagukban is reformálnák az iPhone-os élményt, összevetve azonban teljesen új sztenderdet nyitnak. A vállalat MI-je képes nagy nyelvi modellként üzemelni,
tehát játszi könnyedséggel generál szöveget, készít összesítéseket, vagy fogalmaz át dolgokat, legyen szó egy e-mailről, egy dokumentumról vagy egy teljes weboldalról.
A legszebb az egészben pedig az, hogy az Intelligence az iOS 18, az iPadOS 18 és a macOS Sequoia szerves részét képezi, tehát az MI minden alkalmazással együtt tud működni, legyen szó az Apple által készített appokról vagy olyanokról, amiket egy harmadik feles fejlesztő alkotott. A szövegek értelmezése mellett az Apple Intelligence képes képgenerátorként is működni: szöveg alapján három stílusban képes képet készíteni, de akár egy meglévő képet is át tud alakítani – sőt, bármilyen emojit is létrehoz. Az Apple nagyon kreatívan genmojinak nevezte el a fejlesztést, ami előreláthatólag a fiatalok kedvence lesz az új szoftververzióban.
A genmoji lényege, hogy szöveg alapján bármilyen emojit létrehozhassunk, legyen szó egy rózsaszín szoknyában táncoló dinoszauruszról vagy egy egyszerű tojásos szendvicsről. Az így generált emojikat aztán pontosan úgy használhatjuk, mint a „hivatalos” Unicode által támogatottakat – az Apple ökoszisztémáján belül semmiféle jele nem lesz annak, hogy egy általunk készített emotikonról van szó; ahogy az iOS 18-at futtató barátaink is pontosan úgy fogják látni a genmojikat, mint ahogyan azokat mi megálmodtuk. A képgenerálás azonban ennyiben még nem merül ki, az Apple Intelligence képes lesz:
- egy gombnyomással feljavítani a képeket;
- eltüntetni bizonyos részeket egy képről, majd odaillő részletekkel feltölteni azt;
- illetve meglévő vázlatokból pillanatok alatt kész rajzokat készíteni.
Érti, ami előtte van
Az Apple Intelligence harmadik és negyedik erőssége az, hogy képes dolgokat végrehajtani a telefonon, emellett képes kontextusában értelmezni az utasításokat, valamint azt is képes felfogni, hogy éppen mit jelenít meg a készülék. Remek példa erre az új generációs Siri, ami az új szoftververziókkal érkezik majd az Apple készülékeire. Siri például, amennyiben felteszünk neki egy kérdést, majd egy újabb, az előzőre vonatkozóval folytatjuk azt, már tudni fogja, hogy az új kérdés az előző válaszára vonatkozik-e, vagy sem – hiszen képes értelmezni azt. Ennek köszönhetően az alábbi műveletsor csupán a hangunkkal is elvégezhetővé válik:
- Mutasd meg, milyen lesz az időjárás szombaton Budapesten.
- Milyen túraútvonalak találhatók a környéken?
- Válaszd ki az értékelések alapján a legjobbat és hozz létre egy naptáreseményt délelőtt 10 órára.
- Küldd el a meghívót Kittinek és Gabinak is.
Mindez – amennyiben nem gondolkodunk sokat – alig vesz egy percnél több időt igénybe, míg ha mi magunk állnánk neki a keresésnek, megeshet, hogy 10-15 percig is bajlódnánk vele. Az Apple Intelligence emellett képes minden korábbinál személyre szabottabb ajánlásokat tenni, köszönhetően annak, hogy válaszait és eredményeit nem egy „átlagos embernek” hanem kifejezetten az iPhone, iPad vagy Mac tulajának, azaz nekünk fogalmazza meg, és mivel hozzáférése van minden készüléken tárolt adathoz, ezért olyan kérésekre is választ tud adni, mint például
- „Indítsd el azt a podcastot, amit a feleségem küldött nekem a múltkor”, vagy
- „Mutasd meg azokat a fájlokat, amiket Lacitól kaptam a múlt héten”, vagy
- „Mutasd meg azokat a képeket, amin Gabi van lila felsőben”.
Fő a biztonság
Mindez persze rengeteg kérdést felvet azzal kapcsolatban, hogy a vállalat hogyan kezeli ezeket az adatokat, a képek, szövegek és dokumentumok ugyanis számos esetben bizalmas információkat is tartalmazhatnak – ettől függetlenül azonban a felhasználó számára még hasznos lehet, ha az MI tud velük dolgozni. Az Apple annak érdekében, hogy a lehető legbiztonságosabbá tegye az Intelligence-t, úgy határozott, hogy a műveleteket nem a felhőben,
hanem magukon a készülékeken végeztetik el, tehát az adatok nem kerülnek ki sem az iPhone-ról, sem az iPadről, sem a Macről.
Ennek megvalósításához azonban brutális nyers erőre van szükség, amivel nem rendelkezik az összes olyan Apple-készülék, mire megérkezik az iOS 18, az iPadOS 18 és a macOS Sequoia. Az Apple Intelligence csakis kizárólag az iPhone 15 Prón és az iPhone 15 Pro Maxon lesz elérhető, illetve azokon az iPadeken és Maceken, amikben M szériás chip található. Ez azt jelenti, hogy a tavaly leleplezett két alapmodell, az iPhone 15 és az iPhone 15 Plus nem alkalmas az Apple Intelligence futtatására, ezekben a telefonokban ugyanis „csak” egy A16 Bionic chip ketyeg.
Vannak azonban alkalmak, amikor még az A17 Bionic chip, illetve az M szériás lapkák teljesítménye sem elég, illetve, amikor olyan kérdésekre kell választ adnia az Apple Intelligence-nek, amire egy másik MI például jobban tudna válaszolni. Ekkor jön képbe az Apple és az OpenAI együttműködése, minek keretein belül a ChatGPT-t és az azt működtető GPT-4o modellt ingyen és bérmentve használhatják az iPhone-tulajok, az ugyanis be van építve Siribe és az Apple Intelligence-be. Amikor egy olyan kérdéssel fordulunk Sirihez, amit az asszisztens úgy ítél meg, hogy a ChatGPT jobban meg tudna válaszolni, akkor egyszerűen csak megkérdezi tőlünk, hogy rendben van-e részünkről, ha az OpenAI asszisztensével válaszoltatja meg kérdésünket, a beleegyezés után pedig érkezik is a válasz.
Fontos megjegyezni, hogy Siri a beleegyezésünk nélkül soha nem támaszkodik az Apple Intelligence-en kívül más modellekre, ahogy az Apple azt is leszögezte, hogy a ChatGPT használatához nem kell bejelentkezni az OpenAI-fiókunkba, sőt, az sem feltétel, hogy egyáltalán regisztrációnk legyen.
Nem tudni, mikor lesz kész
Az Apple Intelligence egyelőre még fejlesztés alatt áll, sőt, az iOS 18, iPadOS 18 és macOS Sequoia ősszel várható megjelenésekor is csak béta fázisban lesz – ezt az Apple már most leszögezte, ahogy azt is, hogy a most bemutatott funkciók csak egy része lesz akkor elérhető; a többit valamikor 2025-ben szeretnék elérhetővé tenni. Ugyancsak érdemes megjegyezni, hogy a fejlesztés egyelőre csak angol nyelven lesz elérhető – további nyelvek érkezéséről nem ejtett szót az Apple. Az Apple Intelligence első végleges verzióját valamikor jövőre várhatjuk – addig is azonban el lehet merülni az operációs rendszerek egyéb újdonságaiban is, az új iOS, iPadOS és macOS ugyanis az Apple-féle MI-n felül bőven tartogat még újdonságokat, amiket hamarosan ugyancsak egy csokorba gyűjtünk. A 2024-es WWDC-n készített Apple Keynote-ot alább nézheti vissza teljes egészében:
(Borítókép: Apple)