ChatGPT: teszteltük az AI-ügynököt, ami már nemcsak bevásárlólistát készít, de be is vásárol helyettünk
Az OpenAI július végén elérhetővé tette a ChatGPT Ügynököt, amely az eddig ismert chatbotot proaktívan viselkedő személyi asszisztenssé alakítja. Az OpenAI állítása szerint ezzel a funkcióval a ChatGPT „már nemcsak gondolkodik, hanem cselekszik is”, magyarán a felhasználó utasítására végrehajt feladatokat, az időpontfoglalástól, a termékek rendelésén át a vállalati dokumentációk, üzleti elemzések és prezentációk készítéséig. A vállalat azt ígéri, hogy az Ügynök egyesíti a ChatGPT nyelvi intelligenciáját a weboldalkezelő böngésző és az információelemző mélykutatás képességeivel.
Ennek köszönhetően az AI a böngészéstől és adatgyűjtéstől kezdve a kódfuttatáson át a dokumentumkészítésig számos feladatot önállóan megold. Rábízhatjuk például, hogy ellenőrizze a naptárunkat és készítsen összefoglalót a közelgő megbeszélésekből, tervezzen meg és hajtson is végre egy bevásárlást, vagy éppen elemezze versenytársaink adatait és készítsen belőlük prezentációt.
Felhasználói utasításra a ChatGPT-ügynök végigjárja a szükséges weboldalakat, szűri az információkat, szükség esetén biztonságosan bejelentkezik a felhasználó fiókjaiba, programkódot futtat egy elemzéshez, majd munkája eredményét letölthető formában adja át – például egy szerkeszthető diavetítés vagy táblázat formájában. És teszi mindezt az eddig megszokott módon: természetes nyelven adott utasítások alapján, gördülékeny párbeszédes formában.
Fodrász-időponttól, bevásárláson át a napágy-foglalásig
Négy dologgal is teszteltük az AI-ügynököt. Ehhez csak ki kellett választanunk az ügynök-módot a bal oldalon, vagy a beszélgetés alatt, az Eszközök menüpontban, és már indulhatott is a kísérlet.
Először azt kértük tőle, hogy foglaljon időpontot a kedvenc budai fodrászatunkban másnap 11 órára. Csak a hely nevét adtuk meg, és magát a kérést. Ezután a Chat GPT dolgozni kezdett. A mélykutatáshoz hasonlóan az ügynök-funkció használata során is végig látni lehet, hogy épp mit csinál a mesterséges intelligencia. Hogyan nyitja meg először a böngészőt, hogy rákeressen a fodrászat nevére, utána pedig a fodrászat weboldalát. Az igazi izgalmak innen jöttek, ugyanis a ChatGPT nemcsak végigolvasta az oldalon található információkat, de meg is találta a foglalás-gombot, amit képes megnyomni.
Utána aprólékosan végigböngészte a fodrászok listáját, megnézte, melyikük értékelése a legmagasabb, majd megnyitotta annak a fodrásznak a részletes foglaltsági táblázatát, hogy kiderítse, szabad-e nála a másnap 11 óra. Mivel nem volt az, folytatta a műveletet a második legjobbnak értékelt fodrásszal, akinél meg is találta a keresett időpontot. Mindezt akkurátusan megmutatta a kis ablakban. Amikor idáig ért, megkezdte a konkrét foglalást. Ehhez megkérdezte a weboldalon kért adatokat, vagyis a nevünket, e-mail címünket, telefonszámunkat, és kitöltötte velük a táblázatot. Majd feltette a kérdést, hogy véglegesítse-e a foglalást.
Második tesztként bevásárlásban kértük a segítségét. Azt mondtuk, rakott karfiolhoz szeretnénk bevásárolni, és keresse meg, hol a legolcsóbbak a hozzávalók, valamint rendelje házhoz azokat. A ChatGPT először megkérdezte, van-e diétás preferenciánk, majd hozzálátott a kereséshet. Felkutatta a klasszikus rakott karfiol receptjét és a pontos hozzávalókat. Majd kinyitogatta különböző hipermarketek weboldalait, hogy összehasonlítsa az árakat. Közben a kis ablakban folyamatosan mutatta, épp mit csinál. Például, hogy épp a karfiol, a darált hús, a hagyma, a tojás, a tejföl, az olaj, majd a rizs árait tanulmányozza.
Mindenhol figyelembe vette a szükséges mennyiséget is, és a legolcsóbb kiszerelést választotta. A döntéshez az Árfigyelő információit is feldolgozta. Mindegyik webáruházban a Kosárba tette a szükséges termékeket, hogy lássa az összesített árat, valamint a házhozszállítás költségét. Végül kiválasztotta a legolcsóbb boltot.
Ebben a kísérletben a ChatGPT egyáltalán nem tűnt lassúnak. 9 perc alatt végzett a feladattal, majd azt kérte, lépjünk be a kiválasztott áruház oldalára.
Arról is tájékoztatott, hogy nem készít képernyőképeket, csak mi láthatjuk a megadott információkat, például a jelszavainkat, ugyanakkor felhívta a figyelmet arra, az adataink ettől még veszélybe lehetnek. Miután ezt tudomásul vettük, a ChatGPT-n belül megjelent az áruház bejelentkezési oldala, ahová beírhattuk a belépési adatainkat, majd elvégezhettük volna a fizetést.
Ezután egy még nehezebb feladattal folytattuk. Azt kértük a ChatGPT ügynök-módjától, hogy az augusztus közepére Toscanába tervezett nyaraláshoz foglaljon le egy napernyőt és két napágyat a tengerparton. Megadtuk az utazás időpontját és a szállásunk pontos címét, azt kérve, hogy valamelyik közeli strandon foglalja le a helyet.
A kis ablakban ezúttal is lépésről-lépésre láthattuk, pontosan mi történik. A ChatGPT először is feltérképezte az adott városban található strandokat. Majd egy térkép-alkalmazással beazonosította a szállásunk koordinátáit, és ugyanezt megtette a strandokkal is. Ezután kiválasztotta a legközelebbi strandokat, és sorra megnyitogatta az oldalaikat. Nem volt probléma számára az olasz nyelv, gyorsan megtalálta a foglalási menüpontokat, és megnyitogatta azokat. Végigzongorázta a lehetőségeket, majd elkezdte kitölteni a foglalási adatokat. Beírta az időpontot, azt, hogy két napernyőt szeretnénk és elvégeztette az árkalkulációt. A végén kiválasztotta a legközelebbi és legolcsóbb lehetőséget, majd a foglalás véglegesítése előtt rákérdezett, hogy csakugyan megtegye-e az utolsó lépést.
Harmadik próbaként arra kértük, hogy állítson össze egy útitervet, rajta minden magyar vonatkozású nevezetességgel, amely Erdély területén található. Az utasítást a lehető legjobban leegyszerűsítettük: nem adtuk meg lehetséges időintervallumot és közlekedési eszközt, nem befolyásoltuk a keresést olyan helyszínek megadásával, amelyek a legjobban érdekelnek bennünket, ahogy a kirándulásra szánt napok számát és a rendelkezésére álló forrásokat sem korlátoztuk. Csak hagytuk, hogy a Chat GPT a saját feje után menjen.
A „gondolkodás” közben láthatóvá tette, ahogy fokozatosan összeáll egy linkgyűjtemény, benne az utasításban szereplő helyszínekről szóló cikkekkel. A kutatás közben meg-megmutatta, hogy éppen melyik oldalon elemzi egy romániai nevezetesség magyar vonatkozásait, és közben részinformációkat is közölt róluk, felvillanó szövegdobozok formájában.
A relatíve gyors, 15 perces kutatás végére az AI-Ügynök készített egy listát az egyes helyszínek rövid leírásával, valamint egy összefoglaló táblázatot, amely szerint az általa talált magyar vonatkozású helyszínekre úgy másfél hetet érdemes szánni. Ez aligha elég, de a ChatGPT megoldotta, csak éppen úgy, hogy az egyes napok programja teljesíthetetlenül sűrű lett. A vaskos listát látva megkértük, hogy összesítse: az általa írt útiterv összesen hány helyszínt és megállót tartalmaz.
Nem valószínű, hogy ezt a menetet bárki bevállalná, de ha felülemelkedünk azon, hogy az Ügynök valószínűleg nem törődött sem a múzeumok nyitvatartásával, sem az egyes helyszíneken eltöltött idővel (ellenkező esetben biztosan több napra osztotta volna el az állomásokat), kifejezetten hasznos kutatást végzett, rajta egy sor olyan nevezetességgel, ami erdélyi túrára készülve nem jut azonnal az ember eszébe, pedig érdemes betervezni.
Inkább totyogós gyermek, mint érett sprinter
A technológiai sajtó nagyjából egyetért abban, hogy az AI-ügynök, mint önállóan cselekvő asszisztens, lenyűgöző, ám a gyakorlati használat során a Wired is lassúnak találta, és jelezte, hogy a feladatok végrehajtása sem megy hibátlanul. A Futurism szintén nem volt elragadtatva a tempójától, hiszen egy meglehetősen egyszerű feladaton – egy adag muffin online rendelésén – egy teljes órát ült. Igaz, teljesítette a kérést, de fájdalmasan lassan, ráadásul minden érdemi lépés előtt jóváhagyást kért, amit a fejlesztők nyilván biztonsági megfontolásból építettek be: a modell tévedhet, ezért – egyelőre – nem lehet magára hagyni. A beszámoló arra jut, hogy az ügynök ezzel „furcsa bizonytalanságban ragad: egyszerre túl ostoba és túl hatalmas ahhoz, hogy felügyelet nélkül szabadon engedjük”. A konklúzió viszont az, hogy benne van a potenciál az autonómiára, csak még kell mellé a „babysitter”.
Az OpenAI nem tagadja, hogy az - egyelőre csak előfizetéssel rendelkező felhasználóknak elérhető - AI-ügynök jelenleg inkább totyogós gyermek, mint érett sprinter. Közben viszont szakértők rámutattak arra is, hogy bizonyos feladatokban meglepően hatékony. A Tom’s Guide például egy héten át tesztelte hétköznapi teendőkkel, és megállapította, hogy néhány bosszantó apróságot leszámítva tényleg képes terhet levenni az ember válláról. Az újságíró példaként kiemelte egy ritka játékfigura felkutatását, amit az ügynök hat perc alatt elvégzett, és ha már megtalálta egy webshopban, gyorsan kosárba is tette, majd elnavigált a fizetésig, ahol a szállítási cím és a kártyaadatok megadását már a felhasználóra hagyta. Lássuk be: ez jóval egyszerűbb, mint manuálisan keresgélni, és bár nem minden feladat megy ennyire olajozottan, egy kis felhasználói türelemért cserébe már most az életünk praktikus közreműködője lehet.
A rendszer egyik leglátványosabb képessége az, hogy automatikusan készít letölthető, szerkeszthető dokumentumokat – például komplett PowerPoint-prezentációkat vagy Excel-kimutatásokat – az összegyűjtött adatok alapján. Ezzel részben kiválthatja a hagyományos irodai szoftvereket és napi szinten több munkaórát felszabadíthat.
A szakértők szerint lenyűgöző az is, ahogyan a ChatGPT-ügynök egyetlen beszélgetésen belül zökkenőmentesen vált át „beszélgetésből” cselekvésbe, majd vissza. Egy üzleti riport készítése közben előbb elcseveg a felhasználó preferenciáiról, aztán kérésre nekilát a webes kutatásnak és adatgyűjtésnek, majd elemzi az eredményeket és megírja a jelentést, végül visszakérdez vagy magyarázatot fűz a talált információkhoz.
A gördülékeny folyamat arra utal, hogy az ügynök több AI-képesség olvasztótégelye, sőt, egyfajta „sok az egyben”, és amellett, hogy újszerű, jól demonstrálja, hová fejlődhet a generatív AI: a puszta szövegalkotástól rövid idő alatt eljutott odáig, hogy valós, hasznos munkafolyamatokat képes véghez vinni.
Mivel az eszköz gyakorlatilag minden felhasználó számára hasznos, az OpenAI persze meglátta benne a monetizációs lehetőségeket. A The Guardian emlékeztet: Sam Altman vezérigazgató korábban felvetette, hogy ha az ügynök segítségével a felhasználók vásárlásokat intéznek, akkor a cég jogosult lehetne akár „2 százalékos tranzakciós díjra” is.
Bár az OpenAI sietett leszögezni, hogy a mostani ügynök ajánlásai között nincs reklámozott termék vagy szponzorált találat, a piaci elemzők szerint előbb-utóbb elkerülhetetlen lesz valamilyen hirdetési, esetleg partneri rendszer felállítása az AI-asszisztensekben. A fejlesztés céljai között tehát szerepel, hogy az AI új üzleti modelleket és bevételeket teremtsen – mind az OpenAI, mind a felhasználók számára – utóbbiaknál például azáltal, hogy időt és erőforrást takarít meg a feladatok automatizálásával.
Jövőnket alakító technológia első lépéseit látjuk
A szakértők szerint a ChatGPT ügynök-módja mérföldkőnek tekinthető a mesterséges intelligencia fejlődésében, mert először mutatja meg széles közönség előtt, hogy egy AI nemcsak csevegni, hanem cselekedni is tud. Többen „új korszak hajnalának” nevezték, vagy egyenesen megállapították, hogy az AI-asszisztensek „új generációjának” első képviselője. A TS2 Space elemzése szerint az ügynök júliusi megjelenése paradigmaváltó pillanat, de egyben óvatosságra int: Sam Altman például „forradalmi, de kísérleti” jelzővel illette, és nyomatékosította, hogy „egyelőre nem olyasmi, amit érdemes magas téttel bíró, vagy személyes információk megadásával járó feladatokra használni”.
Mindezzel együtt a ChatGPT Ügynök túlmutat minden korábbi hasonló próbálkozáson, és sokan úgy vélik, előrevetíti, merre tart az AI-fejlesztés jövője. A Wired eljátszott a gondolattal, hogy ha az AI ügynökök tartósan velünk maradnak, alapjaiban változtatják meg az internet-felhasználás szokásait, mivel könnyen lehet, hogy néhány év múlva már nem mi magunk böngészünk és kattintgatunk, hanem a nekünk dolgozó botok teszik helyettünk, aztán nekünk már csak a végeredményre kell figyelni.
A lehetséges távlati irányok között ott a nagyobb önállóság, hogy magas szintű utasításokra teljes projekteket is képes legyen lemenedzselni, vagy éppen a multimodalitás (nemcsak weboldalakat olvas és ír, hanem képeket, hangokat, videókat is értelmez vagy generál) és a nyitás fizikai világ felé, hiszen már most adja magát, hogy az ügynökök integrálhatók legyenek okosotthon-rendszerekbe, robotokba, autókba.
Fontos előrelépés lehet az is, hogy az általános célú ChatGPT Ügynök mellett a jövőben különféle specializált mesterséges intelligencia ügynökök is megjelennek majd, egy-egy terület szakértőiként. Ezt a trendet valószínűsíti, hogy az OpenAI versenytársai ugyancsak kísérleteznek különböző fókuszú személyi asszisztensekkel. Az IBM például a saját watsonx Orchestrate nevű ügynökét fejleszti, kifejezetten nagyvállalati környezetek számára, miközben a Microsoftnak ott a Copilot sorozat, a Google-nek meg a Duet AI, amelyek szintén egy adott cég belső folyamataira szabhatók.
De milyen hatása lesz a mind fejlettebb ügynököknek a világra?
Várhatóan mélyreható változásokat idéznek elő: drasztikusan megnövelhetik az egyének és szervezetek hatékonyságát, másrészt viszont komoly kihívások elé állíthatják a társadalmat a munkahelyek, készségek és etikai normák terén.
A kihívások és negatív hatások oldalán a leggyakrabban a munkahelyekre gyakorolt nyomást említik, és nem minden ok nélkül: ha az ügynökök belépnek a munkaerőpiacra, bizonyos feladatkörökben az emberi munkaerő iránti igény csökkenhet, ami átképzési kényszert és átmeneti munkanélküliséget okozhat. Sam Altman hangsúlyozta, hogy a társadalomnak mihamarabb alkalmazkodnia kell a változásokhoz: már most el kell kezdeni átgondolni az oktatás és a foglalkoztatás átszabását egy AI-asszisztensekkel teli világra.
Felmerül továbbá a kontroll és felelősség kérdése: ha egy AI cselekszik a nevünkben és hibázik (pl. téves adatot ad vagy hibás tranzakciót végez), ki viseli a következményeket? Jogi és etikai keretrendszereket kell kidolgozni az ügynökök tevékenységére, ahogy az is komoly biztonsági rizikó, hogy a fejlett ügynököket mire próbálják majd felhasználni rosszindulatú szereplők.
Egy másik hatás a felhasználói viselkedés és a készségek változása. Ha az emberek hozzászoknak, hogy az AI mindent elintéz, csökkenhet bizonyos képességek gyakorlása, például a komplex információkeresés vagy kritikus értékelés. Ennek oka az, hogy az emberi munka a végső döntésekre és a magasabb szintű felügyeletre korlátozódhat, míg a „piszkos munkát” a gép fogja végrehajtani. Ezzel párhuzamosan az oktatásban is arra kell felkészülni, hogy a jelenlegihez képest más készségeket kell előtérbe helyezni: a kreativitást, az AI-val való együttműködés képességét és például a stratégiai gondolkodást.
A lehetséges nyereség nagy – de csak akkor arathatjuk le, ha okosan kezeljük a kockázatokat. Az OpenAI hangsúlyozza: egyszerre próbálnak szaladni és fékezni, hogy az eredmény biztosan pozitív legyen. Azt viszont innentől már a következő évek döntik el, hogy az akár mindent intéző AI-asszisztensek valóban jobbá teszik-e az életünket, vagy inkább új problémákat szülnek. Egy biztos: a változás elkezdődött, és nem lehet nem tudomást venni róla.