JÖVŐ
A Rovatból

ChatGPT: teszteltük az AI-ügynököt, ami már nemcsak bevásárlólistát készít, de be is vásárol helyettünk

Kipróbáltuk, le tud-e foglalni egy időpontot a kedvenc fodrászatunkban, képes-e bevásárolni, talál-e olyan strandot, ahol van szabad napágy az Olaszországba tervezett nyaraláshoz, valamint hogyan segíthet egy erdélyi utazásban. Lassúnak, de meglepően hatékonynak bizonyult.


Az OpenAI július végén elérhetővé tette a ChatGPT Ügynököt, amely az eddig ismert chatbotot proaktívan viselkedő személyi asszisztenssé alakítja. Az OpenAI állítása szerint ezzel a funkcióval a ChatGPT „már nemcsak gondolkodik, hanem cselekszik is”, magyarán a felhasználó utasítására végrehajt feladatokat, az időpontfoglalástól, a termékek rendelésén át a vállalati dokumentációk, üzleti elemzések és prezentációk készítéséig. A vállalat azt ígéri, hogy az Ügynök egyesíti a ChatGPT nyelvi intelligenciáját a weboldalkezelő böngésző és az információelemző mélykutatás képességeivel.

Ennek köszönhetően az AI a böngészéstől és adatgyűjtéstől kezdve a kódfuttatáson át a dokumentumkészítésig számos feladatot önállóan megold. Rábízhatjuk például, hogy ellenőrizze a naptárunkat és készítsen összefoglalót a közelgő megbeszélésekből, tervezzen meg és hajtson is végre egy bevásárlást, vagy éppen elemezze versenytársaink adatait és készítsen belőlük prezentációt.

Felhasználói utasításra a ChatGPT-ügynök végigjárja a szükséges weboldalakat, szűri az információkat, szükség esetén biztonságosan bejelentkezik a felhasználó fiókjaiba, programkódot futtat egy elemzéshez, majd munkája eredményét letölthető formában adja át – például egy szerkeszthető diavetítés vagy táblázat formájában. És teszi mindezt az eddig megszokott módon: természetes nyelven adott utasítások alapján, gördülékeny párbeszédes formában.

Fodrász-időponttól, bevásárláson át a napágy-foglalásig

Négy dologgal is teszteltük az AI-ügynököt. Ehhez csak ki kellett választanunk az ügynök-módot a bal oldalon, vagy a beszélgetés alatt, az Eszközök menüpontban, és már indulhatott is a kísérlet.

Először azt kértük tőle, hogy foglaljon időpontot a kedvenc budai fodrászatunkban másnap 11 órára. Csak a hely nevét adtuk meg, és magát a kérést. Ezután a Chat GPT dolgozni kezdett. A mélykutatáshoz hasonlóan az ügynök-funkció használata során is végig látni lehet, hogy épp mit csinál a mesterséges intelligencia. Hogyan nyitja meg először a böngészőt, hogy rákeressen a fodrászat nevére, utána pedig a fodrászat weboldalát. Az igazi izgalmak innen jöttek, ugyanis a ChatGPT nemcsak végigolvasta az oldalon található információkat, de meg is találta a foglalás-gombot, amit képes megnyomni.

Utána aprólékosan végigböngészte a fodrászok listáját, megnézte, melyikük értékelése a legmagasabb, majd megnyitotta annak a fodrásznak a részletes foglaltsági táblázatát, hogy kiderítse, szabad-e nála a másnap 11 óra. Mivel nem volt az, folytatta a műveletet a második legjobbnak értékelt fodrásszal, akinél meg is találta a keresett időpontot. Mindezt akkurátusan megmutatta a kis ablakban. Amikor idáig ért, megkezdte a konkrét foglalást. Ehhez megkérdezte a weboldalon kért adatokat, vagyis a nevünket, e-mail címünket, telefonszámunkat, és kitöltötte velük a táblázatot. Majd feltette a kérdést, hogy véglegesítse-e a foglalást.

Ezen a ponton hagytuk abba a kísérletet, ami nagyon meggyőző volt, egyetlen dolgot leszámítva: ha magunk csináljuk ennek az időnek a töredéke alatt elintézzük.

Második tesztként bevásárlásban kértük a segítségét. Azt mondtuk, rakott karfiolhoz szeretnénk bevásárolni, és keresse meg, hol a legolcsóbbak a hozzávalók, valamint rendelje házhoz azokat. A ChatGPT először megkérdezte, van-e diétás preferenciánk, majd hozzálátott a kereséshet. Felkutatta a klasszikus rakott karfiol receptjét és a pontos hozzávalókat. Majd kinyitogatta különböző hipermarketek weboldalait, hogy összehasonlítsa az árakat. Közben a kis ablakban folyamatosan mutatta, épp mit csinál. Például, hogy épp a karfiol, a darált hús, a hagyma, a tojás, a tejföl, az olaj, majd a rizs árait tanulmányozza.

Mindenhol figyelembe vette a szükséges mennyiséget is, és a legolcsóbb kiszerelést választotta. A döntéshez az Árfigyelő információit is feldolgozta. Mindegyik webáruházban a Kosárba tette a szükséges termékeket, hogy lássa az összesített árat, valamint a házhozszállítás költségét. Végül kiválasztotta a legolcsóbb boltot.

Ebben a kísérletben a ChatGPT egyáltalán nem tűnt lassúnak. 9 perc alatt végzett a feladattal, majd azt kérte, lépjünk be a kiválasztott áruház oldalára.

Arról is tájékoztatott, hogy nem készít képernyőképeket, csak mi láthatjuk a megadott információkat, például a jelszavainkat, ugyanakkor felhívta a figyelmet arra, az adataink ettől még veszélybe lehetnek. Miután ezt tudomásul vettük, a ChatGPT-n belül megjelent az áruház bejelentkezési oldala, ahová beírhattuk a belépési adatainkat, majd elvégezhettük volna a fizetést.

Csakhogy ekkor kiderült, mindössze egy karfiolt tett a kosárba, amire felhívtuk a figyelmét. Ezután bepakolta a rizst, a hagymát és a többi összetevőt is, ami újabb 10 percet vett igényba, majd már valóban jöhetett a fizetés.

Ezután egy még nehezebb feladattal folytattuk. Azt kértük a ChatGPT ügynök-módjától, hogy az augusztus közepére Toscanába tervezett nyaraláshoz foglaljon le egy napernyőt és két napágyat a tengerparton. Megadtuk az utazás időpontját és a szállásunk pontos címét, azt kérve, hogy valamelyik közeli strandon foglalja le a helyet.

A kis ablakban ezúttal is lépésről-lépésre láthattuk, pontosan mi történik. A ChatGPT először is feltérképezte az adott városban található strandokat. Majd egy térkép-alkalmazással beazonosította a szállásunk koordinátáit, és ugyanezt megtette a strandokkal is. Ezután kiválasztotta a legközelebbi strandokat, és sorra megnyitogatta az oldalaikat. Nem volt probléma számára az olasz nyelv, gyorsan megtalálta a foglalási menüpontokat, és megnyitogatta azokat. Végigzongorázta a lehetőségeket, majd elkezdte kitölteni a foglalási adatokat. Beírta az időpontot, azt, hogy két napernyőt szeretnénk és elvégeztette az árkalkulációt. A végén kiválasztotta a legközelebbi és legolcsóbb lehetőséget, majd a foglalás véglegesítése előtt rákérdezett, hogy csakugyan megtegye-e az utolsó lépést.

Az egész művelet nagyjából 20-25 percet vett igénybe. És bár ezúttal sem kértük a véglegesítést, összességében nagyon hasznos infókhoz jutottunk, hiszen a foglalási oldal linkjének birtokában ezt már magunk is megtehetjük bármikor.

Harmadik próbaként arra kértük, hogy állítson össze egy útitervet, rajta minden magyar vonatkozású nevezetességgel, amely Erdély területén található. Az utasítást a lehető legjobban leegyszerűsítettük: nem adtuk meg lehetséges időintervallumot és közlekedési eszközt, nem befolyásoltuk a keresést olyan helyszínek megadásával, amelyek a legjobban érdekelnek bennünket, ahogy a kirándulásra szánt napok számát és a rendelkezésére álló forrásokat sem korlátoztuk. Csak hagytuk, hogy a Chat GPT a saját feje után menjen.

A „gondolkodás” közben láthatóvá tette, ahogy fokozatosan összeáll egy linkgyűjtemény, benne az utasításban szereplő helyszínekről szóló cikkekkel. A kutatás közben meg-megmutatta, hogy éppen melyik oldalon elemzi egy romániai nevezetesség magyar vonatkozásait, és közben részinformációkat is közölt róluk, felvillanó szövegdobozok formájában.

A relatíve gyors, 15 perces kutatás végére az AI-Ügynök készített egy listát az egyes helyszínek rövid leírásával, valamint egy összefoglaló táblázatot, amely szerint az általa talált magyar vonatkozású helyszínekre úgy másfél hetet érdemes szánni. Ez aligha elég, de a ChatGPT megoldotta, csak éppen úgy, hogy az egyes napok programja teljesíthetetlenül sűrű lett. A vaskos listát látva megkértük, hogy összesítse: az általa írt útiterv összesen hány helyszínt és megállót tartalmaz.

Kiderült, hogy tíz nap alatt 49 település 52 nevezetességén akar keresztül kergetni bennünket, ráadásul akadt olyan nap, amelyre több, egymástól akár 2-3 órányi autózásra fekvő helység meglátogatását javasolta.

Nem valószínű, hogy ezt a menetet bárki bevállalná, de ha felülemelkedünk azon, hogy az Ügynök valószínűleg nem törődött sem a múzeumok nyitvatartásával, sem az egyes helyszíneken eltöltött idővel (ellenkező esetben biztosan több napra osztotta volna el az állomásokat), kifejezetten hasznos kutatást végzett, rajta egy sor olyan nevezetességgel, ami erdélyi túrára készülve nem jut azonnal az ember eszébe, pedig érdemes betervezni.

Inkább totyogós gyermek, mint érett sprinter

A technológiai sajtó nagyjából egyetért abban, hogy az AI-ügynök, mint önállóan cselekvő asszisztens, lenyűgöző, ám a gyakorlati használat során a Wired is lassúnak találta, és jelezte, hogy a feladatok végrehajtása sem megy hibátlanul. A Futurism szintén nem volt elragadtatva a tempójától, hiszen egy meglehetősen egyszerű feladaton – egy adag muffin online rendelésén – egy teljes órát ült. Igaz, teljesítette a kérést, de fájdalmasan lassan, ráadásul minden érdemi lépés előtt jóváhagyást kért, amit a fejlesztők nyilván biztonsági megfontolásból építettek be: a modell tévedhet, ezért – egyelőre – nem lehet magára hagyni. A beszámoló arra jut, hogy az ügynök ezzel „furcsa bizonytalanságban ragad: egyszerre túl ostoba és túl hatalmas ahhoz, hogy felügyelet nélkül szabadon engedjük”. A konklúzió viszont az, hogy benne van a potenciál az autonómiára, csak még kell mellé a „babysitter”.

Az OpenAI nem tagadja, hogy az - egyelőre csak előfizetéssel rendelkező felhasználóknak elérhető - AI-ügynök jelenleg inkább totyogós gyermek, mint érett sprinter. Közben viszont szakértők rámutattak arra is, hogy bizonyos feladatokban meglepően hatékony. A Tom’s Guide például egy héten át tesztelte hétköznapi teendőkkel, és megállapította, hogy néhány bosszantó apróságot leszámítva tényleg képes terhet levenni az ember válláról. Az újságíró példaként kiemelte egy ritka játékfigura felkutatását, amit az ügynök hat perc alatt elvégzett, és ha már megtalálta egy webshopban, gyorsan kosárba is tette, majd elnavigált a fizetésig, ahol a szállítási cím és a kártyaadatok megadását már a felhasználóra hagyta. Lássuk be: ez jóval egyszerűbb, mint manuálisan keresgélni, és bár nem minden feladat megy ennyire olajozottan, egy kis felhasználói türelemért cserébe már most az életünk praktikus közreműködője lehet.

A technológiai elemzők és újságírók szinte teljes egyetértésben arra jutottak, hogy az Ügynök – némi felügyelettel – kifejezetten komplex munkát végez, és e tekintetben máris ügyesebb a megszokott chatbotoknál.

A rendszer egyik leglátványosabb képessége az, hogy automatikusan készít letölthető, szerkeszthető dokumentumokat – például komplett PowerPoint-prezentációkat vagy Excel-kimutatásokat – az összegyűjtött adatok alapján. Ezzel részben kiválthatja a hagyományos irodai szoftvereket és napi szinten több munkaórát felszabadíthat.

A szakértők szerint lenyűgöző az is, ahogyan a ChatGPT-ügynök egyetlen beszélgetésen belül zökkenőmentesen vált át „beszélgetésből” cselekvésbe, majd vissza. Egy üzleti riport készítése közben előbb elcseveg a felhasználó preferenciáiról, aztán kérésre nekilát a webes kutatásnak és adatgyűjtésnek, majd elemzi az eredményeket és megírja a jelentést, végül visszakérdez vagy magyarázatot fűz a talált információkhoz.

A gördülékeny folyamat arra utal, hogy az ügynök több AI-képesség olvasztótégelye, sőt, egyfajta „sok az egyben”, és amellett, hogy újszerű, jól demonstrálja, hová fejlődhet a generatív AI: a puszta szövegalkotástól rövid idő alatt eljutott odáig, hogy valós, hasznos munkafolyamatokat képes véghez vinni.

És ez még csak a kezdet, hiszen az OpenAI jelezte: folyamatosan dolgozik további fejlesztéseken és finomításokon.

Mivel az eszköz gyakorlatilag minden felhasználó számára hasznos, az OpenAI persze meglátta benne a monetizációs lehetőségeket. A The Guardian emlékeztet: Sam Altman vezérigazgató korábban felvetette, hogy ha az ügynök segítségével a felhasználók vásárlásokat intéznek, akkor a cég jogosult lehetne akár „2 százalékos tranzakciós díjra” is.

Bár az OpenAI sietett leszögezni, hogy a mostani ügynök ajánlásai között nincs reklámozott termék vagy szponzorált találat, a piaci elemzők szerint előbb-utóbb elkerülhetetlen lesz valamilyen hirdetési, esetleg partneri rendszer felállítása az AI-asszisztensekben. A fejlesztés céljai között tehát szerepel, hogy az AI új üzleti modelleket és bevételeket teremtsen – mind az OpenAI, mind a felhasználók számára – utóbbiaknál például azáltal, hogy időt és erőforrást takarít meg a feladatok automatizálásával.

Jövőnket alakító technológia első lépéseit látjuk

A szakértők szerint a ChatGPT ügynök-módja mérföldkőnek tekinthető a mesterséges intelligencia fejlődésében, mert először mutatja meg széles közönség előtt, hogy egy AI nemcsak csevegni, hanem cselekedni is tud. Többen „új korszak hajnalának” nevezték, vagy egyenesen megállapították, hogy az AI-asszisztensek „új generációjának” első képviselője. A TS2 Space elemzése szerint az ügynök júliusi megjelenése paradigmaváltó pillanat, de egyben óvatosságra int: Sam Altman például „forradalmi, de kísérleti” jelzővel illette, és nyomatékosította, hogy „egyelőre nem olyasmi, amit érdemes magas téttel bíró, vagy személyes információk megadásával járó feladatokra használni”.

Magyarán maga a cégvezetés is elismeri, hogy hiába a nagy előrelépés, az Ügynök jelen változata korántsem hibátlan vagy teljesen megbízható.

Mindezzel együtt a ChatGPT Ügynök túlmutat minden korábbi hasonló próbálkozáson, és sokan úgy vélik, előrevetíti, merre tart az AI-fejlesztés jövője. A Wired eljátszott a gondolattal, hogy ha az AI ügynökök tartósan velünk maradnak, alapjaiban változtatják meg az internet-felhasználás szokásait, mivel könnyen lehet, hogy néhány év múlva már nem mi magunk böngészünk és kattintgatunk, hanem a nekünk dolgozó botok teszik helyettünk, aztán nekünk már csak a végeredményre kell figyelni.

A lehetséges távlati irányok között ott a nagyobb önállóság, hogy magas szintű utasításokra teljes projekteket is képes legyen lemenedzselni, vagy éppen a multimodalitás (nemcsak weboldalakat olvas és ír, hanem képeket, hangokat, videókat is értelmez vagy generál) és a nyitás fizikai világ felé, hiszen már most adja magát, hogy az ügynökök integrálhatók legyenek okosotthon-rendszerekbe, robotokba, autókba.

Fontos előrelépés lehet az is, hogy az általános célú ChatGPT Ügynök mellett a jövőben különféle specializált mesterséges intelligencia ügynökök is megjelennek majd, egy-egy terület szakértőiként. Ezt a trendet valószínűsíti, hogy az OpenAI versenytársai ugyancsak kísérleteznek különböző fókuszú személyi asszisztensekkel. Az IBM például a saját watsonx Orchestrate nevű ügynökét fejleszti, kifejezetten nagyvállalati környezetek számára, miközben a Microsoftnak ott a Copilot sorozat, a Google-nek meg a Duet AI, amelyek szintén egy adott cég belső folyamataira szabhatók.

De milyen hatása lesz a mind fejlettebb ügynököknek a világra?

Várhatóan mélyreható változásokat idéznek elő: drasztikusan megnövelhetik az egyének és szervezetek hatékonyságát, másrészt viszont komoly kihívások elé állíthatják a társadalmat a munkahelyek, készségek és etikai normák terén.

A kihívások és negatív hatások oldalán a leggyakrabban a munkahelyekre gyakorolt nyomást említik, és nem minden ok nélkül: ha az ügynökök belépnek a munkaerőpiacra, bizonyos feladatkörökben az emberi munkaerő iránti igény csökkenhet, ami átképzési kényszert és átmeneti munkanélküliséget okozhat. Sam Altman hangsúlyozta, hogy a társadalomnak mihamarabb alkalmazkodnia kell a változásokhoz: már most el kell kezdeni átgondolni az oktatás és a foglalkoztatás átszabását egy AI-asszisztensekkel teli világra.

Az ügynökök ugyanis nemcsak segítők, hanem bizonyos értelemben versenytársak lesznek számos szellemi foglalkozásban.

Felmerül továbbá a kontroll és felelősség kérdése: ha egy AI cselekszik a nevünkben és hibázik (pl. téves adatot ad vagy hibás tranzakciót végez), ki viseli a következményeket? Jogi és etikai keretrendszereket kell kidolgozni az ügynökök tevékenységére, ahogy az is komoly biztonsági rizikó, hogy a fejlett ügynököket mire próbálják majd felhasználni rosszindulatú szereplők.

Egy másik hatás a felhasználói viselkedés és a készségek változása. Ha az emberek hozzászoknak, hogy az AI mindent elintéz, csökkenhet bizonyos képességek gyakorlása, például a komplex információkeresés vagy kritikus értékelés. Ennek oka az, hogy az emberi munka a végső döntésekre és a magasabb szintű felügyeletre korlátozódhat, míg a „piszkos munkát” a gép fogja végrehajtani. Ezzel párhuzamosan az oktatásban is arra kell felkészülni, hogy a jelenlegihez képest más készségeket kell előtérbe helyezni: a kreativitást, az AI-val való együttműködés képességét és például a stratégiai gondolkodást.

A fejlettebb ügynökök hatása tehát kettős lesz: az egyik oldalon gazdasági növekedést és hatékonyságot generálnak, míg a másikon társadalmi feszültségeket és alkalmazkodási kényszert.

A lehetséges nyereség nagy – de csak akkor arathatjuk le, ha okosan kezeljük a kockázatokat. Az OpenAI hangsúlyozza: egyszerre próbálnak szaladni és fékezni, hogy az eredmény biztosan pozitív legyen. Azt viszont innentől már a következő évek döntik el, hogy az akár mindent intéző AI-asszisztensek valóban jobbá teszik-e az életünket, vagy inkább új problémákat szülnek. Egy biztos: a változás elkezdődött, és nem lehet nem tudomást venni róla.


Link másolása
KÖVESS MINKET:

Népszerű
Ajánljuk
Címlapról ajánljuk


JÖVŐ
A Rovatból
Kiderült, meddig marad élhető a Föld – szuperszámítógépekkel számolta ki a NASA
Nem villámcsapás-szerű összeomlásra, hanem lassú, visszafordíthatatlan hanyatlásra kell készülnünk a kutatás eredménye szerint.


A NASA kutatói összefogtak a japán Toho Egyetem szakembereivel, és szuperszámítógépekkel modellezték, meddig maradhat élhető a Föld. Az eredmények egy távoli, de egyértelmű menetrendet vázolnak fel az élet végét illetően – számolt be róla a BGR.

A kutatás szerint a Nap jelenti majd a legnagyobb gondot: a következő egymilliárd évben nő a kibocsátása, és fokozatosan a lakhatósági határ fölé melegíti bolygónkat.

A becslés alapján a földi élet nagyjából az 1 000 002 021-es évben érhet véget, amikor a felszíni viszonyok már a legellenállóbb élőlényeknek is túl szélsőségesek lesznek.

A lejtmenet azonban sokkal korábban elindul. Ahogy a Nap forrósodik, a Föld légköre jelentősen átalakul: csökken az oxigénszint, meredeken nő a hőmérséklet, és romlik a levegő minősége. A részletes éghajlati és napsugárzási modellek szerint

ez nem villámcsapás-szerű összeomlás, hanem lassú, visszafordíthatatlan hanyatlás.

Ennek jelei már most látszanak. Erősödnek a napviharok és a koronakidobódások, nemrég az elmúlt 20 év legerősebb viharát rögzítették. Ezek hatnak a Föld mágneses mezejére és csökkentik a légköri oxigént.

Közben az ember okozta klímaváltozás is tovább növeli a terhelést:

a globális felmelegedés és a sarki jég olvadása a korábbi előrejelzéseknél gyorsabban halad, ami arra utal, hogy a környezet már jóval az egymilliárd éves időtáv előtt is ellehetetleníti az életet az emberek számára.

A kutatók a felkészülés és az alkalmazkodás fontosságát hangsúlyozzák. Egyesek zárt életfenntartó rendszereket és mesterséges élőhelyeket javasolnak, mások pedig a Földön túli lehetőségeket vizsgálják: a NASA és a SpaceX hosszú távú Mars-missziói az emberi élet fennmaradásának lehetséges útjait keresik, ha bolygónk lakhatatlanná válik.


# Csináld másképp

Te mit csinálnál másképp? - Csatlakozz a klímaváltozás hatásairól, a műanyagmentességről és a zero waste-ről szóló facebook-csoportunkhoz, és oszd meg a véleményedet, tapasztalataidat!

Link másolása
KÖVESS MINKET:

JÖVŐ
A Rovatból
A mesterséges intelligencia képes lehet akár tíz évre előre megjósolni, hogy kinek milyen betegsége lesz
A modell névtelen kórlapok mintáit figyeli, és évekre előre megmutatja, hol nagyobb a kockázat. A fejlesztők szerint így hamarabb lehet beavatkozni, és még az is tervezhető, hány szívinfarktusra kell készülnie egy városnak 2030-ban.


A kutatók szerint a mesterséges intelligencia akár tíz évre előre jelezhet egészségi gondokat, írja a BBC. A rendszer az emberek egészségügyi adataiban keres mintákat, és több mint 1000 betegség kockázatát számolja. Úgy írják le, mint egy időjárás-előrejelzést: százalékban adja meg a valószínűséget. A cél, hogy időben kiszűrje a magas kockázatú embereket, és évekre előre segítse a kórházak tervezését.

A Delphi-2M nevű modell hasonló technológiára épül, mint a közismert MI-chatbotok, például a ChatGPT. A chatbotok nyelvi mintákat tanulnak, és megjósolják, milyen szavak követik egymást. A Delphi-2M névtelenített egészségügyi adatokból tanulta meg felismerni a mintázatokat, és így jelzi előre, mi következhet és mikor. Nem mond pontos dátumot, hanem 1231 betegség valószínűségét becsli.

„Ahogy az időjárásnál 70 százalék esélyt jelezhetünk az esőre, ugyanezt meg tudjuk tenni az egészségügyben is”

– mondta Ewan Birney professzor, az Európai Molekuláris Biológiai Laboratórium megbízott főigazgatója. „Ráadásul nemcsak egy betegségre, hanem egyszerre az összesre – ilyet még soha nem tudtunk. Izgatott vagyok” – tette hozzá.

A fejlesztők először brit, névtelenített adatokon tanították a modellt: kórházi felvételek, háziorvosi adatok és életmódbeli szokások (például dohányzás) több mint 400 ezer résztvevőtől a UK Biobank projektből. Ezután más Biobank-résztvevők adataival ellenőrizték az előrejelzéseket, majd 1,9 millió ember dániai egészségügyi adatán is letesztelték. „Ha a modellünk azt mondja, hogy a következő évben tízből egy az esély, akkor tényleg nagyjából tízből egy esetben következik be” - tette hozzá Birney professzor.

A rendszer azoknál a betegségeknél működik a legjobban, amelyeknek jól követhető a lefolyása, például a 2-es típusú cukorbetegség, a szívinfarktus vagy a szepszis. Az inkább esetleges fertőzéseknél gyengébben teljesít.

Az orvosok ma is írnak fel koleszterincsökkentőt annak alapján, mekkora valakinél a szívinfarktus vagy a stroke kockázata. Az MI-eszköz még nem áll készen a klinikai használatra, de hasonló módon tervezik alkalmazni: korán azonosítani a magas kockázatú embereket, amikor még van esély megelőzni a betegséget. Ez jelenthet gyógyszert vagy célzott életmódtanácsot – például akinek nagyobb az esélye bizonyos májbetegségekre, annak a szokásosnál jobban megérheti visszavenni az alkoholfogyasztásból.

Az MI a szűrőprogramok tervezésében is segíthet, és egy térség összes egészségügyi adatát elemezve előre jelezheti a várható igényeket,

például hogy 2030-ban nagyjából hány szívinfarktus várható egy adott városban.

„Ez egy újfajta megközelítés kezdete az emberi egészség és a betegséglefolyás megértésében” – mondta Moritz Gerstung professzor, a Német Rákkutató Központ (DKFZ) onkológiai MI-osztályának vezetője. „Az olyan generatív modellek, mint a miénk, egy napon személyre szabhatják az ellátást, és nagy léptékben előre jelezhetik az egészségügyi szükségleteket.”

A Nature tudományos folyóiratban ismertetett modellt még finomítani és tesztelni kell a klinikai használat előtt. Torzítást okozhat, hogy a UK Biobank adatai főként 40–70 éves emberektől származnak. A fejlesztők most bővítik a modellt képalkotó vizsgálatokkal, genetikai információkkal és vérvizsgálati eredményekkel.

„Fontos hangsúlyozni, hogy ez kutatás – mindent alaposan tesztelni, szabályozni és átgondolni kell, mielőtt használni kezdjük, de a technológia adott ahhoz, hogy ilyen előrejelzéseket készítsünk” – nyomatékosította Birney professzor. Úgy véli, a genomika egészségügyi bevezetéséhez hasonló utat járhat be a folyamat: a tudósok bizalmától a rutinszerű klinikai használatig akár egy évtized is eltelhet.

A kutatás az Európai Molekuláris Biológiai Laboratórium, a Német Rákkutató Központ (DKFZ) és a Koppenhágai Egyetem együttműködésében készült. Gustavo Sudre, a King’s College London kutatója így értékelt: „Ez a munka jelentős lépés a skálázható, értelmezhető és – ami a legfontosabb – etikailag felelős orvosi prediktív modellezés felé.”


Link másolása
KÖVESS MINKET:

Ajánljuk

JÖVŐ
A Rovatból
Megkezdték a humanoid robotok tömeggyártását Kínában
A cég több ezer előrendelést említ, az ár körülbelül 11,5 millió forint. A mozgásnál emberi mintákat követnek: a végtagok összehangolását szimulációk és utánzásos tanulás segíti.
Maier Vilmos - szmo.hu
2025. szeptember 27.



A kínai Kepler Robotics elindította a K2 Bumblebee humanoid robot tömeggyártását, írja a Rakéta. A modellt logisztikai munkákra, gyártási feladatokban segítésre, kiállításokra és „speciális műveletekre” szánják.

A K2 hibrid architektúrával működik, ami energiahatékony üzemet tesz lehetővé. A gyártó szerint a humanoid egyhuzamban akár 8 órát is dolgozik.

Az ár a hasonló, általános célú humanoidokhoz képest kicsivel magasabb:

körülbelül 11,5 millió forint.

A robotra már több ezer megrendelés érkezett.

A cég a külalakot kevésbé, a mozgást viszont nagyon „emberire” tervezte. A K2 Bumblebee imitációs tanulással és szimulációkkal sajátította el a járás emberihez hasonló jellegzetességeit, beleértve a végtagok mozgásának összehangolását.

A humanoid robotról készült videót itt lehet megnézni:


Link másolása
KÖVESS MINKET:


JÖVŐ
A Rovatból
Sora 2: megjöttek a videók, amiket a képtelenség megkülönböztetni a valóságtól
Náci egyenruhába bújtattak hírességek, meghamisított történelmi események, kamu filmjelenetek igazinak tűnő színészekkel – máris ilyen videók készültek az OpenAI legújabb videógeneráló modelljével, ami egyszerre lenyűgöző és félelmetes.


A Sora 2 videógeneráló modell szeptember végén jelent meg, azzal az ígérettel, hogy a korábbi változathoz képest jelentősen javult a fizikai pontosság, a realizmus és az irányíthatóság. Mivel az OpenAI már a Sora tavaly decemberben kiadott első változatát is – a ChatGPT sikerével párhuzamba állítva – a videókészítés „GPT‑1 pillanatának” nevezte, nagy várakozások előzték meg a „GPT‑3.5 pillanatként” beharangozott Sora 2-t.

Az első verzió fejlesztői változatáról a demók alapján azt írtuk, olyan minőségű filmekhez, amelyeket szöveges utasításra generál, normál esetben külső helyszínekre, díszletekre, profi felszerelésekre és szakemberekre, statisztákra, illetve színészekre lenne szükség, de „úgy fest, hogy mostantól egyetlen AI, a Sora is elég lesz hozzá”.

Nyújthat ennél is többet egy videógeneráló modell? A Sora 2–nek a jelek szerint sikerült, mert a világ egyik ámulatból a másikba esik a vele készült mozgóképek láttán. Az OpenAI azt állítja, hogy az új modell kiküszöböli a korábbi videógenerálók jellemző hibáit, például az amorf tárgyakat és karaktereket, a torzult valóságot vagy a „túlzott optimizmust”. Utóbbihoz példát is kapcsol: ha egy generált videóban szereplő kosárlabdázó „elvéti” a dobást, az eddigi verziók inkább kicsavarták a realitást, és a labda még lehetetlen szögből is a gyűrűbe „teleportált”. Ehhez képest a Sora 2 a fizika törvényeivel teljesen megegyező módon bánik a tárgyak mozgásával: a labda a palánkba csapódik és pont úgy pattan vissza, ahogy az a valóságban is történne.

A tökéletlenség lehalkításával és a képminőség feltekerésével az OpenAI kisebb csodát alkotott: még egyszerű szöveges utasításokból is olyan videókat hoz létre, amelyeket a legtöbb néző képtelen megkülönböztetni a valóságtól. Az pedig, hogy mekkora a szakadék a versenytársak videógeneráló modelljei, valamint a Sora 2 között, remekül illusztrálja ez az összehasonlítás, amelyben a Google fejlesztette Veo 3–mal vetik össze a képességeit.

Ebben a videóban semmi sem valódi:

A gyorsan bővülő AI‑videópiacon persze vannak más vetélytársak is, például a Meta „Vibes” alkalmazása és a Meta Movie Gen modell, valamint az Elon Musk-féle xAI Grok Imagine-je. A Forbes hangsúlyozza, hogy utóbbi rendszerek 6–10 másodperces felvételeket készítenek, míg a Sora 2 akár egyperces videókat generálhat, illetve hangot is ad a tartalmakhoz, ami komoly fegyvertény a jelenlegi mezőnyben. És eddig minden jel arra mutat, hogy a Sora 2 a legerősebb videógeneráló AI.

Az OpenAI a modell széles körű – de egyelőre Észak-Amerikára korlátozott – bevezetése óta arra biztatja a felhasználókat, hogy a Sora 2 segítségével találjanak ki minél több új világot és történetet. A lehetőségeknek – látszólag – csak a képzelet szab határt, hiszen a modell képes az emberi hanghoz igazított dialógusok és hangeffektek generálására is, sőt, ha kell, a felhasználó hang‑ és videómintája alapján avatárt készít, így a saját filmünk főszereplőjévé válhatunk.

Mi változott? – A Sora 2 új képességei

Bár hozzáférés hiányában nekünk, magyaroknak egyelőre nincs összehasonlítási alapunk, az új modellről megjelent videókon valóban az látszik, hogy komoly szintlépés történt. Amíg a Sora demóiban a generált karakterek szemeit jótékonyan elrejtette valami (többnyire egy napszemüveg), a Sora 2 már nem tart az „uncanny valley” jelenségtől. Ez ugye az a nyugtalanító érzés, ami egy videojátékhoz vagy filmhez digitális eszközökkel létrehozott arc láttán tör ránk: hiába realisztikus a karakter, a tekintete természetellenes marad.

Az új modell már nem ilyen „félénk”: tisztában van vele, hogy amit előállít, teljesen életszerű, ezért nincs szükség trükközésre.

Olyannyira nincs, hogy az alábbi videóban látható és hallható Sam Altman sem Sam Altman, hanem egy Sora 2-vel létrehozott avatár, ami az OpenAI vezérigazgatójaként mutatja be a generatív AI képességeit. És ha erre nem figyelmeztetnek előre, aligha mondanánk meg, hogy nem a valódi személyt látjuk.

Az OpenAI szerint a Sora 2 legnagyobb újítása a fizikai törvények pontosabb szimulációja és a látvány élethű megjelenítése. A modell hosszabb és összetettebb cselekményeket, illetve akár többszereplős akciókat is képes kezelni, miközben megőrzi a mozgás törvényeinek koherenciáját.

A vállalat kiemelte, hogy a videók több jelenetből álló utasításokat követhetnek, és a rendszer megőrzi a generált világ állapotát: figyelembe veszi például azt, hogy a tárgyak az előző képsorban pontosan hol voltak. Ezzel már lehetséges akár több perces klipek és kisfilmek, ezáltal komplexebb narratívák létrehozása, de az OpenAI most még a rövid, gyorsan terjedő tartalmak felé tereli a felhasználókat, mert a játékos menőség meghozza a befektetők kedvét a további tervek finanszírozásához.

Lőttek a filmeseknek, vagy a Sora 2 csak egy új „ecset”, amivel alkothatnak?

Az OpenAI azzal hirdette a Sora, majd a Sora 2 rendszert, hogy a filmipar, az animációs stúdiók és a művészek eszköze lehet. A BBC Science Focus egyetért ezzel: azt írják, a rendszer megkönnyítheti animált klipek készítését, és ezzel időt, pénzt spórol. Az első verzió tartalmai ugyanakkor hemzsegtek a hibáktól. Ahogy arra a Washington Post is felhívta a figyelmet: a rendszer egy 1930‑as évekbeli jelenetben a cigaretta rossz végét gyújtotta meg vagy épp egyszerre több telefonkagylót adott a generált karakter kezébe, ráadásul hangot sem tudott létrehozni.

Ehhez képest a Sora 2 pontosságot és már szinkronizált hangot, illetve hangeffekteket is kínál, amivel elvileg tökéletesen alkalmassá válik a komplex szórakoztatóipari felhasználásra.

Az IndieWire elemzője ennek ellenére sem gondolja, hogy az új verzió a filmiparnak készült. A fejlesztők szerinte „nem törődnek Hollywooddal”, hiszen a platform elsősorban virális tartalmak gyártására ösztönzi az embereket, így a közösségi média új mémgyártó eszközévé válhat. És addig, ameddig ez csak igazoltatás elől meglépő Super Mario-s viccek szintjén realizálódik, nincs is nagy baj.

Ez még senkit sem bánt:

A gondok akkor kezdődnek, ha a könnyed hecceken túllépve valódi emberekről vagy valós eseményeket szimuláló helyzetekről készülnek valóságszagú kamuvideók, ami megnehezíti a független filmesek etikus AI‑felhasználását. Onnantól a Nintendo sem mókás rajongói videóként fogja kezelni a fentihez hasonló alkotásokat – ami még ingyen reklámot is csap a Mario Kart játékoknak –, mert attól tart majd, hogy a trend visszaéléseket szül, és óriási energiákat kell fordítani a szellemi tulajdona megvédésére.

A véleménycikk arra is figyelmeztet, hogy a Sora‑videók virális mémjei új frontot nyitnak a szerzői jogi háborúban, hiszen az AI‑userek óhatatlanul egyre kevesebbet törődnek majd a szellemi tulajdonnal, ezáltal tovább mélyítik az árkot az alkotók és az AI‑fejlesztők között. Az Indiewire ezzel kapcsolatban szakmai állásfoglalásokat sürget: úgy véli, ha a jogtulajdonosok és szakszervezetek nem alakítanak ki standardokat, elveszíthetik a harcot.

Osztja ezt az aggodalmat a WGBH-nak nyilatkozó digitális képzőművész, Kyt Janae is, aki szerint nem kell egy év, és szinte képtelenek leszünk megkülönböztetni az ember alkotta tartalmakat az AI-val generált képektől. Thomas Smith, a képek digitalizálásával, menedzselésével, kiadásával és monetizálásával foglalkozó Gado Images vezérigazgatója hozzátette:

a mesterségesen létrehozott képek miatt a valódi fotók is hitelességi válságba kerülhetnek.

Ezek a megállapítások azt jelzik, hogy a videógeneráló AI több területen okozhat károkat, a szórakoztatóipartól a politikán át a személyiségi jogokig.

Máris támadják az új AI-modellt

A Sora 2 indítását rögtön kritikák és aggályok kísérték. A The Guardian például arról számolt be, hogy a generált videók posztolására létrehozott TikTok-szerű app feedje hamar megtelt erőszakos és rasszista jelenetekkel, köztük bombázást és tömeggyilkosságot szimuláló tartalmakkal. Joan Donovan kutató ezzel kapcsolatban arra figyelmeztetett, hogy az ilyen eszközök elmossák a valóság és a hazugság között húzódó határt, ezáltal alkalmassá válhatnak gyűlöletkeltésre és zaklatásra.

Sam Altman ehhez képest a saját blogján a „kreativitás ChatGPT‑pillanataként” jellemezte a Sora 2 indulását, de óvatosan elismerte azt is, hogy például a bullying elkerülése érdekében nagyobb figyelmet kell fordítani a moderálásra.

A Rolling Stone közben példákkal illusztrálva mutatta be, hogy a realisztikus videógeneráló segítségével a felhasználók – csupán heccből – náci egyenruhába bújtattak hírességeket, történelmi eseményeket hamisítottak vagy éppen levédett karaktereket (Pikachu, Ronald McDonald, SpongeBob) használtak fel, ami szerzői jogi veszélyeket sejtet.

A Sora 2 kritikusait idézve a magazin azt írja, hogy az OpenAI „próbálja bepereltetni önmagát”.

A Vox cikke egyenesebben fogalmaz: felhívja a figyelmet arra, hogy a Sora 2 alapértelmezése szerint a jogtulajdonosok azok, akiknek kérvényezniük kellene a karaktereik eltávolítását, ami olyan, mintha a fejlesztők kifejezetten a szerzői jogok megsértése felé terelnék a felhasználókat.

Nem véletlen, hogy a kritikákkal szembesülő Sam Altman később frissítette a posztját, jelezve, hogy a jövőben a jogtulajdonosok „opt‑in” alapon adhatnak hozzá karaktereket az AI-modellhez, lehetővé téve, hogy a generált videók után részesedést kapjanak a bevételekből.

Őrületes energiaigény és a Sora 2 más pénzügyi hatásai

A modell bejelentését követően az elemzők felvetették, hogy a videók generálása rendkívüli mennyiségű számítási kapacitást és energiát igényel. Egyes kutatók szerint egy rövid, nagy felbontású videó generálása több mint 700‑szor több energiát fogyaszt, mint egy állókép létrehozása. Ennek következtében a jövő adatközpontjai már minden kétséget kizáróan nagyvárosokkal vetekedő energiazabáló – és karbonkibocsátó – szörnyetegek lesznek.

A Time elemzése rámutat: az AI‑videók ugyan drágák, de a cégek – köztük az OpenAI és a Meta – abban reménykednek, hogy a rövid videók gyártásával több előfizetéses felhasználó és befektető érkezik. Ez további bevételi forráshoz juttatja őket, ami még nagyobb modellek, egy napon pedig az általános mesterséges intelligencia megjelenéséhez vezethet.

Az AI-cégeknek tényleg nagyon kell a pénz, mert a generatív videómodellek fejlesztése hatalmas összegeket emészt fel. Ez az elemzők szerint idővel arra készteti majd a vállalatokat, hogy a befektetőktől és felhasználóktól beszedett pénzen túl a hirdetési piacon is terjeszkedjenek, illetve további előfizetési csomagokat találjanak ki, valamint árat emeljenek.

Mindeközben fontos cél a felhasználók viselkedési adatainak gyűjtése: a jövőbeli modellekhez a valós interakciók és preferenciák révén tudnak több és jobb tréningadatot gyűjteni.

Ami pedig a belátható jövőben érkező fejlesztéseket illeti, az OpenAI egyik korábbi közleménye felvetette azt is, hogy létrehoznak egy „világszimulátort”, amely pontosan modellezi a fizikai világ törvényeit, ezzel új tudományos problémákat lesz képes megoldani.

Új AI-evolúciós lépcsőfokok jönnek

A Sora 2 ezeknek a vízióknak a nagy reménysége, amitől azt várják, hogy további fejlesztéseket és több platformon elérhető verziókat eredményez. A megjelenése új korszakot nyit a generatív AI-k világában, hiszen bátran kijelenthetjük, hogy ennyire valószerű mozgásokat és hangeffekteket, illetve ilyen időtartamú történeteket még egyik videógeneráló AI sem tudott létrehozni.

Bár a fizika törvényeit még nem követi le tökéletesen és vastagon lehetőséget ad a visszaélésekre – a deepfake-től az erőszakos tartalmakon át a szerzői jogok megsértéséig –, a komoly etikai és jogi kérdések kezelése után érdemes lehet kihasználni a benne rejlő lehetőségeket.

A szakértők szerint hamar mainstream eszközzé válhat, de a társadalomnak – még új normarendszerek és hatékony moderálás bevezetése mellett is – fel kell készülnie arra, hogy a valóság és a mesterséges tartalom közötti határ elmosódik.

Mivel a gazdasági potenciál óriási, számolni kell a bővülésével és az energiafogyasztás növekedésével, valamint azzal, hogy a szellemi tulajdon megóvása érdekében ki kell harcolni a generált tartalmak után járó részesedést. Ezek az együttműködések – ha egyáltalán megköttetnek és aztán hosszú távon működőképesnek bizonyulnak – a kreatív tartalomgyártás ragyogó gyöngyszemévé varázsolhatják a Sora 2-t, illetve a jövőben érkező hasonló modelleket.


Link másolása
KÖVESS MINKET:

Ajánljuk