JÖVŐ
A Rovatból

Rab Árpád: Ha a mesterséges intelligencia megcsinálja, amit eddig én, akkor ki vagyok én?

A jövőkutató szerint az MI rákényszerít, hogy belenézzünk az emberi értékek tükrébe. A Momentán Fesztiválon az is kiderülhet, hogy improvizációban legyőzheti-e a színészeket a mesterséges intelligencia.
Fischer Gábor - szmo.hu
2023. június 06.



Az idei Momentán Fesztiválon számomra igazi meglepetésnek ígérkezik Rab Árpád fellépése. Az, hogy a tudomány emberei médiaszerepléseket vállalnak, nem újdonság, hiszen Carl Sagan, de akár Czeizel Endre, vagy Michio Kaku, Kiss László mind médiaszerepléseikről váltak ismertté, de tették népszerűvé az általuk művelt tudományt is. Azonban, hogy egy improvizációs fesztiválon, egy ízig-vérig színpadi, színházi eseményen is szerepel egy tudós, számomra szintlépés. (Nemcsak) erről kérdeztem Rab Árpádot.

– Egy alternatív színházi társulat fesztiválján mit keres egy jövőkutató tudós, hogyan csöppent ebbe bele?

– Az információs társadalomban, az új világban nagyon sok minden megváltozott. Újra vissza kell szerezni a bizalmat a tudománynak. Csak az, hogy én egyetemi docens vagyok, nem azt jelenti, hogy az emberek az én kutatásaimat fogják elolvasni.

De ha el akarom érni, hogy egy olyan témában, ami nekem fontos, tájékozottabbak legyenek, akkor tudnom kell a tudománykommunikáció eszközeivel élni.

Nagyon sok kolléga csinálja, és szerintem nagyon jó dolog. Eddig is volt már több számomra izgalmas „szereplésem”. Például a budapesti filharmonikusokkal volt egy közös előadásunk, ahol ők klasszikus darabokat játszottak, a szünetben én beszéltem a jövőről. Érdekes volt, hogy három darab, között két előadást tartottam, és a szünetben kérdéseket lehetett felírni, és utána folytatódott az előadás. Akkor nem tudtuk, hogy lesznek-e kérdések, de végül egy nagy kötegnyi gyűlt össze. Tehát az emberek nyitottak, nem az a lényeg, hogy egyetértsenek velem, hanem az, hogy gondolkodjanak. Ezért én alapértelmezetten nem mondok nemet ilyen felkérésekre. Ők kerestek meg, az ő ötletük volt és én örömmel vállaltam.

– Van rá tippje, hogy miért pont önre esett a választásuk?

– Én úgy tudom, hogy ez klasszikus előadástípusa a társulatnak, hogy úgy hoznak be tudományt a színpadra, hogy ők közben eljátsszák. Vannak ennek már előzményei az ő életükben. Digitális kultúrakutató, jövőkutató még nem lépett fel a Momentánnal. Viszont én húsz éve csinálom az előrejelzéseket, de az utóbbi két-három évben nagyon megugrott az érdeklődés a munkám iránt.

– Mi lehet ennek az oka?

– Gyorsan változik a világ, kiszámíthatatlanabbá vált, ezért sokakat érdekel, hogy egy jövőkutató mit gondol, hogy lehet felkészülni a jövőre? Hol van a helyünk a világban? Szerintem őket, mint színészeket, emberileg is érdekli, tehát ez valahonnan innen indult el, de erről lehet, hogy ők tudnánk többet mesélni.

– Minden bizonnyal ön is olvasta az Arthur C. Clarke: A jövő körvonalai című rövid könyvét, ami nagyon lenyűgöző olvasmány, de a sok érdekes megállapítás mellett elképesztő azért azt is látni, mennyire el tudott siklani még ez a remek ember is egy-két olyan dolog mellett, ami végül is bekövetkezett. Tehát nagyon népszerű dolog a jövőről beszélgetni, de én azt tapasztalom, hogy igazából ezt még senkinek sem sikerült megjósolnia.

– Nyilván sokféle ember sokféle módon foglalkozik vele, magamról tudok beszélni, tehát nem azt mondom, hogy az egész jövőkutató szakma így gondolkodik, ahogy én. Én magamat eleve trendkutatóként szeretem definiálni. Tehát

az ember a tapasztalatai, meg sok adat segítségével forgatókönyveket vázol fel, és azt mondja, hogy ha így csinálunk valamit, akkor ennek ez lehet az eredménye, ha úgy, akkor ennek ez lehet az eredménye, és akkor visszajövök a jelenbe, és elkezdem úgy alakítani a dolgokat, hogy egy nekem tetsző forgatókönyv valósuljon meg a jövőben.

Ez viszont azt is jelenti, hogy én nagyon társadalom és technológia fókuszú vagyok. 14 iparág adatait gyűjtöm, de én is csak egy szeletét látom át az egésznek. Hiába ezzel foglalkozom éjjel-nappal, de nagyon sok mindent nem látok. A másik, hogy próbálom a saját jelenségeimen belül látni azt, ami fontos, de ezek sose kizáró forgatókönyvek. Én nem egy teljességet vagy nem egy tutit akarok megmondani, hanem az X forgatókönyv közül, amiket jól meg tudok ragadni, azokon dolgozom.

Rab Árpád rövid életrajza, ahogy a Bing mesterséges intelligencia kérésemre összefoglalta:

Rab Árpád egy magyar digitális kultúra szakértő, jövőkutató, egyetemi kutató és tudománykommunikátor. Kulturális antropológus és etnográfus végzettséggel rendelkezik, és a Nemzeti Közszolgálati Egyetem Információs Társadalom Kutatóintézet tudományos főmunkatársa. Kutatási területei közé tartozik az e-health, a mesterséges intelligencia és társadalom, a gamifikáció és az új média. Több mint 200 projektet vezetett vagy vett részt benne hazai és nemzetközi szinten. Számos könyvet és cikket írt a digitális kultúra jellemzőiről és hatásairól. Az Információs Társadalom folyóirat szerkesztője, valamint start-up coach és informatikai projektmenedzser is.

– Szóval abban megegyezhetünk, és akkor ezt meg is értettem, hogy a jövőkutató az nem egy XXI. századi jós, hanem egy olyan ember, aki igazából a jelenben lévő lehetőségekből próbálja felvázolni a különféle útválasztásainkat és azoknak a következményeit?

– Igen, igen, az egyik a kármentés, a várható károk csökkentése. Tehát ha láttuk, hogy jön egy probléma, akkor jó arra időben készülni. Jó előre jelezni, hogy okosabban tervezzünk. Igazából minden arról szól most, hogy okosan viselkedjünk, és ezt az okos viselkedést próbálom forgatókönyvekkel ösztökélni, ráébreszteni az embereket a valóságra. Sokszor, a sikeres munkák visszajelzéseként nekem az jön vissza, hogy nem is az a lényeg, hogy valakinek az adott területén megmondjam a tutit, hanem megmutatni azt, hogy például ő nem gondolt arra, hogy egy másik terület milyen fontos lehet neki. Például egy gyógyszergyárral dolgozom, ők nem gondolják azt, hogy egy közlekedési jövő stratégiailag fontos lehet nekik, és amikor kiderül, hogy fontos, kitágul a látókörük.

– Ez izgalmasnak hangzik. Azt mondja, a jövővel kapcsolatos gondolkozás kármentés. Tehát okosan tudjunk dönteni. Együttesen okosan dönteni viszont nagyon nehéz. Az emberiség történelmének az eddigi több ezer évében nem sikerült igazából soha. Láttuk, hogy mi lesz, és mindig belesétáltunk. Miért reméljük, hogy most nem fogunk belesétálni a soron következő tragédiába, mi kell hozzá?

– Hosszan lehet erre válaszolni. Van egy olyan út, hogy eleve fejlődtünk-e bármit? De azért van egy olyan megközelítés is, hogy ma azért többen halnak meg túlsúlyban, mint éhezésben. Az elmúlt 100 évben igenis elértünk egy olyan jólétet, hogy sokan lettünk, pontosan azért, mert életben maradunk, hosszabban élünk. Luxusban élünk, ezt prédáló, pocsékoló, hatékonytalan technológiák, mennyiségű alapú technológiák tömegével értük el, mert az volt a feladat, hogy most éljünk jól, és most jól is élünk. Viszont lettünk nyolcmilliárdan. Felgyorsult a világ.

Nem a technológia miatt gyorsult fel, hanem azért, mert egy dobozban van 2 milliárd pötty helyett 8 milliárd pötty, minden gyorsabb és összetettebb.

Most mindenki fél mindenkitől, mert idegenek vagyunk, mert lett 8 milliárd új ember. Viszont a technológiát meg imádjuk. Az okostelefont annyira szeretjük, hogy azon keresztül az idegenekben is megbízunk. Ezzel csak azt akarom mondani, hogy nem mindig az együttműködés a fő kihívás. De az, hogy adott ügyekben, technológia segítségével úgy oldjunk meg dolgokat, hogy szinte észre sem vesszük, hogy együttműködünk, vagy kikényszerítek együttműködéseket, ezt meg lehet csinálni a technológiával.

– Amikor én kicsi voltam, mondjuk ez úgy a '70-es években volt és a '80-as években talán, akkor éltük a magunk életét. Akkor el lehetett lubickolni úgy a világban, hogy igazán az ember nem foglalkozott azzal, hogy milyen technológia veszi körül. Ma azonban a technológia az, amivel az alapvető szükségleteinket megoldjuk. Nem is lehetünk képesek megtalálni a jó válaszokat a mai kérdésekre, ha nem vagyunk képesek használni a technológiát.

– Én imádom a digitális kultúrát, ezzel élek, de ez csak bizonyos helyzetekben megoldás. Most az van, hogy van egy helyzetem, és az emberi történelem java részében nagyon sok helyzetre nem volt válaszunk. És akkor vagy jött a vallás, vagy valami. Most van több lehetőség, mint eddig, és ezek közül kell választani, ami mindig elvezet a tudatosság, a kritikus gondolkodás, a kíváncsiság, az önismeret területeire, és kiderül az, hogy a technológia a legemberszerűbb viselkedéseket várja el tőlünk. Azért van ez, mert több a lehetőségünk, nekünk kell választani, mert

ha mi fogalmazzuk meg a problémát és arra keresünk megoldást, akkor a technológia jó. Ha mi csak ülünk és a technológia mondja meg, hogy mit szeretnénk, akkor termékekké válunk.

Szerintem ez az egyik legfontosabb skill, hogy az ember akarjon valamit, ügyeket fogalmazzon meg. Utána kiválasztja a megoldását. Lehet, hogy technológiai, lehet, hogy emberi, lehet biológiai, bármelyik, és tud tenni valamit. Nagyon sokan problémának látjuk, hogy 8 milliárd ember van. De gondoljunk bele, hogyha 8 milliárd ember tesz valamit, az mekkora erő. Hogyha mindenki naponta tíz percig tesz valamit. Nem kell egyből a feje tetejére állni a világnak, csak tíz percet, vagy egy új dolgot megtanulni. Nagyon alkalmazkodó faj vagyunk. Ebben is segít a technológia. De tény, hogy ilyen gyorsan nem változott még a világ soha. Ez nem jó vagy rossz, nem vagyunk emiatt különlegesek, de ilyen gyorsan még nem változott soha.

– Egy kicsit térjünk vissza a Momentán fesztiválra. Valami olyasmi címe van annak, amiben ön lesz, hogy képes-e a mesterséges intelligencia improvizálni? Ami biztos, hogy a Momentán részéről jó hívószó, mert ha most bárki azt leírja, hogy mesterséges intelligencia, akkor biztos megtelik a nézőtér. Ilyen szempontból azt gondolom, hogy eljött az ön ideje, biztos, hogy sűrűbb a naptára, mint mondjuk három évvel ezelőtt.

– Vannak ciklusok a témákban, fura is lenne, ha nem látnám előre. Évek óta foglalkozom mesterséges intelligenciával, és tavaly mondtam is, hogy hamarosan a társadalom látni fogja, és akkor erről nagyon sok beszéd lesz. Három évvel ezelőtt nagyon sok energiaügyi fejlesztést csináltam, mert mondtam, hogy az lesz a fontos. Akkor jött egy energiaválság, vagy mondjuk inkább úgy, hogy pénzügyi tőzsdejáték az energiával, és hirtelen valóban nagyon fontos lett, nem azért persze, mert én ilyen okos vagyok. Tehát nyilván igen, idén nagyon sok MI projektet tudok elindítani, ami tavaly állt volna.

Az emberek most találkoztak egy chatbottal, ami valóban nagyon impresszív. Ki tudjuk próbálni mindannyian, és erről beszélünk. És ez csodálatos dolog, mert az MI először nekünk állít egy tükröt, hogy oké, én tudlak utánozni, de mi a fontos?

És nagyon sokat beszélnek az emberek az MI-ről, és nyilván a Momentánnál, ha egy ilyen adódik, hogy akkor egy olyan képességet állítanak szembe, amit ők maguk a saját képességüknek tartanak: az improvizációt. Jeleneteket tudunk megfogalmazni, amiket ők eljátszanak, és azokra én reflektálok, hogy most igazuk volt-e vagy sem, vagy hogy van ez kicsit másképp. Én teljesen átadom magam a spontaneitásnak, tehát, úgy vagyok vele, hogy a szakmámhoz értek, átadom magam nekik, hogy használjanak. Tehát ők fognak engem használni, kíváncsi vagyok, mire. És a fő kérdés ilyenkor mindig az, hogy oké, mi az improvizáció? Mert az improvizációra mondhatom, hogy nagyon gyors reagálás, hát abban nagyon jó a gép. Tehát hogyha én azt látom, hogy az MI azonnal spontán válaszokat ad, azok nem azonnal spontán válaszok, csak 0,01 milliszekundum alatt alkotja meg a gép azokat. Viszont az, ami egy embernél improvizáció, az a gépnél órákig tartó gondolkodás is lehet.

Mert mégis, mi az improvizáció? Az, hogy úgy reagálok, ahogy nem várják, abban már rosszabb a gép.

Például ő abban nagyon jó, hogy úgy reagáljon, hogy a lehető legtöbb embernek tetszen. De ha azt mondom neki, hogy figyelj, így kell reagálni, de te most reagálj máshogy, ezzel nem tud mit kezdeni. Egy hiányt egy asztalon nehezen talál meg, de azt mondom, hogy találjon meg valamit, azt megtalálja könnyen. Tehát más a logikája, és én erről nagyon szeretek mesélni, szerintem ezeket fogjuk keresgélni. És ez azért is fontos, mert most igazából kicsit az emberi értékek tükrébe kell belenézni.

Mi a munka? Ha rajzol a gép, akkor grafikus vagyok-e vagy sem? Az eddig képesség volt, hogy én nagyon sok szöveget elolvasok, ezeket szintetizálom, megírom, de ha most ezt megcsinálja az MI, töredék annyi idő alatt hatalmasabb az adatbázison, akkor ki vagyok én?

Nem is attól fél az ember, hogy a munkáját elveszik, hanem hogy a pénzét. Vagy lehet ez egy értékválság, hogy akkor most hogy legyek kutató? Nyilván mondhatom azt, hogy félek tőle, vagy mondhatom azt, hogy butább, mint én, mert nem jó adatokat használ. Vagy mondhatom azt, hogy kiegészíti a munkámat, és ezentúl háromszor annyit tudok kutatni. Visszatérve a momentános dologhoz, szerintem ez mindannyiunknak egy kísérlet, amit nem találtunk ki, és nem is akarjuk kitalálni. Szerintem erre jó játék ez a fesztivál, hogy egyszerre ünneplik magukat, másrészt itt szembenéznek a saját jövőnkkel. Nagyon tiszteljük egymást, én ismerem a munkásságukat. Lehet, hogy majd az előadás alatt fogunk erről is beszélni, de ebben a pillanatban még semmi nincs megbeszélve, egyik részről sem. Ők ilyen szempontból nagyon merész és jó társaság.


Link másolása
KÖVESS MINKET:

Népszerű
Ajánljuk
Címlapról ajánljuk


JÖVŐ
A Rovatból
Kiderült, meddig marad élhető a Föld – szuperszámítógépekkel számolta ki a NASA
Nem villámcsapás-szerű összeomlásra, hanem lassú, visszafordíthatatlan hanyatlásra kell készülnünk a kutatás eredménye szerint.


A NASA kutatói összefogtak a japán Toho Egyetem szakembereivel, és szuperszámítógépekkel modellezték, meddig maradhat élhető a Föld. Az eredmények egy távoli, de egyértelmű menetrendet vázolnak fel az élet végét illetően – számolt be róla a BGR.

A kutatás szerint a Nap jelenti majd a legnagyobb gondot: a következő egymilliárd évben nő a kibocsátása, és fokozatosan a lakhatósági határ fölé melegíti bolygónkat.

A becslés alapján a földi élet nagyjából az 1 000 002 021-es évben érhet véget, amikor a felszíni viszonyok már a legellenállóbb élőlényeknek is túl szélsőségesek lesznek.

A lejtmenet azonban sokkal korábban elindul. Ahogy a Nap forrósodik, a Föld légköre jelentősen átalakul: csökken az oxigénszint, meredeken nő a hőmérséklet, és romlik a levegő minősége. A részletes éghajlati és napsugárzási modellek szerint

ez nem villámcsapás-szerű összeomlás, hanem lassú, visszafordíthatatlan hanyatlás.

Ennek jelei már most látszanak. Erősödnek a napviharok és a koronakidobódások, nemrég az elmúlt 20 év legerősebb viharát rögzítették. Ezek hatnak a Föld mágneses mezejére és csökkentik a légköri oxigént.

Közben az ember okozta klímaváltozás is tovább növeli a terhelést:

a globális felmelegedés és a sarki jég olvadása a korábbi előrejelzéseknél gyorsabban halad, ami arra utal, hogy a környezet már jóval az egymilliárd éves időtáv előtt is ellehetetleníti az életet az emberek számára.

A kutatók a felkészülés és az alkalmazkodás fontosságát hangsúlyozzák. Egyesek zárt életfenntartó rendszereket és mesterséges élőhelyeket javasolnak, mások pedig a Földön túli lehetőségeket vizsgálják: a NASA és a SpaceX hosszú távú Mars-missziói az emberi élet fennmaradásának lehetséges útjait keresik, ha bolygónk lakhatatlanná válik.


# Csináld másképp

Te mit csinálnál másképp? - Csatlakozz a klímaváltozás hatásairól, a műanyagmentességről és a zero waste-ről szóló facebook-csoportunkhoz, és oszd meg a véleményedet, tapasztalataidat!

Link másolása
KÖVESS MINKET:

Ajánljuk
JÖVŐ
A Rovatból
A mesterséges intelligencia képes lehet akár tíz évre előre megjósolni, hogy kinek milyen betegsége lesz
A modell névtelen kórlapok mintáit figyeli, és évekre előre megmutatja, hol nagyobb a kockázat. A fejlesztők szerint így hamarabb lehet beavatkozni, és még az is tervezhető, hány szívinfarktusra kell készülnie egy városnak 2030-ban.


A kutatók szerint a mesterséges intelligencia akár tíz évre előre jelezhet egészségi gondokat, írja a BBC. A rendszer az emberek egészségügyi adataiban keres mintákat, és több mint 1000 betegség kockázatát számolja. Úgy írják le, mint egy időjárás-előrejelzést: százalékban adja meg a valószínűséget. A cél, hogy időben kiszűrje a magas kockázatú embereket, és évekre előre segítse a kórházak tervezését.

A Delphi-2M nevű modell hasonló technológiára épül, mint a közismert MI-chatbotok, például a ChatGPT. A chatbotok nyelvi mintákat tanulnak, és megjósolják, milyen szavak követik egymást. A Delphi-2M névtelenített egészségügyi adatokból tanulta meg felismerni a mintázatokat, és így jelzi előre, mi következhet és mikor. Nem mond pontos dátumot, hanem 1231 betegség valószínűségét becsli.

„Ahogy az időjárásnál 70 százalék esélyt jelezhetünk az esőre, ugyanezt meg tudjuk tenni az egészségügyben is”

– mondta Ewan Birney professzor, az Európai Molekuláris Biológiai Laboratórium megbízott főigazgatója. „Ráadásul nemcsak egy betegségre, hanem egyszerre az összesre – ilyet még soha nem tudtunk. Izgatott vagyok” – tette hozzá.

A fejlesztők először brit, névtelenített adatokon tanították a modellt: kórházi felvételek, háziorvosi adatok és életmódbeli szokások (például dohányzás) több mint 400 ezer résztvevőtől a UK Biobank projektből. Ezután más Biobank-résztvevők adataival ellenőrizték az előrejelzéseket, majd 1,9 millió ember dániai egészségügyi adatán is letesztelték. „Ha a modellünk azt mondja, hogy a következő évben tízből egy az esély, akkor tényleg nagyjából tízből egy esetben következik be” - tette hozzá Birney professzor.

A rendszer azoknál a betegségeknél működik a legjobban, amelyeknek jól követhető a lefolyása, például a 2-es típusú cukorbetegség, a szívinfarktus vagy a szepszis. Az inkább esetleges fertőzéseknél gyengébben teljesít.

Az orvosok ma is írnak fel koleszterincsökkentőt annak alapján, mekkora valakinél a szívinfarktus vagy a stroke kockázata. Az MI-eszköz még nem áll készen a klinikai használatra, de hasonló módon tervezik alkalmazni: korán azonosítani a magas kockázatú embereket, amikor még van esély megelőzni a betegséget. Ez jelenthet gyógyszert vagy célzott életmódtanácsot – például akinek nagyobb az esélye bizonyos májbetegségekre, annak a szokásosnál jobban megérheti visszavenni az alkoholfogyasztásból.

Az MI a szűrőprogramok tervezésében is segíthet, és egy térség összes egészségügyi adatát elemezve előre jelezheti a várható igényeket,

például hogy 2030-ban nagyjából hány szívinfarktus várható egy adott városban.

„Ez egy újfajta megközelítés kezdete az emberi egészség és a betegséglefolyás megértésében” – mondta Moritz Gerstung professzor, a Német Rákkutató Központ (DKFZ) onkológiai MI-osztályának vezetője. „Az olyan generatív modellek, mint a miénk, egy napon személyre szabhatják az ellátást, és nagy léptékben előre jelezhetik az egészségügyi szükségleteket.”

A Nature tudományos folyóiratban ismertetett modellt még finomítani és tesztelni kell a klinikai használat előtt. Torzítást okozhat, hogy a UK Biobank adatai főként 40–70 éves emberektől származnak. A fejlesztők most bővítik a modellt képalkotó vizsgálatokkal, genetikai információkkal és vérvizsgálati eredményekkel.

„Fontos hangsúlyozni, hogy ez kutatás – mindent alaposan tesztelni, szabályozni és átgondolni kell, mielőtt használni kezdjük, de a technológia adott ahhoz, hogy ilyen előrejelzéseket készítsünk” – nyomatékosította Birney professzor. Úgy véli, a genomika egészségügyi bevezetéséhez hasonló utat járhat be a folyamat: a tudósok bizalmától a rutinszerű klinikai használatig akár egy évtized is eltelhet.

A kutatás az Európai Molekuláris Biológiai Laboratórium, a Német Rákkutató Központ (DKFZ) és a Koppenhágai Egyetem együttműködésében készült. Gustavo Sudre, a King’s College London kutatója így értékelt: „Ez a munka jelentős lépés a skálázható, értelmezhető és – ami a legfontosabb – etikailag felelős orvosi prediktív modellezés felé.”


Link másolása
KÖVESS MINKET:


JÖVŐ
A Rovatból
Megkezdték a humanoid robotok tömeggyártását Kínában
A cég több ezer előrendelést említ, az ár körülbelül 11,5 millió forint. A mozgásnál emberi mintákat követnek: a végtagok összehangolását szimulációk és utánzásos tanulás segíti.
Maier Vilmos - szmo.hu
2025. szeptember 27.



A kínai Kepler Robotics elindította a K2 Bumblebee humanoid robot tömeggyártását, írja a Rakéta. A modellt logisztikai munkákra, gyártási feladatokban segítésre, kiállításokra és „speciális műveletekre” szánják.

A K2 hibrid architektúrával működik, ami energiahatékony üzemet tesz lehetővé. A gyártó szerint a humanoid egyhuzamban akár 8 órát is dolgozik.

Az ár a hasonló, általános célú humanoidokhoz képest kicsivel magasabb:

körülbelül 11,5 millió forint.

A robotra már több ezer megrendelés érkezett.

A cég a külalakot kevésbé, a mozgást viszont nagyon „emberire” tervezte. A K2 Bumblebee imitációs tanulással és szimulációkkal sajátította el a járás emberihez hasonló jellegzetességeit, beleértve a végtagok mozgásának összehangolását.

A humanoid robotról készült videót itt lehet megnézni:


Link másolása
KÖVESS MINKET:


JÖVŐ
A Rovatból
Sora 2: megjöttek a videók, amiket a képtelenség megkülönböztetni a valóságtól
Náci egyenruhába bújtattak hírességek, meghamisított történelmi események, kamu filmjelenetek igazinak tűnő színészekkel – máris ilyen videók készültek az OpenAI legújabb videógeneráló modelljével, ami egyszerre lenyűgöző és félelmetes.


A Sora 2 videógeneráló modell szeptember végén jelent meg, azzal az ígérettel, hogy a korábbi változathoz képest jelentősen javult a fizikai pontosság, a realizmus és az irányíthatóság. Mivel az OpenAI már a Sora tavaly decemberben kiadott első változatát is – a ChatGPT sikerével párhuzamba állítva – a videókészítés „GPT‑1 pillanatának” nevezte, nagy várakozások előzték meg a „GPT‑3.5 pillanatként” beharangozott Sora 2-t.

Az első verzió fejlesztői változatáról a demók alapján azt írtuk, olyan minőségű filmekhez, amelyeket szöveges utasításra generál, normál esetben külső helyszínekre, díszletekre, profi felszerelésekre és szakemberekre, statisztákra, illetve színészekre lenne szükség, de „úgy fest, hogy mostantól egyetlen AI, a Sora is elég lesz hozzá”.

Nyújthat ennél is többet egy videógeneráló modell? A Sora 2–nek a jelek szerint sikerült, mert a világ egyik ámulatból a másikba esik a vele készült mozgóképek láttán. Az OpenAI azt állítja, hogy az új modell kiküszöböli a korábbi videógenerálók jellemző hibáit, például az amorf tárgyakat és karaktereket, a torzult valóságot vagy a „túlzott optimizmust”. Utóbbihoz példát is kapcsol: ha egy generált videóban szereplő kosárlabdázó „elvéti” a dobást, az eddigi verziók inkább kicsavarták a realitást, és a labda még lehetetlen szögből is a gyűrűbe „teleportált”. Ehhez képest a Sora 2 a fizika törvényeivel teljesen megegyező módon bánik a tárgyak mozgásával: a labda a palánkba csapódik és pont úgy pattan vissza, ahogy az a valóságban is történne.

A tökéletlenség lehalkításával és a képminőség feltekerésével az OpenAI kisebb csodát alkotott: még egyszerű szöveges utasításokból is olyan videókat hoz létre, amelyeket a legtöbb néző képtelen megkülönböztetni a valóságtól. Az pedig, hogy mekkora a szakadék a versenytársak videógeneráló modelljei, valamint a Sora 2 között, remekül illusztrálja ez az összehasonlítás, amelyben a Google fejlesztette Veo 3–mal vetik össze a képességeit.

Ebben a videóban semmi sem valódi:

A gyorsan bővülő AI‑videópiacon persze vannak más vetélytársak is, például a Meta „Vibes” alkalmazása és a Meta Movie Gen modell, valamint az Elon Musk-féle xAI Grok Imagine-je. A Forbes hangsúlyozza, hogy utóbbi rendszerek 6–10 másodperces felvételeket készítenek, míg a Sora 2 akár egyperces videókat generálhat, illetve hangot is ad a tartalmakhoz, ami komoly fegyvertény a jelenlegi mezőnyben. És eddig minden jel arra mutat, hogy a Sora 2 a legerősebb videógeneráló AI.

Az OpenAI a modell széles körű – de egyelőre Észak-Amerikára korlátozott – bevezetése óta arra biztatja a felhasználókat, hogy a Sora 2 segítségével találjanak ki minél több új világot és történetet. A lehetőségeknek – látszólag – csak a képzelet szab határt, hiszen a modell képes az emberi hanghoz igazított dialógusok és hangeffektek generálására is, sőt, ha kell, a felhasználó hang‑ és videómintája alapján avatárt készít, így a saját filmünk főszereplőjévé válhatunk.

Mi változott? – A Sora 2 új képességei

Bár hozzáférés hiányában nekünk, magyaroknak egyelőre nincs összehasonlítási alapunk, az új modellről megjelent videókon valóban az látszik, hogy komoly szintlépés történt. Amíg a Sora demóiban a generált karakterek szemeit jótékonyan elrejtette valami (többnyire egy napszemüveg), a Sora 2 már nem tart az „uncanny valley” jelenségtől. Ez ugye az a nyugtalanító érzés, ami egy videojátékhoz vagy filmhez digitális eszközökkel létrehozott arc láttán tör ránk: hiába realisztikus a karakter, a tekintete természetellenes marad.

Az új modell már nem ilyen „félénk”: tisztában van vele, hogy amit előállít, teljesen életszerű, ezért nincs szükség trükközésre.

Olyannyira nincs, hogy az alábbi videóban látható és hallható Sam Altman sem Sam Altman, hanem egy Sora 2-vel létrehozott avatár, ami az OpenAI vezérigazgatójaként mutatja be a generatív AI képességeit. És ha erre nem figyelmeztetnek előre, aligha mondanánk meg, hogy nem a valódi személyt látjuk.

Az OpenAI szerint a Sora 2 legnagyobb újítása a fizikai törvények pontosabb szimulációja és a látvány élethű megjelenítése. A modell hosszabb és összetettebb cselekményeket, illetve akár többszereplős akciókat is képes kezelni, miközben megőrzi a mozgás törvényeinek koherenciáját.

A vállalat kiemelte, hogy a videók több jelenetből álló utasításokat követhetnek, és a rendszer megőrzi a generált világ állapotát: figyelembe veszi például azt, hogy a tárgyak az előző képsorban pontosan hol voltak. Ezzel már lehetséges akár több perces klipek és kisfilmek, ezáltal komplexebb narratívák létrehozása, de az OpenAI most még a rövid, gyorsan terjedő tartalmak felé tereli a felhasználókat, mert a játékos menőség meghozza a befektetők kedvét a további tervek finanszírozásához.

Lőttek a filmeseknek, vagy a Sora 2 csak egy új „ecset”, amivel alkothatnak?

Az OpenAI azzal hirdette a Sora, majd a Sora 2 rendszert, hogy a filmipar, az animációs stúdiók és a művészek eszköze lehet. A BBC Science Focus egyetért ezzel: azt írják, a rendszer megkönnyítheti animált klipek készítését, és ezzel időt, pénzt spórol. Az első verzió tartalmai ugyanakkor hemzsegtek a hibáktól. Ahogy arra a Washington Post is felhívta a figyelmet: a rendszer egy 1930‑as évekbeli jelenetben a cigaretta rossz végét gyújtotta meg vagy épp egyszerre több telefonkagylót adott a generált karakter kezébe, ráadásul hangot sem tudott létrehozni.

Ehhez képest a Sora 2 pontosságot és már szinkronizált hangot, illetve hangeffekteket is kínál, amivel elvileg tökéletesen alkalmassá válik a komplex szórakoztatóipari felhasználásra.

Az IndieWire elemzője ennek ellenére sem gondolja, hogy az új verzió a filmiparnak készült. A fejlesztők szerinte „nem törődnek Hollywooddal”, hiszen a platform elsősorban virális tartalmak gyártására ösztönzi az embereket, így a közösségi média új mémgyártó eszközévé válhat. És addig, ameddig ez csak igazoltatás elől meglépő Super Mario-s viccek szintjén realizálódik, nincs is nagy baj.

Ez még senkit sem bánt:

A gondok akkor kezdődnek, ha a könnyed hecceken túllépve valódi emberekről vagy valós eseményeket szimuláló helyzetekről készülnek valóságszagú kamuvideók, ami megnehezíti a független filmesek etikus AI‑felhasználását. Onnantól a Nintendo sem mókás rajongói videóként fogja kezelni a fentihez hasonló alkotásokat – ami még ingyen reklámot is csap a Mario Kart játékoknak –, mert attól tart majd, hogy a trend visszaéléseket szül, és óriási energiákat kell fordítani a szellemi tulajdona megvédésére.

A véleménycikk arra is figyelmeztet, hogy a Sora‑videók virális mémjei új frontot nyitnak a szerzői jogi háborúban, hiszen az AI‑userek óhatatlanul egyre kevesebbet törődnek majd a szellemi tulajdonnal, ezáltal tovább mélyítik az árkot az alkotók és az AI‑fejlesztők között. Az Indiewire ezzel kapcsolatban szakmai állásfoglalásokat sürget: úgy véli, ha a jogtulajdonosok és szakszervezetek nem alakítanak ki standardokat, elveszíthetik a harcot.

Osztja ezt az aggodalmat a WGBH-nak nyilatkozó digitális képzőművész, Kyt Janae is, aki szerint nem kell egy év, és szinte képtelenek leszünk megkülönböztetni az ember alkotta tartalmakat az AI-val generált képektől. Thomas Smith, a képek digitalizálásával, menedzselésével, kiadásával és monetizálásával foglalkozó Gado Images vezérigazgatója hozzátette:

a mesterségesen létrehozott képek miatt a valódi fotók is hitelességi válságba kerülhetnek.

Ezek a megállapítások azt jelzik, hogy a videógeneráló AI több területen okozhat károkat, a szórakoztatóipartól a politikán át a személyiségi jogokig.

Máris támadják az új AI-modellt

A Sora 2 indítását rögtön kritikák és aggályok kísérték. A The Guardian például arról számolt be, hogy a generált videók posztolására létrehozott TikTok-szerű app feedje hamar megtelt erőszakos és rasszista jelenetekkel, köztük bombázást és tömeggyilkosságot szimuláló tartalmakkal. Joan Donovan kutató ezzel kapcsolatban arra figyelmeztetett, hogy az ilyen eszközök elmossák a valóság és a hazugság között húzódó határt, ezáltal alkalmassá válhatnak gyűlöletkeltésre és zaklatásra.

Sam Altman ehhez képest a saját blogján a „kreativitás ChatGPT‑pillanataként” jellemezte a Sora 2 indulását, de óvatosan elismerte azt is, hogy például a bullying elkerülése érdekében nagyobb figyelmet kell fordítani a moderálásra.

A Rolling Stone közben példákkal illusztrálva mutatta be, hogy a realisztikus videógeneráló segítségével a felhasználók – csupán heccből – náci egyenruhába bújtattak hírességeket, történelmi eseményeket hamisítottak vagy éppen levédett karaktereket (Pikachu, Ronald McDonald, SpongeBob) használtak fel, ami szerzői jogi veszélyeket sejtet.

A Sora 2 kritikusait idézve a magazin azt írja, hogy az OpenAI „próbálja bepereltetni önmagát”.

A Vox cikke egyenesebben fogalmaz: felhívja a figyelmet arra, hogy a Sora 2 alapértelmezése szerint a jogtulajdonosok azok, akiknek kérvényezniük kellene a karaktereik eltávolítását, ami olyan, mintha a fejlesztők kifejezetten a szerzői jogok megsértése felé terelnék a felhasználókat.

Nem véletlen, hogy a kritikákkal szembesülő Sam Altman később frissítette a posztját, jelezve, hogy a jövőben a jogtulajdonosok „opt‑in” alapon adhatnak hozzá karaktereket az AI-modellhez, lehetővé téve, hogy a generált videók után részesedést kapjanak a bevételekből.

Őrületes energiaigény és a Sora 2 más pénzügyi hatásai

A modell bejelentését követően az elemzők felvetették, hogy a videók generálása rendkívüli mennyiségű számítási kapacitást és energiát igényel. Egyes kutatók szerint egy rövid, nagy felbontású videó generálása több mint 700‑szor több energiát fogyaszt, mint egy állókép létrehozása. Ennek következtében a jövő adatközpontjai már minden kétséget kizáróan nagyvárosokkal vetekedő energiazabáló – és karbonkibocsátó – szörnyetegek lesznek.

A Time elemzése rámutat: az AI‑videók ugyan drágák, de a cégek – köztük az OpenAI és a Meta – abban reménykednek, hogy a rövid videók gyártásával több előfizetéses felhasználó és befektető érkezik. Ez további bevételi forráshoz juttatja őket, ami még nagyobb modellek, egy napon pedig az általános mesterséges intelligencia megjelenéséhez vezethet.

Az AI-cégeknek tényleg nagyon kell a pénz, mert a generatív videómodellek fejlesztése hatalmas összegeket emészt fel. Ez az elemzők szerint idővel arra készteti majd a vállalatokat, hogy a befektetőktől és felhasználóktól beszedett pénzen túl a hirdetési piacon is terjeszkedjenek, illetve további előfizetési csomagokat találjanak ki, valamint árat emeljenek.

Mindeközben fontos cél a felhasználók viselkedési adatainak gyűjtése: a jövőbeli modellekhez a valós interakciók és preferenciák révén tudnak több és jobb tréningadatot gyűjteni.

Ami pedig a belátható jövőben érkező fejlesztéseket illeti, az OpenAI egyik korábbi közleménye felvetette azt is, hogy létrehoznak egy „világszimulátort”, amely pontosan modellezi a fizikai világ törvényeit, ezzel új tudományos problémákat lesz képes megoldani.

Új AI-evolúciós lépcsőfokok jönnek

A Sora 2 ezeknek a vízióknak a nagy reménysége, amitől azt várják, hogy további fejlesztéseket és több platformon elérhető verziókat eredményez. A megjelenése új korszakot nyit a generatív AI-k világában, hiszen bátran kijelenthetjük, hogy ennyire valószerű mozgásokat és hangeffekteket, illetve ilyen időtartamú történeteket még egyik videógeneráló AI sem tudott létrehozni.

Bár a fizika törvényeit még nem követi le tökéletesen és vastagon lehetőséget ad a visszaélésekre – a deepfake-től az erőszakos tartalmakon át a szerzői jogok megsértéséig –, a komoly etikai és jogi kérdések kezelése után érdemes lehet kihasználni a benne rejlő lehetőségeket.

A szakértők szerint hamar mainstream eszközzé válhat, de a társadalomnak – még új normarendszerek és hatékony moderálás bevezetése mellett is – fel kell készülnie arra, hogy a valóság és a mesterséges tartalom közötti határ elmosódik.

Mivel a gazdasági potenciál óriási, számolni kell a bővülésével és az energiafogyasztás növekedésével, valamint azzal, hogy a szellemi tulajdon megóvása érdekében ki kell harcolni a generált tartalmak után járó részesedést. Ezek az együttműködések – ha egyáltalán megköttetnek és aztán hosszú távon működőképesnek bizonyulnak – a kreatív tartalomgyártás ragyogó gyöngyszemévé varázsolhatják a Sora 2-t, illetve a jövőben érkező hasonló modelleket.


Link másolása
KÖVESS MINKET: