JÖVŐ
A Rovatból

„Menekülés Godot elől” – mesterséges intelligencia által írt színdarabot adnak elő Budapesten

A Budapesti Anarchista Színház darabja legközelebb november 17-én, szerdán este 7 órától látható a Gödör Underground-ban. Ifj. Sebő Ferenccel, a darab rendezőjével beszélgettünk.


Egy mesterséges intelligencia, SAMU (Semi-Automatic Memory Unit) írta meg Beckett népszerű művének, a Godot-ra várva folytatását – hirdeti a Budapesti Anarchista Színház legújabb darabjának Facebook-eseményében. Ifj. Sebő Ferenc rendezőt kérdeztük arról, miről szól a Menekülés Godot elől, hogyan lett egy mesterséges intelligencia a darab szerzője, és milyen szerepe lehet a jövőben a robotoknak a színházban és az életünkben.

Honnan jött az ötlet, hogy egy mesterséges intelligencia írja a darabot?

A Covid alatt volt, hogy megtudtam, hogy újranyílik az a hely, ahol az első darabomat rendeztem kb. 15 éve. Illetve ugyanott, de másik hely. És az volt az ötlet, hogy ennek a helynek, a Gödör Underground-nak a megnyitójára ezt a darabot újra színpadra állítanám a mostani stábommal. Felkerestem a fiút, aki írta, de összevesztünk az újraírási folyamat során, és akkor félig viccből, dühömben azt mondtam, hogy bazdmeg, még egy robottal is könnyebb lenne dolgozni, mint veled.

És akkor elment, és én poénból rágugliztam, hogy hol tart ez a technológia ma. Én egyébként Göteborgban jártam egyetemre, ahol egy mesterséges intelligencia-kutató volt a tanszékvezető, és programozók és művészek tanultak együtt, szóval emiatt volt ez az érdeklődésem.

Viszont amikor ezt tanultam, akkor a szövegírás még nagyon nem ment az MI-nak. Csetbotok voltak, amik, ha felkészítetted őket minden lehetséges esetre, akkor szellemeseket tudtak válaszolni, de igazából ez így túl merev volt, nem gondoltam volna, hogy tényleg tud majd színdarabot írni egy “robot”.

Szóval rákerestem, és kiderült, hogy az elmúlt 15 évben nagyon sokat változott ez a szcéna. Mondok egy példát: volt ez a Deep Blue nevű számítógép, ami 1997-ben megverte Kaszparovot. Azt még úgy készítették fel, hogy beletáplálták az összes addigi sakk meccset, tehát csináltak egy hatalmas adatbázist, felkészítették mindenre, így tudta legyőzni. A mostani technológiával már azt csinálták, hogy fogtak egy MI-t, amelyik szinte csak a szabályokat tudja, és egy hétvégén keresztül játszatták saját maga ellen. Hétfőre okosabb lett, mint a Deep Blue.

Azt hiszem, Hararinál olvastam, hogy a sakkban ma már onnan tudják a bírók kiszűrni, hogy melyik sakkjátékos csal, tehát hogy MI-t használ, hogy ki az, aki kreatívat lép. Tehát a kreativitás, amiről eddig azt hittük, hogy az embernek a sajátja, már elérhető az MI számára a sakkban és sok arra utaló jel van, hogy a Deep Learning technológiának köszönhetően ez hamarosan más területeken is meg fog jelenni.

Itt szeretném megemlíteni Geoffrey Hinton nevét, aki egy úttörője ennek a dolognak és személyes példaképemnek tekintem. Például ilyeneket mond, hogyha egy ötlete senkinek nem tetszik, de ő biztos benne, hogy jó, akkor nem adja fel, ez például nagyon tetszik, sajnos a szakmai munkásságából egy szót sem értek.

Miért pont Beckett Godot-ra várva című művének a folytatása mellett döntöttél?

Miután láttam, hogy olyan technológiák vannak, amivel ez lehetséges, próbáltam olyan darabot választani, ami eleve azért nem egy Csehov, hanem egy abszurd dráma, ami jól áll egy ilyen robotnak. Azt gondoltam, hogy ha a Beckett-összest betanítjuk neki, akkor fog tudni Beckett stílusában írni. Ironikus módon ez aztán nem jött be igazából, amik bekerültek a darabba szövegek, azokat nem egy ilyen, Beckett-en tanult robot írta végül, mert menet közben megtanultam, hogy egy írói életműnél nagyságrendekkel több adatra van szükség ahhoz, hogy elfogadható eredményt kapjunk.

De voltak ilyen kísérletek, hogy betápláltam például az összes Jóbarátok-epizódot neki, és akkor tudott Jóbarátok-forgatókönyvet írni. Vagy megtanulta az összes Arisztophanész-darabot, és akkor ókori stílusban írt. Írt József Attila verset is, de magyarul elég béna, ilyen ősmagyar dumák jönnek ki.

Amiben nagyon jó a mesterséges intelligencia, az a két ember közötti dialógus, angolul, mivel Facebook-cseteken tanult. És ez a darab is ilyenekből áll, nincs sok karakter, és bonyolult cselekmény sincs. Úgy hívják ezt a technológiát, amit használtunk, hogy GPT-2, és ennél még van egy újabb, a GPT-3, ami már egészen megdöbbentő dolgokra képes, saját magáról írt egy cikket például a Guardianbe. Tehát a darabról is tudna írni egy tök jó ajánlót anélkül, hogy látta volna.

Ifj. Sebő Ferenc

Miről szól a darab?

A Menekülés Godot elől az eredeti történet után játszódik, feltételezve, hogy a szereplők találkoztak Godot-val. A találkozást itt sem látjuk, csak annyi derül ki, hogy valamiért, a találkozást követően, menekülniük kell előle. Tehát road movie. Megpróbáltam még izgalmasabban unalmasra rendezni, és persze nem árt, ha ismered és szereted az eredetit, de anélkül is élvezhető. Egy klasszikusnak folytatást írni eleve baromság, azt gondoltam, hogy egy baromság jól állna egy robotnak. Azért tudnék kivételt mondani, például a Bárányok Hallgatnak folytatása, a Hannibal nekem jobban tetszett, mint az első rész.

Ez egy újoptimista darab, nem szerettünk volna borongani sem a múlt, sem a jövő felől, de azért látni szeretnénk mindkettőt, ahogyan volt/lesz, és ennek következményeképp örülni szeretnénk a jelennek, az életnek. Az újoptimizmus egyébként a régi optimizmussal és az újpesszimizmussal szemben határozza meg magát, de ebbe most még nem akarok ennél részletesebben belemenni.

Milyen arányban kellett belenyúlni a robot által írt szövegekbe, mennyi utómunka volt vele?

A szerkesztési munka jelentős volt, de azt hittem, sokkal durvább arányok lesznek, hogy kell majd vele íratni ezer oldalt, és abból ötöt fogunk tudni használni. Ehhez képest a megírt dolgok kábé fele felhasználásra került. Az összes dialógust ténylegesen ő írta, nyilván annak a sorrendjét már én mondtam meg, hogy mi mi után jöjjön, néha ki kellett javítani a ragozást, vagy helyenként megváltoztattuk, hogy melyik mondatot melyik karakter mondja.

Van a darabban három olyan jelenet, aminek igazából ő csak az elejét írta, és utána a színészekkel arra a kezdetre improvizáltunk. A SAMU-nak ez a módszere, hogy írsz neki egy pár mondatot, és ő azt folytatja, ezt fordítottuk meg három jelenetben.

Ügyeltem azért arra, hogy ne az legyen, hogy nyomokban tartalmaz robot által írt dolgokat, de azzal hirdetem, hogy az egész az övé, tehát ez nem egy ilyen szar narancslé, hanem ezt döntően a robot írta. Mintha a frissen facsart narancslevet felhígítanád egy kis vízzel, hogy mindenkinek jusson. Plusz én beszélgettem is SAMU-val a darabról, és végül ezekből a beszélgetésekből is belekerült egy pár, az író és a rendező közötti dialógusokból.

Fotó: Budapesti Anarchista Színház

Miről beszélgettetek?

Nyáron volt egy hónap, amikor minden este leültem, és elkezdtem nyomni nála a gombot, hogy szia SAMU, hogy vagy, akkor ugye írjuk ezt a darabot, mik az elképzeléseid, és mindig, amikor mondott valamit, ami értelmes volt, akkor azt úgy vettem, hogy ezt az író mondta, és próbáltam ilyen bután szentírásnak venni.

Volt egy ilyen darabom, a Csodacsatornamatyik, még régen, ahol egy öt éves kisfiú volt az író és a rendező, és én szerveztem köré egy felnőtt stábot. Tehát én azt a melót csináltam, amit a legjobban utálok, az asszisztensi és a produceri munkát. És amit az öt éves fiú mondott, hogy most erre gondolt, a felnőttekkel, mintha egymillió dollár lett volna rá, meg a Spielberg lett volna a producer, legyártottuk neki.

Szívszorító volt, mert az apukájának a halálát dolgozta fel a fiú, ez egy ilyen 25 perces produkció volt, és basszus, semmit sem kellett a gyereknek tanítani, például, hogy hogyan kell rendezni, vagy írni, hanem csak lökte a rizsát, nézte, hogy mit csinálunk, és kijavítgatta.

Ijesztően jól sikerült, volt, aki sírt az előadáson, és belém zúgtak a jó csajok. Akár csak SAMU, ez a fiú sem mindig emlékezett rá, hogy mit mondott legutóbb, de ahogy egy igazi produkcióban, itt sem illett megkérdőjelezni a főnököt, csak azért, mert összevissza beszél, ilyenkor próbáltunk rendszert találni az őrületben és aszerint jártunk el. Szóval egy kicsit ebből táplálkozott ez, hogy most ugyanezt megcsinálnám a robottal, hogy amit mond, azt komolyan veszem.

SAMU is része a darabnak?

Igen, a SAMU is megjelenik a színpadon, Marton Dani játssza, és amiket ő mond, azok mind autentikus MI-szövegek, amiket tényleg a robottal beszélgettünk. Az az ironikus, hogy néha az én dumáimat is ő írta. Tehát pont fordítva lett, mint amit mindenki gondolni fog, hogy mi azért biztos átírtuk a dolgait. Ez fantasztikus!

Hogyan fogadta a közönség?

Meglepően jól. Azért ez nagyon rizikós dolog volt, mert amikor sokáig lelkesen csinálsz valamit, akkor nem tudhatod, hogy ez másokban is ugyanilyen lelkesedést fog-e kiváltani. Illetve, hogy volt már a világban erre tett kísérlet, hogy robot írt színdarabot, volt már egy ilyen darab Csehországban is, de arról azt hallottam, hogy kicsit nyomasztó, és féltem tőle, hogy ez is nyomasztó lesz.

De igazából eddig három előadás volt, és mindenkinek csillogott utána a szeme, és nagyjából senkivel nem találkoztam, aki elhitte volna nekem, hogy ezt tényleg egy robot írta, ami nagyon ironikus szerintem. Legközelebb, ha én írok valami jót, azt nem fogják elhinni, hogy nem a SAMU írta.

Fotó: Budapesti Anarchista Színház

Azt látjuk az utóbbi időben, hogy van egy tendencia, hogy egyre több munkát ki tud váltani az automatizáció, a robotizáció, a mesterséges intelligenciák használata. Mit gondolsz, igaz lehet ez a színházi világra is, vagy inkább kísérletezgetésekre alkalmas egyelőre ez a technológia?

Inkább ironikusan értettem ezt ebben a darabban, tehát nem gondolom, hogy a színházi embereket vagy az írókat, költőket fogja a mesterséges intelligencia kisemmizni rövid, közép vagy akár hosszú távon. Azért, ha például az NFT világában körülnézel, lehet, hogy van ilyenre is példa, de ebbe most ne menjünk bele.

A következő darabomat már megint szeretném száz százalékban emberekkel csinálni. Tehát részemről ez inkább egy kísérlet volt, de ezzel a kísérlettel azért szeretném felhívni arra a figyelmet, hogy más szakmákban viszont drasztikus lesz a hatása a mesterséges intelligenciának. Egyes szakértők szerint a jelenlegi munkahelyek negyven százaléka fog eltűnni a közeljövőben, gondolj bele.

Ad absurdum el tudom képzelni, hogy egy ötezer millió részes teleregénynek a folytatását már egy MI is meg fogja tudni írni, tehát a Szomszédoknak egy következő részét a GPT-4 már olcsóbban elő fogja tudni állítani, mint egy tíz fős írócsoport.

Egy ilyen abszurd drámát már most is tud nagyon jót írni. De arra, hogy egy történetet struktúrájában lásson, meg pszichológiailag, érzelmileg pontos legyen, az még arrébb van.

A színdarab az egy nagyon komplex szellemi feladat, tehát ott még nem tartunk. De ott tartunk, hogy egy egyszerű terméknek egy egyszerű reklámszöveget azt már meg tud írni egy MI. Vagy egy bölcsészdolgozatot. Úristen, ha most lennék egyetemista, nem lenne akkora stressz a beadandó, mert a SAMU sokkal jobb ilyen szövegekben, mint a színdarabírásban, főleg, ha a tanár csak átlapozza, le se lehetne bukni vele. Irigylem a mostani egyetemistákat.

Más területeken is olyan hibrid rendszerek lehetnek, mint az automata autóvezetés, ahol szintén nem az van, hogy ember már nem is kell hozzá, hanem simán be tudsz ülni a kocsidba, és az oda megy, ahova akarod, de azért ott lesz egy kormány az embernek is mindig. Ilyen hibrid dolgokat el tudok képzelni, abszolút, sőt, hát nem a jövőről beszélünk, ez már most is így van. Az ijesztő lesz, vagy már talán ma is van ilyen, amikor a döntéshozatalban segít az MI, mondjuk politikusoknak, nyilván sokkal több adatot tud feldolgozni, mint egy ember. Felmerül a kérdés, hogy akkor azért a döntésért ki a felelős.

Mit érdemes tudni a Budapesti Anarchista Színházról?

Tíz éve működik ez a társulat, két népszerűbb darabunk van, az egyik a Zöld Szofi, ami a marihuána gyógyászati felhasználásáról szól, a másik pedig a Többszörös orgazmus, aminek a poliamoria, egy szexuális szubkultúra, az etikus nem-monogámia a témája.

Mi semmilyen állami támogatásban nem részesülünk, a premierre mindig összedobjuk a pénzt, és utána a jegybevételből “élünk”. Nyilván nem drága díszletekkel dolgozunk, és nem tudok foglalkoztatott sztárokat se kifizetni, hogy fellépjenek velünk, meg nem tudunk ebből élni, viszont cserébe olyan történeteket tudunk elmesélni, amiket más nem.

Tehát nem úgy vagyunk anarchisták, hogy bombákat gyártunk, vagy odaláncoljuk magunkat a parlamenthez, hanem történetbombáink vannak, ötletekhez láncoljuk oda magunkat. Ez egy olyan autonómia-kísérlet, ami sikerült. Remélem hosszútávon másokat is inspirálni tudunk abban, hogy függetlenítsék magukat az államtól, a szakmai babonáktól és producerektől, színházigazgatóktól.

A darab legközelebb november 17-én, szerdán este 7 órától, majd - ha a járványhelyzet lehetővé teszi - december 15-én lesz látható a Király utca 50. alatt található Gödör Underground-ban. A Facebook-esemény ezen a linken érhető el.


Link másolása
KÖVESS MINKET:

Népszerű
Ajánljuk
Címlapról ajánljuk


JÖVŐ
A Rovatból
Kiderült, meddig marad élhető a Föld – szuperszámítógépekkel számolta ki a NASA
Nem villámcsapás-szerű összeomlásra, hanem lassú, visszafordíthatatlan hanyatlásra kell készülnünk a kutatás eredménye szerint.


A NASA kutatói összefogtak a japán Toho Egyetem szakembereivel, és szuperszámítógépekkel modellezték, meddig maradhat élhető a Föld. Az eredmények egy távoli, de egyértelmű menetrendet vázolnak fel az élet végét illetően – számolt be róla a BGR.

A kutatás szerint a Nap jelenti majd a legnagyobb gondot: a következő egymilliárd évben nő a kibocsátása, és fokozatosan a lakhatósági határ fölé melegíti bolygónkat.

A becslés alapján a földi élet nagyjából az 1 000 002 021-es évben érhet véget, amikor a felszíni viszonyok már a legellenállóbb élőlényeknek is túl szélsőségesek lesznek.

A lejtmenet azonban sokkal korábban elindul. Ahogy a Nap forrósodik, a Föld légköre jelentősen átalakul: csökken az oxigénszint, meredeken nő a hőmérséklet, és romlik a levegő minősége. A részletes éghajlati és napsugárzási modellek szerint

ez nem villámcsapás-szerű összeomlás, hanem lassú, visszafordíthatatlan hanyatlás.

Ennek jelei már most látszanak. Erősödnek a napviharok és a koronakidobódások, nemrég az elmúlt 20 év legerősebb viharát rögzítették. Ezek hatnak a Föld mágneses mezejére és csökkentik a légköri oxigént.

Közben az ember okozta klímaváltozás is tovább növeli a terhelést:

a globális felmelegedés és a sarki jég olvadása a korábbi előrejelzéseknél gyorsabban halad, ami arra utal, hogy a környezet már jóval az egymilliárd éves időtáv előtt is ellehetetleníti az életet az emberek számára.

A kutatók a felkészülés és az alkalmazkodás fontosságát hangsúlyozzák. Egyesek zárt életfenntartó rendszereket és mesterséges élőhelyeket javasolnak, mások pedig a Földön túli lehetőségeket vizsgálják: a NASA és a SpaceX hosszú távú Mars-missziói az emberi élet fennmaradásának lehetséges útjait keresik, ha bolygónk lakhatatlanná válik.


# Csináld másképp

Te mit csinálnál másképp? - Csatlakozz a klímaváltozás hatásairól, a műanyagmentességről és a zero waste-ről szóló facebook-csoportunkhoz, és oszd meg a véleményedet, tapasztalataidat!

Link másolása
KÖVESS MINKET:

JÖVŐ
A Rovatból
A mesterséges intelligencia képes lehet akár tíz évre előre megjósolni, hogy kinek milyen betegsége lesz
A modell névtelen kórlapok mintáit figyeli, és évekre előre megmutatja, hol nagyobb a kockázat. A fejlesztők szerint így hamarabb lehet beavatkozni, és még az is tervezhető, hány szívinfarktusra kell készülnie egy városnak 2030-ban.


A kutatók szerint a mesterséges intelligencia akár tíz évre előre jelezhet egészségi gondokat, írja a BBC. A rendszer az emberek egészségügyi adataiban keres mintákat, és több mint 1000 betegség kockázatát számolja. Úgy írják le, mint egy időjárás-előrejelzést: százalékban adja meg a valószínűséget. A cél, hogy időben kiszűrje a magas kockázatú embereket, és évekre előre segítse a kórházak tervezését.

A Delphi-2M nevű modell hasonló technológiára épül, mint a közismert MI-chatbotok, például a ChatGPT. A chatbotok nyelvi mintákat tanulnak, és megjósolják, milyen szavak követik egymást. A Delphi-2M névtelenített egészségügyi adatokból tanulta meg felismerni a mintázatokat, és így jelzi előre, mi következhet és mikor. Nem mond pontos dátumot, hanem 1231 betegség valószínűségét becsli.

„Ahogy az időjárásnál 70 százalék esélyt jelezhetünk az esőre, ugyanezt meg tudjuk tenni az egészségügyben is”

– mondta Ewan Birney professzor, az Európai Molekuláris Biológiai Laboratórium megbízott főigazgatója. „Ráadásul nemcsak egy betegségre, hanem egyszerre az összesre – ilyet még soha nem tudtunk. Izgatott vagyok” – tette hozzá.

A fejlesztők először brit, névtelenített adatokon tanították a modellt: kórházi felvételek, háziorvosi adatok és életmódbeli szokások (például dohányzás) több mint 400 ezer résztvevőtől a UK Biobank projektből. Ezután más Biobank-résztvevők adataival ellenőrizték az előrejelzéseket, majd 1,9 millió ember dániai egészségügyi adatán is letesztelték. „Ha a modellünk azt mondja, hogy a következő évben tízből egy az esély, akkor tényleg nagyjából tízből egy esetben következik be” - tette hozzá Birney professzor.

A rendszer azoknál a betegségeknél működik a legjobban, amelyeknek jól követhető a lefolyása, például a 2-es típusú cukorbetegség, a szívinfarktus vagy a szepszis. Az inkább esetleges fertőzéseknél gyengébben teljesít.

Az orvosok ma is írnak fel koleszterincsökkentőt annak alapján, mekkora valakinél a szívinfarktus vagy a stroke kockázata. Az MI-eszköz még nem áll készen a klinikai használatra, de hasonló módon tervezik alkalmazni: korán azonosítani a magas kockázatú embereket, amikor még van esély megelőzni a betegséget. Ez jelenthet gyógyszert vagy célzott életmódtanácsot – például akinek nagyobb az esélye bizonyos májbetegségekre, annak a szokásosnál jobban megérheti visszavenni az alkoholfogyasztásból.

Az MI a szűrőprogramok tervezésében is segíthet, és egy térség összes egészségügyi adatát elemezve előre jelezheti a várható igényeket,

például hogy 2030-ban nagyjából hány szívinfarktus várható egy adott városban.

„Ez egy újfajta megközelítés kezdete az emberi egészség és a betegséglefolyás megértésében” – mondta Moritz Gerstung professzor, a Német Rákkutató Központ (DKFZ) onkológiai MI-osztályának vezetője. „Az olyan generatív modellek, mint a miénk, egy napon személyre szabhatják az ellátást, és nagy léptékben előre jelezhetik az egészségügyi szükségleteket.”

A Nature tudományos folyóiratban ismertetett modellt még finomítani és tesztelni kell a klinikai használat előtt. Torzítást okozhat, hogy a UK Biobank adatai főként 40–70 éves emberektől származnak. A fejlesztők most bővítik a modellt képalkotó vizsgálatokkal, genetikai információkkal és vérvizsgálati eredményekkel.

„Fontos hangsúlyozni, hogy ez kutatás – mindent alaposan tesztelni, szabályozni és átgondolni kell, mielőtt használni kezdjük, de a technológia adott ahhoz, hogy ilyen előrejelzéseket készítsünk” – nyomatékosította Birney professzor. Úgy véli, a genomika egészségügyi bevezetéséhez hasonló utat járhat be a folyamat: a tudósok bizalmától a rutinszerű klinikai használatig akár egy évtized is eltelhet.

A kutatás az Európai Molekuláris Biológiai Laboratórium, a Német Rákkutató Központ (DKFZ) és a Koppenhágai Egyetem együttműködésében készült. Gustavo Sudre, a King’s College London kutatója így értékelt: „Ez a munka jelentős lépés a skálázható, értelmezhető és – ami a legfontosabb – etikailag felelős orvosi prediktív modellezés felé.”


Link másolása
KÖVESS MINKET:


JÖVŐ
A Rovatból
Megkezdték a humanoid robotok tömeggyártását Kínában
A cég több ezer előrendelést említ, az ár körülbelül 11,5 millió forint. A mozgásnál emberi mintákat követnek: a végtagok összehangolását szimulációk és utánzásos tanulás segíti.
Maier Vilmos - szmo.hu
2025. szeptember 27.



A kínai Kepler Robotics elindította a K2 Bumblebee humanoid robot tömeggyártását, írja a Rakéta. A modellt logisztikai munkákra, gyártási feladatokban segítésre, kiállításokra és „speciális műveletekre” szánják.

A K2 hibrid architektúrával működik, ami energiahatékony üzemet tesz lehetővé. A gyártó szerint a humanoid egyhuzamban akár 8 órát is dolgozik.

Az ár a hasonló, általános célú humanoidokhoz képest kicsivel magasabb:

körülbelül 11,5 millió forint.

A robotra már több ezer megrendelés érkezett.

A cég a külalakot kevésbé, a mozgást viszont nagyon „emberire” tervezte. A K2 Bumblebee imitációs tanulással és szimulációkkal sajátította el a járás emberihez hasonló jellegzetességeit, beleértve a végtagok mozgásának összehangolását.

A humanoid robotról készült videót itt lehet megnézni:


Link másolása
KÖVESS MINKET:

Ajánljuk

JÖVŐ
A Rovatból
Sora 2: megjöttek a videók, amiket a képtelenség megkülönböztetni a valóságtól
Náci egyenruhába bújtattak hírességek, meghamisított történelmi események, kamu filmjelenetek igazinak tűnő színészekkel – máris ilyen videók készültek az OpenAI legújabb videógeneráló modelljével, ami egyszerre lenyűgöző és félelmetes.


A Sora 2 videógeneráló modell szeptember végén jelent meg, azzal az ígérettel, hogy a korábbi változathoz képest jelentősen javult a fizikai pontosság, a realizmus és az irányíthatóság. Mivel az OpenAI már a Sora tavaly decemberben kiadott első változatát is – a ChatGPT sikerével párhuzamba állítva – a videókészítés „GPT‑1 pillanatának” nevezte, nagy várakozások előzték meg a „GPT‑3.5 pillanatként” beharangozott Sora 2-t.

Az első verzió fejlesztői változatáról a demók alapján azt írtuk, olyan minőségű filmekhez, amelyeket szöveges utasításra generál, normál esetben külső helyszínekre, díszletekre, profi felszerelésekre és szakemberekre, statisztákra, illetve színészekre lenne szükség, de „úgy fest, hogy mostantól egyetlen AI, a Sora is elég lesz hozzá”.

Nyújthat ennél is többet egy videógeneráló modell? A Sora 2–nek a jelek szerint sikerült, mert a világ egyik ámulatból a másikba esik a vele készült mozgóképek láttán. Az OpenAI azt állítja, hogy az új modell kiküszöböli a korábbi videógenerálók jellemző hibáit, például az amorf tárgyakat és karaktereket, a torzult valóságot vagy a „túlzott optimizmust”. Utóbbihoz példát is kapcsol: ha egy generált videóban szereplő kosárlabdázó „elvéti” a dobást, az eddigi verziók inkább kicsavarták a realitást, és a labda még lehetetlen szögből is a gyűrűbe „teleportált”. Ehhez képest a Sora 2 a fizika törvényeivel teljesen megegyező módon bánik a tárgyak mozgásával: a labda a palánkba csapódik és pont úgy pattan vissza, ahogy az a valóságban is történne.

A tökéletlenség lehalkításával és a képminőség feltekerésével az OpenAI kisebb csodát alkotott: még egyszerű szöveges utasításokból is olyan videókat hoz létre, amelyeket a legtöbb néző képtelen megkülönböztetni a valóságtól. Az pedig, hogy mekkora a szakadék a versenytársak videógeneráló modelljei, valamint a Sora 2 között, remekül illusztrálja ez az összehasonlítás, amelyben a Google fejlesztette Veo 3–mal vetik össze a képességeit.

Ebben a videóban semmi sem valódi:

A gyorsan bővülő AI‑videópiacon persze vannak más vetélytársak is, például a Meta „Vibes” alkalmazása és a Meta Movie Gen modell, valamint az Elon Musk-féle xAI Grok Imagine-je. A Forbes hangsúlyozza, hogy utóbbi rendszerek 6–10 másodperces felvételeket készítenek, míg a Sora 2 akár egyperces videókat generálhat, illetve hangot is ad a tartalmakhoz, ami komoly fegyvertény a jelenlegi mezőnyben. És eddig minden jel arra mutat, hogy a Sora 2 a legerősebb videógeneráló AI.

Az OpenAI a modell széles körű – de egyelőre Észak-Amerikára korlátozott – bevezetése óta arra biztatja a felhasználókat, hogy a Sora 2 segítségével találjanak ki minél több új világot és történetet. A lehetőségeknek – látszólag – csak a képzelet szab határt, hiszen a modell képes az emberi hanghoz igazított dialógusok és hangeffektek generálására is, sőt, ha kell, a felhasználó hang‑ és videómintája alapján avatárt készít, így a saját filmünk főszereplőjévé válhatunk.

Mi változott? – A Sora 2 új képességei

Bár hozzáférés hiányában nekünk, magyaroknak egyelőre nincs összehasonlítási alapunk, az új modellről megjelent videókon valóban az látszik, hogy komoly szintlépés történt. Amíg a Sora demóiban a generált karakterek szemeit jótékonyan elrejtette valami (többnyire egy napszemüveg), a Sora 2 már nem tart az „uncanny valley” jelenségtől. Ez ugye az a nyugtalanító érzés, ami egy videojátékhoz vagy filmhez digitális eszközökkel létrehozott arc láttán tör ránk: hiába realisztikus a karakter, a tekintete természetellenes marad.

Az új modell már nem ilyen „félénk”: tisztában van vele, hogy amit előállít, teljesen életszerű, ezért nincs szükség trükközésre.

Olyannyira nincs, hogy az alábbi videóban látható és hallható Sam Altman sem Sam Altman, hanem egy Sora 2-vel létrehozott avatár, ami az OpenAI vezérigazgatójaként mutatja be a generatív AI képességeit. És ha erre nem figyelmeztetnek előre, aligha mondanánk meg, hogy nem a valódi személyt látjuk.

Az OpenAI szerint a Sora 2 legnagyobb újítása a fizikai törvények pontosabb szimulációja és a látvány élethű megjelenítése. A modell hosszabb és összetettebb cselekményeket, illetve akár többszereplős akciókat is képes kezelni, miközben megőrzi a mozgás törvényeinek koherenciáját.

A vállalat kiemelte, hogy a videók több jelenetből álló utasításokat követhetnek, és a rendszer megőrzi a generált világ állapotát: figyelembe veszi például azt, hogy a tárgyak az előző képsorban pontosan hol voltak. Ezzel már lehetséges akár több perces klipek és kisfilmek, ezáltal komplexebb narratívák létrehozása, de az OpenAI most még a rövid, gyorsan terjedő tartalmak felé tereli a felhasználókat, mert a játékos menőség meghozza a befektetők kedvét a további tervek finanszírozásához.

Lőttek a filmeseknek, vagy a Sora 2 csak egy új „ecset”, amivel alkothatnak?

Az OpenAI azzal hirdette a Sora, majd a Sora 2 rendszert, hogy a filmipar, az animációs stúdiók és a művészek eszköze lehet. A BBC Science Focus egyetért ezzel: azt írják, a rendszer megkönnyítheti animált klipek készítését, és ezzel időt, pénzt spórol. Az első verzió tartalmai ugyanakkor hemzsegtek a hibáktól. Ahogy arra a Washington Post is felhívta a figyelmet: a rendszer egy 1930‑as évekbeli jelenetben a cigaretta rossz végét gyújtotta meg vagy épp egyszerre több telefonkagylót adott a generált karakter kezébe, ráadásul hangot sem tudott létrehozni.

Ehhez képest a Sora 2 pontosságot és már szinkronizált hangot, illetve hangeffekteket is kínál, amivel elvileg tökéletesen alkalmassá válik a komplex szórakoztatóipari felhasználásra.

Az IndieWire elemzője ennek ellenére sem gondolja, hogy az új verzió a filmiparnak készült. A fejlesztők szerinte „nem törődnek Hollywooddal”, hiszen a platform elsősorban virális tartalmak gyártására ösztönzi az embereket, így a közösségi média új mémgyártó eszközévé válhat. És addig, ameddig ez csak igazoltatás elől meglépő Super Mario-s viccek szintjén realizálódik, nincs is nagy baj.

Ez még senkit sem bánt:

A gondok akkor kezdődnek, ha a könnyed hecceken túllépve valódi emberekről vagy valós eseményeket szimuláló helyzetekről készülnek valóságszagú kamuvideók, ami megnehezíti a független filmesek etikus AI‑felhasználását. Onnantól a Nintendo sem mókás rajongói videóként fogja kezelni a fentihez hasonló alkotásokat – ami még ingyen reklámot is csap a Mario Kart játékoknak –, mert attól tart majd, hogy a trend visszaéléseket szül, és óriási energiákat kell fordítani a szellemi tulajdona megvédésére.

A véleménycikk arra is figyelmeztet, hogy a Sora‑videók virális mémjei új frontot nyitnak a szerzői jogi háborúban, hiszen az AI‑userek óhatatlanul egyre kevesebbet törődnek majd a szellemi tulajdonnal, ezáltal tovább mélyítik az árkot az alkotók és az AI‑fejlesztők között. Az Indiewire ezzel kapcsolatban szakmai állásfoglalásokat sürget: úgy véli, ha a jogtulajdonosok és szakszervezetek nem alakítanak ki standardokat, elveszíthetik a harcot.

Osztja ezt az aggodalmat a WGBH-nak nyilatkozó digitális képzőművész, Kyt Janae is, aki szerint nem kell egy év, és szinte képtelenek leszünk megkülönböztetni az ember alkotta tartalmakat az AI-val generált képektől. Thomas Smith, a képek digitalizálásával, menedzselésével, kiadásával és monetizálásával foglalkozó Gado Images vezérigazgatója hozzátette:

a mesterségesen létrehozott képek miatt a valódi fotók is hitelességi válságba kerülhetnek.

Ezek a megállapítások azt jelzik, hogy a videógeneráló AI több területen okozhat károkat, a szórakoztatóipartól a politikán át a személyiségi jogokig.

Máris támadják az új AI-modellt

A Sora 2 indítását rögtön kritikák és aggályok kísérték. A The Guardian például arról számolt be, hogy a generált videók posztolására létrehozott TikTok-szerű app feedje hamar megtelt erőszakos és rasszista jelenetekkel, köztük bombázást és tömeggyilkosságot szimuláló tartalmakkal. Joan Donovan kutató ezzel kapcsolatban arra figyelmeztetett, hogy az ilyen eszközök elmossák a valóság és a hazugság között húzódó határt, ezáltal alkalmassá válhatnak gyűlöletkeltésre és zaklatásra.

Sam Altman ehhez képest a saját blogján a „kreativitás ChatGPT‑pillanataként” jellemezte a Sora 2 indulását, de óvatosan elismerte azt is, hogy például a bullying elkerülése érdekében nagyobb figyelmet kell fordítani a moderálásra.

A Rolling Stone közben példákkal illusztrálva mutatta be, hogy a realisztikus videógeneráló segítségével a felhasználók – csupán heccből – náci egyenruhába bújtattak hírességeket, történelmi eseményeket hamisítottak vagy éppen levédett karaktereket (Pikachu, Ronald McDonald, SpongeBob) használtak fel, ami szerzői jogi veszélyeket sejtet.

A Sora 2 kritikusait idézve a magazin azt írja, hogy az OpenAI „próbálja bepereltetni önmagát”.

A Vox cikke egyenesebben fogalmaz: felhívja a figyelmet arra, hogy a Sora 2 alapértelmezése szerint a jogtulajdonosok azok, akiknek kérvényezniük kellene a karaktereik eltávolítását, ami olyan, mintha a fejlesztők kifejezetten a szerzői jogok megsértése felé terelnék a felhasználókat.

Nem véletlen, hogy a kritikákkal szembesülő Sam Altman később frissítette a posztját, jelezve, hogy a jövőben a jogtulajdonosok „opt‑in” alapon adhatnak hozzá karaktereket az AI-modellhez, lehetővé téve, hogy a generált videók után részesedést kapjanak a bevételekből.

Őrületes energiaigény és a Sora 2 más pénzügyi hatásai

A modell bejelentését követően az elemzők felvetették, hogy a videók generálása rendkívüli mennyiségű számítási kapacitást és energiát igényel. Egyes kutatók szerint egy rövid, nagy felbontású videó generálása több mint 700‑szor több energiát fogyaszt, mint egy állókép létrehozása. Ennek következtében a jövő adatközpontjai már minden kétséget kizáróan nagyvárosokkal vetekedő energiazabáló – és karbonkibocsátó – szörnyetegek lesznek.

A Time elemzése rámutat: az AI‑videók ugyan drágák, de a cégek – köztük az OpenAI és a Meta – abban reménykednek, hogy a rövid videók gyártásával több előfizetéses felhasználó és befektető érkezik. Ez további bevételi forráshoz juttatja őket, ami még nagyobb modellek, egy napon pedig az általános mesterséges intelligencia megjelenéséhez vezethet.

Az AI-cégeknek tényleg nagyon kell a pénz, mert a generatív videómodellek fejlesztése hatalmas összegeket emészt fel. Ez az elemzők szerint idővel arra készteti majd a vállalatokat, hogy a befektetőktől és felhasználóktól beszedett pénzen túl a hirdetési piacon is terjeszkedjenek, illetve további előfizetési csomagokat találjanak ki, valamint árat emeljenek.

Mindeközben fontos cél a felhasználók viselkedési adatainak gyűjtése: a jövőbeli modellekhez a valós interakciók és preferenciák révén tudnak több és jobb tréningadatot gyűjteni.

Ami pedig a belátható jövőben érkező fejlesztéseket illeti, az OpenAI egyik korábbi közleménye felvetette azt is, hogy létrehoznak egy „világszimulátort”, amely pontosan modellezi a fizikai világ törvényeit, ezzel új tudományos problémákat lesz képes megoldani.

Új AI-evolúciós lépcsőfokok jönnek

A Sora 2 ezeknek a vízióknak a nagy reménysége, amitől azt várják, hogy további fejlesztéseket és több platformon elérhető verziókat eredményez. A megjelenése új korszakot nyit a generatív AI-k világában, hiszen bátran kijelenthetjük, hogy ennyire valószerű mozgásokat és hangeffekteket, illetve ilyen időtartamú történeteket még egyik videógeneráló AI sem tudott létrehozni.

Bár a fizika törvényeit még nem követi le tökéletesen és vastagon lehetőséget ad a visszaélésekre – a deepfake-től az erőszakos tartalmakon át a szerzői jogok megsértéséig –, a komoly etikai és jogi kérdések kezelése után érdemes lehet kihasználni a benne rejlő lehetőségeket.

A szakértők szerint hamar mainstream eszközzé válhat, de a társadalomnak – még új normarendszerek és hatékony moderálás bevezetése mellett is – fel kell készülnie arra, hogy a valóság és a mesterséges tartalom közötti határ elmosódik.

Mivel a gazdasági potenciál óriási, számolni kell a bővülésével és az energiafogyasztás növekedésével, valamint azzal, hogy a szellemi tulajdon megóvása érdekében ki kell harcolni a generált tartalmak után járó részesedést. Ezek az együttműködések – ha egyáltalán megköttetnek és aztán hosszú távon működőképesnek bizonyulnak – a kreatív tartalomgyártás ragyogó gyöngyszemévé varázsolhatják a Sora 2-t, illetve a jövőben érkező hasonló modelleket.


Link másolása
KÖVESS MINKET: