JÖVŐ
A Rovatból

Szuperhiteles videókat generál az AI – hamarosan végképp nem hihetünk majd a szemünknek

A Sora előre megmutathatja majd, milyen lesz építkezés eredménye vagy az étel, amit még el sem kezdtünk főzni, ugyanakkor hiába nyugtat az OpenAI, nem ok nélkül aggódnak a színészek, és azok, akik a manipulált videók áradatától tartanak.


Hiperrealisztikus kisfilmek kíséretében jelentette be februárban az OpenAI, hogy a szöveggeneráló ChatGPT és a képkészítő DALL·E után elkészült a Sora, a vállalat első videógeneráló mesterséges intelligenciája. Az első közzétett felvételeken azóta is ámul a világ, hiszen látványosak és hitelesek (vagyis annak tűnnek), pedig a rajtuk szereplő egyetlen személy, élőlény, tárgy, táj, utca sem létezik a valóságban.

Ilyen minőségű kisfilmek elkészítéséhez normál esetben külső helyszínekre, díszletekre, profi felszerelésekre és szakemberekre, statisztákra, illetve színészekre lett volna szükség, de úgy fest, hogy mostantól egyetlen AI, a Sora is elég lesz hozzá.

Nem véletlen, hogy az amerikai forgatókönyvírók és színészek tavalyi sztrájkövetelései között a második legfontosabb feltétel (a magasabb jutalék és a folyamatos foglalkoztatás után) éppen a mesterséges intelligencia alkalmazásának korlátozása volt.

Mi lenne a Sora célja?

Az OpenAI felhívja rá a figyelmet, hogy az első körben kiadott tesztvideók egyikén sem hajtottak végre semmilyen utólagos módosítást, vagyis azoknak minden egyes képkockáját a Sora generálta, szöveges utasítások alapján.

Mint írják, a mesterséges intelligenciát a fizikai világ megértésére és szimulálására tanítják, hogy végül olyan modelleket képezzenek, amelyek segítenek az embereknek a valós térben lévő problémák megoldásában.

Ez így nagyjából olyan lesz (csak még jobb minőségben), mintha az életünk összes hétköznapi aspektusában megjelennének az iparban ma is használt ún. digitális ikrek, amelyek egy adott gyártósor és gép működését szimulálva mutatják meg például azt, hogy adott beállításokkal milyen termékekre számíthatunk vagy várhatóan mikor válik szükségessé a karbantartás.

Ha a Sora célja valóban az, hogy előre megnézzük: milyen eredményre vezet, amit tenni szándékozunk, akkor egy nap láthatjuk, hogyan fog kinézni az étel, amit még el sem kezdtünk főzni, vagy milyen buktatói vannak a gyerek fakuckójának, amit adott anyagokból és szerszámokkal készülünk megépíteni.

De ezek teljesen banális példák ahhoz képest, hogy mekkora segítséget kaphatnak tőle különböző szakemberek, a víz-vezetékszerelőktől az építészmérnökökön át a sebészorvosokig. Hiszen milyen jó lenne előre megmutatni az ügyfélnek a házába csak ezután bekerülő csörendszert, vizualizálni a művezetőnek az építkezésen elvárt munkafázisokat, vagy műtét előtt szimulálni egy operáció végkimenetelét - egyetlen vágás nélkül? Onnan persze, ahol a Sora most tart, még hosszú az út az utóbb írt szcenáriókig, de a lehetőség kétségtelenül benne van.

Képességek és gyengeségek

A szövegből videót készítő AI modell jelenleg maximum egyperces videókat képes létrehozni, miközben megőrzi a vizuális minőséget és maximálisan követi a felhasználó utasításait.

Az OpenAI közölte: számos vizuális tartalmat készítő művész, tervező és filmkészítő máris hozzáférést kapott a Sorához. A tesztektől egyértelmű visszajelzéseket várnák arra vonatkozóan, hogy az AI működésében milyen javításokat kell eszközölni, esetleg hogyan szavatolhatnák a biztonságos széleskörű alkalmazását.

A Sora képes összetett jeleneteket generálni több szereplővel, meghatározott típusú mozgásokkal, valamint a téma és a háttér pontos részleteivel. A modell nemcsak azt érti meg, hogy a felhasználó mit kért a beírt szövegben, hanem azt is, hogy ezek a dolgok hogyan léteznek a fizikai világban.

Ezeken kívül mélyen érti a nyelvet is, amelyeken az utasításokat kapja, tehát képes pontosan értelmezni a felszólításokat és lenyűgöző karaktereket létrehozni, amelyek élénk érzelmeket fejeznek ki. A Sora egyetlen videón belül több felvételt is generál, és ezek mind pontosan megtartják a kívánt karaktereket, illetve vizuális stílust - állítja az OpenAI.

Egy képkocka sem valódi:

A jelenlegi modell még nem tökéletes. Bármennyire tűnnek első látásra valódinak a felvételek, akadnak folytonossági és abszurd hibák, a sétáló városi lány alatt finoman megcsúszó talajtól a hirtelen ötödik lábat növesztő macskán át az emberi tekintetek torzulásáig. Utóbbi hatást – amit a digitálisan épített arcok miatt fellépő nyugtalanító érzésnek, az ún. „uncanny valley” jelenségnek hívunk – a legtöbb mintavideón napszemüvegekkel tompítják.

Az AI nehezen tudja lekövetni egy összetett jelenet fizikáját is, hiszen nem érti az ok-okozati összefüggések konkrét eseteit. „Előfordulhat például, hogy egy személy beleharap egy sütibe, de utána a sütin nem biztos, hogy marad harapásnyom” - szemléltette a gyártó, hozzátéve: a modell összekeverheti még a felszólítás térbeli részleteit, mondjuk a bal és a jobb oldalt vagy nehézségekbe ütközhet az időben lezajló események pontos leírásával, mondjuk egy adott kameraív követésével.

Utasításra így pásztáz:

Soha többé, egyetlen videóról sem tudhatjuk biztosan, hogy valódi-e?

Az OpenAI azt ígéri, hogy a Sora csak fontos biztonsági intézkedések mellett válhat mindenki számára elérhetővé. A protokollokat a félretájékoztatás, a gyűlöletkeltő vagy elfogult tartalmak szakértőivel együtt dolgozzák ki és olyan eszközöket építenek hozzá, amelyek segítenek felismerni a félrevezető tartalmakat.

Gondolkodnak például egy mindenki számára elérhető szűrő alkalmazáson, ami egyértelműen megállapítja, ha egy videót részben vagy egészben a Sora generált. Ehhez nem kell teljesen új szoftvereket írni, hiszen a DALL·E 3-hoz kidolgozott biztonsági módszerek a Sorára is alkalmazhatók.

„Amint [a felhasználói] kérések egy OpenAI-termékbe kerülnek, a szövegosztályozónk ellenőrzi őket és elutasítja azokat, amelyek sértik az irányelveinket. Ilyen a szélsőséges erőszak, a szexuális tartalom, a gyűlöletkeltő kép, a hírességek arcáról készült másolat vagy a másokat illető szellemi tulajdon. Emellett robusztus képosztályozókat is kifejlesztettünk, amelyek segítségével minden egyes létrehozott képkockát felülvizsgálunk, mielőtt a felhasználónak megmutatnánk.”

A lehetetlen is lehetséges:

A vállalat azt ígéri, hogy a Sora bevezetése előtt a világ minden tájáról megkeres politikai döntéshozókat, oktatókat és művészeket, hogy megértsék az újabb AI-termékkel kapcsolatos aggodalmaikat és meghatározzák az új technológia pozitív felhasználási lehetőségeit. A kiterjedt kutatás és tesztelés ellenére sem lehet azonban megjósolni, hogy az emberek milyen módon fogják használni a technológiát, ahogy azt sem, hogy milyen módon fognak visszaélni vele.

Ezért hiszünk abban, hogy a valós használatból való tanulás kritikus eleme az egyre biztonságosabb mesterséges intelligencia-rendszerek létrehozásának és idővel történő kiadásának – fogalmaz a közlemény.

A Sora egy diffúziós AI modell, ami egy statikus zajnak tűnő videóból kiindulva generál új mozgóképes tartalmat, hogy aztán fokozatosan átalakítsa, a zaj eltávolításával, sok lépésen keresztül. Képes továbbá teljes videókat generálni, vagy generált videókat meghosszabbítani, sőt, meglévő állóképeket mozgásba lendíteni úgy, hogy az apró részletekre is figyelve animálja a fotót.

„A Sora olyan modellek alapjául szolgál, amelyek képesek megérteni és szimulálni a való világot; ez a véleményünk szerint fontos mérföldkő lesz az AGI (általános mesterséges intelligencia) megvalósításában” – fűzi hozzá az OpenAI.

Új aggodalom: „egzisztenciális katasztrófa” közelít

Nem tudni, hogy a Sora, vagy más AI fejlesztésével összefüggésben, esetleg ezektől elhatárolódva, de néhány héttel az OpenAI bemutatója után jelent meg Dr. Roman V. Yampolskiy mesterséges intelligencia-szakértő összefoglaló könyve (AI Unexplainable, Unpredictable, Uncontrollable címmel), ami az AI szabályozhatóságát és társadalmi következményeit vizsgálja.

A Louisville-i Egyetem professzora arra jutott, hogy jelenleg semmilyen tudományosan bizonyított garancia nem létezik a mesterséges intelligencia ellenőrizhető keretek között tartására. Nincs nyoma olyan módszernek vagy mechanizmusnak, ami teljes biztonságot szavatolna – fejtegeti közleményében, hozzátéve: az ilyen fejlett rendszerek használata – pláne közkinccsé tétele – mindig rizikós, hiszen önállóan cselekvő mesterséges intelligenciáról beszélünk.

Yampolskiy hangsúlyozta: pillanatnyilag fogalma sincs, hogy a témával foglalkozó szakemberek mire alapozzák azokat a kijelentéseiket, amelyek szerint az AI szabályozható. A mesterséges intelligencia alapvető tulajdonsága ugyanis éppen az, hogy képes tanulni, alkalmazkodni és saját döntések végeláthatatlan sorozatát meghozni. Ebből képtelenség megjósolni a viselkedését, vagy megmondani, hogy miért dönt úgy, ahogy.

Miközben az AI autonómiája fokozódik, az emberi ellenőrzés lehetősége csökken. És ennek nagyon súlyos egzisztenciális következményei lehetnek az emberiségre nézve.


Link másolása
KÖVESS MINKET:

Népszerű
Ajánljuk
Címlapról ajánljuk


JÖVŐ
A Rovatból
Kiderült, meddig marad élhető a Föld – szuperszámítógépekkel számolta ki a NASA
Nem villámcsapás-szerű összeomlásra, hanem lassú, visszafordíthatatlan hanyatlásra kell készülnünk a kutatás eredménye szerint.


A NASA kutatói összefogtak a japán Toho Egyetem szakembereivel, és szuperszámítógépekkel modellezték, meddig maradhat élhető a Föld. Az eredmények egy távoli, de egyértelmű menetrendet vázolnak fel az élet végét illetően – számolt be róla a BGR.

A kutatás szerint a Nap jelenti majd a legnagyobb gondot: a következő egymilliárd évben nő a kibocsátása, és fokozatosan a lakhatósági határ fölé melegíti bolygónkat.

A becslés alapján a földi élet nagyjából az 1 000 002 021-es évben érhet véget, amikor a felszíni viszonyok már a legellenállóbb élőlényeknek is túl szélsőségesek lesznek.

A lejtmenet azonban sokkal korábban elindul. Ahogy a Nap forrósodik, a Föld légköre jelentősen átalakul: csökken az oxigénszint, meredeken nő a hőmérséklet, és romlik a levegő minősége. A részletes éghajlati és napsugárzási modellek szerint

ez nem villámcsapás-szerű összeomlás, hanem lassú, visszafordíthatatlan hanyatlás.

Ennek jelei már most látszanak. Erősödnek a napviharok és a koronakidobódások, nemrég az elmúlt 20 év legerősebb viharát rögzítették. Ezek hatnak a Föld mágneses mezejére és csökkentik a légköri oxigént.

Közben az ember okozta klímaváltozás is tovább növeli a terhelést:

a globális felmelegedés és a sarki jég olvadása a korábbi előrejelzéseknél gyorsabban halad, ami arra utal, hogy a környezet már jóval az egymilliárd éves időtáv előtt is ellehetetleníti az életet az emberek számára.

A kutatók a felkészülés és az alkalmazkodás fontosságát hangsúlyozzák. Egyesek zárt életfenntartó rendszereket és mesterséges élőhelyeket javasolnak, mások pedig a Földön túli lehetőségeket vizsgálják: a NASA és a SpaceX hosszú távú Mars-missziói az emberi élet fennmaradásának lehetséges útjait keresik, ha bolygónk lakhatatlanná válik.


# Csináld másképp

Te mit csinálnál másképp? - Csatlakozz a klímaváltozás hatásairól, a műanyagmentességről és a zero waste-ről szóló facebook-csoportunkhoz, és oszd meg a véleményedet, tapasztalataidat!

Link másolása
KÖVESS MINKET:

JÖVŐ
A Rovatból
Jön a vaskorszak az akkumulátoriparban? Meglepő áttörés előtt állhat az ágazat
Laborban finomhangolt kristályszerkezet adja a varázslatot. Ha a gyártás bírja a tempót, az MRI-től a mágnesvasútig sok minden megváltozhat.


Meglepő áttörés jöhet az akkuk világában: kutatók bebizonyították, hogy a vas több elektront tud leadni és visszavenni, mint amennyit eddig lehetségesnek tartottak. Az Interesting Engineering beszámolója alapján olyan vasalapú katódok jöhetnek, amelyek egyszerre erősebbek és olcsóbbak – írta a Portfolio.hu.

A kulcs egy új, nanoszerkezetű anyag: lítium–vas–antimon–oxid. A kutatók ennek kristályszerkezetét úgy hangolták finomra, hogy a vasatomok akár öt elektront is képesek legyenek leadni és visszavenni, szemben a korábban ismert kettő–hárommal.

Az elején nem ment zökkenőmentesen: a minták a töltési ciklusok alatt többször is szétestek. A megoldás az extrém lekicsinyítés lett: 300–400 nanométeres szemcsenagyságnál stabil állapotot értek el. „A részecskék lekicsinyítése óriási kihívás volt, de ez tette lehetővé, hogy a kristály stabil maradjon” – mondta az egyik kutató.

Ha ez a megközelítés beválik, a drága és környezeti szempontból vitatott kobalt- és nikkeltartalmú akkuk helyett olcsóbb, vasalapú megoldások is jöhetnek.

A felfedezés hatása túlmutathat az energiatároláson: a vas új elektronikus és mágneses tulajdonságai hatással lehetnek MRI-berendezésekre, mágnesvasúti technológiára, sőt akár a szupravezetők fejlődésére is.

A fordulatot egy 2018-as elmélet indította el: William Gent vetette fel, hogy a vas magasabb oxidációs állapotba kényszeríthető, ha a szomszédos atomok távolsága megfelelő. A következő lépés a nagyobb méretű prototípusok gyártása és a hosszú távú ciklustesztelés. A kutatók szerint néhány éven belül ipari fejlesztések indulhatnak az új technológiára építve, és megkezdődhet az akkumulátorok „új vaskorszaka”.


Link másolása
KÖVESS MINKET:


JÖVŐ
A Rovatból
Megkezdték a humanoid robotok tömeggyártását Kínában
A cég több ezer előrendelést említ, az ár körülbelül 11,5 millió forint. A mozgásnál emberi mintákat követnek: a végtagok összehangolását szimulációk és utánzásos tanulás segíti.
Maier Vilmos - szmo.hu
2025. szeptember 27.



A kínai Kepler Robotics elindította a K2 Bumblebee humanoid robot tömeggyártását, írja a Rakéta. A modellt logisztikai munkákra, gyártási feladatokban segítésre, kiállításokra és „speciális műveletekre” szánják.

A K2 hibrid architektúrával működik, ami energiahatékony üzemet tesz lehetővé. A gyártó szerint a humanoid egyhuzamban akár 8 órát is dolgozik.

Az ár a hasonló, általános célú humanoidokhoz képest kicsivel magasabb:

körülbelül 11,5 millió forint.

A robotra már több ezer megrendelés érkezett.

A cég a külalakot kevésbé, a mozgást viszont nagyon „emberire” tervezte. A K2 Bumblebee imitációs tanulással és szimulációkkal sajátította el a járás emberihez hasonló jellegzetességeit, beleértve a végtagok mozgásának összehangolását.

A humanoid robotról készült videót itt lehet megnézni:


Link másolása
KÖVESS MINKET:


JÖVŐ
A Rovatból
Sora 2: megjöttek a videók, amiket a képtelenség megkülönböztetni a valóságtól
Náci egyenruhába bújtattak hírességek, meghamisított történelmi események, kamu filmjelenetek igazinak tűnő színészekkel – máris ilyen videók készültek az OpenAI legújabb videógeneráló modelljével, ami egyszerre lenyűgöző és félelmetes.


A Sora 2 videógeneráló modell szeptember végén jelent meg, azzal az ígérettel, hogy a korábbi változathoz képest jelentősen javult a fizikai pontosság, a realizmus és az irányíthatóság. Mivel az OpenAI már a Sora tavaly decemberben kiadott első változatát is – a ChatGPT sikerével párhuzamba állítva – a videókészítés „GPT‑1 pillanatának” nevezte, nagy várakozások előzték meg a „GPT‑3.5 pillanatként” beharangozott Sora 2-t.

Az első verzió fejlesztői változatáról a demók alapján azt írtuk, olyan minőségű filmekhez, amelyeket szöveges utasításra generál, normál esetben külső helyszínekre, díszletekre, profi felszerelésekre és szakemberekre, statisztákra, illetve színészekre lenne szükség, de „úgy fest, hogy mostantól egyetlen AI, a Sora is elég lesz hozzá”.

Nyújthat ennél is többet egy videógeneráló modell? A Sora 2–nek a jelek szerint sikerült, mert a világ egyik ámulatból a másikba esik a vele készült mozgóképek láttán. Az OpenAI azt állítja, hogy az új modell kiküszöböli a korábbi videógenerálók jellemző hibáit, például az amorf tárgyakat és karaktereket, a torzult valóságot vagy a „túlzott optimizmust”. Utóbbihoz példát is kapcsol: ha egy generált videóban szereplő kosárlabdázó „elvéti” a dobást, az eddigi verziók inkább kicsavarták a realitást, és a labda még lehetetlen szögből is a gyűrűbe „teleportált”. Ehhez képest a Sora 2 a fizika törvényeivel teljesen megegyező módon bánik a tárgyak mozgásával: a labda a palánkba csapódik és pont úgy pattan vissza, ahogy az a valóságban is történne.

A tökéletlenség lehalkításával és a képminőség feltekerésével az OpenAI kisebb csodát alkotott: még egyszerű szöveges utasításokból is olyan videókat hoz létre, amelyeket a legtöbb néző képtelen megkülönböztetni a valóságtól. Az pedig, hogy mekkora a szakadék a versenytársak videógeneráló modelljei, valamint a Sora 2 között, remekül illusztrálja ez az összehasonlítás, amelyben a Google fejlesztette Veo 3–mal vetik össze a képességeit.

Ebben a videóban semmi sem valódi:

A gyorsan bővülő AI‑videópiacon persze vannak más vetélytársak is, például a Meta „Vibes” alkalmazása és a Meta Movie Gen modell, valamint az Elon Musk-féle xAI Grok Imagine-je. A Forbes hangsúlyozza, hogy utóbbi rendszerek 6–10 másodperces felvételeket készítenek, míg a Sora 2 akár egyperces videókat generálhat, illetve hangot is ad a tartalmakhoz, ami komoly fegyvertény a jelenlegi mezőnyben. És eddig minden jel arra mutat, hogy a Sora 2 a legerősebb videógeneráló AI.

Az OpenAI a modell széles körű – de egyelőre Észak-Amerikára korlátozott – bevezetése óta arra biztatja a felhasználókat, hogy a Sora 2 segítségével találjanak ki minél több új világot és történetet. A lehetőségeknek – látszólag – csak a képzelet szab határt, hiszen a modell képes az emberi hanghoz igazított dialógusok és hangeffektek generálására is, sőt, ha kell, a felhasználó hang‑ és videómintája alapján avatárt készít, így a saját filmünk főszereplőjévé válhatunk.

Mi változott? – A Sora 2 új képességei

Bár hozzáférés hiányában nekünk, magyaroknak egyelőre nincs összehasonlítási alapunk, az új modellről megjelent videókon valóban az látszik, hogy komoly szintlépés történt. Amíg a Sora demóiban a generált karakterek szemeit jótékonyan elrejtette valami (többnyire egy napszemüveg), a Sora 2 már nem tart az „uncanny valley” jelenségtől. Ez ugye az a nyugtalanító érzés, ami egy videojátékhoz vagy filmhez digitális eszközökkel létrehozott arc láttán tör ránk: hiába realisztikus a karakter, a tekintete természetellenes marad.

Az új modell már nem ilyen „félénk”: tisztában van vele, hogy amit előállít, teljesen életszerű, ezért nincs szükség trükközésre.

Olyannyira nincs, hogy az alábbi videóban látható és hallható Sam Altman sem Sam Altman, hanem egy Sora 2-vel létrehozott avatár, ami az OpenAI vezérigazgatójaként mutatja be a generatív AI képességeit. És ha erre nem figyelmeztetnek előre, aligha mondanánk meg, hogy nem a valódi személyt látjuk.

Az OpenAI szerint a Sora 2 legnagyobb újítása a fizikai törvények pontosabb szimulációja és a látvány élethű megjelenítése. A modell hosszabb és összetettebb cselekményeket, illetve akár többszereplős akciókat is képes kezelni, miközben megőrzi a mozgás törvényeinek koherenciáját.

A vállalat kiemelte, hogy a videók több jelenetből álló utasításokat követhetnek, és a rendszer megőrzi a generált világ állapotát: figyelembe veszi például azt, hogy a tárgyak az előző képsorban pontosan hol voltak. Ezzel már lehetséges akár több perces klipek és kisfilmek, ezáltal komplexebb narratívák létrehozása, de az OpenAI most még a rövid, gyorsan terjedő tartalmak felé tereli a felhasználókat, mert a játékos menőség meghozza a befektetők kedvét a további tervek finanszírozásához.

Lőttek a filmeseknek, vagy a Sora 2 csak egy új „ecset”, amivel alkothatnak?

Az OpenAI azzal hirdette a Sora, majd a Sora 2 rendszert, hogy a filmipar, az animációs stúdiók és a művészek eszköze lehet. A BBC Science Focus egyetért ezzel: azt írják, a rendszer megkönnyítheti animált klipek készítését, és ezzel időt, pénzt spórol. Az első verzió tartalmai ugyanakkor hemzsegtek a hibáktól. Ahogy arra a Washington Post is felhívta a figyelmet: a rendszer egy 1930‑as évekbeli jelenetben a cigaretta rossz végét gyújtotta meg vagy épp egyszerre több telefonkagylót adott a generált karakter kezébe, ráadásul hangot sem tudott létrehozni.

Ehhez képest a Sora 2 pontosságot és már szinkronizált hangot, illetve hangeffekteket is kínál, amivel elvileg tökéletesen alkalmassá válik a komplex szórakoztatóipari felhasználásra.

Az IndieWire elemzője ennek ellenére sem gondolja, hogy az új verzió a filmiparnak készült. A fejlesztők szerinte „nem törődnek Hollywooddal”, hiszen a platform elsősorban virális tartalmak gyártására ösztönzi az embereket, így a közösségi média új mémgyártó eszközévé válhat. És addig, ameddig ez csak igazoltatás elől meglépő Super Mario-s viccek szintjén realizálódik, nincs is nagy baj.

Ez még senkit sem bánt:

A gondok akkor kezdődnek, ha a könnyed hecceken túllépve valódi emberekről vagy valós eseményeket szimuláló helyzetekről készülnek valóságszagú kamuvideók, ami megnehezíti a független filmesek etikus AI‑felhasználását. Onnantól a Nintendo sem mókás rajongói videóként fogja kezelni a fentihez hasonló alkotásokat – ami még ingyen reklámot is csap a Mario Kart játékoknak –, mert attól tart majd, hogy a trend visszaéléseket szül, és óriási energiákat kell fordítani a szellemi tulajdona megvédésére.

A véleménycikk arra is figyelmeztet, hogy a Sora‑videók virális mémjei új frontot nyitnak a szerzői jogi háborúban, hiszen az AI‑userek óhatatlanul egyre kevesebbet törődnek majd a szellemi tulajdonnal, ezáltal tovább mélyítik az árkot az alkotók és az AI‑fejlesztők között. Az Indiewire ezzel kapcsolatban szakmai állásfoglalásokat sürget: úgy véli, ha a jogtulajdonosok és szakszervezetek nem alakítanak ki standardokat, elveszíthetik a harcot.

Osztja ezt az aggodalmat a WGBH-nak nyilatkozó digitális képzőművész, Kyt Janae is, aki szerint nem kell egy év, és szinte képtelenek leszünk megkülönböztetni az ember alkotta tartalmakat az AI-val generált képektől. Thomas Smith, a képek digitalizálásával, menedzselésével, kiadásával és monetizálásával foglalkozó Gado Images vezérigazgatója hozzátette:

a mesterségesen létrehozott képek miatt a valódi fotók is hitelességi válságba kerülhetnek.

Ezek a megállapítások azt jelzik, hogy a videógeneráló AI több területen okozhat károkat, a szórakoztatóipartól a politikán át a személyiségi jogokig.

Máris támadják az új AI-modellt

A Sora 2 indítását rögtön kritikák és aggályok kísérték. A The Guardian például arról számolt be, hogy a generált videók posztolására létrehozott TikTok-szerű app feedje hamar megtelt erőszakos és rasszista jelenetekkel, köztük bombázást és tömeggyilkosságot szimuláló tartalmakkal. Joan Donovan kutató ezzel kapcsolatban arra figyelmeztetett, hogy az ilyen eszközök elmossák a valóság és a hazugság között húzódó határt, ezáltal alkalmassá válhatnak gyűlöletkeltésre és zaklatásra.

Sam Altman ehhez képest a saját blogján a „kreativitás ChatGPT‑pillanataként” jellemezte a Sora 2 indulását, de óvatosan elismerte azt is, hogy például a bullying elkerülése érdekében nagyobb figyelmet kell fordítani a moderálásra.

A Rolling Stone közben példákkal illusztrálva mutatta be, hogy a realisztikus videógeneráló segítségével a felhasználók – csupán heccből – náci egyenruhába bújtattak hírességeket, történelmi eseményeket hamisítottak vagy éppen levédett karaktereket (Pikachu, Ronald McDonald, SpongeBob) használtak fel, ami szerzői jogi veszélyeket sejtet.

A Sora 2 kritikusait idézve a magazin azt írja, hogy az OpenAI „próbálja bepereltetni önmagát”.

A Vox cikke egyenesebben fogalmaz: felhívja a figyelmet arra, hogy a Sora 2 alapértelmezése szerint a jogtulajdonosok azok, akiknek kérvényezniük kellene a karaktereik eltávolítását, ami olyan, mintha a fejlesztők kifejezetten a szerzői jogok megsértése felé terelnék a felhasználókat.

Nem véletlen, hogy a kritikákkal szembesülő Sam Altman később frissítette a posztját, jelezve, hogy a jövőben a jogtulajdonosok „opt‑in” alapon adhatnak hozzá karaktereket az AI-modellhez, lehetővé téve, hogy a generált videók után részesedést kapjanak a bevételekből.

Őrületes energiaigény és a Sora 2 más pénzügyi hatásai

A modell bejelentését követően az elemzők felvetették, hogy a videók generálása rendkívüli mennyiségű számítási kapacitást és energiát igényel. Egyes kutatók szerint egy rövid, nagy felbontású videó generálása több mint 700‑szor több energiát fogyaszt, mint egy állókép létrehozása. Ennek következtében a jövő adatközpontjai már minden kétséget kizáróan nagyvárosokkal vetekedő energiazabáló – és karbonkibocsátó – szörnyetegek lesznek.

A Time elemzése rámutat: az AI‑videók ugyan drágák, de a cégek – köztük az OpenAI és a Meta – abban reménykednek, hogy a rövid videók gyártásával több előfizetéses felhasználó és befektető érkezik. Ez további bevételi forráshoz juttatja őket, ami még nagyobb modellek, egy napon pedig az általános mesterséges intelligencia megjelenéséhez vezethet.

Az AI-cégeknek tényleg nagyon kell a pénz, mert a generatív videómodellek fejlesztése hatalmas összegeket emészt fel. Ez az elemzők szerint idővel arra készteti majd a vállalatokat, hogy a befektetőktől és felhasználóktól beszedett pénzen túl a hirdetési piacon is terjeszkedjenek, illetve további előfizetési csomagokat találjanak ki, valamint árat emeljenek.

Mindeközben fontos cél a felhasználók viselkedési adatainak gyűjtése: a jövőbeli modellekhez a valós interakciók és preferenciák révén tudnak több és jobb tréningadatot gyűjteni.

Ami pedig a belátható jövőben érkező fejlesztéseket illeti, az OpenAI egyik korábbi közleménye felvetette azt is, hogy létrehoznak egy „világszimulátort”, amely pontosan modellezi a fizikai világ törvényeit, ezzel új tudományos problémákat lesz képes megoldani.

Új AI-evolúciós lépcsőfokok jönnek

A Sora 2 ezeknek a vízióknak a nagy reménysége, amitől azt várják, hogy további fejlesztéseket és több platformon elérhető verziókat eredményez. A megjelenése új korszakot nyit a generatív AI-k világában, hiszen bátran kijelenthetjük, hogy ennyire valószerű mozgásokat és hangeffekteket, illetve ilyen időtartamú történeteket még egyik videógeneráló AI sem tudott létrehozni.

Bár a fizika törvényeit még nem követi le tökéletesen és vastagon lehetőséget ad a visszaélésekre – a deepfake-től az erőszakos tartalmakon át a szerzői jogok megsértéséig –, a komoly etikai és jogi kérdések kezelése után érdemes lehet kihasználni a benne rejlő lehetőségeket.

A szakértők szerint hamar mainstream eszközzé válhat, de a társadalomnak – még új normarendszerek és hatékony moderálás bevezetése mellett is – fel kell készülnie arra, hogy a valóság és a mesterséges tartalom közötti határ elmosódik.

Mivel a gazdasági potenciál óriási, számolni kell a bővülésével és az energiafogyasztás növekedésével, valamint azzal, hogy a szellemi tulajdon megóvása érdekében ki kell harcolni a generált tartalmak után járó részesedést. Ezek az együttműködések – ha egyáltalán megköttetnek és aztán hosszú távon működőképesnek bizonyulnak – a kreatív tartalomgyártás ragyogó gyöngyszemévé varázsolhatják a Sora 2-t, illetve a jövőben érkező hasonló modelleket.


Link másolása
KÖVESS MINKET: