JÖVŐ
A Rovatból

Tényleg úgy néz ki, mint Elon Musk – így dőlnek be sokan az AI-val készült, hamis videóknak

„Deepfake Elon Musk” sokak egész nyugdíját elvitte. Ő az új nigériai herceg, csak ő sokkal hatásosabban foszt ki gyanútlan embereket, akik bedőlnek a mesterséges intelligenciával generált videókban kínált befektetési lehetőségeknek.


Az online világ mindig is tele volt veszélyekkel, a digitális bűnözés pedig egyidős a világhálóval. Bár mostanra nevetségesen átlátszónak tűnik a kamu nigériai herceg e-mailje, amiben sokszoros kamatra kért kölcsön random emberektől, az adott korszak technológiai lehetőségeihez képest igenis hatásos csalás volt.

A gyanútlan emberek kifosztási lehetőségeit aztán tovább bővítették a közösségi média platformok. Az ipari méretűvé dagadt dezinformálás miatt ma már szinte romantikusnak tűnik az amerikai katonatiszt története, aki a személyes találkozással kecsegtetve vallott szerelmet magányos nők százezreinek, csak fizessék ki végre a repülőjegy árát. Napjainkban ezeknél sokkal kifinomultabb módszerekkel kell szembenézni:

az elképesztő tempóban fejlődő generatív mesterséges intelligencia technológiák hiteles emberekre megszólalásig hasonlító digitális klónokat szülnek.

A csalás pedig automatizálható: már nem kellenek a fiktív karakterek mögé emberek, akik csevegve csalják lépre az áldozatokat. Elég egy meggyőző kamu videó, amire a benne szereplő ismert személy miatt az egész világon tömegek figyelnek fel, és egy online ügyintéző felület, a pénz utalására.

Az AI-alapú deepfake technológia lehetővé tette, hogy manipulált videók ezrei terjedjenek el. Sok gyanútlan befektető rajta is vesztett olyan hamis befektetési lehetőségeken, amilyeneket a világ leggazdagabb embereként ismert Elon Musk – pontosabban annak AI-val generált digitális mása ajánlott.

Érdekes iróniája ez a sorsnak, hiszen a Tesla és a SpaceX mellett a Twitter-utód X-et is birtokló milliárdos nemrég maga is megosztott egy AI-val generált videót, amelyben az általa támogatott Donald Trump ellenfele, Kamala Harris szájába adtak vállalhatatlan mondatokat.

Deepfake Elon Musk az egész nyugdíját elvitte

A New York Times különösen szemléletesnek tartotta, ezért a riportjában ki is emelte (a sok közül) a 82 éves Steve Beauchamp történetét.

A nyugdíjas mindössze a családját akarta támogatni egy jó befektetéssel, amikor „kapóra jött neki” Elon Musk forradalmi befektetési lehetőséget és gyors hozamokat ígérő videója. Az idős férfi elhitte, hogy az igazi dollármilliárdosról van szó, így számlát nyitott a videót megosztó kamu cégnél, először csak 248 dollárral (kb. 90 ezer forinttal). Néhány hét alatt aztán több tranzakciót is végrehajtott, míg végül csaknem 690.000 dollárt (közel 248 millió forintot) fektetett be – az egész nyugdíjszámlájának kiürítése árán. Végül a pénz persze eltűnt, nyoma sem maradt.

„Lehet, hogy mesterséges intelligenciával csinálták, hogy azt mondja, amit mondott, de a kinézete – ha azt kérték volna, hogy mutassak rá egy sorban, biztosan őt választom"

– nyilatkozta a lapnak Beauchamp, egyértelművé téve, hogy a videón látott személy az ő számára a megtévesztésig hasonlított Elon Muskra.

Az áldozat az ehhez hasonló tartalmakat magából egyenesen okádó Facebookon látta a videót, és nem esett le neki, hogy amit néz, az valójában deepfake, vagyis AI-val manipulált hamisítvány. A kiberbűnözők egyébként egy valódi Musk-interjút használtak fel, átszerkesztették annak hangját egy AI-eszközzel, és még a szájmozgásokat is tökéletesen szinkronizálták az új forgatókönyvvel.

Az efféle hamisítványok olyan tökéletesek, hogy egy átlagos néző számára szinte észrevehetetlenek. Hogy ez mennyire igaz, azt az alábbi videó remekül szemlélteti.

Deepfake Elon Musk példa

Ahogy az osztott kijelző jobb oldalán látható kamu Musk (pontosabban a demonstrációs célú videót készítő etikus alkotó) mondja, „ez egy deepfake példa arra, hogy mire képes egy jó számítógép és szerkesztőprogram”. Hozzáteszi: az elkészítése egy erős grafikus processzor használatával 72 órát vett igénybe, de „további számítási kapacitással még jobb eredményt lehetne elérni”, miközben az emberek 90 százalékban már ezt sem tudják megkülönböztetni az eredetitől.

Vadul terjed a deepfake-csalás

Az utóbbi hónapokban több ezer olyan AI-vezérelt deepfake videó került fel az internetre, amelyek hamis Elon Muskokat használtak potenciális befektetők megtévesztésére – meglehetősen sikeresen. A New York Times elemzésekre hivatkozva úgy becsüli, hogy az ilyen generált videók évente több milliárd dollárt húznak ki az emberek zsebéből. Mindeközben ezeket a tartalmakat fillérekből elő lehet állítani, és ha megfelelően erős hardver áll rendelkezésre, akár percek alatt elkészülhetnek.

A videókat jellemzően a hamisítványok kiszűrésében továbbra is dilettánsnak tűnő közösségi médiában, például a Facebookon terjesztik, ráadásul gyakran fizetett hirdetésként, ami azt jelenti, hogy

a platform többszöri szűrés után sem képes megállapítani, hogy kamuról van szó, vagy rosszabb: fizetés ellenében hidegen hagyja, hogy rosszindulatú tartalom terjesztéséhez járul hozzá.

Francesco Cavalli, a deepfake-eket figyelő és elemző Sensity társalapítója szerint az Elon Musk arcát és hangját felhasználó videó „valószínűleg a legnagyobb deepfake által vezérelt csalás”, amit valaha látott a világ. A technológia révén ezek a videók gyakran szinte hátborzongatóan élethűek, mint az, aminek a fent írt nyugdíjas is bedőlt, hiszen gyakorlatilag hibátlanul hozta Musk jellegzetes akcentusát és beszédstílusát. A világ leggazdagabb emberei közé tartozó milliárdos amúgy a leggyakrabban használt mintája a deepfake csalásoknak, különösen a kriptovalutákra összpontosító kampányokban.

Hogyan készül a deepfake?

Mivel a generatív AI fejlődése gyors és megállíthatatlan, muszáj felkészülni rá, hogy gyakorlatilag bárkivel bármit ki lehet mondatni, ha a cél emberek meggyőzése – vagy a pénzük átadásáról, vagy a politikai, vallási, társadalmi értékrendjük megváltoztatásáról. Óriási árnyoldala ez egy olyan technológiának, ami a civilizáció fejlődését pozitív irányba is lökdöshetné – ahelyett, hogy megfelelő fékek és kontrollok nélkül mindenki játékszerévé teszik, ahogy anno a közösségi médiát (és látjuk, mi lett belőle).

A deepfake-ek gyártása meglepően egyszerű és olcsó folyamat, következésképp tömegek számára hozzáférhető. Az AI hangmásoló eszközeivel bármilyen híresség hangját klónozni lehet. Ezzel addig nincs is gond, amíg az veszélytelen szórakozási céllal történik. Itt éppen Orbán Viktor énekli meg Gyurcsány Ferenc választási győzelmét:

Az AI-val manipulált hang birtokában szájmozgásokat manipulálni képes videógeneráló alkalmazásra van szükség, és ha a szoftver kellően kifinomult, a számítógép grafikus teljesítménye pedig kellően magas, akkor megtévesztően hitelesnek tetsző tartalmak születhetnek.

Még élethűbb hamis tartalmak, még kiszolgáltatottabb felhasználók

A generatív AI-val készült tartalmakkal elsősorban technológiai háttérismeretekkel kevésbé rendelkező, és a hírekkel kapcsolatban nem elég kritikus embereket lehet megtéveszteni. Jól példázza ezt a fent írt Kamala Harris videó, amiben az amerikai elnökjelölt az őt támogató Joe Bident szenilisnek, magát pedig az ország vezetésére alkalmatlannak nevezi, aki csak azért lett demokrata elnökjelölt, mert színesbőrű nőként diverzitási aduásznak számít.

A híreket hiteles forrásból követők számára egyértelmű, hogy Harris – nyilvánosan legalábbis – biztosan nem mondana ilyesmit, tehát kamu videóról van szó.

Musk megosztását követően viszont 150 millióan látták

írja az NBC News, és jócskán akadhattak köztük olyanok, akiknek a politikai véleményét befolyásolta a tartalom, főleg úgy, hogy egy sokak szemében hiteles közszereplő tette közzé, ráadásul olyan, aki politikailag szembe helyezi magát Harris-szel.

Amikor nem dezinformálás, hanem közvetlen lopás a cél, hasonló dolog történik: arra ugyan hiteles személyt nem lehet felkérni, hogy maga ossza meg az arca és hangja felhasználásával készült kamu tartalmat, ám a hitelesség látszatát elő lehet idézni – például úgy, hogy a befektetési tanácsot egy valódinak tűnő, online pénzügyi konferencia álcája alá rejtik. Az a tény, hogy a videón látszólag valós személy oszt meg igaznak tűnő állításokat, és mindez valóságosnak tűnő, nyilvános esemény keretei közé helyeződik, sokaknak már elég, hogy előkotorják a bankkártyát és fizessenek.

Beauchamp esetében viszont ennél is tovább mentek a csalók: nem elég, hogy az idős férfi elhitte azt, amit látott és fizetett, még újabb befektetési lehetőségekkel is kecsegtették – olyan hamis visszaigazolásokat küldve, amelyek a tőkéje növekedését mutatták. Akkor azonban, amikor ki akarta venni a pénzét, egy sor adminisztratív díjat és jutalékot kellett fizetnie, míg végül a teljes nyugdíjmegtakarítása odaveszett.

Fel kellene venni a kesztyűt a terjesztők ellen

Ahogy sok állam különbséget tesz a drogbirtoklás és a drogterjesztés között, érdemes lenne azokat fülön csípni, akik révén a kamu tartalmak eljutnak az emberekhez.

Ezzel próbálkozik mostanában egy ausztrál milliárdos, aki szintén deepfake videók áldozata lett – számolt be a The Guardian.

Andrew Forrest beperelte a Facebookot működtető Metát, amiért annak hirdetési rendszere „ártatlan felhasználókat vesz rá rossz befektetésekre”. A Meta erre azt nyilatkozta, hogy folyamatosan fejlesztik az AI-alapú automatikus észlelési rendszereiket, hogy kiszűrjék a csalókat, de szerintük véget nem érő harcról van szó:

a jól finanszírozott bűnözők folyamatosan változtatják a módszereiket, hogy elkerüljék a lebukást, de ennek az egésznek a levét valahogy mindig a felhasználók, a kisemberek isszák meg.

Ettől függetlenül valóban vannak próbálkozások: a YouTube például szintén igyekszik harcolni a manipulált videók és a csalások ellen. A NY Times szerint csak 2024 első negyedévében több mint 15,7 millió csatornát és 8,2 millió videót töröltek a közösségi irányelvek megsértése miatt. A YouTube emellett kötelezővé tette, hogy a tartalomkészítők jelöljék, ha AI-alapú technológiát használnak videóikban – kérdés, hogy ezt megteszik-e, és ha nem, azt a jövőben hogyan szándékoznak kiszűrni.

Van vége ennek az egésznek?

Lou Steinberg, a CTM Insights alapítója szerint „a szervezett bűnözés rájött, hogy pénzt tud csinálni az AI-ból, így egyre több és több kísérlet lesz”. Az AI-generált videók egyre jobbak, és a jövőben valószínűleg még hitelesebbé válnak. Az egyéni felhasználók számára a legfontosabb tanulság az, hogy mindig kritikusan, természetes kételkedéssel álljanak hozzá az online látott tartalmakhoz, különösen, ha pénzről vagy befektetésekről van szó! A valószínűtlenül magas hozamok például mindig gyanúsak, és ha egy ajánlat túl szép ahhoz, hogy igaz legyen, akkor valószínűleg nem is az.

Ami pedig a nem túl távoli jövő választási kampányait illeti, elég valószínű, hogy egymást érik majd a Kamala Harriséhez hasonló videók, amelyekkel az egyik politikai oldal igyekszik ellehetetleníteni a másikat – például az opponens vezéregyéniség hitelének rombolásával.

Egy szoros választási versenyben néhány száz szavazat eldöntheti választókörzetek sorsát, így a parlament összetételét is. Ami biztosan a demokrácia hanyatlásához vezet – csak az a kérdés, mikor? Nagy szükség lenne a deepfake tartalmak terjesztésének mihamarabbi szankcionálására, illetve arra, hogy a társadalom tudatosabb hírfogyasztóvá váljon. Mert ha minden úgy megy tovább, ahogy most, akkor óriási baj lesz.


Link másolása
KÖVESS MINKET:

Népszerű
Ajánljuk
Címlapról ajánljuk


JÖVŐ
A Rovatból
A mesterséges intelligencia képes lehet akár tíz évre előre megjósolni, hogy kinek milyen betegsége lesz
A modell névtelen kórlapok mintáit figyeli, és évekre előre megmutatja, hol nagyobb a kockázat. A fejlesztők szerint így hamarabb lehet beavatkozni, és még az is tervezhető, hány szívinfarktusra kell készülnie egy városnak 2030-ban.


A kutatók szerint a mesterséges intelligencia akár tíz évre előre jelezhet egészségi gondokat, írja a BBC. A rendszer az emberek egészségügyi adataiban keres mintákat, és több mint 1000 betegség kockázatát számolja. Úgy írják le, mint egy időjárás-előrejelzést: százalékban adja meg a valószínűséget. A cél, hogy időben kiszűrje a magas kockázatú embereket, és évekre előre segítse a kórházak tervezését.

A Delphi-2M nevű modell hasonló technológiára épül, mint a közismert MI-chatbotok, például a ChatGPT. A chatbotok nyelvi mintákat tanulnak, és megjósolják, milyen szavak követik egymást. A Delphi-2M névtelenített egészségügyi adatokból tanulta meg felismerni a mintázatokat, és így jelzi előre, mi következhet és mikor. Nem mond pontos dátumot, hanem 1231 betegség valószínűségét becsli.

„Ahogy az időjárásnál 70 százalék esélyt jelezhetünk az esőre, ugyanezt meg tudjuk tenni az egészségügyben is”

– mondta Ewan Birney professzor, az Európai Molekuláris Biológiai Laboratórium megbízott főigazgatója. „Ráadásul nemcsak egy betegségre, hanem egyszerre az összesre – ilyet még soha nem tudtunk. Izgatott vagyok” – tette hozzá.

A fejlesztők először brit, névtelenített adatokon tanították a modellt: kórházi felvételek, háziorvosi adatok és életmódbeli szokások (például dohányzás) több mint 400 ezer résztvevőtől a UK Biobank projektből. Ezután más Biobank-résztvevők adataival ellenőrizték az előrejelzéseket, majd 1,9 millió ember dániai egészségügyi adatán is letesztelték. „Ha a modellünk azt mondja, hogy a következő évben tízből egy az esély, akkor tényleg nagyjából tízből egy esetben következik be” - tette hozzá Birney professzor.

A rendszer azoknál a betegségeknél működik a legjobban, amelyeknek jól követhető a lefolyása, például a 2-es típusú cukorbetegség, a szívinfarktus vagy a szepszis. Az inkább esetleges fertőzéseknél gyengébben teljesít.

Az orvosok ma is írnak fel koleszterincsökkentőt annak alapján, mekkora valakinél a szívinfarktus vagy a stroke kockázata. Az MI-eszköz még nem áll készen a klinikai használatra, de hasonló módon tervezik alkalmazni: korán azonosítani a magas kockázatú embereket, amikor még van esély megelőzni a betegséget. Ez jelenthet gyógyszert vagy célzott életmódtanácsot – például akinek nagyobb az esélye bizonyos májbetegségekre, annak a szokásosnál jobban megérheti visszavenni az alkoholfogyasztásból.

Az MI a szűrőprogramok tervezésében is segíthet, és egy térség összes egészségügyi adatát elemezve előre jelezheti a várható igényeket,

például hogy 2030-ban nagyjából hány szívinfarktus várható egy adott városban.

„Ez egy újfajta megközelítés kezdete az emberi egészség és a betegséglefolyás megértésében” – mondta Moritz Gerstung professzor, a Német Rákkutató Központ (DKFZ) onkológiai MI-osztályának vezetője. „Az olyan generatív modellek, mint a miénk, egy napon személyre szabhatják az ellátást, és nagy léptékben előre jelezhetik az egészségügyi szükségleteket.”

A Nature tudományos folyóiratban ismertetett modellt még finomítani és tesztelni kell a klinikai használat előtt. Torzítást okozhat, hogy a UK Biobank adatai főként 40–70 éves emberektől származnak. A fejlesztők most bővítik a modellt képalkotó vizsgálatokkal, genetikai információkkal és vérvizsgálati eredményekkel.

„Fontos hangsúlyozni, hogy ez kutatás – mindent alaposan tesztelni, szabályozni és átgondolni kell, mielőtt használni kezdjük, de a technológia adott ahhoz, hogy ilyen előrejelzéseket készítsünk” – nyomatékosította Birney professzor. Úgy véli, a genomika egészségügyi bevezetéséhez hasonló utat járhat be a folyamat: a tudósok bizalmától a rutinszerű klinikai használatig akár egy évtized is eltelhet.

A kutatás az Európai Molekuláris Biológiai Laboratórium, a Német Rákkutató Központ (DKFZ) és a Koppenhágai Egyetem együttműködésében készült. Gustavo Sudre, a King’s College London kutatója így értékelt: „Ez a munka jelentős lépés a skálázható, értelmezhető és – ami a legfontosabb – etikailag felelős orvosi prediktív modellezés felé.”


Link másolása
KÖVESS MINKET:

Ajánljuk
JÖVŐ
A Rovatból
Megkezdték a humanoid robotok tömeggyártását Kínában
A cég több ezer előrendelést említ, az ár körülbelül 11,5 millió forint. A mozgásnál emberi mintákat követnek: a végtagok összehangolását szimulációk és utánzásos tanulás segíti.
Maier Vilmos - szmo.hu
2025. szeptember 27.



A kínai Kepler Robotics elindította a K2 Bumblebee humanoid robot tömeggyártását, írja a Rakéta. A modellt logisztikai munkákra, gyártási feladatokban segítésre, kiállításokra és „speciális műveletekre” szánják.

A K2 hibrid architektúrával működik, ami energiahatékony üzemet tesz lehetővé. A gyártó szerint a humanoid egyhuzamban akár 8 órát is dolgozik.

Az ár a hasonló, általános célú humanoidokhoz képest kicsivel magasabb:

körülbelül 11,5 millió forint.

A robotra már több ezer megrendelés érkezett.

A cég a külalakot kevésbé, a mozgást viszont nagyon „emberire” tervezte. A K2 Bumblebee imitációs tanulással és szimulációkkal sajátította el a járás emberihez hasonló jellegzetességeit, beleértve a végtagok mozgásának összehangolását.

A humanoid robotról készült videót itt lehet megnézni:


Link másolása
KÖVESS MINKET:


JÖVŐ
A Rovatból
Sora 2: megjöttek a videók, amiket a képtelenség megkülönböztetni a valóságtól
Náci egyenruhába bújtattak hírességek, meghamisított történelmi események, kamu filmjelenetek igazinak tűnő színészekkel – máris ilyen videók készültek az OpenAI legújabb videógeneráló modelljével, ami egyszerre lenyűgöző és félelmetes.


A Sora 2 videógeneráló modell szeptember végén jelent meg, azzal az ígérettel, hogy a korábbi változathoz képest jelentősen javult a fizikai pontosság, a realizmus és az irányíthatóság. Mivel az OpenAI már a Sora tavaly decemberben kiadott első változatát is – a ChatGPT sikerével párhuzamba állítva – a videókészítés „GPT‑1 pillanatának” nevezte, nagy várakozások előzték meg a „GPT‑3.5 pillanatként” beharangozott Sora 2-t.

Az első verzió fejlesztői változatáról a demók alapján azt írtuk, olyan minőségű filmekhez, amelyeket szöveges utasításra generál, normál esetben külső helyszínekre, díszletekre, profi felszerelésekre és szakemberekre, statisztákra, illetve színészekre lenne szükség, de „úgy fest, hogy mostantól egyetlen AI, a Sora is elég lesz hozzá”.

Nyújthat ennél is többet egy videógeneráló modell? A Sora 2–nek a jelek szerint sikerült, mert a világ egyik ámulatból a másikba esik a vele készült mozgóképek láttán. Az OpenAI azt állítja, hogy az új modell kiküszöböli a korábbi videógenerálók jellemző hibáit, például az amorf tárgyakat és karaktereket, a torzult valóságot vagy a „túlzott optimizmust”. Utóbbihoz példát is kapcsol: ha egy generált videóban szereplő kosárlabdázó „elvéti” a dobást, az eddigi verziók inkább kicsavarták a realitást, és a labda még lehetetlen szögből is a gyűrűbe „teleportált”. Ehhez képest a Sora 2 a fizika törvényeivel teljesen megegyező módon bánik a tárgyak mozgásával: a labda a palánkba csapódik és pont úgy pattan vissza, ahogy az a valóságban is történne.

A tökéletlenség lehalkításával és a képminőség feltekerésével az OpenAI kisebb csodát alkotott: még egyszerű szöveges utasításokból is olyan videókat hoz létre, amelyeket a legtöbb néző képtelen megkülönböztetni a valóságtól. Az pedig, hogy mekkora a szakadék a versenytársak videógeneráló modelljei, valamint a Sora 2 között, remekül illusztrálja ez az összehasonlítás, amelyben a Google fejlesztette Veo 3–mal vetik össze a képességeit.

Ebben a videóban semmi sem valódi:

A gyorsan bővülő AI‑videópiacon persze vannak más vetélytársak is, például a Meta „Vibes” alkalmazása és a Meta Movie Gen modell, valamint az Elon Musk-féle xAI Grok Imagine-je. A Forbes hangsúlyozza, hogy utóbbi rendszerek 6–10 másodperces felvételeket készítenek, míg a Sora 2 akár egyperces videókat generálhat, illetve hangot is ad a tartalmakhoz, ami komoly fegyvertény a jelenlegi mezőnyben. És eddig minden jel arra mutat, hogy a Sora 2 a legerősebb videógeneráló AI.

Az OpenAI a modell széles körű – de egyelőre Észak-Amerikára korlátozott – bevezetése óta arra biztatja a felhasználókat, hogy a Sora 2 segítségével találjanak ki minél több új világot és történetet. A lehetőségeknek – látszólag – csak a képzelet szab határt, hiszen a modell képes az emberi hanghoz igazított dialógusok és hangeffektek generálására is, sőt, ha kell, a felhasználó hang‑ és videómintája alapján avatárt készít, így a saját filmünk főszereplőjévé válhatunk.

Mi változott? – A Sora 2 új képességei

Bár hozzáférés hiányában nekünk, magyaroknak egyelőre nincs összehasonlítási alapunk, az új modellről megjelent videókon valóban az látszik, hogy komoly szintlépés történt. Amíg a Sora demóiban a generált karakterek szemeit jótékonyan elrejtette valami (többnyire egy napszemüveg), a Sora 2 már nem tart az „uncanny valley” jelenségtől. Ez ugye az a nyugtalanító érzés, ami egy videojátékhoz vagy filmhez digitális eszközökkel létrehozott arc láttán tör ránk: hiába realisztikus a karakter, a tekintete természetellenes marad.

Az új modell már nem ilyen „félénk”: tisztában van vele, hogy amit előállít, teljesen életszerű, ezért nincs szükség trükközésre.

Olyannyira nincs, hogy az alábbi videóban látható és hallható Sam Altman sem Sam Altman, hanem egy Sora 2-vel létrehozott avatár, ami az OpenAI vezérigazgatójaként mutatja be a generatív AI képességeit. És ha erre nem figyelmeztetnek előre, aligha mondanánk meg, hogy nem a valódi személyt látjuk.

Az OpenAI szerint a Sora 2 legnagyobb újítása a fizikai törvények pontosabb szimulációja és a látvány élethű megjelenítése. A modell hosszabb és összetettebb cselekményeket, illetve akár többszereplős akciókat is képes kezelni, miközben megőrzi a mozgás törvényeinek koherenciáját.

A vállalat kiemelte, hogy a videók több jelenetből álló utasításokat követhetnek, és a rendszer megőrzi a generált világ állapotát: figyelembe veszi például azt, hogy a tárgyak az előző képsorban pontosan hol voltak. Ezzel már lehetséges akár több perces klipek és kisfilmek, ezáltal komplexebb narratívák létrehozása, de az OpenAI most még a rövid, gyorsan terjedő tartalmak felé tereli a felhasználókat, mert a játékos menőség meghozza a befektetők kedvét a további tervek finanszírozásához.

Lőttek a filmeseknek, vagy a Sora 2 csak egy új „ecset”, amivel alkothatnak?

Az OpenAI azzal hirdette a Sora, majd a Sora 2 rendszert, hogy a filmipar, az animációs stúdiók és a művészek eszköze lehet. A BBC Science Focus egyetért ezzel: azt írják, a rendszer megkönnyítheti animált klipek készítését, és ezzel időt, pénzt spórol. Az első verzió tartalmai ugyanakkor hemzsegtek a hibáktól. Ahogy arra a Washington Post is felhívta a figyelmet: a rendszer egy 1930‑as évekbeli jelenetben a cigaretta rossz végét gyújtotta meg vagy épp egyszerre több telefonkagylót adott a generált karakter kezébe, ráadásul hangot sem tudott létrehozni.

Ehhez képest a Sora 2 pontosságot és már szinkronizált hangot, illetve hangeffekteket is kínál, amivel elvileg tökéletesen alkalmassá válik a komplex szórakoztatóipari felhasználásra.

Az IndieWire elemzője ennek ellenére sem gondolja, hogy az új verzió a filmiparnak készült. A fejlesztők szerinte „nem törődnek Hollywooddal”, hiszen a platform elsősorban virális tartalmak gyártására ösztönzi az embereket, így a közösségi média új mémgyártó eszközévé válhat. És addig, ameddig ez csak igazoltatás elől meglépő Super Mario-s viccek szintjén realizálódik, nincs is nagy baj.

Ez még senkit sem bánt:

A gondok akkor kezdődnek, ha a könnyed hecceken túllépve valódi emberekről vagy valós eseményeket szimuláló helyzetekről készülnek valóságszagú kamuvideók, ami megnehezíti a független filmesek etikus AI‑felhasználását. Onnantól a Nintendo sem mókás rajongói videóként fogja kezelni a fentihez hasonló alkotásokat – ami még ingyen reklámot is csap a Mario Kart játékoknak –, mert attól tart majd, hogy a trend visszaéléseket szül, és óriási energiákat kell fordítani a szellemi tulajdona megvédésére.

A véleménycikk arra is figyelmeztet, hogy a Sora‑videók virális mémjei új frontot nyitnak a szerzői jogi háborúban, hiszen az AI‑userek óhatatlanul egyre kevesebbet törődnek majd a szellemi tulajdonnal, ezáltal tovább mélyítik az árkot az alkotók és az AI‑fejlesztők között. Az Indiewire ezzel kapcsolatban szakmai állásfoglalásokat sürget: úgy véli, ha a jogtulajdonosok és szakszervezetek nem alakítanak ki standardokat, elveszíthetik a harcot.

Osztja ezt az aggodalmat a WGBH-nak nyilatkozó digitális képzőművész, Kyt Janae is, aki szerint nem kell egy év, és szinte képtelenek leszünk megkülönböztetni az ember alkotta tartalmakat az AI-val generált képektől. Thomas Smith, a képek digitalizálásával, menedzselésével, kiadásával és monetizálásával foglalkozó Gado Images vezérigazgatója hozzátette:

a mesterségesen létrehozott képek miatt a valódi fotók is hitelességi válságba kerülhetnek.

Ezek a megállapítások azt jelzik, hogy a videógeneráló AI több területen okozhat károkat, a szórakoztatóipartól a politikán át a személyiségi jogokig.

Máris támadják az új AI-modellt

A Sora 2 indítását rögtön kritikák és aggályok kísérték. A The Guardian például arról számolt be, hogy a generált videók posztolására létrehozott TikTok-szerű app feedje hamar megtelt erőszakos és rasszista jelenetekkel, köztük bombázást és tömeggyilkosságot szimuláló tartalmakkal. Joan Donovan kutató ezzel kapcsolatban arra figyelmeztetett, hogy az ilyen eszközök elmossák a valóság és a hazugság között húzódó határt, ezáltal alkalmassá válhatnak gyűlöletkeltésre és zaklatásra.

Sam Altman ehhez képest a saját blogján a „kreativitás ChatGPT‑pillanataként” jellemezte a Sora 2 indulását, de óvatosan elismerte azt is, hogy például a bullying elkerülése érdekében nagyobb figyelmet kell fordítani a moderálásra.

A Rolling Stone közben példákkal illusztrálva mutatta be, hogy a realisztikus videógeneráló segítségével a felhasználók – csupán heccből – náci egyenruhába bújtattak hírességeket, történelmi eseményeket hamisítottak vagy éppen levédett karaktereket (Pikachu, Ronald McDonald, SpongeBob) használtak fel, ami szerzői jogi veszélyeket sejtet.

A Sora 2 kritikusait idézve a magazin azt írja, hogy az OpenAI „próbálja bepereltetni önmagát”.

A Vox cikke egyenesebben fogalmaz: felhívja a figyelmet arra, hogy a Sora 2 alapértelmezése szerint a jogtulajdonosok azok, akiknek kérvényezniük kellene a karaktereik eltávolítását, ami olyan, mintha a fejlesztők kifejezetten a szerzői jogok megsértése felé terelnék a felhasználókat.

Nem véletlen, hogy a kritikákkal szembesülő Sam Altman később frissítette a posztját, jelezve, hogy a jövőben a jogtulajdonosok „opt‑in” alapon adhatnak hozzá karaktereket az AI-modellhez, lehetővé téve, hogy a generált videók után részesedést kapjanak a bevételekből.

Őrületes energiaigény és a Sora 2 más pénzügyi hatásai

A modell bejelentését követően az elemzők felvetették, hogy a videók generálása rendkívüli mennyiségű számítási kapacitást és energiát igényel. Egyes kutatók szerint egy rövid, nagy felbontású videó generálása több mint 700‑szor több energiát fogyaszt, mint egy állókép létrehozása. Ennek következtében a jövő adatközpontjai már minden kétséget kizáróan nagyvárosokkal vetekedő energiazabáló – és karbonkibocsátó – szörnyetegek lesznek.

A Time elemzése rámutat: az AI‑videók ugyan drágák, de a cégek – köztük az OpenAI és a Meta – abban reménykednek, hogy a rövid videók gyártásával több előfizetéses felhasználó és befektető érkezik. Ez további bevételi forráshoz juttatja őket, ami még nagyobb modellek, egy napon pedig az általános mesterséges intelligencia megjelenéséhez vezethet.

Az AI-cégeknek tényleg nagyon kell a pénz, mert a generatív videómodellek fejlesztése hatalmas összegeket emészt fel. Ez az elemzők szerint idővel arra készteti majd a vállalatokat, hogy a befektetőktől és felhasználóktól beszedett pénzen túl a hirdetési piacon is terjeszkedjenek, illetve további előfizetési csomagokat találjanak ki, valamint árat emeljenek.

Mindeközben fontos cél a felhasználók viselkedési adatainak gyűjtése: a jövőbeli modellekhez a valós interakciók és preferenciák révén tudnak több és jobb tréningadatot gyűjteni.

Ami pedig a belátható jövőben érkező fejlesztéseket illeti, az OpenAI egyik korábbi közleménye felvetette azt is, hogy létrehoznak egy „világszimulátort”, amely pontosan modellezi a fizikai világ törvényeit, ezzel új tudományos problémákat lesz képes megoldani.

Új AI-evolúciós lépcsőfokok jönnek

A Sora 2 ezeknek a vízióknak a nagy reménysége, amitől azt várják, hogy további fejlesztéseket és több platformon elérhető verziókat eredményez. A megjelenése új korszakot nyit a generatív AI-k világában, hiszen bátran kijelenthetjük, hogy ennyire valószerű mozgásokat és hangeffekteket, illetve ilyen időtartamú történeteket még egyik videógeneráló AI sem tudott létrehozni.

Bár a fizika törvényeit még nem követi le tökéletesen és vastagon lehetőséget ad a visszaélésekre – a deepfake-től az erőszakos tartalmakon át a szerzői jogok megsértéséig –, a komoly etikai és jogi kérdések kezelése után érdemes lehet kihasználni a benne rejlő lehetőségeket.

A szakértők szerint hamar mainstream eszközzé válhat, de a társadalomnak – még új normarendszerek és hatékony moderálás bevezetése mellett is – fel kell készülnie arra, hogy a valóság és a mesterséges tartalom közötti határ elmosódik.

Mivel a gazdasági potenciál óriási, számolni kell a bővülésével és az energiafogyasztás növekedésével, valamint azzal, hogy a szellemi tulajdon megóvása érdekében ki kell harcolni a generált tartalmak után járó részesedést. Ezek az együttműködések – ha egyáltalán megköttetnek és aztán hosszú távon működőképesnek bizonyulnak – a kreatív tartalomgyártás ragyogó gyöngyszemévé varázsolhatják a Sora 2-t, illetve a jövőben érkező hasonló modelleket.


Link másolása
KÖVESS MINKET:


JÖVŐ
A Rovatból
Mesterséges intelligenciával hoztak létre egy színésznőt - a hollywoodi színészek kiakadtak
Tilly Norwood már ügynökségeknél is próbálkozik, hogy szerepet kapjon, de több ismert színész és a szakszervezet is tiltakozik ellene.


Eline Van der Velden holland színész és komikus egy mesterséges intelligenciával működő, Tilly Norwood nevű szintetikus színészt hozott létre. Az alkotó szerint ez „a képzelőerő megnyilvánulása”, és hasonló „egy karakter megrajzolásához, egy szerep megírásához vagy egy előadás megalkotásához”.

Tilly Norwoodnak már saját Instagram-oldala is van. Készítői bőrhibákat is megjelenítettek rajta, valamint olyan mondatokat írtak a nevében, mint például azt, hogy „nagyon izgatott” a jövő miatt.

A fejlesztők már több ügynökségnél is bejelentkeztek, hogy hollywoodi filmes szereplési lehetőséget szerezzenek neki.

A hollywoodi színészszakszervezet és több ismert színész is tiltakozik az AI-színész ellen. A szervezet közleményében úgy fogalmazott:

Norwood „nem színész, hanem egy számítógépes program által generált karakter, amit profi színészek munkájával tanítottak be.

Nincsenek élményei, amikből meríthetne, nincsenek érzelmei, és az eddig látottak alapján a közönséget sem érdekli a számítógéppel generált, emberi valóságtól elszakadt tartalmak”.

Emily Blunt a mesterséges színészt „ijesztőnek” nevezte. Natasha Lyonne szerint pedig bojkottálni kell mindenkit, aki együtt dolgozna vele. A BBC szerint Lyonne épp egy olyan filmen dolgozik, amelyben valódi színészek szerepelnek, és amelyben „etikus mesterséges intelligenciát” alkalmaznak.

Whoopi Goldberg úgy véli, hogy a közönség képes megkülönböztetni a valódi embereket a mesterséges intelligencia által generált alakoktól, mivel „másképp mozognak”.

Van der Velden egy közelmúltbeli előadáson azt mondta, szerinte a hollywoodi stúdiók és ügynökségek titokban támogatják a mesterséges intelligencia használatát, és a következő hónapokban nagy bejelentésekre lehet számítani ezzel kapcsolatban.

(via 444)


Link másolása
KÖVESS MINKET: