JÖVŐ
A Rovatból

Balogh Petya: A kínai DeepSeek semennyire nem veszélyes, sőt, egy demokratikusabb irányba viszi az AI-fejlesztést

Az olcsó kínai AI megjelenése megrengette az amerikai tőzsdét. Balogh Petya szerint azonban ennél jobb nem is történhetett volna. Lehet, hogy a nagy amerikai techcégek, amelyek ezért a monopóliumért versenyeztek, most veszítettek, de a világ mindenképpen nyert.


Komoly pánikot váltott ki Amerikában, hogy egy kínai cég olyan mesterséges intelligenciával állt elő, amelyik töredékáron készült, és mégis hasonló teljesítményt nyújt, mint a ChatGPT. A DeepSeek mindössze 5,6 millió dollárba került. A hírre az amerikai tőzsde a történelem egyik legnagyobb részvényzuhanásával reagált. A mesterséges intelligenciákhoz drága chipeket gyártó NVidia egyetlen nap alatt 600 milliárd dollárt veszített az értékéből. Ez 17%-os esés, igaz, az első pánik után másnap 8%-ot erősödtek a cég részvényei.

De a DeepSeek rávilágított arra, mennyire törékeny az amerikai óriáscégek előnye Kínával szemben a mesterséges intelligencia terén.

Donald Trump úgy reagált, végsősoron jó dolog történt, mert hosszabb távon olcsóbban lehet majd fejleszteni. Hogyan lehet, hogy ilyen olcsón ki tudott jönni a DeepSeek, és ez az esemény milyen hatással lesz a mesterséges intelligencia fejlesztésére? A kérdéseinkre Balogh Petya válaszolt, aki az STRT Holding Nyrt igazgatósági elnöke, és befektetéseik mellett csapatával tavaly több ezer cégvezetőnek tartott oktatást az AI fejlődéséről és várható üzleti hatásairól. Kiderült, őt kifejezetten feldobták az új fejlemények.

– Örülünk, és miért örülünk?

– Azért, mert az egyik nagy dilemmája a technológiának az utóbbi évtizedekben, hogy több olyan technológia volt, ami nagyon nyitottnak, nagyon szabadnak és demokratizálónak indult, és végül egy-egy monopólium rátelepedett. Maga a webes böngészés és információszerzés is szabadnak indult, hiszen bárki tud weboldalt csinálni, de aztán kiderült, ahhoz, hogy bárkinek a weboldalát megtaláljuk, csak egy darab játékos lett a Google, akin keresztül ezt hatékonyan és jól lehetett megoldani.

Úgyhogy végül is a webet a Google monopóliumba tudta ezzel hajtani, és a webes kereséseknek, hirdetéseknek ő lett a vámszedője. És most már ott tartunk, hogy akár a tranzakció értékének a negyede, ötöde hirdetési költség formájában ennél a vámszedőnél landol.

Ugyanígy a social médiában a Meta, azaz a Facebook anyacége, az Instagram és más platformok révén szintén monopóliumot alakított ki, és most arra törekszik, hogy a TikTokot is megszerezze, ezzel tovább erősítve pozícióját. Tehát egy szabadnak, nyitottnak indult technológiából végül monopólium lett. A mesterséges intelligencia kapcsán ez azért veszélyes, akárcsak a Google kapcsán, hogy aki a tudáshoz való hozzáférést vezérli, annak nemcsak brutális gazdasági, hanem hihetetlen politikai befolyásoló ereje is lesz. Nem véletlen, hogy amikor Trump először nyert, akkor azt egyértelműen egy, a Facebookot ügyesen használó csapatnak, a Cambridge Analyticának köszönhette jelentős mértékben, mert a Facebookot, mint manipulatív eszközt a politikai célokra fegyverként bevetve tudtak a szavazókra hatni.

Ha ugyanez történik a mesterséges intelligenciában, akkor lesz egy cég, amely eldöntheti, hogy egy-egy kérdésben mit tudjon az egész emberiség.

És akkor jön egy kis kínai játékos, aki pedig megmutatja, hogy több nagyságrenddel olcsóbban közel olyan színvonalat tud előállítani. És nem elég, hogy megcsinálja ezt, és árban versenyezne vele, hanem a teljes fejlesztését, az összes programkódot, a teljes adatbázist, a létrejövő mesterséges intelligenciát mindenestől bedobja a közösbe.

– Ez neki miért jó?

– Érdekes, hogy nem ők kezdték ezt a játékot, hanem nyílt forráskódú fejlesztésben is sokan kísérletezgettek, hogy tudnak-e valami hasonlót csinálni, mint a ChatGPT, de a legnagyobb játékos az utóbbi években ebben a Meta lett, a Facebook anyacége. A cég még nem tudja, hogyan fog üzleti hasznot húzni, de azt tudja, hogy nem szeretné, ha a három nagy monopóliumból valaki más nyerje meg a versenyt. Ezért egy Llama nevű modellt tett elérhetővé, amely szintén ingyenesen hozzáférhető.

Ez egyfajta válasz volt a nagy monopóliumokra: egy esély arra, hogy a piac demokratizálódjon.

Most a kínaiak rájöttek arra, hogy mindabból a kutatási eredményből, amit az emberiség az utóbbi években a témában felhalmozott, hogyan lehet nagyon olcsón, nagyon könnyen, közel olyan szintű mesterséges intelligenciát előállítani, mint egy évvel ezelőtt a csúcstechnológia volt. És ez nekik kevesebb, mint 6 millió dollárba került, és egy kis csapattal csinálták meg, ráadásul egy kis kutatócsapattal. Innentől ez továbbfejleszthető, újra tréningezhető.

Pár millió dollárnyi energiát elégetve egy szerverteremben, a kommunista propagandát kiszedve, bárki tud csinálni egy saját változatot, mert ott van hozzá minden készen.

És ami még izgalmasabb, hogy amennyiben valaki erre építve egy új dolgot akar fejleszteni, akkor már ingyen elérhető ez a lépcső, és innen már csak a következő lépésre kell költeni. Azaz hirtelen a nyílt forráskódú, a mindenki által hozzáférhető, mindenki által ingyen használható technológia, ha nem is leelőzte, de majdnem utolérte a csúcstechnológiát.

– Ez nagyon szépen hangzik, hogy innentől kezdve bárki a saját képére és hasonlatosságára szabva újabb és újabb AI-okat tud létrehozni. Na, de ezt mégiscsak egy nem éppen baráti hatalom fejlesztette ki. Biztos, hogy nem veszélytelen ránk nézve, hogy ez az AI Kínából jön?

– Szerintem semennyire nem veszélyes. Nyilván a DeepSeek-ként elérhető modellben vannak olyan témák, amik a kínai központi narratívát tartalmazzák, és ha csak egy olcsó konkurenciája lenne a ChatGPT-nek, ha nem adtak volna ki semmit nyílt forráskódra, akkor ez egy olcsóbb, csak éppen egy másik ország aktuális narratíváját közvetítő modell lenne, amiben lehetne egyfajta társadalmi, kulturális, politikai veszély. De igazából mindegyik nagy nyelvi modell tud eszköz lenni arra, hogy valakinek a narratíváját közvetítse.

Úgyhogy a demokratikusabb világ irányába mind üzleti, mind társadalmi oldalról nem az vezet, hogy egy olyan modell nyerjen, aminek az értékeivel jobban egyetértek, hanem az, hogy ebből egy sokszereplős piac jöjjön létre, amiben sokféle modell van, és kialakul a modellek között egy verseny, mert ingyen elérhető most már nagyon sokféle modell.

Ennek adott egy újabb lökést most a DeepSeek is, de ez egyben azt is jelenti, hogy nagyon hamar fog valaki csinálni majd egy ugyanilyen tudású, szintén ingyenes, akár ingyen hozzáférhető, de a kínai helyett például egy európai narratívát közvetítő modellt. És igazából ez benne a jó. A társadalom érdeke nem abban van, hogy az amerikai vagy a kínai narratívát hordozó modell győzzön, hanem hogy nagyon sokféle modell legyen, és legyen köztük verseny.

– Nagyon sok esetben tetten értük azt, hogy a kínaiak elég kreatívan értelmezik a licencjogot. Biztosak vagyunk benne, hogy ez a DeepSeek teljesen originális fejlesztés, és nem részben ipari kémkedés eredménye?

– A mesterséges intelligencia területén az az izgalmas, hogy nagyon felgyorsultak az események, de a technológia nagyja bárki által elérhető tudományos publikációkban zajlik. A szédítő gyorsaságról tavaly nyáron volt egy személyes élményem: kijött egy új kutatási publikáció, ami újfajta algoritmust javasolt arra, hogy hogyan lehetne hatékonyabban képeket generálni. Majd pár nappal később megjelent a forráskód, ami ezt megvalósította, szintén ingyen hozzáférhetően, mert valaki ezt elolvasta és implementálta, ezután megint csak pár nappal később már le lehetett tölteni egy olyan ingyenes, közösség által fejlesztett szoftvert, ami ezt tudta, és pár héttel később pedig a fizetős szoftverekbe is beépült ez az új megoldás. Talán az OpenAI az egyetlen, aki a nevével ellentétben szinte semmit nem publikál, vagy nagyon keveset csak. A 60-as években az Intel, akkori nevén Fairchild Semiconductor marketingvezetője megfigyelte, hogy kétévente duplázódik az ugyanannyi dollárért eladott tranzisztoroknak a száma. Kétévente tudnak mindig duplázni és újra duplázni. Akkor 100 tranzisztor volt nagyjából egy mikrochipben. Gordon Moore volt ez az ember, és róla nevezték el Moore törvényét. Ha ez a jóslata akkor igaz, akkor most, mivel 60 év alatt 30-szor duplázott a technológia, a 100 darab tranzisztorból mára körülbelül 100 milliárdnak kellene lennie.

És így is lett, ha bemegyünk az almás boltba, akkor a 134 milliárd tranzisztorral rendelkező M2 Ultra processzoros Macintosh-t haza tudjuk vinni.

Az AI viszont, ahogy én is kutattam, nem ezen a pályán fejlődik, hanem ennél meredekebb a gyorsulás üteme. Összegyűjtöttem az ezzel kapcsolatos kutatásokat és eredményeket, amiből az rajzolódott ki, hogy a főbb hajtóerejei a mesterséges intelligencia fejlődésének oda mutatnak, hogy jelenleg nagyjából évi 26-szoros az a tempó, ahogy fejlődik.

Azaz évente tudunk olyat, hogy ugyanazt a szintet huszonhatod áron érhetjük el, vagy 26-szor pontosabbat tudunk létrehozni ugyanannyi pénzért. Ez kétéves távon 650-szeres fejlődés, ami eddig soha nem látott tempó az emberiség történelmében.

És ez alapján én azt számolgattam, hogy ha valaki a ChatGPT négyesnek az egy-másfél évvel, majdnem két évvel ezelőtti színvonalát most valaki a kutatási költség huszadáért, huszonötödéért, tehát pontosan olyasmi összegért tudja megvalósítani, mint amennyibe a DeepSeek került, az nagyjából ezen a trendvonalon van rajta. Azaz van-e egy brutális, felfoghatatlan, emberi aggyal beláthatatlan fejlődési tempó, és az, hogy a DeepSeek 6 millió dollárból megcsinálta azt a modellt, ami körülbelül az egy évvel ezelőtti ChatGPT-vel pariban van nagyjából, az pont ennek a brutális fejlődésnek a visszaigazolása.

– De ha innen nézzük, hogy az új kínai AI rajta van ezen a vonalon, akkor valójában nem volt akkora meglepetés, hiszen csak egy korábbi modellel jött ki, ami pontosan ennek megfelelően olcsóbb. Akkor viszont nem értem ezt a nagy tőzsdei pánikot.

– Az ad okot pánikra, az a nagy kérdés merült fel, hogy amit készítenek 5 milliárd dollárból, annak egy éven belül az értéke a huszada lesz. Ez a dilemmája annak a típusú kutatásnak, amit az OpenAI is végez, meg a Google, vagy az Anthropic is.

Ezeket a nagy nyelvi modelleket ennyire drágán fejleszteni fontos és jó cél, csak sosem fog anyagilag megtérülni. Amiért a befektetők ennyi pénzt fektettek ezekbe az alapkutatásokat végző cégekbe, az az a hit volt, hogy a hármójuk közül valamelyik ezt meg fogja nyerni, és monopóliumként ez majd sokszorosan megtérül. De amit a DeepSeek példája mutat, az pontosan az, hogy a tavalyi eredményt újra szinte fillérekért el lehet érni.

Azonban, ha évről évre drasztikusan csökken a belépési küszöb, hogy valaki ugyanezzel foglalkozzon, akkor nem lesz monopólium, és az nem tudja kirabolni az emberiséget, akkor nem tud az OpenAI-ba, vagy a Microsoftba, vagy a Google-be, vagy az Anthropicba fektetett sok milliárd dollár sokszorosan megtérülni. És ez okozta az ijedtséget, hogy ezek a típusú befektetések, amit az alapmodell fejlesztésére fordítanak, valószínűleg sohasem fognak megtérülni. Viszont voltak olyan cégek, amiknek nem esett a részvényárfolyama. Ezek azok voltak, amelyek nem ezzel a típusú alapkutatással foglalkoznak, hanem csak használják a mesterséges intelligenciát.

Egy olyan cég, ami a mesterséges intelligenciát használva szolgáltatást fejleszt egy iparág számára, annak ez a legjobb dolog, ami történhet, hogy hirtelen a költségei, amiből az adott piaci szolgáltatását nyújtani tudja, leesett a huszadára, vagy századára, és le fog majd újra esni, és újra.

És ez azt jelenti, hogy valószínűleg a mesterséges intelligencia körül a nagy megtérülés nem az alapmodellek fejlesztésében lesz, hanem a mesterséges intelligencia modellek ipari, vagy kereskedelmi hasznosításában, azaz a megoldások készítésében.

– Én szőrösszívű kapitalistaként valóban kivonnám a pénzemet az alapkutatásból, viszont ennek az lenne a következménye, hogy lelassul vagy leáll maga a fejlesztés, nem lesznek újabb modellek.

– Igen, és nem. Biztos, hogy emiatt lesz tőkekivonás ezekből a nagyon nagy alapkutató cégekből. A másik oldalról viszont van egy Hugging Face nevű gyűjtőoldal, ahol mesterséges intelligencia modelleket lehet publikálni ingyen. Az a különlegessége ennek az oldalnak, hogy ma már több mint egymillió különböző mesterséges intelligencia modell érhető el ott ingyen, publikusan a közösségbe bedobva, és több mint 3 millió fejlesztő van ebben a közösségben, akik mesterséges intelligencia fejlesztéssel foglalkoznak valamilyen szinten. Tehát nem fog ettől leállni a folyamatos fejlődés, mert már nem néhány szakember, szűk kis csoportokban, elszigetelten viszi előre ezt a tudományágat, hanem nagyon széles fejlesztőbázisa lett, rengeteg ebbe beletanuló szakértővel, akik együtt hozzák az innovációkat és áttöréseket.

Valószínűleg, ha a három nagy játékos visszavesz a fejlesztési tempóból, és kevesebb pénzből gazdálkodva fejleszt újabb és újabb modelleket, akkor is brutális tempóban fog fejlődni ez a terület, de egy sokkal kiegyensúlyozottabb irányban.

Például az Nvidia részvényei azért estek, mert rájöttek a befektetők is, hogy ha nem fog tízmilliárdokat költeni a Google évente AI-hardverek beszerzésére, akkor az a pénz nem fog beáramlani az Nvidiához, így hosszú távon nem tudja azt a profitabilitást, bevételszintet az Nvidia biztosítani. Mert a másik nagy csavar a sztoriban az, hogy a kínaiak azért tudták 6 millió dollárból megoldani a saját fejlesztésüket, mert az amerikaiak blokkolták, hogy a legkorszerűbb chiptechnológiához hozzáférhessenek Kínában, ezért kénytelenek voltak a számukra elérhető, kevésbé fejlett technológiát használva dolgozni.

– Hogy állunk az AI karbonlábnyomával? Bizonyos hírek szerint a legnagyobb környezetterhelést jelenleg ez az iparág okozza.

– Ez nem igaz. A ChatGPT elkér tőlünk 4-5 dollárt 1 millió szótagnyi gondolkodásért. Azért egymillió szótagnyi gondolkodás az sok, tehát azt be lehet látni, hogy annyit olvasni vagy írni, vagy végiggondolni, az nagyon sok gondolkodás, és az pár dollárba kerül. Ez a bizonyos 26-szoros fejlődési tempó, ebben az is benne van, hogy ugyanazt a szintű gépi gondolkodást, amit egy évvel ezelőtt egy dollárnyi energiából tudtunk megcsinálni, azt mostanra kb. a tizedéből. Tehát van egy drasztikus csökkenése az egy egységnyi gondolkodásra eső energiaköltségnek. Az tény, hogy nagyon sok cég rengeteg üzleti alkalmazásban és nagyon sok gondolkodást használ, és ezek nagyon központosítottan, néhány adatközpontban jelentkeznek, és nem mindenkinek otthon a saját számítógépén.

Azaz az energiafelvétel is pontszerűen, központosítottan történik jelenleg. De ez elosztva több százmillió végfelhasználóra, ha mindenki emiatt fél wattal többet fogyasztana a saját háztartásában, mert helyben futtatná ezeket a programokat, észre sem vennénk a teljes energiafelhasználásban ennyi többletet.

Számokra fordítva: az OpenAI néhány százmillió dollárt költ áramra évente, így alig egy ezrelékét használja az Egyesült Államok összes energiafelhasználásának, valószínűleg a teljes AI iparág is kevesebb, mint egy százalékát összesen, miközben a bitcoin globális működése a teljes amerikai fogyasztáshoz képest 2,5-4 százalékot. Az AI rengeteg közvetlen hasznot hajt, többszázmillió embernek segítve naponta, míg a másikkal csak spekulálni lehet. Abba is gondoljunk bele, hogy ha egy emberrel gondolkodtatnánk egymillió szótagnyit, akkor több hétig kellene őt etetni, itatni, energiával ellátni, kiszolgálni az igényeit, feldolgozott élelmiszert az asztalára tenni. Könnyen belátható, hogy csak ez nagyságrendekkel több, mint pár dollár. Ilyen szempontból az egységnyi elvégzett munkára vetített lábnyom messze tört része minden másnak, ráadásul több gondolkodást tud az emberiség végezni, mint korábban. Ráadásul a modellek robbanásszerű fejlődésével, ami akkor is észvesztően gyors marad, ha vissza is vesznek kissé a tempóból, hamarosan eljutunk oda, hogy

minden eszközünkbe, számítógépünkbe, mobiltelefonunkba, hűtőnkbe előbb-utóbb beépül majd az a képesség, hogy helyben tudjon mesterséges intelligenciát futtatni, és így ez az áramfelhasználás sem feltétlenül fog hosszú ideig a nagy adatközpontokban maradni, hanem ennek egyre nagyobb része ki fog kerülni a kliensekhez.

Ilyen körei voltak már a technológiának, amikor hirtelen mindent szerverekre raktunk, aztán meg kiderült, hogy sokkal praktikusabb egyes programokat helyben futtatni, mert már helyben is tudjuk, hiszen olyan okosak a készülékeink. Tehát nem gondolom, hogy ennek a technológiának hosszú távon brutális kell, hogy legyen az energialábnyoma, pontosan a fejlődési tempója teszi lehetővé azt, hogy ez ne így legyen.


Link másolása
KÖVESS MINKET:

Népszerű
Ajánljuk
Címlapról ajánljuk


JÖVŐ
A Rovatból
A mesterséges intelligencia képes lehet akár tíz évre előre megjósolni, hogy kinek milyen betegsége lesz
A modell névtelen kórlapok mintáit figyeli, és évekre előre megmutatja, hol nagyobb a kockázat. A fejlesztők szerint így hamarabb lehet beavatkozni, és még az is tervezhető, hány szívinfarktusra kell készülnie egy városnak 2030-ban.


A kutatók szerint a mesterséges intelligencia akár tíz évre előre jelezhet egészségi gondokat, írja a BBC. A rendszer az emberek egészségügyi adataiban keres mintákat, és több mint 1000 betegség kockázatát számolja. Úgy írják le, mint egy időjárás-előrejelzést: százalékban adja meg a valószínűséget. A cél, hogy időben kiszűrje a magas kockázatú embereket, és évekre előre segítse a kórházak tervezését.

A Delphi-2M nevű modell hasonló technológiára épül, mint a közismert MI-chatbotok, például a ChatGPT. A chatbotok nyelvi mintákat tanulnak, és megjósolják, milyen szavak követik egymást. A Delphi-2M névtelenített egészségügyi adatokból tanulta meg felismerni a mintázatokat, és így jelzi előre, mi következhet és mikor. Nem mond pontos dátumot, hanem 1231 betegség valószínűségét becsli.

„Ahogy az időjárásnál 70 százalék esélyt jelezhetünk az esőre, ugyanezt meg tudjuk tenni az egészségügyben is”

– mondta Ewan Birney professzor, az Európai Molekuláris Biológiai Laboratórium megbízott főigazgatója. „Ráadásul nemcsak egy betegségre, hanem egyszerre az összesre – ilyet még soha nem tudtunk. Izgatott vagyok” – tette hozzá.

A fejlesztők először brit, névtelenített adatokon tanították a modellt: kórházi felvételek, háziorvosi adatok és életmódbeli szokások (például dohányzás) több mint 400 ezer résztvevőtől a UK Biobank projektből. Ezután más Biobank-résztvevők adataival ellenőrizték az előrejelzéseket, majd 1,9 millió ember dániai egészségügyi adatán is letesztelték. „Ha a modellünk azt mondja, hogy a következő évben tízből egy az esély, akkor tényleg nagyjából tízből egy esetben következik be” - tette hozzá Birney professzor.

A rendszer azoknál a betegségeknél működik a legjobban, amelyeknek jól követhető a lefolyása, például a 2-es típusú cukorbetegség, a szívinfarktus vagy a szepszis. Az inkább esetleges fertőzéseknél gyengébben teljesít.

Az orvosok ma is írnak fel koleszterincsökkentőt annak alapján, mekkora valakinél a szívinfarktus vagy a stroke kockázata. Az MI-eszköz még nem áll készen a klinikai használatra, de hasonló módon tervezik alkalmazni: korán azonosítani a magas kockázatú embereket, amikor még van esély megelőzni a betegséget. Ez jelenthet gyógyszert vagy célzott életmódtanácsot – például akinek nagyobb az esélye bizonyos májbetegségekre, annak a szokásosnál jobban megérheti visszavenni az alkoholfogyasztásból.

Az MI a szűrőprogramok tervezésében is segíthet, és egy térség összes egészségügyi adatát elemezve előre jelezheti a várható igényeket,

például hogy 2030-ban nagyjából hány szívinfarktus várható egy adott városban.

„Ez egy újfajta megközelítés kezdete az emberi egészség és a betegséglefolyás megértésében” – mondta Moritz Gerstung professzor, a Német Rákkutató Központ (DKFZ) onkológiai MI-osztályának vezetője. „Az olyan generatív modellek, mint a miénk, egy napon személyre szabhatják az ellátást, és nagy léptékben előre jelezhetik az egészségügyi szükségleteket.”

A Nature tudományos folyóiratban ismertetett modellt még finomítani és tesztelni kell a klinikai használat előtt. Torzítást okozhat, hogy a UK Biobank adatai főként 40–70 éves emberektől származnak. A fejlesztők most bővítik a modellt képalkotó vizsgálatokkal, genetikai információkkal és vérvizsgálati eredményekkel.

„Fontos hangsúlyozni, hogy ez kutatás – mindent alaposan tesztelni, szabályozni és átgondolni kell, mielőtt használni kezdjük, de a technológia adott ahhoz, hogy ilyen előrejelzéseket készítsünk” – nyomatékosította Birney professzor. Úgy véli, a genomika egészségügyi bevezetéséhez hasonló utat járhat be a folyamat: a tudósok bizalmától a rutinszerű klinikai használatig akár egy évtized is eltelhet.

A kutatás az Európai Molekuláris Biológiai Laboratórium, a Német Rákkutató Központ (DKFZ) és a Koppenhágai Egyetem együttműködésében készült. Gustavo Sudre, a King’s College London kutatója így értékelt: „Ez a munka jelentős lépés a skálázható, értelmezhető és – ami a legfontosabb – etikailag felelős orvosi prediktív modellezés felé.”


Link másolása
KÖVESS MINKET:

Ajánljuk
JÖVŐ
A Rovatból
Megkezdték a humanoid robotok tömeggyártását Kínában
A cég több ezer előrendelést említ, az ár körülbelül 11,5 millió forint. A mozgásnál emberi mintákat követnek: a végtagok összehangolását szimulációk és utánzásos tanulás segíti.
Maier Vilmos - szmo.hu
2025. szeptember 27.



A kínai Kepler Robotics elindította a K2 Bumblebee humanoid robot tömeggyártását, írja a Rakéta. A modellt logisztikai munkákra, gyártási feladatokban segítésre, kiállításokra és „speciális műveletekre” szánják.

A K2 hibrid architektúrával működik, ami energiahatékony üzemet tesz lehetővé. A gyártó szerint a humanoid egyhuzamban akár 8 órát is dolgozik.

Az ár a hasonló, általános célú humanoidokhoz képest kicsivel magasabb:

körülbelül 11,5 millió forint.

A robotra már több ezer megrendelés érkezett.

A cég a külalakot kevésbé, a mozgást viszont nagyon „emberire” tervezte. A K2 Bumblebee imitációs tanulással és szimulációkkal sajátította el a járás emberihez hasonló jellegzetességeit, beleértve a végtagok mozgásának összehangolását.

A humanoid robotról készült videót itt lehet megnézni:


Link másolása
KÖVESS MINKET:


JÖVŐ
A Rovatból
Sora 2: megjöttek a videók, amiket a képtelenség megkülönböztetni a valóságtól
Náci egyenruhába bújtattak hírességek, meghamisított történelmi események, kamu filmjelenetek igazinak tűnő színészekkel – máris ilyen videók készültek az OpenAI legújabb videógeneráló modelljével, ami egyszerre lenyűgöző és félelmetes.


A Sora 2 videógeneráló modell szeptember végén jelent meg, azzal az ígérettel, hogy a korábbi változathoz képest jelentősen javult a fizikai pontosság, a realizmus és az irányíthatóság. Mivel az OpenAI már a Sora tavaly decemberben kiadott első változatát is – a ChatGPT sikerével párhuzamba állítva – a videókészítés „GPT‑1 pillanatának” nevezte, nagy várakozások előzték meg a „GPT‑3.5 pillanatként” beharangozott Sora 2-t.

Az első verzió fejlesztői változatáról a demók alapján azt írtuk, olyan minőségű filmekhez, amelyeket szöveges utasításra generál, normál esetben külső helyszínekre, díszletekre, profi felszerelésekre és szakemberekre, statisztákra, illetve színészekre lenne szükség, de „úgy fest, hogy mostantól egyetlen AI, a Sora is elég lesz hozzá”.

Nyújthat ennél is többet egy videógeneráló modell? A Sora 2–nek a jelek szerint sikerült, mert a világ egyik ámulatból a másikba esik a vele készült mozgóképek láttán. Az OpenAI azt állítja, hogy az új modell kiküszöböli a korábbi videógenerálók jellemző hibáit, például az amorf tárgyakat és karaktereket, a torzult valóságot vagy a „túlzott optimizmust”. Utóbbihoz példát is kapcsol: ha egy generált videóban szereplő kosárlabdázó „elvéti” a dobást, az eddigi verziók inkább kicsavarták a realitást, és a labda még lehetetlen szögből is a gyűrűbe „teleportált”. Ehhez képest a Sora 2 a fizika törvényeivel teljesen megegyező módon bánik a tárgyak mozgásával: a labda a palánkba csapódik és pont úgy pattan vissza, ahogy az a valóságban is történne.

A tökéletlenség lehalkításával és a képminőség feltekerésével az OpenAI kisebb csodát alkotott: még egyszerű szöveges utasításokból is olyan videókat hoz létre, amelyeket a legtöbb néző képtelen megkülönböztetni a valóságtól. Az pedig, hogy mekkora a szakadék a versenytársak videógeneráló modelljei, valamint a Sora 2 között, remekül illusztrálja ez az összehasonlítás, amelyben a Google fejlesztette Veo 3–mal vetik össze a képességeit.

Ebben a videóban semmi sem valódi:

A gyorsan bővülő AI‑videópiacon persze vannak más vetélytársak is, például a Meta „Vibes” alkalmazása és a Meta Movie Gen modell, valamint az Elon Musk-féle xAI Grok Imagine-je. A Forbes hangsúlyozza, hogy utóbbi rendszerek 6–10 másodperces felvételeket készítenek, míg a Sora 2 akár egyperces videókat generálhat, illetve hangot is ad a tartalmakhoz, ami komoly fegyvertény a jelenlegi mezőnyben. És eddig minden jel arra mutat, hogy a Sora 2 a legerősebb videógeneráló AI.

Az OpenAI a modell széles körű – de egyelőre Észak-Amerikára korlátozott – bevezetése óta arra biztatja a felhasználókat, hogy a Sora 2 segítségével találjanak ki minél több új világot és történetet. A lehetőségeknek – látszólag – csak a képzelet szab határt, hiszen a modell képes az emberi hanghoz igazított dialógusok és hangeffektek generálására is, sőt, ha kell, a felhasználó hang‑ és videómintája alapján avatárt készít, így a saját filmünk főszereplőjévé válhatunk.

Mi változott? – A Sora 2 új képességei

Bár hozzáférés hiányában nekünk, magyaroknak egyelőre nincs összehasonlítási alapunk, az új modellről megjelent videókon valóban az látszik, hogy komoly szintlépés történt. Amíg a Sora demóiban a generált karakterek szemeit jótékonyan elrejtette valami (többnyire egy napszemüveg), a Sora 2 már nem tart az „uncanny valley” jelenségtől. Ez ugye az a nyugtalanító érzés, ami egy videojátékhoz vagy filmhez digitális eszközökkel létrehozott arc láttán tör ránk: hiába realisztikus a karakter, a tekintete természetellenes marad.

Az új modell már nem ilyen „félénk”: tisztában van vele, hogy amit előállít, teljesen életszerű, ezért nincs szükség trükközésre.

Olyannyira nincs, hogy az alábbi videóban látható és hallható Sam Altman sem Sam Altman, hanem egy Sora 2-vel létrehozott avatár, ami az OpenAI vezérigazgatójaként mutatja be a generatív AI képességeit. És ha erre nem figyelmeztetnek előre, aligha mondanánk meg, hogy nem a valódi személyt látjuk.

Az OpenAI szerint a Sora 2 legnagyobb újítása a fizikai törvények pontosabb szimulációja és a látvány élethű megjelenítése. A modell hosszabb és összetettebb cselekményeket, illetve akár többszereplős akciókat is képes kezelni, miközben megőrzi a mozgás törvényeinek koherenciáját.

A vállalat kiemelte, hogy a videók több jelenetből álló utasításokat követhetnek, és a rendszer megőrzi a generált világ állapotát: figyelembe veszi például azt, hogy a tárgyak az előző képsorban pontosan hol voltak. Ezzel már lehetséges akár több perces klipek és kisfilmek, ezáltal komplexebb narratívák létrehozása, de az OpenAI most még a rövid, gyorsan terjedő tartalmak felé tereli a felhasználókat, mert a játékos menőség meghozza a befektetők kedvét a további tervek finanszírozásához.

Lőttek a filmeseknek, vagy a Sora 2 csak egy új „ecset”, amivel alkothatnak?

Az OpenAI azzal hirdette a Sora, majd a Sora 2 rendszert, hogy a filmipar, az animációs stúdiók és a művészek eszköze lehet. A BBC Science Focus egyetért ezzel: azt írják, a rendszer megkönnyítheti animált klipek készítését, és ezzel időt, pénzt spórol. Az első verzió tartalmai ugyanakkor hemzsegtek a hibáktól. Ahogy arra a Washington Post is felhívta a figyelmet: a rendszer egy 1930‑as évekbeli jelenetben a cigaretta rossz végét gyújtotta meg vagy épp egyszerre több telefonkagylót adott a generált karakter kezébe, ráadásul hangot sem tudott létrehozni.

Ehhez képest a Sora 2 pontosságot és már szinkronizált hangot, illetve hangeffekteket is kínál, amivel elvileg tökéletesen alkalmassá válik a komplex szórakoztatóipari felhasználásra.

Az IndieWire elemzője ennek ellenére sem gondolja, hogy az új verzió a filmiparnak készült. A fejlesztők szerinte „nem törődnek Hollywooddal”, hiszen a platform elsősorban virális tartalmak gyártására ösztönzi az embereket, így a közösségi média új mémgyártó eszközévé válhat. És addig, ameddig ez csak igazoltatás elől meglépő Super Mario-s viccek szintjén realizálódik, nincs is nagy baj.

Ez még senkit sem bánt:

A gondok akkor kezdődnek, ha a könnyed hecceken túllépve valódi emberekről vagy valós eseményeket szimuláló helyzetekről készülnek valóságszagú kamuvideók, ami megnehezíti a független filmesek etikus AI‑felhasználását. Onnantól a Nintendo sem mókás rajongói videóként fogja kezelni a fentihez hasonló alkotásokat – ami még ingyen reklámot is csap a Mario Kart játékoknak –, mert attól tart majd, hogy a trend visszaéléseket szül, és óriási energiákat kell fordítani a szellemi tulajdona megvédésére.

A véleménycikk arra is figyelmeztet, hogy a Sora‑videók virális mémjei új frontot nyitnak a szerzői jogi háborúban, hiszen az AI‑userek óhatatlanul egyre kevesebbet törődnek majd a szellemi tulajdonnal, ezáltal tovább mélyítik az árkot az alkotók és az AI‑fejlesztők között. Az Indiewire ezzel kapcsolatban szakmai állásfoglalásokat sürget: úgy véli, ha a jogtulajdonosok és szakszervezetek nem alakítanak ki standardokat, elveszíthetik a harcot.

Osztja ezt az aggodalmat a WGBH-nak nyilatkozó digitális képzőművész, Kyt Janae is, aki szerint nem kell egy év, és szinte képtelenek leszünk megkülönböztetni az ember alkotta tartalmakat az AI-val generált képektől. Thomas Smith, a képek digitalizálásával, menedzselésével, kiadásával és monetizálásával foglalkozó Gado Images vezérigazgatója hozzátette:

a mesterségesen létrehozott képek miatt a valódi fotók is hitelességi válságba kerülhetnek.

Ezek a megállapítások azt jelzik, hogy a videógeneráló AI több területen okozhat károkat, a szórakoztatóipartól a politikán át a személyiségi jogokig.

Máris támadják az új AI-modellt

A Sora 2 indítását rögtön kritikák és aggályok kísérték. A The Guardian például arról számolt be, hogy a generált videók posztolására létrehozott TikTok-szerű app feedje hamar megtelt erőszakos és rasszista jelenetekkel, köztük bombázást és tömeggyilkosságot szimuláló tartalmakkal. Joan Donovan kutató ezzel kapcsolatban arra figyelmeztetett, hogy az ilyen eszközök elmossák a valóság és a hazugság között húzódó határt, ezáltal alkalmassá válhatnak gyűlöletkeltésre és zaklatásra.

Sam Altman ehhez képest a saját blogján a „kreativitás ChatGPT‑pillanataként” jellemezte a Sora 2 indulását, de óvatosan elismerte azt is, hogy például a bullying elkerülése érdekében nagyobb figyelmet kell fordítani a moderálásra.

A Rolling Stone közben példákkal illusztrálva mutatta be, hogy a realisztikus videógeneráló segítségével a felhasználók – csupán heccből – náci egyenruhába bújtattak hírességeket, történelmi eseményeket hamisítottak vagy éppen levédett karaktereket (Pikachu, Ronald McDonald, SpongeBob) használtak fel, ami szerzői jogi veszélyeket sejtet.

A Sora 2 kritikusait idézve a magazin azt írja, hogy az OpenAI „próbálja bepereltetni önmagát”.

A Vox cikke egyenesebben fogalmaz: felhívja a figyelmet arra, hogy a Sora 2 alapértelmezése szerint a jogtulajdonosok azok, akiknek kérvényezniük kellene a karaktereik eltávolítását, ami olyan, mintha a fejlesztők kifejezetten a szerzői jogok megsértése felé terelnék a felhasználókat.

Nem véletlen, hogy a kritikákkal szembesülő Sam Altman később frissítette a posztját, jelezve, hogy a jövőben a jogtulajdonosok „opt‑in” alapon adhatnak hozzá karaktereket az AI-modellhez, lehetővé téve, hogy a generált videók után részesedést kapjanak a bevételekből.

Őrületes energiaigény és a Sora 2 más pénzügyi hatásai

A modell bejelentését követően az elemzők felvetették, hogy a videók generálása rendkívüli mennyiségű számítási kapacitást és energiát igényel. Egyes kutatók szerint egy rövid, nagy felbontású videó generálása több mint 700‑szor több energiát fogyaszt, mint egy állókép létrehozása. Ennek következtében a jövő adatközpontjai már minden kétséget kizáróan nagyvárosokkal vetekedő energiazabáló – és karbonkibocsátó – szörnyetegek lesznek.

A Time elemzése rámutat: az AI‑videók ugyan drágák, de a cégek – köztük az OpenAI és a Meta – abban reménykednek, hogy a rövid videók gyártásával több előfizetéses felhasználó és befektető érkezik. Ez további bevételi forráshoz juttatja őket, ami még nagyobb modellek, egy napon pedig az általános mesterséges intelligencia megjelenéséhez vezethet.

Az AI-cégeknek tényleg nagyon kell a pénz, mert a generatív videómodellek fejlesztése hatalmas összegeket emészt fel. Ez az elemzők szerint idővel arra készteti majd a vállalatokat, hogy a befektetőktől és felhasználóktól beszedett pénzen túl a hirdetési piacon is terjeszkedjenek, illetve további előfizetési csomagokat találjanak ki, valamint árat emeljenek.

Mindeközben fontos cél a felhasználók viselkedési adatainak gyűjtése: a jövőbeli modellekhez a valós interakciók és preferenciák révén tudnak több és jobb tréningadatot gyűjteni.

Ami pedig a belátható jövőben érkező fejlesztéseket illeti, az OpenAI egyik korábbi közleménye felvetette azt is, hogy létrehoznak egy „világszimulátort”, amely pontosan modellezi a fizikai világ törvényeit, ezzel új tudományos problémákat lesz képes megoldani.

Új AI-evolúciós lépcsőfokok jönnek

A Sora 2 ezeknek a vízióknak a nagy reménysége, amitől azt várják, hogy további fejlesztéseket és több platformon elérhető verziókat eredményez. A megjelenése új korszakot nyit a generatív AI-k világában, hiszen bátran kijelenthetjük, hogy ennyire valószerű mozgásokat és hangeffekteket, illetve ilyen időtartamú történeteket még egyik videógeneráló AI sem tudott létrehozni.

Bár a fizika törvényeit még nem követi le tökéletesen és vastagon lehetőséget ad a visszaélésekre – a deepfake-től az erőszakos tartalmakon át a szerzői jogok megsértéséig –, a komoly etikai és jogi kérdések kezelése után érdemes lehet kihasználni a benne rejlő lehetőségeket.

A szakértők szerint hamar mainstream eszközzé válhat, de a társadalomnak – még új normarendszerek és hatékony moderálás bevezetése mellett is – fel kell készülnie arra, hogy a valóság és a mesterséges tartalom közötti határ elmosódik.

Mivel a gazdasági potenciál óriási, számolni kell a bővülésével és az energiafogyasztás növekedésével, valamint azzal, hogy a szellemi tulajdon megóvása érdekében ki kell harcolni a generált tartalmak után járó részesedést. Ezek az együttműködések – ha egyáltalán megköttetnek és aztán hosszú távon működőképesnek bizonyulnak – a kreatív tartalomgyártás ragyogó gyöngyszemévé varázsolhatják a Sora 2-t, illetve a jövőben érkező hasonló modelleket.


Link másolása
KÖVESS MINKET:

Ajánljuk

JÖVŐ
A Rovatból
Mesterséges intelligenciával hoztak létre egy színésznőt - a hollywoodi színészek kiakadtak
Tilly Norwood már ügynökségeknél is próbálkozik, hogy szerepet kapjon, de több ismert színész és a szakszervezet is tiltakozik ellene.


Eline Van der Velden holland színész és komikus egy mesterséges intelligenciával működő, Tilly Norwood nevű szintetikus színészt hozott létre. Az alkotó szerint ez „a képzelőerő megnyilvánulása”, és hasonló „egy karakter megrajzolásához, egy szerep megírásához vagy egy előadás megalkotásához”.

Tilly Norwoodnak már saját Instagram-oldala is van. Készítői bőrhibákat is megjelenítettek rajta, valamint olyan mondatokat írtak a nevében, mint például azt, hogy „nagyon izgatott” a jövő miatt.

A fejlesztők már több ügynökségnél is bejelentkeztek, hogy hollywoodi filmes szereplési lehetőséget szerezzenek neki.

A hollywoodi színészszakszervezet és több ismert színész is tiltakozik az AI-színész ellen. A szervezet közleményében úgy fogalmazott:

Norwood „nem színész, hanem egy számítógépes program által generált karakter, amit profi színészek munkájával tanítottak be.

Nincsenek élményei, amikből meríthetne, nincsenek érzelmei, és az eddig látottak alapján a közönséget sem érdekli a számítógéppel generált, emberi valóságtól elszakadt tartalmak”.

Emily Blunt a mesterséges színészt „ijesztőnek” nevezte. Natasha Lyonne szerint pedig bojkottálni kell mindenkit, aki együtt dolgozna vele. A BBC szerint Lyonne épp egy olyan filmen dolgozik, amelyben valódi színészek szerepelnek, és amelyben „etikus mesterséges intelligenciát” alkalmaznak.

Whoopi Goldberg úgy véli, hogy a közönség képes megkülönböztetni a valódi embereket a mesterséges intelligencia által generált alakoktól, mivel „másképp mozognak”.

Van der Velden egy közelmúltbeli előadáson azt mondta, szerinte a hollywoodi stúdiók és ügynökségek titokban támogatják a mesterséges intelligencia használatát, és a következő hónapokban nagy bejelentésekre lehet számítani ezzel kapcsolatban.

(via 444)


Link másolása
KÖVESS MINKET: