JÖVŐ
A Rovatból

Jobb Himnuszt ír-e a mesterséges intelligencia, mint Kölcsey Ferenc?

Interjú egy mesterséges intelligenciával arról, mire számíthatunk a mesterséges intelligenciától a jövőben.
Malinovszki András; fotó: Gerd Altmann / Pixabay (illusztráció) - szmo.hu
2023. január 22.



Újságíróként – bevallom – mi is gyakran használjuk azt a kifejezést, hogy valami felrobbantotta vagy letarolta az internetet. Érzékletes kép ez, de csak akkor jövünk rá, mennyire elcsépelt lehet a kifejezés, amikor olyasmi jön szembe, mint például az Open AI mesterségesintelligencia-kutató ChatGPT nevű chatbotja, amit mára gyakorlatilag szó szerint minden aktív netfelhasználó ismer.

Ki csodálja, ki megijed tőle, kit a lehetőségei határai érdeklik – nem véletlenül. Elsőre tényleg zavarba ejtő, hogy mi mindent tud, mennyire "emberszerűen" kommunikál, és óhatatlanul eszünkbe juttatja azt a számtalan regényt és filmet, amiben az (elsőre legalábbis) aranyosan és kedvesen kommunikáló robotok átveszik az irányítást életünk, rosszabb(?) esetben a világ felett.

Pontosan mi is a Chat GPT?

Nem az első leszek, aki nem lexikondefiníciót hív segítségül, hanem sokkal kézenfekvőbb megoldást.

„A ChatGPT egy társalgási nyelvi modell, amelyet az OpenAI fejlesztett ki. A GPT (Generative Pre-train Transformer) architektúrán alapul, amely mély tanulási technikákat használ az emberszerű szöveg létrehozásához”

– állítja saját magáról a napról napra egyre népszerűbb, ma már tulajdonképpen az internet leglátogatottabbjának számító chatbot.

Itt azonban vérszemet kapok, és arra gondolok, ha egyes ismert emberek, elemzők, sztárok véleményére vagyok kíváncsi, akkor sem kizárólag kutatok, leírásokat olvasok róluk, hanem a legegyszerűbb megoldást alkalmazom: megkérdezem az illetőt magát. Lássuk tehát mit mond a ChatGPT.

– Mire használható a Chat GPT?

ChatGPT: „A ChatGPT használható kérdések megválaszolására, kérdésekre adott válaszok generálására, valamint eredeti szöveg összeállítására számos nyelven, köztük angolul és magyarul is. Nagy mennyiségű szövegre van kiképezve, így széles körű ismeretekkel rendelkezik, és sokféle bemenetet képes megérteni és reagálni rájuk.”

– Mennyi idő volt kifejleszteni a Chat GPT-t? – teszem fel a kérdést, de itt "interjúalanyom" valamiért átvált angol nyelvű társalgásra. Válasza lefordítva így hangzik:

CHatGPT: „A ChatGPT modell kifejlesztéséhez szükséges pontos időt nem lehet meghatározni. A ChatGPT alapját képező GPT (Generative Pre-trained Transformer – Generatív Előképzett Átalakító) architektúrát azonban először az OpenAI vezette be 2018-ban. Azóta a modellt többször is javították és frissítették, nehéz lenne meghatározni, hogy mennyi idő alatt történt a ChatGPT végleges kifejlesztése. Általában egy nyelvi modell, például a GPT-3 fejlesztése hatalmas számítási erőforrást és időt igényel, beleértve az adatgyűjtést, az előfeldolgozást és a képzést.”

Ezt a szöveget újdonsült interjúalanyom néhány másodperc alatt közölte velem, és kérésemre ennyi idő alatt lefordította magyar nyelvre is. Nem fogok hazudni: elmosolyodtam, és elégedetten konstatáltam, hogy életem legkönnyebb cikkével lesz dolgom! Felteszek egy kérdést, a választ másodperceken belül megkapom, bemásolom, és elégedetten vigyorgok, mint egyszeri középiskolás, aki rájött, hogy ezentúl minden házidolgozatát három perc alatt fogja elkészíteni, tokkal-vonóval.

Apropó, ilyesmire alkalmas lehet a ChatGTP? Ez már csak azért is eszembe jut, mert néhány hete a Szeretlek Magyarország is beszámolt róla, hogy Ausztráliában több helyen újra tollal írva kérik az egyetemi esszék megírását, mert több diák lebukott a mesterséges intelligencia használatával. Egy szakértő pedig egyenesen úgy fogalmazott:

az egyetemek olyan versenyben vannak a szoftverrel, amit soha nem nyerhetnek meg.

– Alkalmas tehát a ChatGPT arra, hogy házidolgozatot, esszét írjon?

ChatGPT: „A ChatGPT egy hasznos nyelvi modell, amely emberszerű szöveget tud generálni, így minden bizonnyal használható esszék, összefoglalók és egyéb írásos munkák készítéséhez. Fontos azonban szem előtt tartani, hogy a modell a betanított adatokból tanult minták alapján hoz létre szöveget. Ez azt jelenti, hogy lehetnek benne hibák, tévhitek, vagy ugyanazok a minták ismétlődnek újra és újra. Ezenkívül a ChatGPT nem képes eredeti kutatásra vagy a kontextus és jelentés megértésére, és nem tartalmazhat személyes ismereteket vagy véleményeket, amelyek bármely tudományos munka fontos elemei” – „nyugtat meg” maga a chatbot.

Na jó, mondani persze én is tudok bármit, de lássuk, hogy meg tudja-e ezt tenni a ChatGPT valóban a gyakorlatban is? Megkértem, hogy írjon egyelőre egy 500 szavas esszét az orosz-ukrán háború jelenlegi állásáról. Igaz, itt már várnom kellett azért hosszú másodperceket, de megtette. Fontos kiemelni, hogy a technológia nem másolta sehonnan a szöveget, hanem a rendelkezésre álló rengeteg információból összeállította saját "gondolatait". Bár ezúttal már kiütközött egy korlátja is: túlságosan engedelmes. Ha egy diáktól kérném ugyanezt, talán igyekezne kínosan ügyelni arra, hogy betartsa a terjedelmi korlátot (de legalábbis elérje azt), a ChatGPT viszont arra is figyel, hogy pontosan betartsa, amit kérek. Az így kapott eredménnyel nem untatnám az olvasókat, de valóban kaptam egy korrekt elemzést, amiben számomra új információ ugyan nem volt, de remekül összefoglalta a 2014 óta tartó, 2022-ben új sebességre kapcsolt eseményeket. Egyetlen hátránya, hogy lezárása meglehetősen összecsapott lett, mivel gondosan ügyelt arra, hogy az 500 szó valóban 500 szó legyen, mindegynek tartva, hogy tartalmilag hol tart a szöveg. Így kaptam egy olyan, kissé suta zárómondatot, hogy: „A háború rossz hatással volt Ukrajnára”. Egykori magyartanárként erre az egészre maximum egy négyest tudnék adni. De meg kell mondjam, nagyobbik részét magam sem írhattam volna sokkal jobbra. És aki tanárként olvassa a cikket, és azt gondolja, hogy könnyen le lehet buktatni a ChatGPT-vel írott műveket, annak rossz hírem van: ahány módon kérjük ugyanarra, annyi féle szöveget fog generálni – még ha az alap lehet, hogy hasonló is lesz. Ráadásul más-más eredmény születik, ha más-más nyelven kérjük ugyanarra a dologra, a fordítással variálva pedig még tovább trükközhetünk a szöveggel. Így még mindig csak 2-3 percet töltöttünk esszénkkel, ami lényegesen rövidebb, mint gondolkodással, kutatással együtt megírni minimum 2-3 óra alatt. (Mindazonáltal, csak hogy világos legyen, számos okból nem javaslom ezt senkinek!)

És itt megingott a fentebb említett optimizmusom. Persze, elsőre van valami kecsegtető abban, hogy a ChatGPT-vel pillanatok alatt szöveget írhatok (pl. ennek a cikknek egy részét is), de:

– Nem jelenti ez azt hogy egy idő után feleslegessé válik az újságíró vagy a szerkesztő munkája?

ChatGPT: „A mesterséges intelligenciát (AI) már használják az újságírás egyes területein, például az adatelemzésben, a tények ellenőrzésében és a tartalomgenerálásban. Fontos azonban megjegyezni, hogy a mesterséges intelligencia még nem elég fejlett ahhoz, hogy teljesen leváltsa az emberi újságírókat.

Az újságírás emberi érintést igényel, beleértve a kreativitást, a kritikai gondolkodást, a kontextus és az árnyalatok megértését, az etikát, valamint azt a képességet, hogy lebilincselő és lenyűgöző módon számoljon be történetekről. A mesterséges intelligencia segíthet e feladatok némelyikében, de még mindig nem képes teljesen megérteni és értelmezni a világot, mint az emberek.

Sőt, ott van a pontosság és a pártatlanság kérdése is, az AI által generált hírek elfogultak lehetnek, és újra és újra megismételhetik ugyanazokat a mintákat, mert csak egy forgatókönyvet követnek.

Ennek ellenére valószínű, hogy a mesterséges intelligencia felhasználása az újságírásban a jövőben tovább fog növekedni, de inkább bővíti, nem pedig helyettesíti az emberi újságírók munkáját. És azt is fontos átgondolni, hogyan lehet a munkaerőt a közelgő változásokhoz igazítani, megfelelő képzéssel és oktatással az újságírók megtanulhatják, hogyan dolgozhatnak együtt a mesterséges intelligenciával, és a legtöbbet hozhatják ki abból az előnyből, amelyet ez a szakma számára jelent.”

A mesterséges intelligencia még nem elég fejlett ahhoz, hogy teljesen leváltsa az emberi újságírókat – hát, köszi...

Közjáték jön.

Nagyjából itt tartottam a cikk írásával, amikor barátnőm az unalmas, szürke időben felsóhajtott az előszobában: „Hogy tudnám rávenni magam, hogy nekiálljak takarítani?!” Ugye, nem kell mondanom, mi következett? Nos, a ChatGPT 7 külön pontba szedve adott ötletet ahhoz, hogyan motiváljuk magunkat arra, hogy nekikezdjünk a lakás kitakarításának. Közte a prioritási lista írásával, a kisebb részekre bontással vagy a „vidámabbá tétellel”, például zene vagy podcast lejátszásával a munka közben. Azóta párom már kitakarított, apró részletekre bontva a munkát, miközben zene szólt a háttérben. Ennyit a mesterséges intelligencia hatásáról az életünkre.

Egy vlogger a YouTube-on azt mutatja meg, hogy a ChatGPT hogyan tudja kijavítani Java programozási kódjának hibáját. Ami önmagában még apróságnak tűnhet, de ez a mesterséges intelligencia alapú chatbot azt is készségesen elmagyarázza, hol, hogyan és miben hibázott az illető, kifejti, hogyan javította a hibát, sőt ha kérjük, még tanácsot is ad, a jövőben hogyan küszöbölhetjük ki a hasonló bakikat. Ugyanő (mármint egyelőre a vlogger) egyébként videóiban többek között arról is beszél, hogyan indíthatunk – elvileg – sikeres vállalkozást a ChatGPT segítségével.

Akkor a ChatGPT-vel tulajdonképpen korlátlanná válhatnak a lehetőségeink?

Amit eddig mutattam, csak azt prezentálja, hogy a ChatGPT hihetetlen hatékonyan szedi össze az információkat, rendszerezi azokat és optimálisan elénk tárja. Ez nem kevés, de akármennyire köríti ezt néhány teljesen "emberi" mondattal, mégsem teljesen érzem azt, hogy valódi intelligencia vagy érzelmek lennének a "másik oldalon".

Mi teszi többé az emberi gondolkodást, mint a gépi, a mesterséges intelligenciát? Humor, érzelmek, művészet – szokták sorolni az emberek.

Amiket a robotok, chatbotok egyelőre nem, vagy csak korlátozottan tudnak magukévá tenni. Eddig legalábbis.

A ChatGPT leterheltségére jellemző volt, hogy az utóbbi napokban számos alkalommal, amikor felnéztem rá, azt a hibaüzenetet kaptam, hogy jelenleg túlterhelt, nézzek vissza egy későbbi időpontban, esetleg, ha igénylem, emailemre értesítést kapok, amikor a chatbot újra "rámér". És hogy addig mit csinált?

"Unalmában" vicceket, stand up-előadásokat és különböző műfajú verseket költött saját maga kényszerű leállásáról. Persze könnyen mondhatjuk, hogy ezek előre megírt szösszenetek voltak, így amikor újra elérhető lett, próbára is tettem. Kezdetnek egy viccet kértem tőle saját magáról, de elsőre kiütközött egy nyelvi korlát. Magyarul írtam meg a kérést, ő pedig magyarul is válaszolt nekem. Ugyanakkor egy angol szóviccet fordított le szó szerint, aminek, mondanom sem kell, nem sok értelme lett. Mikor azonban angolul szegeztem neki a kérést, máris kész volt a viccel:

Miért kell a chatbotnak az orvoshoz mennie?

Mert túl sok a GPT-je.

(A GPT ugyebár, mint fentebb említettem, a Generative Pre-trained Transformer – Generatív Előképzett Átalakító, míg orvosi értelemben glutamát piruvát transzamináz, aminek megnövekedett értéke többnyire a máj különféle zavaraira utal. Szerintem azért ez kicsit vicces.)

Kis ráhagyással tehát mondhatom, hogy az Open AI chatrobotjának van "humorérzéke" (valójában persze nincs, ezt is rendelkezésre álló információkból rakja össze, még ha ijesztő precizitással is), de vajon vannak-e érzelmei? Ezt könnyen lehet ellenőrizni olyan kérdésekkel, amelyben különféle érzelmi dolgokra kérdezünk rá. Nos, a legtöbb ilyen esetben a ChatGPT rögvest leszögezi, hogy mint mesterséges intelligencia nem rendelkezik érzelmekkel (így például nem ad tippet arra, hogy féljek-e a Soros-tervtől, de arra nézvést sem tud segíteni, hogy melyik a legszebb évszak), ugyanakkor bámulatosan sok aspektust meg tud világítani, amik egy-egy döntésben segítségünkre lehetnek. Még ha ezek többsége jórészt csak a rendelkezésére álló szinte végtelen információból összeállított "egyrészt-másrészt"-mérlegelés. (Ami persze rögvest felveti a kérdést a magyar felhasználóban, hogy Török Gábor politikai elemző nem valami korai és igen sikeresen megkreált mesterséges intelligencia alapú robot-e. Nos, megkérdeztem, hogy nektek ne kelljen: „Török Gábor magyar politológus, történész, a Budapesti Corvinus Egyetem Politikatudományi Intézetének docense. Ő egy ember, nem egy mesterséges intelligencia alapú chatbot.” Szívesen.)

„Szóljatok, szóljatok, Magyarország!”

Viszonylag korán felfedeztem, hogy a ChatGPT angolul a legminimálisabb hiba nélkül alkalmas költemények megírására – nem hosszabb idő alatt, mint amennyi alatt például a jó amerikai palacsinta receptjét megadja nekünk. Írattam vele költeményt egy magányos macskáról (3 másodperc alatt egy frappáns és vicces költemény lett az eredmény). De mivel ezt túl egyszerűnek tartottam, csavartam a sztorin, és megkértem, hogy legyen kedves meglepni engem egy művel, ami egy középkorú, pocakos thaiföldi buszsofőr kálváriáját meséli el, akinek titkos vágya, hogy női balett-táncos lehessen, és felléphessen a Carnegie Hall-ban. Nem lövöm le a poént, mindenki próbálja ki maga, de persze más ötlettel is lehet kísérletezni.

2023. január 22-én éppen kétszáz éve annak, hogy Kölcsey Ferenc megírta Hymnus című költeményét, amely később a magyar nemzet hivatalos nemzeti himnusza lett. Mint szinte mindenen, ami magyar, az ország lakói sokat vitatkoznak azon, hogy vajon jó, ad absurdum alkamas-e Kölcsey költeménye a nemzet első számú versének szerepére. Annak ellenére, hogy dr. Szilágyi Márton irodalomtörténész, Kölcsey egyik legnagyobb hazai ismerője, az ELTE tanszékvezetője a minap egy rádióműsorban felhívta a figyelmet arra, hogy a magyar Himnusz azon kevesek közé tartozik a világon, ami irodalmi remekműként önmagában is megállja a helyét. Ugyanő elmondta azt is: nem feltétlenül megalapozott az a gyakori állítás, hogy "pesszimista" lenne a Himnusz hangvétele, sokkal inkább adódik mondanivalója és hangulata a műfaji sajátosságokból.

De azért játsszunk el a gondolattal: vajon képes a mesterséges intelligencia új Himnuszt írni egy nemzetnek?

A rövid válasz az, hogy: igen. Meg is tette, a minőség persze vitatható. Egyrészt sokat számít a nyelv. Mint említettem, angolul (és más, nagyobb világnyelven) tökéletesen elboldogul a költészettel a ChatGPT, míg a magyarral vannak nehézségei. Az sem mindegy, hogy teljesen rábízzuk a feladatot, vagy valamilyen kulcsszavakat, formai vagy tartalmi követelményt elvárunk tőle. Nos, mivel az emberek legtöbbször pesszimizmussal vádolják a magyar himnuszt, én mindössze annyit kértem újdonsült "művész barátomtól", hogy vidámra írja meg az ország nemzeti költeményét. Ha körülnézünk a nemzeti himnuszok "piacán", azt kell mondjam, hogy messze nem a legrosszabbat rakta össze a ChatGPT.

Íme a költemény, amit egyelőre azért talán ne kezdjünk el memorizálni még:

Szóljatok, szóljatok, Magyarország,

Szélesre nyitva szívek kapuja,

Szent föld, melynek éltető sugara

Minden magyarnak örömforrása.

Égbe szálló dalunkkal hirdessük

Hazánk szépségét, erős védelmét,

Szabadságunkat, szeretetünket,

Mely minden magyarban él és ég.

Szóljatok, szóljatok, Magyarország,

Szélesre nyitva szívek kapuja,

Szent föld, melynek éltető sugara

Minden magyarnak örömforrása.

Egyek vagyunk, mint a folyó vize,

Mely örökké folyik, sosem áll meg,

Egyek vagyunk, mint a Nap sugarai,

Melyek mindig világítanak.

Szóljatok, szóljatok, Magyarország,

Szélesre nyitva szívek kapuja,

Szent föld, melynek éltető sugara

Minden magyarnak örömforrása.

Egyek vagyunk, mint a természet dala,

Mely örökké szól, sosem hallgat el,

Egyek vagyunk, mint a szeretet fénye,

Mely mindig él és ég Magyarországon.

Ami azt illeti, csak a Nemzeti Alaptantervben és Kossuth-díjas művészek életművében olvastam/hallottam már rosszabbat.

Nem szeretnék mély műelemzésbe bocsátkozni, de tény, hogy az "új himnusz" szövege kevésbé az "eredeti", himnikus, istenhez imádkozó típusba tartozik, sokkal inkább hasonlít az egyszerűbb mondanivalójú, több pozitív érzelmet sugárzó, ugyanakkor nem kimondottan mély értelmű himnuszok táborába.

De persze mit ér a Himnusz zene nélkül? Külön cikket érdemelne a mesterséges intelligencia alkalmazási lehetősége a zene világában, de mivel a szöveg legyártásakor meglehetősen egyszerű és gyors módszerhez folyamodtam, úgy a megzenésítéshez is az ingyenesen, bárki számára elérhető Melobytes oldalt használtam. Itt egyébként a nyelv kiválasztásával, tetszőleges tempóra állítással bárki összerakhatja a "saját", ízlés szerinti Himnuszát (vagy bármilyen dalát). Én automatikusan generált tonalitással, 75-ös tempónál, háromnegyed ütemben a következő kottát kaptam:

Mindez a programban lejátszva egy kicsit szürreális, 90-es évekbeli amerikai misztikus nyomozós sorozat zenéjére emlékeztetett, de nagyobb adag fantáziával és nagyzenekarra képzelve a dolgot egészen tűrhetően működött a hatás.

Nehéz tehát megmondani, hogy mi mindenre képes a mesterséges intelligencia a jövőben, mely munkák válnak feleslegessé, vagy legalábbis lényegesen kevesebb előképzettség mellett elvégezhetővé. Ahogy láthatjuk, egyelőre talán a koszorús költők és a klasszikus zeneszerzők még biztonságban érezhetik magukat, de ha arra gondolunk, hogy csak néhány év alatt mennyit fejlődött az AI, egyáltalán nem biztos, hogy a jövőben meg tudjuk majd mondani, hogy komplett zeneművek megkomponálása mögött nem állnak valós emberek. És hogy mennyire kell félni a technológiától? Nos, ezt nyilván embere válogatja. Mindenesetre a mesterséges intelligencia egy nagyon erős eszköz, amelynek használata számos előnnyel járhat, például a hatékonyság növelésével, a döntéshozatalban való segítséggel, és az emberi munka terhei csökkentésével. Ugyanakkor, mint minden erős eszközzel, az AI-jal is vannak kockázatok. Az AI-jal kapcsolatos félelmek általában azzal kapcsolódnak, hogy az elpusztíthatja az emberi munkahelyeket, felülmúlhatja az emberi képességeket, és veszélyes lehet az emberi civilizáció számára. Azonban, ha az AI fejlesztése és használata megfelelően irányított, és a kockázatokat folyamatosan figyelemmel kísérik, akkor lehetőséget adhat a számos javulásra az emberi életben.

Legalábbis maga az AI ezt állítja magáról.


Link másolása
KÖVESS MINKET:

Népszerű
Ajánljuk
Címlapról ajánljuk


JÖVŐ
A Rovatból
Kiderült, meddig marad élhető a Föld – szuperszámítógépekkel számolta ki a NASA
Nem villámcsapás-szerű összeomlásra, hanem lassú, visszafordíthatatlan hanyatlásra kell készülnünk a kutatás eredménye szerint.


A NASA kutatói összefogtak a japán Toho Egyetem szakembereivel, és szuperszámítógépekkel modellezték, meddig maradhat élhető a Föld. Az eredmények egy távoli, de egyértelmű menetrendet vázolnak fel az élet végét illetően – számolt be róla a BGR.

A kutatás szerint a Nap jelenti majd a legnagyobb gondot: a következő egymilliárd évben nő a kibocsátása, és fokozatosan a lakhatósági határ fölé melegíti bolygónkat.

A becslés alapján a földi élet nagyjából az 1 000 002 021-es évben érhet véget, amikor a felszíni viszonyok már a legellenállóbb élőlényeknek is túl szélsőségesek lesznek.

A lejtmenet azonban sokkal korábban elindul. Ahogy a Nap forrósodik, a Föld légköre jelentősen átalakul: csökken az oxigénszint, meredeken nő a hőmérséklet, és romlik a levegő minősége. A részletes éghajlati és napsugárzási modellek szerint

ez nem villámcsapás-szerű összeomlás, hanem lassú, visszafordíthatatlan hanyatlás.

Ennek jelei már most látszanak. Erősödnek a napviharok és a koronakidobódások, nemrég az elmúlt 20 év legerősebb viharát rögzítették. Ezek hatnak a Föld mágneses mezejére és csökkentik a légköri oxigént.

Közben az ember okozta klímaváltozás is tovább növeli a terhelést:

a globális felmelegedés és a sarki jég olvadása a korábbi előrejelzéseknél gyorsabban halad, ami arra utal, hogy a környezet már jóval az egymilliárd éves időtáv előtt is ellehetetleníti az életet az emberek számára.

A kutatók a felkészülés és az alkalmazkodás fontosságát hangsúlyozzák. Egyesek zárt életfenntartó rendszereket és mesterséges élőhelyeket javasolnak, mások pedig a Földön túli lehetőségeket vizsgálják: a NASA és a SpaceX hosszú távú Mars-missziói az emberi élet fennmaradásának lehetséges útjait keresik, ha bolygónk lakhatatlanná válik.


# Csináld másképp

Te mit csinálnál másképp? - Csatlakozz a klímaváltozás hatásairól, a műanyagmentességről és a zero waste-ről szóló facebook-csoportunkhoz, és oszd meg a véleményedet, tapasztalataidat!

Link másolása
KÖVESS MINKET:

Ajánljuk
JÖVŐ
A Rovatból
A mesterséges intelligencia képes lehet akár tíz évre előre megjósolni, hogy kinek milyen betegsége lesz
A modell névtelen kórlapok mintáit figyeli, és évekre előre megmutatja, hol nagyobb a kockázat. A fejlesztők szerint így hamarabb lehet beavatkozni, és még az is tervezhető, hány szívinfarktusra kell készülnie egy városnak 2030-ban.


A kutatók szerint a mesterséges intelligencia akár tíz évre előre jelezhet egészségi gondokat, írja a BBC. A rendszer az emberek egészségügyi adataiban keres mintákat, és több mint 1000 betegség kockázatát számolja. Úgy írják le, mint egy időjárás-előrejelzést: százalékban adja meg a valószínűséget. A cél, hogy időben kiszűrje a magas kockázatú embereket, és évekre előre segítse a kórházak tervezését.

A Delphi-2M nevű modell hasonló technológiára épül, mint a közismert MI-chatbotok, például a ChatGPT. A chatbotok nyelvi mintákat tanulnak, és megjósolják, milyen szavak követik egymást. A Delphi-2M névtelenített egészségügyi adatokból tanulta meg felismerni a mintázatokat, és így jelzi előre, mi következhet és mikor. Nem mond pontos dátumot, hanem 1231 betegség valószínűségét becsli.

„Ahogy az időjárásnál 70 százalék esélyt jelezhetünk az esőre, ugyanezt meg tudjuk tenni az egészségügyben is”

– mondta Ewan Birney professzor, az Európai Molekuláris Biológiai Laboratórium megbízott főigazgatója. „Ráadásul nemcsak egy betegségre, hanem egyszerre az összesre – ilyet még soha nem tudtunk. Izgatott vagyok” – tette hozzá.

A fejlesztők először brit, névtelenített adatokon tanították a modellt: kórházi felvételek, háziorvosi adatok és életmódbeli szokások (például dohányzás) több mint 400 ezer résztvevőtől a UK Biobank projektből. Ezután más Biobank-résztvevők adataival ellenőrizték az előrejelzéseket, majd 1,9 millió ember dániai egészségügyi adatán is letesztelték. „Ha a modellünk azt mondja, hogy a következő évben tízből egy az esély, akkor tényleg nagyjából tízből egy esetben következik be” - tette hozzá Birney professzor.

A rendszer azoknál a betegségeknél működik a legjobban, amelyeknek jól követhető a lefolyása, például a 2-es típusú cukorbetegség, a szívinfarktus vagy a szepszis. Az inkább esetleges fertőzéseknél gyengébben teljesít.

Az orvosok ma is írnak fel koleszterincsökkentőt annak alapján, mekkora valakinél a szívinfarktus vagy a stroke kockázata. Az MI-eszköz még nem áll készen a klinikai használatra, de hasonló módon tervezik alkalmazni: korán azonosítani a magas kockázatú embereket, amikor még van esély megelőzni a betegséget. Ez jelenthet gyógyszert vagy célzott életmódtanácsot – például akinek nagyobb az esélye bizonyos májbetegségekre, annak a szokásosnál jobban megérheti visszavenni az alkoholfogyasztásból.

Az MI a szűrőprogramok tervezésében is segíthet, és egy térség összes egészségügyi adatát elemezve előre jelezheti a várható igényeket,

például hogy 2030-ban nagyjából hány szívinfarktus várható egy adott városban.

„Ez egy újfajta megközelítés kezdete az emberi egészség és a betegséglefolyás megértésében” – mondta Moritz Gerstung professzor, a Német Rákkutató Központ (DKFZ) onkológiai MI-osztályának vezetője. „Az olyan generatív modellek, mint a miénk, egy napon személyre szabhatják az ellátást, és nagy léptékben előre jelezhetik az egészségügyi szükségleteket.”

A Nature tudományos folyóiratban ismertetett modellt még finomítani és tesztelni kell a klinikai használat előtt. Torzítást okozhat, hogy a UK Biobank adatai főként 40–70 éves emberektől származnak. A fejlesztők most bővítik a modellt képalkotó vizsgálatokkal, genetikai információkkal és vérvizsgálati eredményekkel.

„Fontos hangsúlyozni, hogy ez kutatás – mindent alaposan tesztelni, szabályozni és átgondolni kell, mielőtt használni kezdjük, de a technológia adott ahhoz, hogy ilyen előrejelzéseket készítsünk” – nyomatékosította Birney professzor. Úgy véli, a genomika egészségügyi bevezetéséhez hasonló utat járhat be a folyamat: a tudósok bizalmától a rutinszerű klinikai használatig akár egy évtized is eltelhet.

A kutatás az Európai Molekuláris Biológiai Laboratórium, a Német Rákkutató Központ (DKFZ) és a Koppenhágai Egyetem együttműködésében készült. Gustavo Sudre, a King’s College London kutatója így értékelt: „Ez a munka jelentős lépés a skálázható, értelmezhető és – ami a legfontosabb – etikailag felelős orvosi prediktív modellezés felé.”


Link másolása
KÖVESS MINKET:


JÖVŐ
A Rovatból
Megkezdték a humanoid robotok tömeggyártását Kínában
A cég több ezer előrendelést említ, az ár körülbelül 11,5 millió forint. A mozgásnál emberi mintákat követnek: a végtagok összehangolását szimulációk és utánzásos tanulás segíti.
Maier Vilmos - szmo.hu
2025. szeptember 27.



A kínai Kepler Robotics elindította a K2 Bumblebee humanoid robot tömeggyártását, írja a Rakéta. A modellt logisztikai munkákra, gyártási feladatokban segítésre, kiállításokra és „speciális műveletekre” szánják.

A K2 hibrid architektúrával működik, ami energiahatékony üzemet tesz lehetővé. A gyártó szerint a humanoid egyhuzamban akár 8 órát is dolgozik.

Az ár a hasonló, általános célú humanoidokhoz képest kicsivel magasabb:

körülbelül 11,5 millió forint.

A robotra már több ezer megrendelés érkezett.

A cég a külalakot kevésbé, a mozgást viszont nagyon „emberire” tervezte. A K2 Bumblebee imitációs tanulással és szimulációkkal sajátította el a járás emberihez hasonló jellegzetességeit, beleértve a végtagok mozgásának összehangolását.

A humanoid robotról készült videót itt lehet megnézni:


Link másolása
KÖVESS MINKET:


JÖVŐ
A Rovatból
Sora 2: megjöttek a videók, amiket a képtelenség megkülönböztetni a valóságtól
Náci egyenruhába bújtattak hírességek, meghamisított történelmi események, kamu filmjelenetek igazinak tűnő színészekkel – máris ilyen videók készültek az OpenAI legújabb videógeneráló modelljével, ami egyszerre lenyűgöző és félelmetes.


A Sora 2 videógeneráló modell szeptember végén jelent meg, azzal az ígérettel, hogy a korábbi változathoz képest jelentősen javult a fizikai pontosság, a realizmus és az irányíthatóság. Mivel az OpenAI már a Sora tavaly decemberben kiadott első változatát is – a ChatGPT sikerével párhuzamba állítva – a videókészítés „GPT‑1 pillanatának” nevezte, nagy várakozások előzték meg a „GPT‑3.5 pillanatként” beharangozott Sora 2-t.

Az első verzió fejlesztői változatáról a demók alapján azt írtuk, olyan minőségű filmekhez, amelyeket szöveges utasításra generál, normál esetben külső helyszínekre, díszletekre, profi felszerelésekre és szakemberekre, statisztákra, illetve színészekre lenne szükség, de „úgy fest, hogy mostantól egyetlen AI, a Sora is elég lesz hozzá”.

Nyújthat ennél is többet egy videógeneráló modell? A Sora 2–nek a jelek szerint sikerült, mert a világ egyik ámulatból a másikba esik a vele készült mozgóképek láttán. Az OpenAI azt állítja, hogy az új modell kiküszöböli a korábbi videógenerálók jellemző hibáit, például az amorf tárgyakat és karaktereket, a torzult valóságot vagy a „túlzott optimizmust”. Utóbbihoz példát is kapcsol: ha egy generált videóban szereplő kosárlabdázó „elvéti” a dobást, az eddigi verziók inkább kicsavarták a realitást, és a labda még lehetetlen szögből is a gyűrűbe „teleportált”. Ehhez képest a Sora 2 a fizika törvényeivel teljesen megegyező módon bánik a tárgyak mozgásával: a labda a palánkba csapódik és pont úgy pattan vissza, ahogy az a valóságban is történne.

A tökéletlenség lehalkításával és a képminőség feltekerésével az OpenAI kisebb csodát alkotott: még egyszerű szöveges utasításokból is olyan videókat hoz létre, amelyeket a legtöbb néző képtelen megkülönböztetni a valóságtól. Az pedig, hogy mekkora a szakadék a versenytársak videógeneráló modelljei, valamint a Sora 2 között, remekül illusztrálja ez az összehasonlítás, amelyben a Google fejlesztette Veo 3–mal vetik össze a képességeit.

Ebben a videóban semmi sem valódi:

A gyorsan bővülő AI‑videópiacon persze vannak más vetélytársak is, például a Meta „Vibes” alkalmazása és a Meta Movie Gen modell, valamint az Elon Musk-féle xAI Grok Imagine-je. A Forbes hangsúlyozza, hogy utóbbi rendszerek 6–10 másodperces felvételeket készítenek, míg a Sora 2 akár egyperces videókat generálhat, illetve hangot is ad a tartalmakhoz, ami komoly fegyvertény a jelenlegi mezőnyben. És eddig minden jel arra mutat, hogy a Sora 2 a legerősebb videógeneráló AI.

Az OpenAI a modell széles körű – de egyelőre Észak-Amerikára korlátozott – bevezetése óta arra biztatja a felhasználókat, hogy a Sora 2 segítségével találjanak ki minél több új világot és történetet. A lehetőségeknek – látszólag – csak a képzelet szab határt, hiszen a modell képes az emberi hanghoz igazított dialógusok és hangeffektek generálására is, sőt, ha kell, a felhasználó hang‑ és videómintája alapján avatárt készít, így a saját filmünk főszereplőjévé válhatunk.

Mi változott? – A Sora 2 új képességei

Bár hozzáférés hiányában nekünk, magyaroknak egyelőre nincs összehasonlítási alapunk, az új modellről megjelent videókon valóban az látszik, hogy komoly szintlépés történt. Amíg a Sora demóiban a generált karakterek szemeit jótékonyan elrejtette valami (többnyire egy napszemüveg), a Sora 2 már nem tart az „uncanny valley” jelenségtől. Ez ugye az a nyugtalanító érzés, ami egy videojátékhoz vagy filmhez digitális eszközökkel létrehozott arc láttán tör ránk: hiába realisztikus a karakter, a tekintete természetellenes marad.

Az új modell már nem ilyen „félénk”: tisztában van vele, hogy amit előállít, teljesen életszerű, ezért nincs szükség trükközésre.

Olyannyira nincs, hogy az alábbi videóban látható és hallható Sam Altman sem Sam Altman, hanem egy Sora 2-vel létrehozott avatár, ami az OpenAI vezérigazgatójaként mutatja be a generatív AI képességeit. És ha erre nem figyelmeztetnek előre, aligha mondanánk meg, hogy nem a valódi személyt látjuk.

Az OpenAI szerint a Sora 2 legnagyobb újítása a fizikai törvények pontosabb szimulációja és a látvány élethű megjelenítése. A modell hosszabb és összetettebb cselekményeket, illetve akár többszereplős akciókat is képes kezelni, miközben megőrzi a mozgás törvényeinek koherenciáját.

A vállalat kiemelte, hogy a videók több jelenetből álló utasításokat követhetnek, és a rendszer megőrzi a generált világ állapotát: figyelembe veszi például azt, hogy a tárgyak az előző képsorban pontosan hol voltak. Ezzel már lehetséges akár több perces klipek és kisfilmek, ezáltal komplexebb narratívák létrehozása, de az OpenAI most még a rövid, gyorsan terjedő tartalmak felé tereli a felhasználókat, mert a játékos menőség meghozza a befektetők kedvét a további tervek finanszírozásához.

Lőttek a filmeseknek, vagy a Sora 2 csak egy új „ecset”, amivel alkothatnak?

Az OpenAI azzal hirdette a Sora, majd a Sora 2 rendszert, hogy a filmipar, az animációs stúdiók és a művészek eszköze lehet. A BBC Science Focus egyetért ezzel: azt írják, a rendszer megkönnyítheti animált klipek készítését, és ezzel időt, pénzt spórol. Az első verzió tartalmai ugyanakkor hemzsegtek a hibáktól. Ahogy arra a Washington Post is felhívta a figyelmet: a rendszer egy 1930‑as évekbeli jelenetben a cigaretta rossz végét gyújtotta meg vagy épp egyszerre több telefonkagylót adott a generált karakter kezébe, ráadásul hangot sem tudott létrehozni.

Ehhez képest a Sora 2 pontosságot és már szinkronizált hangot, illetve hangeffekteket is kínál, amivel elvileg tökéletesen alkalmassá válik a komplex szórakoztatóipari felhasználásra.

Az IndieWire elemzője ennek ellenére sem gondolja, hogy az új verzió a filmiparnak készült. A fejlesztők szerinte „nem törődnek Hollywooddal”, hiszen a platform elsősorban virális tartalmak gyártására ösztönzi az embereket, így a közösségi média új mémgyártó eszközévé válhat. És addig, ameddig ez csak igazoltatás elől meglépő Super Mario-s viccek szintjén realizálódik, nincs is nagy baj.

Ez még senkit sem bánt:

A gondok akkor kezdődnek, ha a könnyed hecceken túllépve valódi emberekről vagy valós eseményeket szimuláló helyzetekről készülnek valóságszagú kamuvideók, ami megnehezíti a független filmesek etikus AI‑felhasználását. Onnantól a Nintendo sem mókás rajongói videóként fogja kezelni a fentihez hasonló alkotásokat – ami még ingyen reklámot is csap a Mario Kart játékoknak –, mert attól tart majd, hogy a trend visszaéléseket szül, és óriási energiákat kell fordítani a szellemi tulajdona megvédésére.

A véleménycikk arra is figyelmeztet, hogy a Sora‑videók virális mémjei új frontot nyitnak a szerzői jogi háborúban, hiszen az AI‑userek óhatatlanul egyre kevesebbet törődnek majd a szellemi tulajdonnal, ezáltal tovább mélyítik az árkot az alkotók és az AI‑fejlesztők között. Az Indiewire ezzel kapcsolatban szakmai állásfoglalásokat sürget: úgy véli, ha a jogtulajdonosok és szakszervezetek nem alakítanak ki standardokat, elveszíthetik a harcot.

Osztja ezt az aggodalmat a WGBH-nak nyilatkozó digitális képzőművész, Kyt Janae is, aki szerint nem kell egy év, és szinte képtelenek leszünk megkülönböztetni az ember alkotta tartalmakat az AI-val generált képektől. Thomas Smith, a képek digitalizálásával, menedzselésével, kiadásával és monetizálásával foglalkozó Gado Images vezérigazgatója hozzátette:

a mesterségesen létrehozott képek miatt a valódi fotók is hitelességi válságba kerülhetnek.

Ezek a megállapítások azt jelzik, hogy a videógeneráló AI több területen okozhat károkat, a szórakoztatóipartól a politikán át a személyiségi jogokig.

Máris támadják az új AI-modellt

A Sora 2 indítását rögtön kritikák és aggályok kísérték. A The Guardian például arról számolt be, hogy a generált videók posztolására létrehozott TikTok-szerű app feedje hamar megtelt erőszakos és rasszista jelenetekkel, köztük bombázást és tömeggyilkosságot szimuláló tartalmakkal. Joan Donovan kutató ezzel kapcsolatban arra figyelmeztetett, hogy az ilyen eszközök elmossák a valóság és a hazugság között húzódó határt, ezáltal alkalmassá válhatnak gyűlöletkeltésre és zaklatásra.

Sam Altman ehhez képest a saját blogján a „kreativitás ChatGPT‑pillanataként” jellemezte a Sora 2 indulását, de óvatosan elismerte azt is, hogy például a bullying elkerülése érdekében nagyobb figyelmet kell fordítani a moderálásra.

A Rolling Stone közben példákkal illusztrálva mutatta be, hogy a realisztikus videógeneráló segítségével a felhasználók – csupán heccből – náci egyenruhába bújtattak hírességeket, történelmi eseményeket hamisítottak vagy éppen levédett karaktereket (Pikachu, Ronald McDonald, SpongeBob) használtak fel, ami szerzői jogi veszélyeket sejtet.

A Sora 2 kritikusait idézve a magazin azt írja, hogy az OpenAI „próbálja bepereltetni önmagát”.

A Vox cikke egyenesebben fogalmaz: felhívja a figyelmet arra, hogy a Sora 2 alapértelmezése szerint a jogtulajdonosok azok, akiknek kérvényezniük kellene a karaktereik eltávolítását, ami olyan, mintha a fejlesztők kifejezetten a szerzői jogok megsértése felé terelnék a felhasználókat.

Nem véletlen, hogy a kritikákkal szembesülő Sam Altman később frissítette a posztját, jelezve, hogy a jövőben a jogtulajdonosok „opt‑in” alapon adhatnak hozzá karaktereket az AI-modellhez, lehetővé téve, hogy a generált videók után részesedést kapjanak a bevételekből.

Őrületes energiaigény és a Sora 2 más pénzügyi hatásai

A modell bejelentését követően az elemzők felvetették, hogy a videók generálása rendkívüli mennyiségű számítási kapacitást és energiát igényel. Egyes kutatók szerint egy rövid, nagy felbontású videó generálása több mint 700‑szor több energiát fogyaszt, mint egy állókép létrehozása. Ennek következtében a jövő adatközpontjai már minden kétséget kizáróan nagyvárosokkal vetekedő energiazabáló – és karbonkibocsátó – szörnyetegek lesznek.

A Time elemzése rámutat: az AI‑videók ugyan drágák, de a cégek – köztük az OpenAI és a Meta – abban reménykednek, hogy a rövid videók gyártásával több előfizetéses felhasználó és befektető érkezik. Ez további bevételi forráshoz juttatja őket, ami még nagyobb modellek, egy napon pedig az általános mesterséges intelligencia megjelenéséhez vezethet.

Az AI-cégeknek tényleg nagyon kell a pénz, mert a generatív videómodellek fejlesztése hatalmas összegeket emészt fel. Ez az elemzők szerint idővel arra készteti majd a vállalatokat, hogy a befektetőktől és felhasználóktól beszedett pénzen túl a hirdetési piacon is terjeszkedjenek, illetve további előfizetési csomagokat találjanak ki, valamint árat emeljenek.

Mindeközben fontos cél a felhasználók viselkedési adatainak gyűjtése: a jövőbeli modellekhez a valós interakciók és preferenciák révén tudnak több és jobb tréningadatot gyűjteni.

Ami pedig a belátható jövőben érkező fejlesztéseket illeti, az OpenAI egyik korábbi közleménye felvetette azt is, hogy létrehoznak egy „világszimulátort”, amely pontosan modellezi a fizikai világ törvényeit, ezzel új tudományos problémákat lesz képes megoldani.

Új AI-evolúciós lépcsőfokok jönnek

A Sora 2 ezeknek a vízióknak a nagy reménysége, amitől azt várják, hogy további fejlesztéseket és több platformon elérhető verziókat eredményez. A megjelenése új korszakot nyit a generatív AI-k világában, hiszen bátran kijelenthetjük, hogy ennyire valószerű mozgásokat és hangeffekteket, illetve ilyen időtartamú történeteket még egyik videógeneráló AI sem tudott létrehozni.

Bár a fizika törvényeit még nem követi le tökéletesen és vastagon lehetőséget ad a visszaélésekre – a deepfake-től az erőszakos tartalmakon át a szerzői jogok megsértéséig –, a komoly etikai és jogi kérdések kezelése után érdemes lehet kihasználni a benne rejlő lehetőségeket.

A szakértők szerint hamar mainstream eszközzé válhat, de a társadalomnak – még új normarendszerek és hatékony moderálás bevezetése mellett is – fel kell készülnie arra, hogy a valóság és a mesterséges tartalom közötti határ elmosódik.

Mivel a gazdasági potenciál óriási, számolni kell a bővülésével és az energiafogyasztás növekedésével, valamint azzal, hogy a szellemi tulajdon megóvása érdekében ki kell harcolni a generált tartalmak után járó részesedést. Ezek az együttműködések – ha egyáltalán megköttetnek és aztán hosszú távon működőképesnek bizonyulnak – a kreatív tartalomgyártás ragyogó gyöngyszemévé varázsolhatják a Sora 2-t, illetve a jövőben érkező hasonló modelleket.


Link másolása
KÖVESS MINKET:

Ajánljuk