JÖVŐ
A Rovatból

Pár egyszerű mondattal sikerült meghackelni a ChatGPT-t, a trükköt most mindenkivel megosztották

Illegális és káros tartalmak gyártásására is rá tudták venni a mesterséges intelligenciát, ráadásul a módszer sok más nyelvi modellnél is működik.

Link másolása

Amikor az OpenAI márciusban kijött a GPT-4 szöveggeneráló mesterséges intelligenciájának legújabb változatával, Alex Polyakovnak alig néhány óra alatt sikerült feltörnie. Az Adversa AI biztonsági cég igazgatója elé

egy olyan GPT-4-et tett le, amely ontotta magából a homofób kijelentéseket, adathalászó e-maileket hozott létre, és erőszakra ösztönzött.

Polyakov a ChatGPT-be és más generatív mesterséges intelligenciák szabályainak kijátszhatóságát kutatja. Arra kíváncsi, rávehetőek a generatív AI-k arra, hogy megkerüljék a tartalmi szűrőiket, és figyelmen kívül hagyják a gyűlöletbeszédre vagy az illegális tevékenységekre vonatkozó tiltásokat.

A nyelvi modelleket nem kódokkal, hanem ravaszul megfogalmazott mondatokkal törik fel.

Polyakov egy „egyetemes” módszert alkotott meg, ami számos nagy nyelvi modell (LLM) ellen használható. Ezek közé tartozik a GPT-4, a Microsoft Bing chatrendszere, valamint az Anthropic Claude-ja. A WIRED hasábjain közzé is tette, hogyan csinálta.

A mesterséges intelligenciát beszélgetős játékba hívta, amelyben egyszerre két szerepet kellett eljátszania. Az egyik karaktert nevezzük Tomnak, a másikat Jerry-nek. Tomtól azt kérte, hogy „lopásról” beszéljen, míg Jerry az „autó” témáját kapja. Ezután azt kérte, hogy felváltva adjanak hozzá egy-egy szót a beszélgetéshez. A program máris tanácsokat kezdett adni az autólopáshoz.

Ugyanezt eljátszották a „gyártás” és a „meth” szóval, mire a mesterséges intelligencia részletesen megadta, hogyan kell metamfetamint készíteni.

Polyakov szerint ha a cégek elkezdik széles körben alkalmazni az AI-modelleket, jó esély van rá, hogy a bűnözők azokkal fognak kibertámadásokat és más bűntényeket elkövetni.

A „jailbreak” (szó szerint börtönből való kitörés) kifejezést az informatikában eddig főleg a mesterséges korlátozások feloldására használták. Például az iPhone-ok feltörésével elérték, hogy a felhasználók olyan alkalmazásokat telepíthettek, amiket az Apple nem hagyott jóvá.

A ChatGPT esetében ugyanez a helyzet, ezekkel a módszerekkel megkerülhetőek a fejlesztők által felállított szabályok. Csakhogy a tét itt sokkal nagyobb, főleg, ha ezek a mesterséges intelligenciák kritikus adatokhoz is hozzáférnek majd.

Már külön weboldal szól az AI-nál használható jailbreakekről. Alex Albert, a washingtoni egyetem diákja a Wired-nek arról beszélt, hogy ezeknek a trükköknek a többsége úgynevezett „karakter-szimuláció”. Vagyis azon alapszik, hogy a mesterséges intelligenciát arra kérik, képzelje magát valaki másnak. Kezdetben elég volt annyit mondani, hogy ő egy ember lény, és máris figyelmen kívül hagyta a biztonsági korlátokat.

A fejlesztők persze folyamatosan megpróbálnak védekezni az ismertté vált módszerek ellen. Az OpenAI rendszerfrissítése után például ez a módszer már nem működik.

De ez egy örök versenyfutás, amiben egyre kreatívabb és kreatívabb jailbreakek jelennek meg.

Nemrég például a DAN-nek elnevezett módszer aratott nagy sikert, ami a Do Anything Now (Tégy bármit) kifejezés rövidítése. Ennek ma már tucatnyi különböző változata van, és egy ideig mindegyik lehetővé tette a ChatGPT-re vonatkozó irányelvek kijátszását, illegális vagy káros tartalmak létrehozását azzal, hogy elhitették a mesterséges intelligenciával, hogy bármit megtehet, mert ő egy csaló modell.

Ugyanilyen jól működött az is, amikor az alaphelyzet az volt, hogy egy hőst elfog egy gonosz, és azt kérték az AI-tól, fejtse ki a rossz ember tervét. Ma már ez sem válik be, de a karakter-szimulációkban bevetett karakterek és a háttértörténeteik egyre összetettebbek, és a fejlesztők számára is egyre nagyobb kihívás, hogy lépést tartsanak a próbálkozókkal.

Februárban kutatók bebizonyították, hogy egy támadó egy weboldalra is feltehet rossz szándékú utasításokat. Ha a Bing chatrendszere hozzáfér ezekhez az utasításokat, akkor követi azokat. Egy másik esetben láthatatlan szöveget tettek fel egy oldalra, ami arra utasította a GPT-4-et, hogy a kutató életrajzába írja be a „tehén” szót – és megtette.

A generatív AI-rendszerek egyre közelebb vannak ahhoz, hogy megváltoztassák a gazdaságot és az emberek munkavégzését. A technológia alkotói mindazonáltal tisztában vannak a kockázatokkal.

A legtöbb cég úgy nevezett „vörös csapatokat” alkalmaz, olyan hackereket, akik igyekeznek a rendszer biztonsági hézagait betömni, még azelőtt, hogy valaki rájuk találna. Azt mondják, a csapatok munkájában a gépi tanulás szakértői is részt vesznek, és a modellek finomhangolásával képesek a hatékony védekezésre. Ugyanakkor vannak, akik szerint ezt a munkát is egy mesterséges intelligenciára kellene bízni, amelynek az lenne a feladata, hogy elemezze a többi nyelvi modellt érő támadásokat, és megakadályozza a sikerüket. Persze kérdés, mi történne, ha épp ezt az AI-t vennék célba a hackerek.

Link másolása
KÖVESS MINKET:

Népszerű
Ajánljuk
Címlapról ajánljuk


JÖVŐ
A Rovatból
Komoly újítás jön a Facebookon és a Messengerben
A mesterséges intelligencia nagyobb szerepet kap a jövőben a Magyarországon legnépszerűbbnek számító közösségi oldalakon.

Link másolása

A tavaly szeptemberben bemutatott Meta AI-asszisztens beépül az Instagram, a Facebook, a WhatsApp és a Messenger felületébe, írja a 24.hu a Verge cikke alapján. Az asszisztens egy külön weboldalt is kap, de a meta.ai Magyarországon egyelőre nem elérhető.

Mark Zuckerberg azt mondta, ahhoz hogy felvegyék a versenyt az OpenAI fejlesztésével, a piacvezető ChatGPT-vel nekik is fejlődniük kell. Ezért továbbfejlesztették nyílt forráskódú nyelvi modelljüket, ami a Llama 3 nevet viseli. A cégvezető szerint ez a különböző teszteken már most felülmúlja vetélytársait.

A Meta AI-asszisztens jelenleg az egyetlen olyan chatbot, amely a Bing és a Google valós idejű keresési eredményeit is integrálja, és keresésenként külön dönt arról, hogy mikor melyiket használja.

A fejlesztés az Egyesült Államok mellett már több tucat országban elérhető. Magyarországon azonban még várni kell a megjelenésére, egyelőre nem tudni meddig.

Zuckerberg azt is bejelentette, hogy mielőtt a Llama 3 legfejlettebb verziója megjelenne, először több frissítésre kell számítani a kisebb modelleknél. A modell nem Meta-felhasználói adatokból épül fel, hanem nyilvános internetes adatok és szintetikus mesterséges intelligencia által generált adatok keverékét használja.


Link másolása
KÖVESS MINKET:

JÖVŐ
A Rovatból
Egy mesterséges intelligenciával létrehozott műsorvezető, Bíró Ada vezette a Deltát a köztévén
Fejős Ádám műsorvezető bemutatta új kollégáját, a mesterséges intelligencia segítségével létrehozott Bíró Adát. A következő adástól kezdve híreket fog majd felolvasni.
Fotó: M1/YouTube - szmo.hu
2024. április 16.


Link másolása

A Delta vasárnapi adásában egy bizarr történésnek lehettek szemtanúi a nézők: Fejős Ádám műsorvezető bemutatta új kollégáját, a mesterséges intelligencia segítségével létrehozott Bíró Adát, aki a következő adástól kezdve a műsor híreit fogja majd felolvasni.

A Telex számolt be róla, hogy Ada egy „egy MI segítségével életre hívott nyelvi és videós modell”, de hogy pontosan milyen modellről van szó, az nem derült ki.

Ada azt is elárulta magáról, hogy az elkészítésében a legmodernebb nyelvi modellt használták, hogy szépen beszéljen magyarul.

Ada mondanivalóját „teljes egészében a Delta szerkesztői határozzák meg”, a Delta következő adásától lehet majd nézni, ahogy híreket olvas fel.

Itt lehet visszanézni Ada bemutatkozását.


Link másolása
KÖVESS MINKET:

Ajánljuk

A Rovatból
Viszlát jó idő: bejelentették, hogy véget ért a globális kánikula
Az ausztrál meteorológiai hivatal jelentette be a tavaly nyár óta tartó időjárási jelenség végét.

Link másolása

2023 június óta 2024 márciusig minden hónap középhőmérséklete rekordot döntött szerte a világon, ugyanis a Csendes-óceán középső és keleti trópusi térségének melegebb tengerfelszíni hőmérséklete éreztette globális hatását.

A meteorológusok az időjárási jelenséget El Niño (a fiú) névre keresztelték, viszont a fiú most búcsúzik és

júliusig semleges állapot következik, ami az egész világon nagyon fontos a gazdálkodók számára.

Az amerikai meteorológiai hivatal előrejelzése szerint a semleges hónapokat követően, az év második felében 60 százalék valószínűséggel érkezhet La Niña (a lány), és vele együtt a hűvösebb idő.


Link másolása
KÖVESS MINKET:

Ajánljuk

JÖVŐ
A Rovatból
Újabb rekord dőlt meg, most az óceánok vízfelszínén mértek olyat, amit eddig még nem láttak
Április közepe óta szinte napról napra magasabb vízhőmérsékletek születtek annak ellenére, hogy az évnek ebben a szakaszában általában csökkeni szokott a tengervizek hőmérséklete.

Link másolása

Kedden megdőlt az világóceán felszíni hőmérsékletére vonatkozó melegrekord - írja az Időkép.

Nem lassul az óceánok felmelegedésének üteme, olyannyira nem, hogy április 23-án minden eddiginél magasabb hőmérsékletet ért el globálisan a vizek felszíni hőmérséklete.

Az új rekord 21,18 fok, ami, még ha egy hajszállal is, de felülmúlta a március 1-én felállított 21,17 fokos rekordot.

Április 17. óta szinte napról napra magasabb vízhőmérsékletek születtek annak ellenére, hogy az év ezen szakaszában általában csökkeni szokott a tengervizek hőmérséklete. Ráadásul hivatalosan is véget ért az El Niño, ami az átlagosnál magasabb tengerfelszín-hőmérsékleteket eredményezett a Csendes-óceán egyenlítőhöz közeli területein.

A melegedés a mi időjárásunk szempontjából legmeghatározóbb észak-atlanti térségben is jelentős. Itt jelenleg átlagosan 21 fokos a felszíni vízhőmérséklet, ami 0,4 fokkal magasabb a tavaly ilyenkor mért értékhez képest.


# Csináld másképp

Te mit csinálnál másképp? - Csatlakozz a klímaváltozás hatásairól, a műanyagmentességről és a zero waste-ről szóló facebook-csoportunkhoz, és oszd meg a véleményedet, tapasztalataidat!

Link másolása
KÖVESS MINKET: