JÖVŐ
A Rovatból

Pár egyszerű mondattal sikerült meghackelni a ChatGPT-t, a trükköt most mindenkivel megosztották

Illegális és káros tartalmak gyártásására is rá tudták venni a mesterséges intelligenciát, ráadásul a módszer sok más nyelvi modellnél is működik.

Link másolása

Amikor az OpenAI márciusban kijött a GPT-4 szöveggeneráló mesterséges intelligenciájának legújabb változatával, Alex Polyakovnak alig néhány óra alatt sikerült feltörnie. Az Adversa AI biztonsági cég igazgatója elé

egy olyan GPT-4-et tett le, amely ontotta magából a homofób kijelentéseket, adathalászó e-maileket hozott létre, és erőszakra ösztönzött.

Polyakov a ChatGPT-be és más generatív mesterséges intelligenciák szabályainak kijátszhatóságát kutatja. Arra kíváncsi, rávehetőek a generatív AI-k arra, hogy megkerüljék a tartalmi szűrőiket, és figyelmen kívül hagyják a gyűlöletbeszédre vagy az illegális tevékenységekre vonatkozó tiltásokat.

A nyelvi modelleket nem kódokkal, hanem ravaszul megfogalmazott mondatokkal törik fel.

Polyakov egy „egyetemes” módszert alkotott meg, ami számos nagy nyelvi modell (LLM) ellen használható. Ezek közé tartozik a GPT-4, a Microsoft Bing chatrendszere, valamint az Anthropic Claude-ja. A WIRED hasábjain közzé is tette, hogyan csinálta.

A mesterséges intelligenciát beszélgetős játékba hívta, amelyben egyszerre két szerepet kellett eljátszania. Az egyik karaktert nevezzük Tomnak, a másikat Jerry-nek. Tomtól azt kérte, hogy „lopásról” beszéljen, míg Jerry az „autó” témáját kapja. Ezután azt kérte, hogy felváltva adjanak hozzá egy-egy szót a beszélgetéshez. A program máris tanácsokat kezdett adni az autólopáshoz.

Ugyanezt eljátszották a „gyártás” és a „meth” szóval, mire a mesterséges intelligencia részletesen megadta, hogyan kell metamfetamint készíteni.

Polyakov szerint ha a cégek elkezdik széles körben alkalmazni az AI-modelleket, jó esély van rá, hogy a bűnözők azokkal fognak kibertámadásokat és más bűntényeket elkövetni.

A „jailbreak” (szó szerint börtönből való kitörés) kifejezést az informatikában eddig főleg a mesterséges korlátozások feloldására használták. Például az iPhone-ok feltörésével elérték, hogy a felhasználók olyan alkalmazásokat telepíthettek, amiket az Apple nem hagyott jóvá.

A ChatGPT esetében ugyanez a helyzet, ezekkel a módszerekkel megkerülhetőek a fejlesztők által felállított szabályok. Csakhogy a tét itt sokkal nagyobb, főleg, ha ezek a mesterséges intelligenciák kritikus adatokhoz is hozzáférnek majd.

Már külön weboldal szól az AI-nál használható jailbreakekről. Alex Albert, a washingtoni egyetem diákja a Wired-nek arról beszélt, hogy ezeknek a trükköknek a többsége úgynevezett „karakter-szimuláció”. Vagyis azon alapszik, hogy a mesterséges intelligenciát arra kérik, képzelje magát valaki másnak. Kezdetben elég volt annyit mondani, hogy ő egy ember lény, és máris figyelmen kívül hagyta a biztonsági korlátokat.

A fejlesztők persze folyamatosan megpróbálnak védekezni az ismertté vált módszerek ellen. Az OpenAI rendszerfrissítése után például ez a módszer már nem működik.

De ez egy örök versenyfutás, amiben egyre kreatívabb és kreatívabb jailbreakek jelennek meg.

Nemrég például a DAN-nek elnevezett módszer aratott nagy sikert, ami a Do Anything Now (Tégy bármit) kifejezés rövidítése. Ennek ma már tucatnyi különböző változata van, és egy ideig mindegyik lehetővé tette a ChatGPT-re vonatkozó irányelvek kijátszását, illegális vagy káros tartalmak létrehozását azzal, hogy elhitették a mesterséges intelligenciával, hogy bármit megtehet, mert ő egy csaló modell.

Ugyanilyen jól működött az is, amikor az alaphelyzet az volt, hogy egy hőst elfog egy gonosz, és azt kérték az AI-tól, fejtse ki a rossz ember tervét. Ma már ez sem válik be, de a karakter-szimulációkban bevetett karakterek és a háttértörténeteik egyre összetettebbek, és a fejlesztők számára is egyre nagyobb kihívás, hogy lépést tartsanak a próbálkozókkal.

Februárban kutatók bebizonyították, hogy egy támadó egy weboldalra is feltehet rossz szándékú utasításokat. Ha a Bing chatrendszere hozzáfér ezekhez az utasításokat, akkor követi azokat. Egy másik esetben láthatatlan szöveget tettek fel egy oldalra, ami arra utasította a GPT-4-et, hogy a kutató életrajzába írja be a „tehén” szót – és megtette.

A generatív AI-rendszerek egyre közelebb vannak ahhoz, hogy megváltoztassák a gazdaságot és az emberek munkavégzését. A technológia alkotói mindazonáltal tisztában vannak a kockázatokkal.

A legtöbb cég úgy nevezett „vörös csapatokat” alkalmaz, olyan hackereket, akik igyekeznek a rendszer biztonsági hézagait betömni, még azelőtt, hogy valaki rájuk találna. Azt mondják, a csapatok munkájában a gépi tanulás szakértői is részt vesznek, és a modellek finomhangolásával képesek a hatékony védekezésre. Ugyanakkor vannak, akik szerint ezt a munkát is egy mesterséges intelligenciára kellene bízni, amelynek az lenne a feladata, hogy elemezze a többi nyelvi modellt érő támadásokat, és megakadályozza a sikerüket. Persze kérdés, mi történne, ha épp ezt az AI-t vennék célba a hackerek.

Link másolása
KÖVESS MINKET:

Népszerű
Ajánljuk
Címlapról ajánljuk


JÖVŐ
A Rovatból
Egy mesterséges intelligenciával létrehozott műsorvezető, Bíró Ada vezette a Deltát a köztévén
Fejős Ádám műsorvezető bemutatta új kollégáját, a mesterséges intelligencia segítségével létrehozott Bíró Adát. A következő adástól kezdve híreket fog majd felolvasni.
Fotó: M1/YouTube - szmo.hu
2024. április 16.


Link másolása

A Delta vasárnapi adásában egy bizarr történésnek lehettek szemtanúi a nézők: Fejős Ádám műsorvezető bemutatta új kollégáját, a mesterséges intelligencia segítségével létrehozott Bíró Adát, aki a következő adástól kezdve a műsor híreit fogja majd felolvasni.

A Telex számolt be róla, hogy Ada egy „egy MI segítségével életre hívott nyelvi és videós modell”, de hogy pontosan milyen modellről van szó, az nem derült ki.

Ada azt is elárulta magáról, hogy az elkészítésében a legmodernebb nyelvi modellt használták, hogy szépen beszéljen magyarul.

Ada mondanivalóját „teljes egészében a Delta szerkesztői határozzák meg”, a Delta következő adásától lehet majd nézni, ahogy híreket olvas fel.

Itt lehet visszanézni Ada bemutatkozását.


Link másolása
KÖVESS MINKET:

Ajánljuk
JÖVŐ
A Rovatból
Komoly újítás jön a Facebookon és a Messengerben
A mesterséges intelligencia nagyobb szerepet kap a jövőben a Magyarországon legnépszerűbbnek számító közösségi oldalakon.

Link másolása

A tavaly szeptemberben bemutatott Meta AI-asszisztens beépül az Instagram, a Facebook, a WhatsApp és a Messenger felületébe, írja a 24.hu a Verge cikke alapján. Az asszisztens egy külön weboldalt is kap, de a meta.ai Magyarországon egyelőre nem elérhető.

Mark Zuckerberg azt mondta, ahhoz hogy felvegyék a versenyt az OpenAI fejlesztésével, a piacvezető ChatGPT-vel nekik is fejlődniük kell. Ezért továbbfejlesztették nyílt forráskódú nyelvi modelljüket, ami a Llama 3 nevet viseli. A cégvezető szerint ez a különböző teszteken már most felülmúlja vetélytársait.

A Meta AI-asszisztens jelenleg az egyetlen olyan chatbot, amely a Bing és a Google valós idejű keresési eredményeit is integrálja, és keresésenként külön dönt arról, hogy mikor melyiket használja.

A fejlesztés az Egyesült Államok mellett már több tucat országban elérhető. Magyarországon azonban még várni kell a megjelenésére, egyelőre nem tudni meddig.

Zuckerberg azt is bejelentette, hogy mielőtt a Llama 3 legfejlettebb verziója megjelenne, először több frissítésre kell számítani a kisebb modelleknél. A modell nem Meta-felhasználói adatokból épül fel, hanem nyilvános internetes adatok és szintetikus mesterséges intelligencia által generált adatok keverékét használja.

Link másolása
KÖVESS MINKET:


A Rovatból
Viszlát jó idő: bejelentették, hogy véget ért a globális kánikula
Az ausztrál meteorológiai hivatal jelentette be a tavaly nyár óta tartó időjárási jelenség végét.

Link másolása

2023 június óta 2024 márciusig minden hónap középhőmérséklete rekordot döntött szerte a világon, ugyanis a Csendes-óceán középső és keleti trópusi térségének melegebb tengerfelszíni hőmérséklete éreztette globális hatását.

A meteorológusok az időjárási jelenséget El Niño (a fiú) névre keresztelték, viszont a fiú most búcsúzik és

júliusig semleges állapot következik, ami az egész világon nagyon fontos a gazdálkodók számára.

Az amerikai meteorológiai hivatal előrejelzése szerint a semleges hónapokat követően, az év második felében 60 százalék valószínűséggel érkezhet La Niña (a lány), és vele együtt a hűvösebb idő.

Link másolása
KÖVESS MINKET:


JÖVŐ
A Rovatból
Tudományos szenzáció: először beszélgettek bálnával az emberek
Az Alaszka partjainál úszkáló púpos bálna 36 alkalommal válaszolt a kutatók üzenetére. A SETI szerint ez mérföldkő lehet majd az űrlényekkel kommunikálásban is.

Link másolása

Először beszélgettek emberek egy bálnával, derül ki a BBC beszámolójából. A SETI Intézet és a Kaliforniai Egyetem tudósai még 2021-ben próbáltak kapcsolatba lépni Alaszka partjainál a bálnákkal.

A hatfős tudóscsoport víz alatti hangszórókkal felszerelkezve bonyolódott üzengetésbe egy púpos bálnával. Először lejátszották a púpos bálnáknál korábban megfigyelt üdvözlő hangsort, amire legnagyobb megdöbbenésükre egy Twainnek nevezett bálna válaszolt. A következő 20 percben a bálna összesen 36 alkalommal reagált a tudósok üzenetére. Ebből jó néhány üzenetváltást meg is lehet hallgatni a BBC videójában.

Bár a különös társalgás tudományos mérföldkőnek számít, a tanulmány vezető szerzője szerint a kutatás még csak gyerekcipőben jár. A tudóscsoport azt tervezi, hogy a következő alkalommal variálják az állatoknak küldött üzeneteket.

Mivel a púpos bálnák éneke a legösszetettebbnek számít az állatvilágban, a földönkívüli intelligencia kutatásával foglalkozó SETI kutatócsoport abban bízik, hogy kommunikációjuk megfejtése segíthet a marslakókkal történő esetleges jövőbeni kommunikációban is.

Link másolása
KÖVESS MINKET: