Az Amazon-felhő leállása megmutatta, mennyire kiszolgáltatottá vált a globális infrastruktúra néhány amerikai óriáscégnek
Az Amazon Web Services (AWS) október 20-i leállása jelentős és ijesztő üzemzavarként marad meg az emlékezetünkben. Nem, nem azért, mert néhány órán át nem működtek bizonyos szolgáltatások, hanem azért, mert az eset rávilágít, mennyire sebezhető az online adatforgalom, ami kvázi a világgazdaság fundamentuma.
Az Egyesült Államok keleti régiójában, Észak-Virginiában beállt üzemzavar hatással volt a globális internetre, és a felhőszolgáltatás kimaradása akár órákra megbénított számos nagy online platformot, köztük a Snapchatet, a McDonald’s appot, az Apple TV-t, a Prime Videót, az HBO Maxot, a Tindert és olyan népszerű, milliók által használt játékszervereket, amelyek a Robloxot, a Fortnite-ot vagy a PUBG-t tartják működésben.
A veterán internetezők elsőre megmosolyoghatták a dolgot: többen túlélték már, ha néhány órára elszállt a videojáték vagy a streaming, de talán elmúlt a humorérzékük, amikor kijött a bedőlt online szolgáltatások teljes listája, rajta banki, tömegközlekedési és egészségügyi szolgáltatásokkal, illetve már olyan nevekkel, mint a ChatGPT, a Perplexity AI, és főleg a banki adatokat kezelő, illetve tranzakciókat is bonyolító Alexa AI-asszisztens, Amazon webáruház, Venmo mobilfizetési szolgáltató és Coinbase kriptovaluta-tőzsde.
A The Guardian szerint az AWS-re épülő online rendszerek sokasága vált elérhetetlenné vagy kezdett el akadozni a kimaradás idején: a hírek szerint több mint 2000 vállalat és szolgáltatás élt át zavarokat, a teljes leállástól az akadozó működésig.
A fennakadás következtében emberek milliói szembesültek azzal, hogy alapvető online tevékenységek váltak elérhetetlenné: sokan nem tudtak mobilalkalmazásból repülőjáratot ellenőrizni, online fizetést indítani vagy banki ügyeket intézni, és számos munkahelyen a napi működés is leállt – sorolja a Reuters.
A jelenség ezen a ponton ugyan zavarba ejtő, ám jelentős káoszt nem okozott. Figyelmeztető jel viszont, hogy azon a szinten, mint amekkorát a felhőóriás AWS képvisel, egyetlen hibának is világszintű jelentősége van. Itt már nincs apró baki, mert egész egyszerűen túl nagy adatforgalom, túl sok szolgáltatás és felhasználó kapcsolódik egyetlen szolgáltatóhoz – amelyből ráadásul kifejezetten kevés van a világon.
| Felhőszolgáltató | Globális Felhőinfrastruktúra Piaci Részesedés (IaaS + PaaS) |
|---|---|
| Amazon Web Services (AWS) | kb. 31-33% |
| Microsoft Azure | kb. 21-24% |
| Google Cloud Platform (GCP) | kb. 10-12% |
| Alibaba Cloud | kb. 4-7% |
| Huawei Cloud | kb. 2-4% |
| Többi szereplő (IBM Cloud, Oracle stb.) | A fennmaradó rész |
Mi okozta az ijesztő üzemzavart? DNS-hiba és a mögöttes okok
Az AWS tájékoztatása szerint egy belső DNS-hiba indította el a láncreakciót. Azt írták, a domainnév-szerverek hibásan működtek, így a rendszer nem tudta a DynamoDB nevű adatbázis-szolgáltatás végpontjának domainnevét számítógépek által is olvasható IP-címmé alakítani.
Ez konyhanyelven annyit tesz, hogy amikor meglátogatunk egy weboldalt, például a szeretlekmagyarorszag.hu-t (ami az oldal domainneve), akkor a számítógépünk nem a domainnév alapján találja meg az adatokat (cikkeket, videókat, galériákat) a szerveren. A tartalomhoz vezető utat a számsorból álló IP-címek mutatják meg a számítógépünknek, ami „az internet telefonkönyvétől”, a DNS-től, vagyis Domainnév Rendszertől kérdezi meg, hogy mi a szeretlekmagyarorszag.hu IP-címe. A DNS megküldi a választ, így a böngészőnk már tudja is, hová küldje a kérést, és megjelenik az oldal.
De ha a DNS nem működik, akkor ez az alapvető folyamat sem tud lejátszódni. Az AWS-nél éppen ez történt a leállás idején: a számítógépek nem tudták, hova kapcsolódjanak, a DynamoDB-t használó szolgáltatások (pl. weboldalak, játékok, appok) nem tudtak adatot kérni vagy menteni, így a felhasználók rögtön érzékelték, hogy az oldalak és online alkalmazások nem töltődnek be.
Az elakadás miatt a régió szinte összes többi szolgáltatása is hibázni kezdett, és ennek következtében az internet jelentős része egyszerűen leállt: banki rendszerek, videojátékok, közösségi oldalak, kormányzati szolgáltatások dőltek a kardjukba. Ez elképesztően ijesztő – pláne, ha hozzávesszük, mennyire lassan reagáltak a problémára az AWS mérnökei.
Úgy tudni, a szakemberek 75 kínosan hosszú percig keresték a hiba forrását, mert akadozott a kommunikáció: azok a mérnökök, akik az AWS státuszoldalát figyelték, azt láthatták, hogy a rendszerrel „minden rendben”, miközben a háttérben fejlesztők százai küzdöttek a leállással.
A The Register elemzése felidézi: a vállalat már korábbi incidenseknél is elismerte, hogy nem megfelelően gyors és részletes a hibakommunikáció, de a jelek szerint ebben továbbra sincs érdemi előrelépés, ráadásul az ügyfelek javarészt tehetetlenül, tájékoztatás nélkül nézték végig, hogy a szolgáltatásuk tömegesen veszíti el a felhasználókat.
Kár volt leépíteni a rutinos szakembereket?
Az Amazon szerint egy technikai malőr – egy belső hálózati komponens hibája – állt az október 20-i leállás hátterében, ám a szakértői vélemények ennél összetettebb okokra is rávilágítanak. Corey Quinn szakújságíró például azt emelte ki, hogy az AWS csapatainál felhalmozott sokéves tapasztalat elengedhetetlen (lenne) az ilyen hibák gyors felismeréséhez és orvoslásához. Ezen a ponton persze felvetődik a kérdés, hogy hová tűntek azok a veterán mérnökök, akiket már legalább egyszer táncba vittek ehhez hasonló krízisek, így emlékeznek rá, hogy ha baj van, akkor melyik sarokban milyen – a hibától látszólag független – rendszert kell megpiszkálni.
A gyanú szerint az utóbbi években sok tapasztalt szakember hagyta el a céget, és magával vitte azt az elemi tudást, amivel az AWS óriási rendszereinek mély hibamintáit is gyorsan fel lehetne tárni. És ha ez a tapasztalat elvész a vállalatból, akkor rengeteg belső szakértelmet kell újra, a nulláról felépíteni.
Ezt támasztották alá a leállások kapcsán sokat kommentelő volt Amazon-dolgozók is, akik szerint a cég elhibázott módon próbálta visszakényszeríteni az irodába a home office-ban foglalkoztatott embereit, illetve sok, a bánásmód miatt csalódott, kiégett veterán inkább máshol helyezkedett el.
Bár a hiba bekövetkezését feltehetően nem a kisebb rutinnal rendelkező szakemberek okozták, teljesen biztosnak tűnik, hogy a leállást olcsóbban és rövidebb idő alatt is megúszhatták volna szolgáltatók ezrei és felhasználók milliói, ha az AWS jobban megbecsüli a veterán dolgozóit, ahelyett, hogy a tapasztalt, drágább csapatokat kisebb létszámú, olcsóbb, de kevésbé rutinos gárdákkal váltja fel.
„Az AWS mostani, elnyújtott leállása intő jel: a cég persze elszigetelt esetnek minősítheti a történteket, de ha a mérnöki gárdát kiüresítik, minden újabb hiba egyre valószínűbbé válik. A következő leállás már készülőben van – csak az a kérdés, melyik túlterhelt csapat botlik meg először” – fogalmaz a szerző.
Globális dominóhatás: az AWS-kiesés súlyos következményei
A mostani AWS-kimaradás rávilágított a modern internet sérülékenységére, hiszen egyetlen szolgáltató egyetlen régiójának hibája is globális fennakadásokat okozott. Jake Moore, az ESET európai kiberbiztonsági cég szakértője szerint az egész jól illusztrálja, mennyire függünk egy „relatíve törékeny infrastruktúrától”, és milyen sebezhető a világ összekapcsolt digitális szolgáltatási lánca. Hasonló véleményt fogalmazott meg Cori Crider, a Technológiai Jövő Intézet vezetője is: szerinte „nem hagyhatjuk”, hogy a kritikus infrastruktúránk továbbra is amerikai techóriások kegyétől függjön.
Az incidens valóban számos kritikus ágazatot érintett: az Egyesült Királyságban például több nagy bank (Lloyds, Halifax, Bank of Scotland) online rendszere akadt meg, üzletek és éttermek kényszerültek leállni (mert nem működtek a kártyás fizetések), és a kiesés sok helyen a hétköznapi életet is lassította vagy megállította, zömében internetalapú tömegközlekedési és fuvarozási rendszerek (buszok, vonatok, taxi- és fuvarappok), máshol pedig akár kórházi és sürgősségi rendszerek (pl. digitális betegnyilvántartások, laborvizsgálati eredmények) üzemzavara miatt.
Az AWS kiesése arra figyelmeztet, hogy a felhőpiac centralizáltsága túl kockázatos. Dave McCarthy, az IDC piackutató felhőszolgáltatásokért felelős vezetője a CBS Newsnak azt mondta, az eset „emlékeztetőül szolgál a hatalmas koncentrációs kockázatra, amit a globális gazdaság vállalt azzal, hogy mindössze néhány felhőóriásra építette digitális hátországát”.
Madeline Carr, a University College London professzora szerint nehéz vitatkozni a kritikákkal, amelyek szerint a globális internet túlságosan kevés cégre támaszkodik. Az ellenérv viszont az, hogy pont ezeknek a hiperméretű cégeknek van elegendő erőforrásuk ahhoz, hogy biztonságos és ellenálló globális szolgáltatásokat nyújtsanak – mégis „a legtöbb szakember úgy véli, hogy ez egy kockázatos helyzet a világ számára”.
Leállhat tartósan is az internet? A kockázatok és valószínűségük
Felmerül a kérdés: mekkora az esélye egy a mostaninál is súlyosabb, akár napokig tartó internetleállásnak, és mit okozhatna egy ilyen katasztrófa? A szakértők szerint a teljes globális internet összeomlása nem következne be egyik pillanatról a másikra. Maga az internethálózat ugyanis nem kapcsolható le egyetlen ponton: világszerte szerverfarmok, tenger alatti kábelek, műholdak és alternatív útvonalak bonyolult szövete biztosítja, hogy ha egy útvonal kiesik, akkor az adatok egy másik úton célba jussanak.
Elég baj viszont, hogy akár egy regionális felhőleállás is óriási zavart kelthet. Nem zárható ki, hogy a jövőben lesznek még hasonló vagy súlyosabb incidensek – például egy másik nagy felhőszolgáltató párhuzamos meghibásodása, vagy több kritikus régió egyidejű kiesése, amikor a helyreállítás meghaladhatja a „csupán” néhány órát, hiszen a hibajavítást egyszerre több fronton kell elvégezni.
Ennek a valószínűsége rendkívül kicsi, de nem nulla: a szakértők már évek óta figyelmeztetnek szándékos, globális léptékű kibertámadásra vagy extrém erősségű napkitörésre. Ezek bármelyike okozhat olyan fizikai károkat, amelyek nemhogy órákra, de napokra vagy akár hetekre is elnémíthatják a világhálót – figyelmeztet az Elite Group.
Az ilyen forgatókönyveket eddig jobbára a sci-fi kategóriába soroltuk, ám az AWS mostani incidense rávilágított, hogy a digitális infrastruktúránk sebezhetősége valós – és mintha minden nagyobb kiesés egy újabb figyelmeztető jelzést igyekezne a világ fejébe verni.
Milyen lenne internet nélkül egy napig, egy hétig, egy hónapig vagy még tovább?
A szakértői elemzések alapján egy tartós leállás következményei drámaiak lennének, és a helyzet súlyossága az idő előrehaladtával hatványozottan nőne.
Már egynapos globális internetleállás esetén is komoly fennakadásokkal szembesülne a világ. Az Economic Times által hivatkozott becslések szerint a 24 órás teljes kimaradás 43 milliárd dollár veszteséget jelentene a világgazdaságnak, és az élet szinte minden területén éreznénk a hatását.
Leállnának az elektronikus fizetési rendszerek (bankkártyás tranzakciók, online utalások), akadoznának a kommunikációs csatornák (internetes telefon- és üzenetküldő szolgáltatások), és nehézkessé válnának a létfontosságú közszolgáltatások is (mint az egészségügy, a közlekedés vagy az energiaellátás).
A Allconnect konkrét példát is hoz egy regionális incidens alapján: 2015-ben Arizonában vandálok rongáltak meg egy fő internetkábelt, és pár órára az egész államban megállt az élet – nem működtek a bankkártyák, bezártak a boltok, sőt csak rádióval és vészmegoldásokkal volt elérhető a 911-es segélyhívó is, így az emberek hirtelen rádöbbentek, mennyire elválaszthatatlan az internet a mindennapjaiktól.
Noha egy nap kiesés után az alapvető rendszerek valószínűleg helyreállnának, a kiesett adatok pótlása és a feldolgozatlan tranzakciók utólagos rendezése napokig terhelné és döcögőssé tenné a gazdaságot.
Egyhetes internetleállás esetén a hatások már jóval súlyosabbak lennének, és akár mély káoszba is lökhetnék a gazdaságot. A szállítási és ellátási láncok megszakadnának, és a társadalmi rend is meginogna. A BBC Science Focus elemzése arra jut, hogy minden bizonnyal zavargások törnének ki – ahogy azt az ilyen forgatókönyveket elemző tanulmányok is előrevetítik.
A pénzügyi piacok összeomlanának, hiszen egy hétig semmilyen tranzakció vagy banki művelet nem menne végbe elektronikus úton. A vállalatok jelentős része képtelen lenne működni, számos iparág termelése leállna vagy visszaesne. A kormányok valószínűleg vészhelyzeti intézkedéseket vezetnének be a közrend fenntartására és a legfontosabb szolgáltatások (így az élelmiszer- és üzemanyag-ellátás, egészségügyi szolgáltatás) biztosítására.
Ha a világháló egy teljes hónapra eltűnne, az példa nélküli krízist idézne elő a modern civilizációban. Az elemzések egy ilyen forgatókönyv esetén már a globális gazdaság megbénulását és újjászerveződését emlegetik. Néhány hét internet nélkül gyakorlatilag azt jelentené, hogy a mindennapi életünk alapjai szaladnak ki a lábunk alól: a készpénz utáni roham és a bankrendszer túlterheltsége miatt a pénzügyi rendszer manuális üzemmódba kényszerülne, de valószínűleg nem bírná a terhelést. Az ATM-ek nem működnének, a bankfiókok előtt hosszú sorok kígyóznának, majd hamarosan a banki szolgáltatások nagy része is összeomlana.
Mindeközben a globális tőzsdék aktivitása leállna; a kereskedelem alapvető mechanizmusai megbénulnának. Leállna a GPS-műholdhálózat és számos kommunikációs műhold is, hiszen internet híján a vezérlőrendszerek nagy része nem érhető el. Ezzel a légi közlekedés irányítása is ellehetetlenülne, a légitársaságok kénytelenek lennének tartósan a földre parancsolni a repülőgépeket.
Hálózat hiányában a vasúti és városi tömegközlekedési hálózatok is felmondanák a szolgálatot. A nagyvárosokban pánik és zűrzavar alakulna ki: az emberek többsége semmilyen friss információhoz nem jutna hagyományos (online) csatornákon, a 0-24 órás hírszolgáltatás megszűnne, az országok és közösségek elszigetelődnének egymástól, és a társadalmak csak nehezen tudnák újjászervezni magukat a megszokott kommunikációs eszközök nélkül.
Ez már messze nem csak technológiai probléma lenne, hanem humanitárius válság, amely akkor is további hónapokig tartó káoszt hagyna maga után, ha a hálózatot sikerülne újraindítani.
De mi van, ha ez nem történik meg, és jön egy tényleg tartós, többéves internetkiesés? Gyakorlatilag teljes a konszenzus abban, hogy ez példátlan változásokat hozna a történelemben. A világ, ahogyan eddig ismertük, megszűnne működni. Olyan alapvető globális újrarendeződés menne végbe, amihez képest a korábbi gazdasági válságok eltörpülnének.
Ha a világháló tartósan elsötétülne, a napjainkat uraló tech-óriások (Google, Microsoft, Amazon, Meta stb.) vagy drasztikusan összezsugorodnának, vagy teljesen megszűnnének, így a világgazdaságnak gyökeresen át kellene alakulnia.
A mindennapi életünk évtizedeket repülne vissza az időben – ám most a modern kori népességgel, amely teljesen rászokott a digitális kényelmi megoldásokra. Mintha egyik napról a másikra az 1980-as években találnánk magunkat, de úgy, hogy közben a társadalom nem készült fel erre a váltásra.
Egy ilyen helyzetben a modern civilizáció alapjai rendülnének meg. A globalizáció azonnal visszafordulna: az országok és közösségek csak helyi szinten tudnák újraszervezni a gazdasági és társadalmi működést, a nemzetközi együttműködés minimálisra csökkenne. A digitális kor vívmányai nélkül maradt emberiség kénytelen lenne hagyományos módszerekhez nyúlni – a cégek visszatérnének a papír alapú adminisztrációhoz és postai levelezéshez, a bankoknak ismét papíron kellene vezetniük a számlákat, a hírek pedig csak nyomtatott sajtón vagy rádión keresztül terjedhetnének.
A szakértők szerint ez a forgatókönyv maga lenne a globális rémálom – a modern világ „lekapcsolásának” hatásait szinte lehetetlen megjósolni, de az biztos, hogy civilizációnk ezzel egy egészen új korszakba lépne, amelyben az eddig megszokott életünk gyorsan és gyökeresen megváltozna.