Egy elírás miatt állt le a fél internet
Önt is bosszantja, amikor egy Index-cikkben megakad a szeme egy elgépelt betűn? Na most képzelje el, hogy nem az ön olvasási élményét akasztja meg egy ilyen kellemetlen hiba, hanem a fél internetet. Nagyjából ez történt, amikor kedden az Amazon bukdácsolása miatt a fél internet akadozott – írja a Verge.
Ahogy mi is megírtuk, kedden egy rakás népszerű netes szolgáltatás elérhetetlenné vált, mert valami gond volt az internet infrastruktúrájának jelentős részét biztosító Amazon szerverszolgáltatásával, az S3-mal. A világ rendje valamivel több mint négy órával később állt csak helyre. Az Amazon végre elárulta, mi is történt.
Kedd reggel az S3 csapatának néhány tagja épp a számlázási rendszer hibáit javítgatta, ennek részeként néhány szervert le kellett kapcsolniuk a hálózatról. Ezt önmagában senki meg se érezte volna, de valamelyik alkalmazott egyszerűen rosszul írt be egy parancsot, ezért véletlenül a szükségesnél több szerver állt le, köztük ráadásul olyanok, amelyek két további S3-alrendszert működtettek. És ezzel borult a dominó, több másik amazonos szolgáltatás is leállt. A helyreállításhoz teljes újraindításra volt szükség, ami az ilyen szervereknél kicsit bonyolultabb művelet, mint egy házi laptopnál.
Az Amazon válaszul bejelentette, hogy változtatásokat fognak végrehajtani, hogy gyorsabban helyreálljon a rendszer hasonló hibák után. És persze egyáltalán a hasonló hibák előfordulását is igyekeznek elkerülni, például azzal, hogy a jövőben nem lehet majd csak úgy lekapcsolni egy szervert, ha az valamilyen alrendszer működését veszélyeztetné.