Kedden, helyi idő szerint kora délután (magyar idő szerint késő este) nagyjából két órára elérhetetlenné vált a Google népszerű levelezőszolgáltatása, a Gmail. 150 millió felhasználó nem tudta elérni a levelezését, ami főleg Amerikában okozott gondokat, mivel ott éppen a munkaidő közepe volt, és egyébként is elterjedtebb a Gmail üzleti felhasználóknak szánt verziója a céges levelezés megoldására.
Ironikus módon a leállást éppen azok a változások okozták, amiket a Google a forgalmat irányító routereknél vezetett be nemrég, hogy növelje a rendszer stabilitását. A probléma egy rutinszerű szerverkarbantartással indult: a Gmailt kiszolgáló gépek egy részét lehúzták a hálózatról, hogy a feleslegessé vált ideiglenes fájlokat töröljék, defragmentálják a merevlemezeket és hasonlók – ilyet rendszeresen végeznek minden nagyobb szerverparkon.
A forgalomátirányító rendszer az éppen karbantartás alatt álló szerverekről másikokra terelte a beérkező lekérdezéseket. Néhány szerver túlterhelődött, és az új rendszer ilyenkor automatikusan eltereli azokról is a forgalmat, mielőtt még a felhasználók a problémát a levelezés lelassulásának képében észrevennék. A jelenség egyre több szervert ért el (valószínűleg rosszul volt beállítva az a szint, ahol túlterheltnek érzi magát egy router, és nem fogad több lekérdezést), és nagyjából délután fél egy körül az egész Gmail összeomlott. A rendszert fél háromkor sikerült újraindítani.
A levelező azóta gond nélkül megy, valószínűleg az egész új forgalomirányító rendszert kikapcsolták, míg nem sikerül úgy finomhangolni, hogy pár szerver kiesése ne okozzon ilyen láncreakciót. A Google illetékese, Ben Treynor sűrű bocsánatkérések közepette nem felejtette el megemlíteni, hogy a Gmail rendelkezésre állása továbbra is 99,9 százalékos.
A Gmail felhasználói legutóbb februárban, és márciusban élhettek át ehhez hasonló világszintű összeomlást.