Jak jediný soubor způsobil výpadek Cloudflare a ochromil X, OpenAI i části McDonald’s

18. listopadu ochromil internet rozsáhlý výpadek, který se nakonec ukázal jako důsledek jediného chybně vytvořeného souboru na serverech Cloudflare. Když jeho velikost nečekaně narostla na dvojnásobek, spustilo to řetěz technických selhání a vyřadilo z provozu několik velkých webových služeb, včetně X, OpenAI a dokonce některých divizí McDonald’s. Cloudflare se formálně omluvil a spoluzakladatel Matthew Prince v blogovém příspěvku uvedl, že inženýři zpočátku zvažovali kyberútok — zvlášť poté, co Microsoft ve stejný den hlásil rozsáhlý DDoS — avšak příčinou se později ukázala konfigurační chyba. Že jediný soubor dokázal vyvolat tak rozsáhlé narušení, je střízlivou připomínkou, jak těsně propojená dnešní infrastruktura je.

Prince vysvětlil, že incident nevznikl přímo ani nepřímo v důsledku útoku či jiné škodlivé aktivity. Spustila ho změna přístupových oprávnění v jednom z databázových systémů, kvůli níž databáze zapsala více položek do „functions file“, souboru využívaného systémem Cloudflare pro správu botů. Soubor se tím zdvojnásobil a následně byl rozdistribuován na všechny stroje v síti.

Soubor byl nahrán v 11:05 UTC, ale první potíže se objevily až o 23 minut později. Jak se změna šířila, chyba se rozlézala napříč sítí a kulminovala kolem 13:00. Inženýři problém identifikovali a opravili ve 14:30 a v 17:06 UTC se služby vrátily do normálu. Časová osa ukazuje, jak rychle se drobná konfigurační změna může rozprostřít celou sítí — a jak dlouho pak trvá, než se vše vrátí do zaběhnutých kolejí.