Cloudflare障害はなぜ起きたのか:設定ファイル膨張と復旧の全記録

Danny Weber

17:24 20-11-2025

© Pepelac News

11月18日のCloudflare大規模インターネット障害は、設定変更でfunctions fileが肥大化し全網に配布されたのが原因。XやOpenAIなど主要サービスが停止。サイバー攻撃ではなく、時系列の解析と復旧手順を解説。影響範囲やCloudflareの謝罪、教訓もまとめます。復旧までのタイムラインも掲載。

11月18日に起きた広範なインターネット障害は、Cloudflareのサーバー上にあった正しく構成されていない1つのファイルに行き着いた。そのサイズが思いがけず倍に膨らみ、技術的な故障が連鎖。XやOpenAI、マクドナルドの一部部門を含む主要なウェブサービスが相次いでオフラインになった。Cloudflareは正式に謝罪し、共同創業者のマシュー・プリンス氏はブログで、エンジニアは当初サイバー攻撃を疑っていたと説明した。同じ日にMicrosoftが大規模なDDoS攻撃を報告していた事情も影響したが、のちに原因は設定の誤りだと判明している。たった1つのファイルがこれほどの混乱を引き起こすという現実は、現代のインフラがいかに密に結び付いているかを雄弁に物語る。

プリンス氏によれば、今回の障害はサイバー攻撃や悪意のある活動による直接的・間接的なものではなかった。発端は、同社のデータベースシステムの一つで実施したアクセス権限の変更だ。これが引き金となり、Cloudflareのボット管理システムが用いる「functions file」にデータベースから複数のエントリが出力され、ファイルは結果的に倍の大きさになった。そのファイルがネットワーク全体のマシンへ一斉に配布されたことで、問題は一気に広がった。偶発的に見えても、結合度の高い仕組みでは小さな設定差分が大きな揺らぎとなる。

当該ファイルがアップロードされたのはUTC11時05分。だが最初の不具合が現れたのは23分後だった。配布が進むにつれてエラーはネットワークに波及し、13時ごろにピークを迎える。エンジニアは14時30分に問題を突き止めて修正し、17時06分にはサービスが通常運用に戻った。時系列でたどると、設定変更の波紋は瞬時に広がる一方、収束には時間を要することが見て取れる。