https://pepelac.news/ja/posts/id11901-cloudflareda-gui-mo-zhang-hai-nozhen-xiang-1tsunoshe-ding-misugaxyaopenaiwozhi-metali-you-toshi-xi-lie-denofu-jiu-noquan-mao
Cloudflare大規模障害の真相:1つの設定ミスがXやOpenAIを止めた理由と時系列での復旧の全貌
Cloudflare障害はなぜ起きたのか:設定ファイル膨張と復旧の全記録
Cloudflare大規模障害の真相:1つの設定ミスがXやOpenAIを止めた理由と時系列での復旧の全貌
11月18日のCloudflare大規模インターネット障害は、設定変更でfunctions fileが肥大化し全網に配布されたのが原因。XやOpenAIなど主要サービスが停止。サイバー攻撃ではなく、時系列の解析と復旧手順を解説。影響範囲やCloudflareの謝罪、教訓もまとめます。復旧までのタイムラインも掲載。
2025-11-20T17:24:19+03:00
2025-11-20T17:24:19+03:00
2025-11-20T17:24:19+03:00
11月18日に起きた広範なインターネット障害は、Cloudflareのサーバー上にあった正しく構成されていない1つのファイルに行き着いた。そのサイズが思いがけず倍に膨らみ、技術的な故障が連鎖。XやOpenAI、マクドナルドの一部部門を含む主要なウェブサービスが相次いでオフラインになった。Cloudflareは正式に謝罪し、共同創業者のマシュー・プリンス氏はブログで、エンジニアは当初サイバー攻撃を疑っていたと説明した。同じ日にMicrosoftが大規模なDDoS攻撃を報告していた事情も影響したが、のちに原因は設定の誤りだと判明している。たった1つのファイルがこれほどの混乱を引き起こすという現実は、現代のインフラがいかに密に結び付いているかを雄弁に物語る。プリンス氏によれば、今回の障害はサイバー攻撃や悪意のある活動による直接的・間接的なものではなかった。発端は、同社のデータベースシステムの一つで実施したアクセス権限の変更だ。これが引き金となり、Cloudflareのボット管理システムが用いる「functions file」にデータベースから複数のエントリが出力され、ファイルは結果的に倍の大きさになった。そのファイルがネットワーク全体のマシンへ一斉に配布されたことで、問題は一気に広がった。偶発的に見えても、結合度の高い仕組みでは小さな設定差分が大きな揺らぎとなる。当該ファイルがアップロードされたのはUTC11時05分。だが最初の不具合が現れたのは23分後だった。配布が進むにつれてエラーはネットワークに波及し、13時ごろにピークを迎える。エンジニアは14時30分に問題を突き止めて修正し、17時06分にはサービスが通常運用に戻った。時系列でたどると、設定変更の波紋は瞬時に広がる一方、収束には時間を要することが見て取れる。
Cloudflare, インターネット障害, 設定ミス, functions file, X, OpenAI, マクドナルド, DDoS, サイバー攻撃ではない, 復旧手順, 時系列, ボット管理, データベース, 影響範囲, 障害原因, 11月18日
2025
news
Cloudflare障害はなぜ起きたのか:設定ファイル膨張と復旧の全記録
11月18日のCloudflare大規模インターネット障害は、設定変更でfunctions fileが肥大化し全網に配布されたのが原因。XやOpenAIなど主要サービスが停止。サイバー攻撃ではなく、時系列の解析と復旧手順を解説。影響範囲やCloudflareの謝罪、教訓もまとめます。復旧までのタイムラインも掲載。
11月18日に起きた広範なインターネット障害は、Cloudflareのサーバー上にあった正しく構成されていない1つのファイルに行き着いた。そのサイズが思いがけず倍に膨らみ、技術的な故障が連鎖。XやOpenAI、マクドナルドの一部部門を含む主要なウェブサービスが相次いでオフラインになった。Cloudflareは正式に謝罪し、共同創業者のマシュー・プリンス氏はブログで、エンジニアは当初サイバー攻撃を疑っていたと説明した。同じ日にMicrosoftが大規模なDDoS攻撃を報告していた事情も影響したが、のちに原因は設定の誤りだと判明している。たった1つのファイルがこれほどの混乱を引き起こすという現実は、現代のインフラがいかに密に結び付いているかを雄弁に物語る。
プリンス氏によれば、今回の障害はサイバー攻撃や悪意のある活動による直接的・間接的なものではなかった。発端は、同社のデータベースシステムの一つで実施したアクセス権限の変更だ。これが引き金となり、Cloudflareのボット管理システムが用いる「functions file」にデータベースから複数のエントリが出力され、ファイルは結果的に倍の大きさになった。そのファイルがネットワーク全体のマシンへ一斉に配布されたことで、問題は一気に広がった。偶発的に見えても、結合度の高い仕組みでは小さな設定差分が大きな揺らぎとなる。
当該ファイルがアップロードされたのはUTC11時05分。だが最初の不具合が現れたのは23分後だった。配布が進むにつれてエラーはネットワークに波及し、13時ごろにピークを迎える。エンジニアは14時30分に問題を突き止めて修正し、17時06分にはサービスが通常運用に戻った。時系列でたどると、設定変更の波紋は瞬時に広がる一方、収束には時間を要することが見て取れる。