Cloudflare執行長Matthew Prince針對近期造成眾多網站離線的大規模服務中斷事件做出說明,表示雖然初期懷疑是遭受DDoS攻擊,但在後續釐清則確認是內部誤判,強調此次事故並非由任何網路攻擊或惡意活動造成,而是來自於內部資料庫系統權限的變更,導致其「機器人管理」 (Bot Management)系統所使用關鍵檔案發生錯誤。
配置檔大小變動觸發錯誤,導致HTTP 5xx情形
Matthew Prince針在官方部落格詳細解釋了技術細節,指出Cloudflare的機器人管理系統使用機器學習模型來為網路請求進行評分,藉此判斷其是否為自動化機器人 。該模型依賴一個每幾分鐘就會更新一次的「特徵」配置檔。
而稍早發生問題,則是由於底層生成機制的變更,導致了該配置檔的大小發生變化,進而觸發了系統錯誤。Matthew Prince表示:「結果導致負責處理客戶流量的核心代理系統,針對任何依賴機器人模組的流量,回傳了HTTP 5xx錯誤碼。」
On November 18 Cloudflare experienced a service outage, triggered by an issue with a Bot Management feature, impacting multiple Cloudflare services. Here's a detailed breakdown of what happened. https://t.co/7WArlr5ghI
— Cloudflare (@Cloudflare) November 18, 2025
2019 年來最嚴重事故,影響核心流量
這起事件被Cloudflare視為多年來最嚴重的服務中斷。官方表示,自2019年以來,該公司未曾發生過導致「大部分核心流量停止流經其網路」的事故。Matthew Prince也代表團隊對此次問題表達歉意。
報導也補充,Cloudflare的機器人評分機制對於客戶而言至關重要,常被用於決定是否阻擋特定機器人存取網站,例如阻擋AI公司抓取內容來訓練大型語言模型 (LLM) 。Cloudflare也在今年7月推出了相關的「付費抓取」 (pay per crawl)實驗計畫。
