You are currently viewing AWS 當機 15 小時啟示錄:「數位韌性」對資安防護的重要性

AWS 當機 15 小時啟示錄:「數位韌性」對資安防護的重要性

AWS 15 小時全球系統大當機,您也受到影響了嗎?2025 年 10 月 20 日,全球雲端服務供應商 AWS,其核心網路層與 DNS 管理系統出現自動化腳本邏輯判定失誤,造成自 2024 CrowdStrike 藍屏事件以來,全球規模最大的網路中斷。據統計,本次故障影響範圍涵蓋全球超過 35% 的網路流量,總共波及 60 多個國家,以及 3,500 家以上企業受到影響,在故障期間收到超過 1,700 萬份的用戶通報,全球經濟損失估計達上億美元。

本次事件並非單一連線中斷,而是典型的連鎖效應,若全球多數企業皆將核心系統與核心業務的資料一同放在關鍵節點上,恐會因一個微小的設定或程序錯誤,造成世界級的系統崩潰。鼎新資安建議企業從事件中汲取相關經驗,立即著手檢視自身雲端架構及應用服務,乃至於整個資訊架構,強化智慧即時監控、備援機制與災難應變程序,以分散風險、集中管理的策略,降低資安風險的連鎖效應。

為什麼數位韌性很重要?帶您釐清 2025 年 AWS 當機事件的主因

回顧此次全球性雲端災難,與過往局部區域的故障截然不同,不僅導致網頁服務中斷,更引發供應鏈斷鏈、即時交易虧損及資料毀損等災情,甚至波及依賴雲端控制的物聯網設備,顯現了現代雲端架構中高度相依的脆弱性。受其影響的企業們將意識到,過度信任單一基礎設施恐導致風險過度集中,直接衝擊商業運作核心。

究竟發生了什麼事?是 AWS 雲端系統的漏洞嗎?

AWS 15 小時大當機,在在挑戰企業的數位韌性
AWS 15 小時大當機,在在挑戰企業的數位韌性
  • 核心服務 DNS 解析異常:
    本次事件的導火線源自於 DNS 路由的自動化更新配置錯誤,致使內部服務無法正確解析彼此位址,造成系統內部通訊全面中斷。
  • 連鎖效應擴散:
    多數系統服務架構仰賴域名解析,如應用層需解析資料庫端點,而 DNS 服務異常失去定位連結,其影響迅速擴散並轉化為應用層的全面癱瘓,以致系統陷入邏輯死結。
  • 節點壓力與資源耗盡:
    當基礎資料庫回應延遲時,上層應用未能及時啟動中斷機制,反而發起大量重試請求,導致流量過載而癱瘓。

AWS 數位韌性不足?是否要改用其他雲端服務商?

儘管本次雲端中斷事件證實了即便是大型雲端服務商,也可能因為一次系統錯誤,造成全球性的服務停擺,引發企業對於風險過度集中的擔憂,並開始評估是否更換雲端服務商,以確保營運持續。

然而實務上,大型雲端服務商發生此等規模的中斷事件機率極低,像 AWS 上一次當機是在 2021 年,且市場上能提供與 AWS 同等規模、全球覆蓋率及服務深度的供應商寥寥無幾。若僅因單一事件就貿然遷移至其他服務商,未必契合自身業務性質和系統架構,可能會衍生更多整合問題及漏洞風險。在此建議企業藉此契機重新審視最適化的雲端策略,以減少自家企業的營運風險。

  • AWS:具備強大運算能力與完整生態系,適用於需高算力支撐核心業務的企業。
  • Azure:企業級整合能力優異,特別適合深度依賴 Windows AD、Office 365 等微軟生態系,需進行跨域系統整合的企業。
  • GCP:在人工智慧與數據分析領域具備優勢,適合需導入 AI 工具及大數據模型,以輔助創新營運的企業。
依需求選擇雲端服務供應商提升數位韌性(圖片由Freepik提供)
依需求選擇雲端服務供應商提升數位韌性(圖片由Freepik提供)

當機 15 小時 vs. 數位韌性!企業可藉由 AWS 事件了解 3 件事

  • 資安事件不限於惡意攻擊:
    傳統資安側重於防禦駭客及惡意攻擊,然而本次事件起因為內部配置錯誤或軟體邏輯漏洞,其造成的營運中斷損失甚於外部攻擊。
  • 集中化結構的系統性風險:
    雲端集中化雖提升效率,但過度依賴單一區域或服務,容易導致單點故障的重大影響,將使企業在供應商發生異常時缺乏應變能力。
  • 自動化需搭配人為監督:
    系統自動化乃至 AI 驅動為時下趨勢,卻可能因為系統穩定性不足,未能在全自動化流程中搭配人為監督機制,導致無法及時阻斷錯誤的系統邏輯,反而加速災難擴散。

AWS 當機事件中獲得的 3 大關鍵反思,顯示數位韌性的重要性

這場長達 15 小時的服務中斷,是近年來全球科技產業所遭遇最為嚴峻的一次資安事件,包含 Snapchat、Canva 在內的眾多社群網站及系統應用服務,大至企業、小至個人用戶皆蒙受巨大衝擊。

企業必須認清無遠弗屆的網際網路中,風險無所不在,且往往來自我們最信任的基礎設施,所以真正的安全,不是祈禱資安事件不再發生,而是當風暴來臨時,您的企業具備數位韌性,擁有比競爭對手更強的生存與復原能力。

應降低核心系統之於關鍵應用的依存性,緩解單點故障的衝擊

本次事件顯現了一大問題,即使應用服務分散部署,但受到 AWS 之單點故障的影響,將導致核心節點失效,周邊服務同步癱瘓,形成全球性的連線中斷事件。

建議企業定期盤點資訊資產,辨別核心業務及核心系統,降低系統應用、資料與基礎架構間的相依性,確保在局部故障發生時,系統仍具備基本運作的能力,緩減單點故障的營運衝擊。

風險集中化會擴大營運衝擊,應分散風險以阻斷供應鏈骨牌效應

效率的集中化反映出全球網路基礎設施的內在矛盾,其往往伴隨風險全面化,形成供應鏈的骨牌效應,即使是看似微小的單點故障,也將會擴大影響企業 CRM、ERP、訂單金流等系統。未來,網際網路勢必著重提升營運韌性,可評估採用多元或混合架構,以「分散即安全」的概念鞏固核心業務及系統安全。

提升數位韌性的關鍵是分散風險,避免風險集中化(圖片由Freepik提供)
提升數位韌性的關鍵是分散風險,避免風險集中化(圖片由Freepik提供)

應強化事前準備與應變演練,完善預防及因應,提升數位韌性

衝擊企業營運的資安事件不限於駭客組織的惡意攻擊,更可能是來自內外部的單點或多點故障,企業做好完善資安準備,不只是追求零風險,而是要將損失控制於可接受範圍。妥適的事前準備如主動識別風險點、漏洞管理,可儘量預防事件發生,制定備援機制與災難復原計劃等完善的事中應變機制,則有效減少資安損失,強化企業數位韌性,在發生資安事件時維持營運連續性。

企業如何提升數位韌性?從事前、事中、事後守衛核心系統

身在數位轉型及 AI 科技疾速發展的世代,各大企業紛紛導入包含雲端在內的新興技術取代老舊系統,可轉型或整合的過程中,勢必會出現看得到或看不到的資安風險,還可能因為資訊服務供應商的偶發性錯誤,導致企業面臨營運中斷的損失。

這次 AWS 當機 15 小時的事件印證了資安韌性的重要性,企業可從中回顧每一個環節以自省公司內部的資安架構,尤其是核心業務及系統應是求穩不求新,藉由事前、事中、事後的各項資安治理及防護措施,儘可能識別風險、排除風險,乃至分散風險。

事前中後完善資安防護,強化數位韌性(圖片由freepik提供)
事前中後完善資安防護,強化數位韌性(圖片由freepik提供)

透過全面風險評估識別潛在問題及漏洞

企業應定期執行全面的風險評估,盤點資訊資產,以識別監控弱點,使資安漏洞的存在「可視化」。企業進一步檢視系統運作邏輯的相依性後,可制定精準的改善策略,避免牽一髮動全身的資安風險,遏制資安事件的災情蔓延擴大。(延伸閱讀:【資安風險評估顧問服務】助力企業掌握資安風險、智能平台管理資產

完善資安規劃以排除資訊架構風險

傳統的防火牆或防毒軟體,已無法有效防範現今的資安威脅與風險,尤其在數位化時代下,雲端及  AI 系統讓原有的資訊架構越加複雜,帶來除了便利以外的變數,企業資安需要更完善的資安規劃,以防過時或雜亂的架構在事件發生時加劇營運衝擊。(延伸閱讀:【鼎新資訊委外服務】AI 賦能使效率、資安、成本三贏!打造企業的堅實後盾

建立核心系統備援機制以支持營運不中斷

資安風險僅能趨近於零,卻無法完全避險,因此不論是資安攻擊或是來自內外部的系統故障,必將造成企業短時間的營運中斷,對業務運作影響甚大。故企業應為核心系統建立妥善的備援機制,並且透過「異地」、「異構(跨雲)」備援分散風險,讓企業核心業務在資安事件發生時,仍保有最低限度的營運能量。(延伸閱讀:【企業資料備份備援】重要資料需多重保護,確保公司營運不中斷

制定災難應變程序並定期執行演練

企業應根據資安目標及策略,標準化復原時間目標(RTO)與復原點目標(RPO),制定完善的災難應變程序(DRP),以利系統全面停擺時力挽狂瀾,減少資安事件造成的衝擊及損失。並透過定期災難還原演練,持續驗證進而優化復原程序,極力降低營運中斷事件的影響。(延伸閱讀:【災難復原演練】只有資料備份跟備援機還不夠!定期演練完善災難復原程序

導入 AI 智慧監控機制掌握營運實時現況

Ai 智管家的智慧化監控管理,實現數位韌性願景
Ai 智管家的智慧化監控管理,實現數位韌性願景

為了跟上科技爆炸進展的時代浪潮,企業不能也不會停下數位化的腳步,這也意味著企業將面對越來越複雜的資訊架構,傳統的人力監控已不足以應對新型的資安威脅,也無力應變引發一連串事故的資安事件。故而建議企業導入智慧化監控體系,如鼎新資安的 Ai 智管家,可以即時偵測核心系統及資訊設備的異常,預警並追蹤其效能,協助企業快速掌握系統狀態,實現主動式的數位韌性防護。(延伸閱讀:【Ai智管家】資訊設備大小事 AI協助您智能管理

 

這場長達 15 小時的數位服務大停擺,徹底粉碎了「上雲等於一勞永逸」的迷思,即便擁有頂尖技術資源的科技巨頭,亦無法完全避免極端風險,更凸顯了雲端集中化結構的弱點。對於高度依賴雲端架構的現代企業而言,這無疑是一次高昂且嚴峻的壓力測試,使資訊安全及數位主權的議題更為複雜。

而今事件雖已落幕,但它留給全球企業的震撼教育才正要開始,現在,就是重新審視資安策略,強化數位韌性的最佳時機!鼎新資安是企業數位轉型及提升資安韌性之路的堅實後盾,協助您從被動的防火牆防禦,走向主動的異地備援與 AI 智慧監控,一步步構建起堅不可摧的數位防護網,將不可控的風險,轉化為可控的競爭優勢。