인터넷 인프라 기업 Cloudflare에서 발생한 잠재적 버그가 전 세계 인터넷에 대규모 장애를 초래했다. 이로 인해 11월 18일 ChatGPT, X(구 트위터), Spotify 등 주요 서비스들이 최대 6시간 동안 접속 불가 상태에 빠졌다.
Cloudflare는 전 세계 웹사이트의 약 20%를 지원하는 콘텐츠 전송 네트워크(CDN)로, 봇 완화와 트래픽 최적화 등의 기능을 제공한다. 이번 장애는 봇 대응 시스템에서 잠재적 버그가 일상적 구성 변경 이후 활성화되며 발생했다. Cloudflare CTO Dane Knecht는 외부 공격이 아닌 내부 오류임을 강조하며 사과했다.
장애 발생 직후 Cloudflare는 즉각적인 원인 파악과 수정 작업을 시작했으며, 약 2시간 내에 문제가 해결되었다고 발표했다. 그러나 캐시 및 네트워크 전파 문제로 일부 서비스는 복구에 시간이 더 소요되었다. Cloudflare는 향후 유사한 사고를 방지하기 위해 시스템 테스트 강화와 기술적 보강을 약속했다.
이번 사건은 인터넷 인프라의 중앙화된 구조적 취약성을 부각시켰다. 전문가들은 Cloudflare, AWS, Google Cloud 등 소수의 대형 업체에 대한 의존이 높아질수록 작은 결함 하나가 광범위한 영향을 미칠 수 있다고 지적하며, 다중 CDN 활용과 인프라 분산의 필요성을 강조했다. Cloudflare는 향후 기술 보고서를 통해 장애 원인과 대응 과정을 공개할 예정이다.
이번 사건은 인터넷 서비스 제공자들이 장애 대응 계획과 재해 복구 전략을 강화해야 함을 일깨워주며, 사용자들도 서비스 중단에 대한 민감도가 높아질 전망이다.
© 2025 TechMore. All rights reserved. 무단 전재 및 재배포 금지.
