구글 클라우드 6시간 장애, 원인은 '침묵'
AI Store에서 AI코딩으로 만들어진 앱을 만나보세요!
지금 바로 방문하기

구글클라우드, 서비스 장애 6시간만 복구…장애 원인은 '침묵'

카테고리

인프라/DevOps/보안

서브카테고리

인프라

대상자

IT 전문가, DevOps 엔지니어, 클라우드 서비스 운영자

핵심 요약

  • 6시간에 걸친 글로벌 클라우드 서비스 장애 발생
  • 장애 원인에 대한 구체적 설명 없음
  • 버텍스 AI 온라인 예측 기능이 가장 큰 영향을 받음

섹션별 세부 요약

1. 장애 발생 및 복구 현황

  • 2025년 6월 12일 오전 10시 51분에 API 요청 실패와 5xx 오류 발생
  • 6시간 뒤인 오후 6시 18분에 전 세계 서비스 복구 완료
  • 구글클라우드 CEO 토마스 쿠리안이 복구 완료를 공식 발표

2. 영향 받은 주요 서비스

  • 버텍스 AI 온라인 예측 기능이 장애 기간 동안 가장 높은 오류율을 기록
  • 미국 중부 리전(us-central1) 복구가 다른 리전보다 지연됨
  • 대시보드 통해 장애 발생부터 복구까지 실시간 모니터링 가능

3. 복구 과정

  • 오후 1시에 일부 완화 조치 시행
  • 오후 2시부터 리전별 복구 작업 단계적으로 진행
  • 클러스터 단위로 시스템 안정화 모니터링 중

4. 장애 원인 공개 누락

  • 공식적인 기술 분석 보고서는 아직 발표되지 않음
  • 장애 원인에 대한 설명 없음으로 인해 사용자 및 파트너 불안감 증대

결론

  • 장애 원인 공개와 투명한 대응이 중요하며, 실시간 모니터링 도구(대시보드) 활용이 필수적임.