레일웨이, 구글 클라우드 계정 정지 한 방에 플랫폼 전체 장애
레일웨이가 구글 클라우드의 잘못된 계정 정지로 약 8시간 동안 플랫폼 전반 장애를 겪었다. 문제는 단순히 GCP 위의 워크로드가 죽은 게 아니라, 라우팅 테이블을 채우는 네트워크 제어 평면이 GCP에 묶여 있어서 AWS와 자체 Metal 환경까지 접근 불가로 번진 점이다.
- 1
구글 클라우드가 레일웨이 운영 계정을 자동 조치로 잘못 정지하면서 대시보드, API, 데이터베이스, GCP 컴퓨트가 내려감
- 2
엣지 프록시의 라우팅 캐시가 만료되자 GCP 밖의 AWS와 Railway Metal 워크로드도 404를 반환하며 사실상 전 지역 장애로 확대됨
- 3
레일웨이는 GCP를 데이터 평면의 핫 패스에서 빼고, 데이터베이스 샤드를 AWS와 Metal까지 확장하겠다고 밝힘
고가용성 구성을 해도 제어 평면의 발견 경로가 한 벤더 계정에 묶여 있으면 전체 장애가 될 수 있다는 꽤 뼈아픈 사례다. 멀티 클라우드는 리소스를 여러 군데 두는 것보다, 장애 때 의존성 그래프가 실제로 끊기지 않는지가 핵심임.
관련 기사
포드가 AI 데이터센터 붐 수혜주로 뜬 이유는 자동차가 아니라 ESS였다
포드의 에너지 저장 사업이 AI 데이터센터 건설 붐을 타고 새 성장축으로 주목받고 있어. 전기차 수요 둔화로 남는 배터리 생산능력을 데이터센터·전력망용 ESS로 돌리는 전략이고, EDF 북미 사업체에 2028년부터 연간 4기가와트시 규모 공급 계약까지 체결했어.
클라우드 빅3 차별화 논쟁, 정작 컴퓨트·스토리지는 거의 범용재가 됐다는 얘기
클라우드 업체들은 인공지능, 데이터베이스, 전용 서비스로 차별화를 강조하지만, 대부분의 기업 워크로드는 여전히 컴퓨트와 스토리지 위에서 돌아간다는 주장이다. AWS, 애저, 구글 클라우드의 핵심 인프라는 성숙도가 높아져 실질 역량 차이가 줄었고, 아키텍트는 브랜드보다 워크로드 적합성·비용·거버넌스·운영 정합성을 봐야 한다는 내용이다.
DynIP, RFC 2136·IPv6·DNSSEC 지원하는 동적 DNS 서비스 공개
DynIP는 홈랩, 엣지 라우터, 인프라 팀을 겨냥한 동적 DNS(DDNS) 서비스다. 60초 안팎의 전파, RFC 2136 TSIG 기반 라우터 업데이트, 개인 도메인 연결, IPv6와 DNSSEC 지원을 핵심 기능으로 내세운다.
깃허브 액션, 내부 데이터베이스 마이그레이션 여파로 4시간 지연
깃허브에서 2026년 5월 12일 13:41부터 17:43 협정세계시까지 일부 서비스 처리 지연이 발생했음. 내부 데이터베이스 마이그레이션으로 복제 지연이 생겼고, 작업 큐에 쌓이는 요청을 처리할 워커가 부족해진 게 원인이었음.
AI 강국 경쟁, 결국 전기와 데이터센터 싸움으로 간다
AI 경쟁의 핵심이 모델과 반도체만이 아니라 안정적인 전력 확보로 이동하고 있다는 분석이야. 글로벌 데이터센터 전력 사용량은 2024년 400TWh에서 2030년 800TWh, 2050년 3500TWh 이상으로 커질 전망이고, 한국도 AI 데이터센터와 에너지 전략을 같이 설계해야 하는 상황이야.
댓글
댓글
댓글을 불러오는 중...