본문으로 건너뛰기
피드

Stonebraker의 CAP 정리 비판 — NoSQL 진영이 결과적 일관성을 남용하고 있다 (2010)

backend 약 3분
vote
0
댓글
북마크

Mike Stonebraker가 NoSQL 진영의 CAP 정리 남용을 비판한 글에 대한 James Hamilton의 코멘터리. 애플리케이션 버그와 관리 실수에는 결과적 일관성이 무용하며, 완전 일관성을 너무 일찍 포기하지 말라는 주장.

  • 1

    CAP 정리가 적용되지 않는 데이터 손실 케이스(앱 버그, 관리 실수, DB 구현 버그)를 결과적 일관성이 보호하지 못함

  • 2

    지연 삭제(Deferred Delete) 기법으로 데이터 손실 방어 가능

  • 3

    네트워크 파티션은 이론적으로 드물지만 현실에서는 여전히 포스트모템 단골 주제

  • 4

    완전 일관성은 대규모에서도 실용적으로 구현 가능하며 앱 구현 오류를 줄여줌

  • 2010년 글인데 지금 읽어도 유효한 내용임. Mike Stonebraker가 CACM 블로그에서 NoSQL 진영이 CAP 정리(CAP Theorem)를 남용하고 있다고 정면으로 비판한 글에 대한 코멘터리

  • NoSQL 쪽에서 흔히 하는 주장이 "CAP 정리 때문에 결과적 일관성(Eventual Consistency)을 선택할 수밖에 없다"인데, Stonebraker는 이게 논점을 잘못 짚은 거라고 반박함. 애플리케이션 버그, 관리자 실수, DB 구현체 버그로 데이터가 날아가면 결과적 일관성이든 뭐든 아무 소용없다는 거임

  • 글쓴이(James Hamilton, AWS VP 출신)가 소개하는 꿀팁: 지연 삭제(Deferred Delete). 삭제 요청이 들어와도 즉시 지우지 않고 며칠~몇 주 뒤에 가비지 컬렉션하는 방식. 완벽한 보호는 아니지만 실제로 여러 번 살려줬다고 함

  • 네트워크 파티션이 드물다는 Stonebraker 주장에는 살짝 이견을 보임. 이론적으로는 드물어야 하는데, 현실에서는 네트워크 장비 설정 오류, 블랙홀, 패킷 드롭, 브라운아웃이 포스트모템 단골 주제라는 거임. 네트워크 장비가 아직도 메인프레임 비즈니스 모델(비싸고, 수직 통합, 2중화)에서 못 벗어났다는 지적이 인상적

중요

> Stonebraker의 핵심 주장: 완전 일관성(Full Consistency)을 너무 일찍 포기하지 마라. 많은 애플리케이션에서 완전 일관성은 충분히 감당 가능하고, 오히려 애플리케이션 구현 오류를 줄여준다.

  • Amazon SimpleDB가 완전 일관성 지원을 추가한 게 이 글 시점이었음. 결과적 일관성이 필요한 곳에는 쓰고, 완전 일관성이 필요한 곳에는 그걸 쓰면 된다는 것. 양자택일이 아니라는 얘기

  • 16년이 지난 지금 돌이켜보면, Spanner, CockroachDB, TiDB 같은 분산 DB들이 실제로 완전 일관성 + 고가용성을 대규모로 구현해냈으니 Stonebraker의 주장이 맞았던 셈

16년이 지난 지금 Spanner, CockroachDB 등이 완전 일관성 + 고가용성을 대규모로 증명했으니, Stonebraker의 주장이 선견지명이었던 셈.

댓글

댓글

댓글을 불러오는 중...

backend

Go에서 Rust로 옮길 때 진짜로 바뀌는 것들

이 글은 Go 백엔드 서비스를 Rust로 옮길 때 속도보다 컴파일 타임 보장, 런타임 트레이드오프, 개발자 경험이 더 중요하다고 설명한다. nil 패닉, 데이터 레이스, 에러 처리, 제네릭, 비동기 모델, 마이그레이션 전략까지 실무 관점에서 Go와 Rust를 길게 비교한다.

backend

Python 3.15에서 헤드라인은 못 탔지만 꽤 쓸만한 기능들

Python 3.15에는 lazy imports나 Tachyon profiler 같은 큰 기능 말고도 실무에서 바로 체감될 만한 작은 개선들이 들어가. TaskGroup 취소, 컨텍스트 매니저 데코레이터 개선, 스레드 안전 이터레이터처럼 평소 애매하게 불편했던 지점들이 꽤 깔끔해졌어.

backend

심평원, DUR부터 의료영상 심사까지 클라우드로 갈아엎는다

심평원이 정보시스템 클라우드 전환과 함께 병·의원 업무에 직접 닿는 DUR, 의료영상 AI 심사, 요양급여내역 조회 시스템을 고도화한다. 핵심은 설치형 프로그램 중심이던 연계를 웹과 API 기반으로 넓히고, 진료·청구 과정에서 실시간 확인과 자동 판독을 강화하는 쪽이다.

backend

윈도우 에러 코드 7번 ‘ERROR_ARENA_TRASHED’는 어디서 왔을까

ERROR_ARENA_TRASHED는 Win32에서 실제로 쓰이는 현대적 에러라기보다 MS-DOS 시절 메모리 관리 구조에서 넘어온 잔재야. MS-DOS가 메모리 블록 앞의 arena 시그니처를 훑다가 예상한 값이 아니면 ‘arena가 망가졌다’고 보고 이 에러를 냈다는 이야기야.

backend

C/C++ 컴파일러의 느슨한 메모리 동시성 버그를 자동으로 잡는 박사논문

C와 C++ 컴파일러에서 relaxed memory 동시성 버그를 찾는 자동 테스트 프레임워크를 다룬 박사논문이 공개됐어. Téléchat, Atomic-mixer 같은 도구로 소스 수준 동작과 컴파일된 프로그램 동작을 비교하고, LLVM과 GCC 툴체인에서 실제 버그를 찾아낸 내용이 핵심이야.