본문으로 건너뛰기
피드

소프트웨어 아키텍처의 최대 죄악: 상태의 불필요한 분산

backend 약 3분
vote
0
댓글
북마크

아키텍처 인터뷰 경험에서 도출한 핵심 교훈. 소프트웨어의 최악의 우발적 복잡성은 상태의 불필요한 분산, 복제, 재구조화임. 코드는 부채이고 데이터가 자산이므로, 상태를 최소화하고 정규화해서 한 곳에 잘 관리하라는 주장.

  • 1

    코드는 부채, 데이터는 자산 — 레거시 데이터는 재앙이 될 수 있음

  • 2

    인터뷰 후보자들이 본능적으로 컴포넌트 추가로 문제를 해결하려 함

  • 3

    파생 가능한 데이터는 저장하지 말고 계산할 것

  • 4

    정규화로 데이터 중복 제거하고 단일 정본을 참조하게 만드는 것이 핵심

  • 5

    K8s처럼 정보 단일 소스가 없으면 디버깅 자체가 불가능해짐

소프트웨어 아키텍처 인터뷰를 많이 해본 Samir Talwar가 내린 결론: 아키텍처의 최대 죄악은 상태(state)의 불필요한 분산, 복제, 재구조화라는 거임.

  • 인터뷰 때 설계 문제가 생기면 대부분의 후보자가 본능적으로 "컴포넌트를 하나 더 추가하자"고 반응함. 단순화가 아니라 복잡화로 가는 거임
  • 코드는 부채(liability)이고 데이터가 자산(asset)임. 레거시 코드는 짜증나는 수준이지만, 레거시 데이터는 재앙 수준이 될 수 있음
  • "DB에 전 고객의 마지막 주소가 없으면... 영원히 없는 거다" — 데이터는 코드처럼 리팩터링으로 복구가 안 됨
  • 실제 사례: 여러 MongoDB 인스턴스에 데이터가 흩어져 있고, 일부만 백업되고, 중복 저장된 조직에서 일해 봤는데, 새 기능에 필요한 데이터가 고객 50%분밖에 없는 상황이 벌어짐
  • K8s 디버깅 사례도 나옴. Pod가 왜 재배포됐는지 알고 싶었는데, 쿠버네티스에는 정보의 단일 소스가 없어서 여러 곳을 교차 참조해도 결국 원인을 못 찾았다는 거임
  • 상태를 최소화하는 핵심 원칙: 파생 가능한 데이터는 저장하지 말고 계산할 것. 예를 들어 합계를 저장하는 대신 매번 계산하면 됨
  • 캐싱은 괜찮지만, 파생 데이터를 "저장"하는 순간 그건 고정된 상태가 되어버려서 스키마 변경 시 마이그레이션 대상이 됨
  • 정규화(normalization)가 요즘 인기를 잃었지만, 데이터 중복을 없애고 단일 정본(canonical version)을 참조하게 만드는 가장 좋은 방법임

한 줄 요약: "상태를 한 곳에 두고, 잘 관리해라(Put your state in one place, and make it good)."

상태를 한 곳에 두고 잘 관리하라(Put your state in one place, and make it good). 캐싱은 괜찮지만 파생 데이터를 저장하면 마이그레이션 부채가 됨.

댓글

댓글

댓글을 불러오는 중...

backend

Go에서 Rust로 옮길 때 진짜로 바뀌는 것들

이 글은 Go 백엔드 서비스를 Rust로 옮길 때 속도보다 컴파일 타임 보장, 런타임 트레이드오프, 개발자 경험이 더 중요하다고 설명한다. nil 패닉, 데이터 레이스, 에러 처리, 제네릭, 비동기 모델, 마이그레이션 전략까지 실무 관점에서 Go와 Rust를 길게 비교한다.

backend

Python 3.15에서 헤드라인은 못 탔지만 꽤 쓸만한 기능들

Python 3.15에는 lazy imports나 Tachyon profiler 같은 큰 기능 말고도 실무에서 바로 체감될 만한 작은 개선들이 들어가. TaskGroup 취소, 컨텍스트 매니저 데코레이터 개선, 스레드 안전 이터레이터처럼 평소 애매하게 불편했던 지점들이 꽤 깔끔해졌어.

backend

심평원, DUR부터 의료영상 심사까지 클라우드로 갈아엎는다

심평원이 정보시스템 클라우드 전환과 함께 병·의원 업무에 직접 닿는 DUR, 의료영상 AI 심사, 요양급여내역 조회 시스템을 고도화한다. 핵심은 설치형 프로그램 중심이던 연계를 웹과 API 기반으로 넓히고, 진료·청구 과정에서 실시간 확인과 자동 판독을 강화하는 쪽이다.

backend

윈도우 에러 코드 7번 ‘ERROR_ARENA_TRASHED’는 어디서 왔을까

ERROR_ARENA_TRASHED는 Win32에서 실제로 쓰이는 현대적 에러라기보다 MS-DOS 시절 메모리 관리 구조에서 넘어온 잔재야. MS-DOS가 메모리 블록 앞의 arena 시그니처를 훑다가 예상한 값이 아니면 ‘arena가 망가졌다’고 보고 이 에러를 냈다는 이야기야.

backend

C/C++ 컴파일러의 느슨한 메모리 동시성 버그를 자동으로 잡는 박사논문

C와 C++ 컴파일러에서 relaxed memory 동시성 버그를 찾는 자동 테스트 프레임워크를 다룬 박사논문이 공개됐어. Téléchat, Atomic-mixer 같은 도구로 소스 수준 동작과 컴파일된 프로그램 동작을 비교하고, LLVM과 GCC 툴체인에서 실제 버그를 찾아낸 내용이 핵심이야.