본문으로 건너뛰기
피드

Tailscale 공동창업자가 또 창업했다 — '내가 쓰고 싶은 클라우드를 직접 만든다'

devops 약 8분

Tailscale 공동창업자 David Crawshaw가 exe.dev라는 새 클라우드 서비스를 런칭하며 현재 클라우드의 근본 문제를 비판했다. VM 추상화, HDD 시대 유물인 원격 블록 디스크, 약탈적 egress 가격, 그리고 쿠버네티스가 왜 '돼지에 립스틱'에 불과한지를 짚으며 에이전트 시대에는 추상화 품질이 토큰 효율로 직결된다는 주장이다.

  • 1

    VM이 CPU/메모리 자원에 묶인 추상화 자체가 잘못됨 — 원하는 건 리소스 풀 위에 VM 자유 배치

  • 2

    원격 블록 디스크는 HDD 시대 설계 — SSD 시대엔 IOPS 오버헤드 10배 이상 폭증

  • 3

    맥북 500k IOPS vs EC2 200k IOPS에 월 $10k — 인프라를 느린 디스크로 절뚝거리게 만들고 있음

  • 4

    쿠버네티스는 본질적으로 불가능한 문제를 풀려는 제품 — 근본을 그대로 두고 추상화만 쌓음

  • 5

    에이전트가 AWS API 우회에 컨텍스트 토큰 낭비하는 구조 — 추상화 품질이 AI 코딩 효율에 직결

  • 6

    exe.dev는 CPU/메모리 풀 구매 + 로컬 NVMe + anycast 네트워크로 시작

  • Tailscale 공동창업자 중 한 명인 David Crawshaw가 또 창업함 — 이번엔 exe.dev라는 새 클라우드 서비스
    • 투자 유치 공식 발표와 별개로, 본인이 왜 또 스타트업의 고통을 자처했는지 개인 블로그로 풀어냄
    • 동료 창업자들조차 "잘 나가는 회사 냅두고 또 튀김기에 뛰어드는 거냐"고 놀랐다고 함
  • 이유는 거창하지 않다고 본인이 인정함 — "I like computers"
    • 마이크로컨트롤러, 데스크톱, 폰, 서버 모두 좋아하는데 클라우드만큼은 좋아할 수가 없다는 것
    • BSD, Linux, Windows, BeOS, OS/2 Warp까지 다 재밌게 써봤지만 지금의 클라우드는 "모양 자체가 틀렸다(wrong shape)"고 단언

클라우드가 왜 망가졌는가 — 3가지 근본 문제

  • VM 모델이 잘못 추상화됨 — VM이 CPU/메모리 자원에 묶여 있는 구조
    • 정작 개발자가 원하는 건 "CPU·메모리·디스크를 사서 그 위에 내가 원하는 만큼 VM을 돌리는 것"
    • Linux VM은 결국 다른 Linux의 cgroup 위에서 돌아가는 프로세스인데, 클라우드에선 그게 안 됨
    • gVisor나 중첩 가상화로 직접 격리를 구현하면 성능 패널티 + 리버스 프록시 운영 부담이 고스란히 개발자 몫
  • PaaS는 더 나쁜 해답 — 공급자별로 특수한 추상화를 새로 배워야 하고, 프로젝트 중반에 "이 플랫폼에선 이게 안 되네"를 발견
    • "이거다!" 싶었던 서비스들이 대충 구현된 추상화 때문에 배신하는 경험이 반복됨
  • 디스크 추상화가 HDD 시대 유물 — 원격 블록 디바이스는 10ms seek time HDD엔 맞는 설계였음
    • SSD가 들어오면서 seek time이 20 마이크로초로 떨어졌는데, 네트워크 RTT 오버헤드는 HDD 기준 10%에서 SSD 기준 10배 이상으로 폭증
    • EC2에서 200k IOPS 맞추려면 월 $10k 지출 필요
    • 저자 맥북 SSD가 500k IOPS — "우리가 왜 클라우드 인프라를 느린 디스크로 절뚝거리게 만들고 있나"

중요

> 맥북 SSD 500k IOPS vs EC2 200k IOPS에 월 $10,000. 이 한 줄이 이 글의 주장을 가장 잘 압축한다.

  • 네트워킹 과금이 약탈적 — 하이퍼스케일러 egress GB당 가격이 일반 데이터센터 대비 10배
    • 대량 사용자는 할인되지만, 월 $XX짜리 사이드 프로젝트엔 해당 없음
    • 기술적으론 멀쩡한데 "당신이 만드는 게 절대 저렴해지지 못하게" 제한이 걸려 있음
  • K8s는 해결책이 아니라 못 푸는 문제를 풀려는 시도 — "클라우드를 휴대성 있고 쓸 만하게 만들자"
    • VM은 중첩 가상화 때문에 어렵고, 디스크는 공통 패턴을 찾아도 느리고, 네트워크는 쉬워지면 클라우드 비용이 폭락하니까 쉬워질 수가 없음
    • "돼지에 립스틱 바르는 프로젝트, 다만 립스틱 품질은 높다" 수준으로 표현

에이전트 시대가 결정적 변곡점인 이유

  • LLM 에이전트 덕분에 사람 한 명이 쓰는 소프트웨어 총량이 폭증 — 일종의 Jevons 역설
    • 각자 더 많은 프로그램을 짜게 되고, 돌릴 곳이 필요해짐
    • 예전엔 짜증나는 수준이었던 클라우드 불편함이 이제는 심각한 병목
  • 에이전트한테 AWS API 맡기면 작동은 함 (가끔 프로덕션 DB를 지우긴 하지만)
    • 문제는 에이전트도 잘못된 추상화의 한계를 돌파 못 함
    • 컨텍스트 윈도우의 상당 부분을 "어떻게 이 망가진 추상화를 우회할까" 고민하는 데 써버림 → 해결하려던 진짜 문제엔 쓸 토큰이 부족

exe.dev가 실제로 만든 것

  • VM 자원 격리 문제부터 잡음 — 개별 VM을 프로비저닝하는 게 아니라 CPU/메모리를 사고 그 위에 VM을 마음대로 돌림
    • TLS 프록시와 인증 프록시 기본 제공 (생짜 VM을 인터넷에 노출시키기 싫다는 이유)
    • 디스크는 로컬 NVMe, 블록은 오프머신 비동기 복제
  • 전 세계 리전 + anycast 네트워크로 글로벌 사용자에 저지연 엔트리포인트 제공
  • 정적 IP, 자동 디스크 스냅샷 UX 같은 건 앞으로 빌드
    • 동시에 데이터센터에 직접 서버 랙을 세우고, 소프트웨어 스택 모든 레이어를 처음부터 다시 설계 중
  • 결론은 "내가 쓰고 싶은 클라우드를 내가 만든다"

기술 맥락

exe.dev가 공격하는 지점은 "VM = 리소스 단위"라는 15년짜리 업계 관습이에요. AWS나 GCP에서 t3.medium 같은 인스턴스 타입을 고르는 순간, 이미 "CPU·메모리 조합 = VM 1개"라는 추상화에 갇혀버리는 거죠. Crawshaw는 이걸 뒤집어서 "리소스 풀을 사고, 그 위에 VM을 원하는 만큼"으로 가고 싶어해요.

디스크 얘기가 특히 날카로운데, 원격 블록 디바이스(EBS 같은 것)는 HDD 시대의 합리적 타협이었거든요. seek time이 10ms인데 네트워크 1ms RTT 더해봐야 10% 오버헤드니까요. 근데 NVMe SSD로 넘어오면서 seek가 20μs까지 떨어지니, 같은 네트워크 RTT가 이제는 50배짜리 오버헤드가 돼버린 거예요. 그래서 exe.dev는 로컬 NVMe를 기본으로 하고, 복제는 비동기로 뒷단에서 처리하는 방향을 선택했어요.

쿠버네티스 비판도 의미심장해요. K8s가 만들어질 당시 클라우드는 "VM을 중첩으로 돌리기 어렵고, 원격 블록이 느리고, 네트워크가 비싼" 상태였는데, K8s는 이 위에 포터블한 레이어를 얹으려고 했거든요. 근본 문제를 그대로 둔 채 추상화를 쌓으니 "본질적으로 불가능한 제품"이 됐다는 게 저자 주장이에요.

마지막으로 에이전트 논리가 재밌는데, "에이전트가 클라우드 API를 우회하느라 컨텍스트 윈도우를 태우면, 정작 유저 문제 해결에 쓸 컨텍스트가 줄어든다"는 관점이에요. 즉 AI 코딩 시대에는 추상화 품질 자체가 토큰 효율로 직결된다는 거죠. 이게 지금 이 타이밍에 새 클라우드를 만드는 명분이에요.

단순 신제품 발표가 아니라 지난 15년 클라우드 패러다임 전체를 정면으로 비판하는 선언문에 가깝다. 에이전트 시대가 왜 인프라 리빌드의 타이밍인지에 대한 논증이 특히 설득력 있다.

댓글

댓글

댓글을 불러오는 중...

devops

한국 공공 민간 클라우드 이용률 11.8%…GDP 대비 지출도 싱가포르의 1/3

한국 공공 부문의 민간 클라우드 이용률이 2024년 기준 11.8%에 그치고, GDP 대비 클라우드 지출도 0.51%로 싱가포르(1.75%)의 3분의 1 수준이라는 지적이 제기됐다. 정부는 공공기관 경영평가에 클라우드 도입 성과를 반영하는 등 민간 클라우드 전환 전면화 방침을 내놨다.

devops

MSP 3사, 클라우드 수수료 한계에 AX 사업으로 'AI 허브' 전환 중

국내 MSP 3사(메가존클라우드·메타넷엑스·베스핀글로벌)가 클라우드 관리 수수료 구조의 수익성 한계를 넘어서기 위해 AX 사업으로 선회 중이다. R&D 투자, M&A, 지분 확대로 AI 역량을 확보하며 'AI 네이티브 인프라' 전문기업으로 재포지셔닝하고 있다.

devops

GitHub CLI, 이제 유사익명 텔레메트리 수집한다 — 옵트아웃하려면 직접 꺼야

GitHub CLI가 서브커맨드/플래그 사용 패턴을 수집하는 텔레메트리를 기본 활성화로 도입했다. 에이전트 워크로드에서의 사용 패턴 파악이 명분이며, 로깅 모드로 전송 내용을 미리 확인하거나 환경변수(DO_NOT_TRACK 포함)로 옵트아웃할 수 있다.

devops

레드햇, 구글과 손잡고 규제 산업용 독립형 오픈시프트 선보인다

레드햇이 '오픈시프트 온 구글 클라우드 데디케이티드'를 발표함. 금융·의료·공공 분야 기업이 운영 통제권·전략적 유연성을 유지하면서 구글 클라우드 위에서 오픈시프트를 쓸 수 있게 하는 서비스로, 디지털 주권 요구에 대응하는 하이브리드 클라우드 형태임. 올해 하반기 정식 제공 예정.

devops

GPU를 '몇 장 살지'가 아니라 '어떻게 운영할지'로 재정의하는 웨비나

오픈소스컨설팅이 5월 12일 GPU 온프레미스 AI 인프라 운영 전략 웨비나를 연다. GPUaaS·MLOps 자동화·인프라 구성 선택 기준 3축으로 구성되며, 구축 관점에 머무는 기업들의 자원 비효율 문제를 운영 체계 관점으로 재정의함.