---
title: "AI는 지금 느려지고 있는데, 비용 구조는 절대 느려지면 안 되는 상태다"
published: 2026-06-08T15:46:37.000Z
canonical: https://jeff.news/article/3897
---
# AI는 지금 느려지고 있는데, 비용 구조는 절대 느려지면 안 되는 상태다

이 글은 생성형 AI 산업이 데이터센터, GPU, 클라우드 약정, 토큰 과금 위에 얼마나 무리한 성장 가정을 얹어놨는지 공격적으로 뜯어본다. 핵심은 단순한 버블론이 아니라, 오픈AI와 앤트로픽이 2030년까지 지금보다 훨씬 큰 매출을 만들지 못하면 현재 인프라 투자 자체가 설명되지 않는다는 주장이다.

## AI 산업은 ‘성장 둔화’를 감당할 수 없는 구조가 됐음

- 글쓴이의 핵심 주장은 꽤 단순함 — 생성형 AI는 그냥 잘되면 좋은 사업이 아니라, 계속 미친 속도로 커지지 않으면 숫자가 안 맞는 사업이 됐다는 것임
  - 데이터센터, GPU, 클라우드 약정, 토큰 과금이 전부 “앞으로 수요가 폭발한다”는 가정 위에 올라가 있음
  - 문제는 그 수요가 실제 매출로 확인되기 전에 이미 수천억~수조 달러 단위의 약정과 설비 투자가 먼저 깔렸다는 점임

- 데이터센터 숫자부터 스케일이 정신없음
  - Sightline Climate 자료 기준으로 계획된 데이터센터가 190GW라고 보고, 젠슨 황의 “데이터센터는 기가와트당 800억~1000억 달러” 발언을 대입하면 총비용은 9조5000억~15조 달러 수준까지 튐
  - 블룸버그가 말한 3조 달러 빌드아웃보다 훨씬 큰 숫자라는 게 글쓴이의 계산임
  - 절반만 실제로 지어진다고 해도, 데이터센터 운영사가 매년 감당해야 할 매출 규모가 8750억 달러쯤 필요하다는 계산이 나옴

- 엔비디아의 미래도 생각보다 몇몇 초대형 구매자에게 묶여 있음
  - 엔비디아 매출의 54%가 세 고객에게서 나온다고 언급됨
  - 글쓴이는 이 고객들이 마이크로소프트, 구글, 메타용 서버를 만드는 대만 ODM일 가능성이 크다고 봄
  - 결국 엔비디아의 성장 서사는 “수백만 달러짜리 GPU 랙을 계속 살 수 있는 회사가 계속 돈을 빌릴 수 있다”는 전제 위에 있음

> [!IMPORTANT]
> 이 글에서 제일 센 숫자는 “AI 컴퓨트와 생성형 AI 서비스가 2030년까지 연 2조 달러 이상 매출을 만들어야 현재 투자가 설명된다”는 주장임. 성능 논쟁이 아니라 손익계산서 논쟁으로 넘어간 셈임.

## 오픈AI와 앤트로픽이 거의 모든 수요를 떠안고 있음

- 글쓴이는 현재 AI 컴퓨트 수요가 사실상 오픈AI와 앤트로픽에 과도하게 집중돼 있다고 봄
  - 두 회사가 전체 AI 컴퓨트 수요의 최소 70%, 많게는 80~90%를 차지한다고 추정함
  - 둘 다 매년 수십억~수백억 달러를 태우는 구조라, “큰 고객이 있으니 괜찮다”가 아니라 “손실 큰 고객 둘이 산업 전체를 떠받친다”에 가까움

- 앤트로픽의 약정 규모도 장난이 아님
  - 구글, 아마존, 마이크로소프트와 3300억 달러 규모의 컴퓨트·칩 약정
  - 코어위브와 300억 달러, 스페이스X와 150억 달러 약정도 언급됨
  - 이걸 감당하려면 2029년에 연 1740억 달러 매출을 찍어야 한다는 전망이 깔려 있음

- 오픈AI도 비슷하게 빡셈
  - 2030년 말까지 최소 8520억 달러를 태울 것으로 예상된다고 글은 주장함
  - 마이크로소프트, 아마존, 코어위브, 세레브라스, 오라클 등과 7700억 달러가 넘는 컴퓨트 약정을 맺었다고 봄
  - 3월의 1220억 달러 펀딩으로는 부족하고, 연말까지 최소 2500억 달러 추가 자금이 필요할 수 있다고 주장함

- 둘의 매출 성장 목표는 거의 판타지급임
  - 오픈AI와 앤트로픽의 2026년 합산 예상 매출을 약 600억 달러로 잡으면, 2029년 말까지 496% 성장해야 한다는 계산이 나옴
  - 더 극단적으로는 두 회사가 각각 연 4000억 달러 수준의 매출을 만들어야 현재 컴퓨트 투자 논리가 맞는다고 봄
  - 글쓴이는 “최소 두 개의 오픈AI급 회사가 더 필요하다”는 식으로 표현함

## 그런데 고객들은 벌써 토큰 비용에 브레이크를 걸기 시작함

- AI가 진짜 문제 없이 돈값을 하고 있다면, 기업들은 토큰 지출을 자랑해야 함
  - “이만큼 썼고, 이만큼 기능을 냈고, 이만큼 비용을 줄였다”는 식의 사례가 쏟아져야 정상임
  - 그런데 실제로는 “비용이 너무 많이 나오는데 투자 대비 효과를 모르겠다”는 기사가 나오기 시작했다는 게 글의 포인트임

- 몇몇 기업 사례가 꽤 구체적임
  - 어떤 회사는 사용량 통제를 걸지 않아 한 달에 앤트로픽 모델 비용으로 5억 달러를 썼다고 언급됨
  - 우버는 연간 토큰 예산을 한 분기 만에 다 써버렸고, 이후 직원당 월 1500달러로 사용량을 제한함
  - 티모바일은 임시로 직원당 월 2000달러 제한을 뒀고, 브렉스는 엔지니어에게 주당 500달러, 비엔지니어에게 주당 5달러 한도를 둠

- 비용 가시성도 엉망이라는 지적이 나옴
  - KPMG 조사에서 AI 비용을 포괄적으로 파악한다고 답한 회사는 26%뿐임
  - 50%는 일부만 보인다고 했고, 22%는 가시성이 없거나 청구 후에야 안다고 답함
  - SaaS 비용도 아니고 인프라성 변동비가 이렇게 불투명하면, CFO 입장에선 당연히 칼을 들 수밖에 없음

> [!WARNING]
> 에이전트형 코딩 도구는 “조금 더 생각하게 두면 더 잘하겠지”가 비용 폭탄으로 바뀔 수 있음. 루프, 재시도, 긴 컨텍스트, 자동 작업 분해가 전부 토큰 지출로 이어지기 때문임.

## AI 회사들은 더 많이 쓰게 만들려고 할 가능성이 큼

- 글쓴이는 최근 “에이전트 루프를 설계하라”는 메시지를 의심스럽게 봄
  - Claude Code 쪽 인물과 오픈AI 계열 인물이 사용자가 직접 프롬프트를 던지는 대신 에이전트가 계속 작업하게 하는 방식을 강조했다는 대목이 나옴
  - 글쓴이 해석은 노골적임 — 더 많은 토큰을 태우게 만들어야 AI 회사들의 매출 구조가 버틴다는 것임

- 문제는 에이전트가 오래 돈다고 항상 좋은 결과가 나오는 게 아니라는 점임
  - LLM은 계획을 길게 세우고 추론을 많이 한다고 무조건 정확해지는 시스템이 아님
  - 환각, 잘못된 수정, 불필요한 파일 변경, 테스트 없는 자동 패치 같은 리스크가 늘 수 있음
  - 무료 크레딧이나 정액제에서는 “초기 기술이라 그렇다”로 넘길 수 있지만, 토큰 기반 과금에선 그 실패 비용을 사용자가 직접 맞음

- IPO를 앞두면 보조금 모델도 줄어들 가능성이 큼
  - 오픈AI와 앤트로픽이 상장 기업처럼 보이려면 매출, 마진, 비용 통제가 더 중요해짐
  - 그러면 무제한에 가까운 보조형 구독은 제한되거나 더 비싼 토큰 기반 과금으로 이동할 수 있음
  - 개발자 입장에선 지금의 “월 구독으로 대충 많이 쓰는” 경험이 오래가지 않을 수 있다는 얘기임

## 순환 경제는 결국 진짜 제품 수요를 만나야 함

- 글쓴이가 보는 AI 산업의 큰 구조는 일종의 순환 매출임
  - AI 연구소가 클라우드 사업자에게 컴퓨트 비용을 지불함
  - 클라우드 사업자와 인프라 회사는 엔비디아 GPU를 삼
  - 엔비디아는 다시 AI 회사나 컴퓨트 제공자에 투자함
  - 겉으로는 모두가 성장하는 것처럼 보이지만, 마지막엔 실제 고객이 충분한 돈을 내야 함

- 효율화는 오히려 이 서사와 충돌함
  - 오픈AI나 앤트로픽이 정말 비용을 확 줄이면 필요한 컴퓨트도 줄어듦
  - 그러면 클라우드, 오라클, 코어위브, 엔비디아 GPU 수요 논리가 약해짐
  - 반대로 컴퓨트를 계속 사려면 매출이 더 커져야 하는데, 고객은 이미 비용 통제를 시작함

- 한국 개발자에게도 남 얘기가 아님
  - 회사에서 코파일럿, 클로드 코드, 내부 AI 에이전트를 도입할 때 “생산성이 올라간다더라”만으로는 부족함
  - 월별·팀별·작업별 토큰 비용, 실패한 실행 비용, 리뷰와 롤백 비용까지 같이 봐야 함
  - 특히 자동화 에이전트는 데모보다 운영비가 먼저 튀는 경우가 많아서, 예산 한도와 관측 가능성을 처음부터 박아야 함

---

## 기술 맥락

- 이 글에서 말하는 기술적 선택은 “AI를 정액제 도구처럼 쓸 것인가, 사용량 기반 인프라처럼 관리할 것인가”예요. LLM이 코드 작성이나 업무 자동화에 들어오면 매 요청이 토큰 비용으로 바뀌기 때문에, 사실상 클라우드 리소스 관리 문제에 가까워져요.

- 왜 이게 중요하냐면, 기존 SaaS는 좌석 수와 월 구독료로 예산을 어느 정도 예측할 수 있었거든요. 그런데 에이전트형 LLM은 한 작업이 몇 번 재시도되고, 얼마나 긴 컨텍스트를 읽고, 얼마나 많은 파일을 수정할지에 따라 비용이 크게 달라져요.

- 그래서 구현 관점에서는 모델 도입 자체보다 비용 관측성이 먼저예요. 팀·사용자·저장소·작업 유형별 토큰 사용량을 나눠 보고, 월 한도와 알림, 자동 중단 기준을 둬야 나중에 청구서 보고 놀라는 일을 줄일 수 있어요.

- 대안은 무작정 막는 게 아니라 작업 등급을 나누는 거예요. 코드 검색, 테스트 생성, 문서 초안처럼 실패 비용이 낮은 작업은 넓게 열고, 대규모 리팩터링이나 자동 배포처럼 실패 비용이 큰 작업은 승인 흐름과 예산 제한을 더 빡세게 두는 식이 현실적이에요.

## 핵심 포인트

- 계획된 데이터센터 190GW를 엔비디아 CEO의 기가와트당 비용 발언으로 계산하면 9조5000억~15조 달러 규모가 될 수 있다는 주장이 나옴
- 오픈AI와 앤트로픽은 이미 수천억 달러 규모의 컴퓨트 약정을 걸어놨고, 이를 감당하려면 2029~2030년까지 비현실적으로 빠른 매출 성장이 필요함
- 기업 고객들은 토큰 기반 과금으로 넘어가자마자 비용 통제와 투자 대비 효과 문제를 겪기 시작했고, 우버·티모바일·브렉스 같은 사례가 등장함
- AI 산업의 순환 구조는 클라우드 사업자, 엔비디아, AI 연구소가 서로 매출과 투자를 밀어주는 형태인데, 결국 진짜 고객 수요가 있어야 지속됨

## 인사이트

AI 도입 논쟁에서 성능이나 벤치마크만 보는 건 이제 반쪽짜리임. 개발 조직 입장에선 모델이 뭘 할 수 있느냐보다, 그걸 반복 가능한 비용 구조로 운영할 수 있느냐가 더 빡센 질문이 됐음.
