본문으로 건너뛰기
피드

AI는 지금 느려지고 있는데, 비용 구조는 절대 느려지면 안 되는 상태다

ai-ml 약 10분
vote
0
댓글
북마크

이 글은 생성형 AI 산업이 데이터센터, GPU, 클라우드 약정, 토큰 과금 위에 얼마나 무리한 성장 가정을 얹어놨는지 공격적으로 뜯어본다. 핵심은 단순한 버블론이 아니라, 오픈AI와 앤트로픽이 2030년까지 지금보다 훨씬 큰 매출을 만들지 못하면 현재 인프라 투자 자체가 설명되지 않는다는 주장이다.

  • 1

    계획된 데이터센터 190GW를 엔비디아 CEO의 기가와트당 비용 발언으로 계산하면 9조5000억~15조 달러 규모가 될 수 있다는 주장이 나옴

  • 2

    오픈AI와 앤트로픽은 이미 수천억 달러 규모의 컴퓨트 약정을 걸어놨고, 이를 감당하려면 2029~2030년까지 비현실적으로 빠른 매출 성장이 필요함

  • 3

    기업 고객들은 토큰 기반 과금으로 넘어가자마자 비용 통제와 투자 대비 효과 문제를 겪기 시작했고, 우버·티모바일·브렉스 같은 사례가 등장함

  • 4

    AI 산업의 순환 구조는 클라우드 사업자, 엔비디아, AI 연구소가 서로 매출과 투자를 밀어주는 형태인데, 결국 진짜 고객 수요가 있어야 지속됨

AI 산업은 ‘성장 둔화’를 감당할 수 없는 구조가 됐음

  • 글쓴이의 핵심 주장은 꽤 단순함 — 생성형 AI는 그냥 잘되면 좋은 사업이 아니라, 계속 미친 속도로 커지지 않으면 숫자가 안 맞는 사업이 됐다는 것임

    • 데이터센터, GPU, 클라우드 약정, 토큰 과금이 전부 “앞으로 수요가 폭발한다”는 가정 위에 올라가 있음
    • 문제는 그 수요가 실제 매출로 확인되기 전에 이미 수천억~수조 달러 단위의 약정과 설비 투자가 먼저 깔렸다는 점임
  • 데이터센터 숫자부터 스케일이 정신없음

    • Sightline Climate 자료 기준으로 계획된 데이터센터가 190GW라고 보고, 젠슨 황의 “데이터센터는 기가와트당 800억1000억 달러” 발언을 대입하면 총비용은 9조5000억15조 달러 수준까지 튐
    • 블룸버그가 말한 3조 달러 빌드아웃보다 훨씬 큰 숫자라는 게 글쓴이의 계산임
    • 절반만 실제로 지어진다고 해도, 데이터센터 운영사가 매년 감당해야 할 매출 규모가 8750억 달러쯤 필요하다는 계산이 나옴
  • 엔비디아의 미래도 생각보다 몇몇 초대형 구매자에게 묶여 있음

    • 엔비디아 매출의 54%가 세 고객에게서 나온다고 언급됨
    • 글쓴이는 이 고객들이 마이크로소프트, 구글, 메타용 서버를 만드는 대만 ODM일 가능성이 크다고 봄
    • 결국 엔비디아의 성장 서사는 “수백만 달러짜리 GPU 랙을 계속 살 수 있는 회사가 계속 돈을 빌릴 수 있다”는 전제 위에 있음

중요

> 이 글에서 제일 센 숫자는 “AI 컴퓨트와 생성형 AI 서비스가 2030년까지 연 2조 달러 이상 매출을 만들어야 현재 투자가 설명된다”는 주장임. 성능 논쟁이 아니라 손익계산서 논쟁으로 넘어간 셈임.

오픈AI와 앤트로픽이 거의 모든 수요를 떠안고 있음

  • 글쓴이는 현재 AI 컴퓨트 수요가 사실상 오픈AI와 앤트로픽에 과도하게 집중돼 있다고 봄

    • 두 회사가 전체 AI 컴퓨트 수요의 최소 70%, 많게는 80~90%를 차지한다고 추정함
    • 둘 다 매년 수십억~수백억 달러를 태우는 구조라, “큰 고객이 있으니 괜찮다”가 아니라 “손실 큰 고객 둘이 산업 전체를 떠받친다”에 가까움
  • 앤트로픽의 약정 규모도 장난이 아님

    • 구글, 아마존, 마이크로소프트와 3300억 달러 규모의 컴퓨트·칩 약정
    • 코어위브와 300억 달러, 스페이스X와 150억 달러 약정도 언급됨
    • 이걸 감당하려면 2029년에 연 1740억 달러 매출을 찍어야 한다는 전망이 깔려 있음
  • 오픈AI도 비슷하게 빡셈

    • 2030년 말까지 최소 8520억 달러를 태울 것으로 예상된다고 글은 주장함
    • 마이크로소프트, 아마존, 코어위브, 세레브라스, 오라클 등과 7700억 달러가 넘는 컴퓨트 약정을 맺었다고 봄
    • 3월의 1220억 달러 펀딩으로는 부족하고, 연말까지 최소 2500억 달러 추가 자금이 필요할 수 있다고 주장함
  • 둘의 매출 성장 목표는 거의 판타지급임

    • 오픈AI와 앤트로픽의 2026년 합산 예상 매출을 약 600억 달러로 잡으면, 2029년 말까지 496% 성장해야 한다는 계산이 나옴
    • 더 극단적으로는 두 회사가 각각 연 4000억 달러 수준의 매출을 만들어야 현재 컴퓨트 투자 논리가 맞는다고 봄
    • 글쓴이는 “최소 두 개의 오픈AI급 회사가 더 필요하다”는 식으로 표현함

그런데 고객들은 벌써 토큰 비용에 브레이크를 걸기 시작함

  • AI가 진짜 문제 없이 돈값을 하고 있다면, 기업들은 토큰 지출을 자랑해야 함

    • “이만큼 썼고, 이만큼 기능을 냈고, 이만큼 비용을 줄였다”는 식의 사례가 쏟아져야 정상임
    • 그런데 실제로는 “비용이 너무 많이 나오는데 투자 대비 효과를 모르겠다”는 기사가 나오기 시작했다는 게 글의 포인트임
  • 몇몇 기업 사례가 꽤 구체적임

    • 어떤 회사는 사용량 통제를 걸지 않아 한 달에 앤트로픽 모델 비용으로 5억 달러를 썼다고 언급됨
    • 우버는 연간 토큰 예산을 한 분기 만에 다 써버렸고, 이후 직원당 월 1500달러로 사용량을 제한함
    • 티모바일은 임시로 직원당 월 2000달러 제한을 뒀고, 브렉스는 엔지니어에게 주당 500달러, 비엔지니어에게 주당 5달러 한도를 둠
  • 비용 가시성도 엉망이라는 지적이 나옴

    • KPMG 조사에서 AI 비용을 포괄적으로 파악한다고 답한 회사는 26%뿐임
    • 50%는 일부만 보인다고 했고, 22%는 가시성이 없거나 청구 후에야 안다고 답함
    • SaaS 비용도 아니고 인프라성 변동비가 이렇게 불투명하면, CFO 입장에선 당연히 칼을 들 수밖에 없음

⚠️주의

> 에이전트형 코딩 도구는 “조금 더 생각하게 두면 더 잘하겠지”가 비용 폭탄으로 바뀔 수 있음. 루프, 재시도, 긴 컨텍스트, 자동 작업 분해가 전부 토큰 지출로 이어지기 때문임.

AI 회사들은 더 많이 쓰게 만들려고 할 가능성이 큼

  • 글쓴이는 최근 “에이전트 루프를 설계하라”는 메시지를 의심스럽게 봄

    • Claude Code 쪽 인물과 오픈AI 계열 인물이 사용자가 직접 프롬프트를 던지는 대신 에이전트가 계속 작업하게 하는 방식을 강조했다는 대목이 나옴
    • 글쓴이 해석은 노골적임 — 더 많은 토큰을 태우게 만들어야 AI 회사들의 매출 구조가 버틴다는 것임
  • 문제는 에이전트가 오래 돈다고 항상 좋은 결과가 나오는 게 아니라는 점임

    • LLM은 계획을 길게 세우고 추론을 많이 한다고 무조건 정확해지는 시스템이 아님
    • 환각, 잘못된 수정, 불필요한 파일 변경, 테스트 없는 자동 패치 같은 리스크가 늘 수 있음
    • 무료 크레딧이나 정액제에서는 “초기 기술이라 그렇다”로 넘길 수 있지만, 토큰 기반 과금에선 그 실패 비용을 사용자가 직접 맞음
  • IPO를 앞두면 보조금 모델도 줄어들 가능성이 큼

    • 오픈AI와 앤트로픽이 상장 기업처럼 보이려면 매출, 마진, 비용 통제가 더 중요해짐
    • 그러면 무제한에 가까운 보조형 구독은 제한되거나 더 비싼 토큰 기반 과금으로 이동할 수 있음
    • 개발자 입장에선 지금의 “월 구독으로 대충 많이 쓰는” 경험이 오래가지 않을 수 있다는 얘기임

순환 경제는 결국 진짜 제품 수요를 만나야 함

  • 글쓴이가 보는 AI 산업의 큰 구조는 일종의 순환 매출임

    • AI 연구소가 클라우드 사업자에게 컴퓨트 비용을 지불함
    • 클라우드 사업자와 인프라 회사는 엔비디아 GPU를 삼
    • 엔비디아는 다시 AI 회사나 컴퓨트 제공자에 투자함
    • 겉으로는 모두가 성장하는 것처럼 보이지만, 마지막엔 실제 고객이 충분한 돈을 내야 함
  • 효율화는 오히려 이 서사와 충돌함

    • 오픈AI나 앤트로픽이 정말 비용을 확 줄이면 필요한 컴퓨트도 줄어듦
    • 그러면 클라우드, 오라클, 코어위브, 엔비디아 GPU 수요 논리가 약해짐
    • 반대로 컴퓨트를 계속 사려면 매출이 더 커져야 하는데, 고객은 이미 비용 통제를 시작함
  • 한국 개발자에게도 남 얘기가 아님

    • 회사에서 코파일럿, 클로드 코드, 내부 AI 에이전트를 도입할 때 “생산성이 올라간다더라”만으로는 부족함
    • 월별·팀별·작업별 토큰 비용, 실패한 실행 비용, 리뷰와 롤백 비용까지 같이 봐야 함
    • 특히 자동화 에이전트는 데모보다 운영비가 먼저 튀는 경우가 많아서, 예산 한도와 관측 가능성을 처음부터 박아야 함

기술 맥락

  • 이 글에서 말하는 기술적 선택은 “AI를 정액제 도구처럼 쓸 것인가, 사용량 기반 인프라처럼 관리할 것인가”예요. LLM이 코드 작성이나 업무 자동화에 들어오면 매 요청이 토큰 비용으로 바뀌기 때문에, 사실상 클라우드 리소스 관리 문제에 가까워져요.

  • 왜 이게 중요하냐면, 기존 SaaS는 좌석 수와 월 구독료로 예산을 어느 정도 예측할 수 있었거든요. 그런데 에이전트형 LLM은 한 작업이 몇 번 재시도되고, 얼마나 긴 컨텍스트를 읽고, 얼마나 많은 파일을 수정할지에 따라 비용이 크게 달라져요.

  • 그래서 구현 관점에서는 모델 도입 자체보다 비용 관측성이 먼저예요. 팀·사용자·저장소·작업 유형별 토큰 사용량을 나눠 보고, 월 한도와 알림, 자동 중단 기준을 둬야 나중에 청구서 보고 놀라는 일을 줄일 수 있어요.

  • 대안은 무작정 막는 게 아니라 작업 등급을 나누는 거예요. 코드 검색, 테스트 생성, 문서 초안처럼 실패 비용이 낮은 작업은 넓게 열고, 대규모 리팩터링이나 자동 배포처럼 실패 비용이 큰 작업은 승인 흐름과 예산 제한을 더 빡세게 두는 식이 현실적이에요.

AI 도입 논쟁에서 성능이나 벤치마크만 보는 건 이제 반쪽짜리임. 개발 조직 입장에선 모델이 뭘 할 수 있느냐보다, 그걸 반복 가능한 비용 구조로 운영할 수 있느냐가 더 빡센 질문이 됐음.

댓글

댓글

댓글을 불러오는 중...

ai-ml

애플, Siri를 앱 안에서 움직이는 개인형 AI 비서로 다시 밀어붙임

애플이 Apple Intelligence 기반의 새 Siri AI를 예고했다. 핵심은 단순 질의응답이 아니라 사용자의 앱, 화면, 사진, 메일, 메시지 맥락을 읽고 실제 행동까지 이어주는 개인형 AI 비서다. 영어 지원은 올해 말부터 순차적으로 들어오고, 일부 기능은 이미 제공 중이다.

ai-ml

xAI, 프런티어 AI 연구소보다 데이터센터 임대업자에 가까워지는 중

xAI가 Anthropic과 Google에 대규모 GPU 데이터센터 용량을 빌려주면서, Grok을 키우는 AI 연구소라기보다 데이터센터 임대 사업자처럼 보이기 시작했다는 분석이다. Anthropic은 피크 시간대 용량 부족을 겪다가 xAI의 멤피스 데이터센터를 쓰면서 제한을 완화했고, 계약 규모는 월 12억5천만 달러까지 올라간다. 핵심은 단순 회계 장난이 아니라, AI 업계 전체의 GPU 부족과 xAI의 빠른 데이터센터 구축 능력이 실제 경쟁력일 수 있다는 점이다.

ai-ml

샤오미 MiMo, 1조 파라미터 모델에서 초당 1000토큰 찍었다

샤오미 MiMo 팀과 TileRT가 1조 파라미터급 모델 MiMo-V2.5-Pro-UltraSpeed를 공개했고, 단일 8-GPU 범용 노드에서 초당 1000토큰 이상 디코딩 속도를 냈다고 밝힘. 핵심은 전용 하드웨어가 아니라 FP4 양자화, DFlash 투기적 디코딩, TileRT의 초저지연 실행 엔진을 모델-시스템 공동설계로 묶은 점임. API는 2026년 6월 9일부터 6월 23일까지 제한 신청제로 열리고, 가격은 기존 MiMo-V2.5-Pro의 3배지만 생성 속도는 약 10배라고 주장함.

ai-ml

정부, 2조800억 원 들여 GPU 9704장 확보한다

과기정통부가 2조800억 원 규모 첨단 GPU 확보·구축·운용 지원 사업자로 네이버클라우드, 삼성SDS, 엘리스그룹을 선정했다. 총 9704장의 최신 GPU를 확보해 독자 AI 파운데이션 모델, 국가 AI 프로젝트, 산학연 연구개발, 클라우드 GPU 서비스에 투입할 계획이다.

ai-ml

딥시크발 가격 전쟁, 중국 AI 클라우드 마진을 갈아버리는 중

딥시크 V4의 초저가 정책 이후 중국 AI 시장에서 API 가격 인하가 연쇄적으로 터지고 있다. 샤오미는 최대 99%, 텐센트 클라우드는 최대 97.5%까지 가격을 낮췄고, 오픈 웨이트 모델 확산이 추론 서비스의 차별점을 가격 경쟁으로 몰아가고 있다.