본문으로 건너뛰기
피드

월 20달러 무제한 AI의 종말 — "전기세처럼 쓴 만큼 내는 시대"

ai-ml 약 5분

오픈AI, 앤트로픽, 구글 등 주요 AI 기업이 정액 구독 모델 대신 사용량 기반 과금 체계로 이동 중이다. 추론형 모델 연산 비용 급증과 2026년 140억 달러 적자 전망 때문이다. 앤트로픽은 이미 클로드 구독자의 타사 AI 사용에 추가 요금을 부과하기 시작했다.

  • 1

    오픈AI 2026년 예상 손실 약 140억 달러, 유료 전환율 5% 미만

  • 2

    앤트로픽은 클로드 구독자가 타사 AI 도구를 쓰려면 추가 요금 또는 별도 API 키 필요하도록 정책 변경

  • 3

    AI 에이전트 확산으로 작업당 토큰 사용량이 기존 대비 5~30배 증가 (가트너)

  • 4

    2030년까지 단위 추론 비용은 90% 하락 전망이지만 총 운영비는 오히려 증가

  • 5

    글로벌 AI 인프라 투자 규모 2026년 5000억 달러 돌파 전망

  • 월 20달러 정액제로 생성형 AI를 무한정 쓰던 시대가 사실상 끝나가는 분위기
    • 오픈AI, 앤트로픽, 구글, xAI 모두 200달러(약 29만원) 넘는 프리미엄 요금제를 신설하거나 고성능 기능에 별도 과금하는 방향으로 이동 중
    • 비즈니스인사이더는 "전기세나 클라우드처럼 사용량 기반 과금 체계로 옮겨갈 것"이라고 전망

왜 정액제가 붕괴하고 있나

  • 추론형 모델이 연산 비용을 박살내고 있음
    • 과거 GPT 응답 대비 추론(reasoning) 모델은 훨씬 많은 컴퓨팅을 먹는 구조
    • AI 에이전트 확산으로 작업당 토큰 사용량이 기존 대비 5배에서 최대 30배까지 늘어난다는 가트너 분석
  • 오픈AI의 구조적 적자
    • 2026년 손실 규모가 약 140억 달러(약 21조원) 예상
    • 전체 이용자 9억명이지만 유료 전환율은 5% 미만 — 공짜 유저가 비용만 키우는 구조
    • 샘 알트먼 CEO는 "월 200달러 고가 요금제에서도 여전히 손해 보는 이용자가 있다"고 토로

중요

> 오픈AI 2026년 예상 손실 21조원. 유료 전환율 5% 미만. 프리미엄 요금제마저 헤비유저에게는 적자라는 게 알트먼 본인의 말이다.

앤트로픽도 결국 제3자 도구 사용에 제동

  • 앤트로픽은 ARR 300억 달러까지 올라왔지만 학습·추론 비용이 각각 수십억 달러 규모
  • 지난주 클로드 구독자가 앤트로픽 시스템에서 타사 AI 모델을 쓰려면 추가 요금 또는 별도 API 키가 필요하다는 정책 발표
  • FT 분석은 "클로드 수요 급증으로 제3자 도구 기반 고강도 사용 패턴을 감당 못 한 결과"라고 평가

앞으로 어떻게 바뀌나

  • 가트너 전망 — 2030년까지 단위 AI 추론 비용은 90% 이상 감소, 1조 파라미터 모델 기준 비용 효율은 2022년 대비 최대 100배 개선
    • 근데 총 운영 비용은 줄지 않음 — 토큰 단가는 떨어지지만 사용량 증가 속도가 더 빠름
  • 요금 구조 재편 흐름
    • 기본 기능은 저렴하게, 고성능 기능은 별도 과금
    • 일정 사용량 초과 시 제한
    • 저가·무료 유저에게 광고 도입 가능성까지 실험 중
  • 글로벌 AI 인프라 투자 규모는 2026년 기준 5000억 달러 돌파 전망 (MS, 구글, 아마존, 메타 합산)

기술 맥락

"무제한 정액제" 붕괴의 기술적 뿌리는 추론형 모델(reasoning model)이에요. 기존 챗봇은 토큰을 한 번에 쭉 뱉으면 끝나지만, o1·o3·클로드 익스텐디드 같은 추론 모델은 답하기 전에 내부적으로 수천수만 토큰의 "생각"을 돌리거든요. 이 생각 과정이 전부 GPU 시간이라서, 같은 질문에도 기존 모델의 530배 비용이 나와요.

가트너가 말하는 "토큰 단가는 떨어지는데 총비용은 오른다"도 같은 맥락이에요. 모델이 똑똑해질수록 한 작업에 쓰는 토큰이 기하급수적으로 늘어서, 칩값 하락이 사용량 증가를 못 따라가는 거예요. 에이전트 AI가 본격화하면 한 유저가 자동으로 수백 번 API를 호출하는 패턴이 생겨서 이 격차는 더 벌어져요.

앤트로픽이 타사 AI 브릿지에 추가 요금을 붙인 것도 이 문맥에서 봐야 해요. Cursor나 Cline 같은 IDE·에이전트 툴이 클로드 API를 대량으로 긁어가는데, 월 20달러 구독자가 그걸 통해 수천만 토큰을 소비하면 앤트로픽 입장에서는 손해가 눈덩이처럼 굴러요. 헤비유저가 다른 헤비유저를 보조하는 구조는 지속 불가능하다는 판단이죠.

결국 SaaS식 정액제에서 클라우드식 사용량 과금으로 넘어가는 건 시간 문제예요. 전기·수도처럼 "쓴 만큼 낸다"는 게 AI의 진짜 비용 구조에 더 맞거든요. 한국 개발자 입장에서는 월 구독료로 묶여 있던 비용이 앞으로는 사용량에 따라 요동치는 운영비로 바뀐다는 뜻이라 API 사용량 모니터링이 훨씬 중요해져요.

추론형 모델과 에이전트가 본격화되면서 '월정액 무제한' 구조는 구조적으로 지속 불가능해졌다. SaaS식 구독에서 클라우드식 종량제로의 전환은 AI 비용을 API 운영비처럼 관리해야 하는 시대를 의미한다.

댓글

댓글

댓글을 불러오는 중...

ai-ml

리벨리온 '리벨100', gpt-oss·미니맥스에서 H200 대비 전성비 3배 기록

리벨리온이 2세대 AI 반도체 리벨 100으로 gpt-oss-120b와 MiniMax 등 최신 오픈소스 추론 모델을 구동해 엔비디아 H200 대비 3배 높은 전성비를 기록했다고 공개했다. UCIe 기반 칩렛 구조에 HBM3E 144GB를 탑재했으며, TPOT 3.2ms로 체감 응답 속도에서도 경쟁력을 입증했다.

ai-ml

ETRI, 영상 VFX를 AI로 자동 생성하는 미디어 기술 3종 공개

ETRI가 NAB 2026에서 멀티모달 프롬프트로 VFX를 자동 생성하는 기술, 2D 영상을 USD 기반 3D 에셋으로 변환하는 기술, AI UI·UX 분석 에이전트 등 3종을 공개했다. 기존 영상 편집툴에 플러그인으로 붙는 형태라 현장 투입이 빠르다는 점이 특징이다.

ai-ml

크래프톤, 자체 AI 브랜드 'Raon' 공개 — 음성 LLM·실시간 대화·TTS·비전 인코더 4종 오픈소스

크래프톤이 AI 모델 브랜드 Raon을 출범하고 9B 음성 LLM, 국내 최초 실시간 양방향 음성 대화 모델, TTS, 비전 인코더 4종을 허깅페이스에 오픈소스로 공개했다. 음성 LLM은 10B 이하급에서 영어·한국어 모두 글로벌 1위 성능, 비전 인코더는 구글 SigLIP2를 일부 태스크에서 상회한다.

ai-ml

Godot 관리자 비명 "AI가 생성한 쓰레기 PR 리뷰에 기진맥진"

생성형 AI 코드가 쏟아지면서 고도 엔진 수석 관리자는 '검토·거절 과정이 소모적'이라 토로했고, 2026 상반기 Game Developer 설문에선 생성형 AI 도입률이 36%에서 29%로 반전, 개발자 47%가 AI가 게임 품질을 저하시킬 것이라 응답했다. 감지가 어려운 '조용한 실패'가 장기 프로젝트 안정성을 위협한다는 지적이 핵심이다.

ai-ml

칼텍, 세포 분할 파운데이션 모델 'CellSAM' 오픈소스 공개

칼텍 연구진이 다양한 생물학 이미지에서 세포를 자동 식별하는 범용 파운데이션 모델 CellSAM을 네이처 메서즈에 공개했다. 단일 모델로 종양세포·박테리아·면역세포를 모두 커버하고 세포 간 상호작용과 공간 구조까지 분석 가능하다. 연구자 누구나 무료로 쓸 수 있게 오픈소스로 풀었다.