본문으로 건너뛰기
피드

AI 서비스, 월정액만으론 못 버틴다…빅테크가 토큰 종량제로 가는 이유

ai-ml 약 5분
vote
0
댓글
북마크

소프트웨어 산업은 세일즈포스 이후 월정액 구독형 서비스(SaaS)를 표준 모델로 삼아왔어. 하지만 에이전틱 AI가 등장하면서 사용자당 토큰 사용량이 폭발했고, 빅테크는 사용한 만큼 돈을 받는 토큰 종량제(TaaS) 모델로 이동하고 있다는 내용이야.

  • 1

    세일즈포스는 설치형 패키지 소프트웨어 시대에서 구독형 SaaS 모델로 전환을 이끈 대표 기업으로 소개됨

  • 2

    마이크로소프트 코파일럿은 월 30달러, 구글 워크스페이스 AI는 월 20~26달러, 어도비 AI는 월 5~10달러 수준으로 제시됨

  • 3

    에이전틱 AI는 한 번의 지시로 수십 분간 작업하면서 토큰 소비량을 크게 늘리고, 기존 월정액 모델의 비용 부담을 키움

  • 소프트웨어 업계의 기본 과금 모델은 오랫동안 ‘구독’이었음

    • 1999년 세일즈포스가 “소프트웨어는 필요없다”는 캠페인으로 설치형 패키지 소프트웨어 시장에 균열을 냄
    • CD로 소프트웨어를 한 번에 비싸게 파는 대신, 매달 사용료를 받는 방식으로 바꾼 게 핵심임
    • 이후 어도비, 마이크로소프트, 오토데스크 같은 회사들이 이 모델을 따라가면서 SaaS가 표준이 됨
  • AI도 처음엔 이 구독 모델을 그대로 따라가는 분위기였음

    • 마이크로소프트 코파일럿은 월 30달러
    • 구글 워크스페이스 AI는 월 20~26달러
    • 어도비 AI는 월 5~10달러 수준으로 제시됨
    • 사용자당 정해진 월정액을 받고 AI 기능을 붙이는 방식이 상식처럼 보였음
  • 그런데 올해 들어 이 구조가 흔들리기 시작했다는 게 기사의 핵심임

    • 이유는 에이전틱 AI 때문임
    • 에이전틱 AI는 사용자의 지시 한 번으로 수십 분 동안 스스로 작업할 수 있음
    • 그 과정에서 AI가 읽고 쓰는 최소 단위인 토큰 소비량이 폭발적으로 늘어남

중요

> 월 20달러 안팎의 구독료로는 에이전틱 AI 사용량을 감당하기 어려워졌다는 게 포인트임. AI가 오래 일할수록 토큰 비용도 같이 불어나기 때문임.

  • 그래서 빅테크 클라우드 사업자들이 옮겨가는 모델이 TaaS, 즉 토큰 종량제임

    • TaaS는 Token as a Service의 약자로, 사용한 토큰 양만큼 청구하는 구조임
    • 구독형 SaaS가 “좌석당 월 얼마”였다면, TaaS는 “실제로 AI를 얼마나 돌렸나”에 더 가깝게 돈을 받는 방식임
    • 기사 표현대로라면 “땅 파서 장사하나?”라는 질문에 대한 빅테크의 답이 종량제인 셈임
  • 이 변화는 투자 이야기로 포장돼 있지만, 개발자 입장에서도 꽤 현실적인 문제임

    • AI 기능을 제품에 붙이면 이제 월정액 플랜 하나로 비용을 예측하기 어려워짐
    • 사용자 한 명이 짧은 질문 몇 번만 하는지, 에이전트에게 긴 작업을 계속 맡기는지에 따라 원가가 완전히 달라짐
    • 결국 제품 설계 단계에서 토큰 제한, 캐싱, 모델 라우팅, 사용량 기반 과금 같은 구조를 같이 고민해야 함
  • 재미있는 건 세일즈포스가 만든 SaaS 혁명이 AI 시대에 다시 뒤집히고 있다는 점임

    • 설치형 소프트웨어에서 구독형 서비스로 넘어간 지 20년 넘게 지났는데, 이제는 구독형 서비스가 AI 비용을 못 따라가는 상황이 됨
    • AI가 ‘기능’이 아니라 실제로 계속 일하는 ‘작업자’에 가까워질수록, 가격도 좌석 수보다 작업량에 붙는 쪽으로 갈 가능성이 큼

기술 맥락

  • 여기서 중요한 선택은 AI 서비스를 월정액으로 팔지, 사용량 기반으로 팔지예요. 기존 SaaS는 사용자 수를 기준으로 과금해도 비용 예측이 어느 정도 됐지만, AI는 사용자가 얼마나 많은 토큰을 태우느냐에 따라 원가가 확 달라지거든요.

  • 에이전틱 AI가 이 문제를 키워요. 단순 챗봇은 질문 하나에 답변 하나를 만들면 끝나지만, 에이전트는 여러 단계를 계획하고 중간 결과를 읽고 다시 판단하면서 수십 분 동안 작업할 수 있어요. 그래서 같은 사용자 1명이라도 비용이 몇 배로 튈 수 있어요.

  • 빅테크가 TaaS를 보는 이유는 비용과 매출을 더 직접적으로 맞출 수 있기 때문이에요. 사용자가 토큰을 많이 쓰면 많이 내고, 적게 쓰면 적게 내는 구조라서 클라우드 사업자 입장에선 손실 위험을 줄일 수 있어요.

  • 제품 개발팀에겐 이게 아키텍처 문제가 돼요. 어떤 요청은 비싼 모델로 보내고, 어떤 요청은 저렴한 모델로 처리할지 나눠야 하고, 긴 컨텍스트를 매번 다시 보내지 않도록 캐싱이나 요약 전략도 필요해요.

  • 결국 AI 시대의 가격 정책은 결제 페이지에서 끝나는 얘기가 아니에요. 모델 선택, 토큰 예산, 사용자별 제한, 백엔드 관측 지표까지 한꺼번에 설계해야 서비스가 커져도 비용을 버틸 수 있어요.

AI 서비스 가격 정책은 개발자에게도 남 일 아님. 제품에 AI 기능을 붙일수록 기능 설계보다 사용량 제어, 과금 단위, 토큰 비용 예측이 더 중요한 아키텍처 문제가 되고 있음.

댓글

댓글

댓글을 불러오는 중...

ai-ml

대학생들은 이미 챗지피티와 제미나이를 쪼개 쓰는 ‘AI 네이티브’가 됐다

이화여대 학생 설문과 인터뷰를 보면 생성형 AI는 과제 보조 도구를 넘어 학습, 글쓰기, 자료조사, 감정 상담까지 들어온 일상 인프라가 됐다. 학생들은 챗지피티, 제미나이, 클로드, 퍼플렉시티를 용도별로 나눠 쓰면서도 환각과 오류 때문에 교차검증이 필요하다고 보고 있다. 대학의 윤리 지침은 존재하지만 학생 체감은 낮고, 이제는 금지보다 활용 교육과 평가 방식 재설계가 핵심 이슈로 떠올랐다.

ai-ml

AI 에이전트 시대, 진짜 해자는 코딩 실력이 아니라 도메인 지식이다

이 글은 에이전트형 AI가 소프트웨어 개발의 병목을 “만들 수 있나”에서 “맞는지 판단할 수 있나”로 옮겼다고 주장한다. 일반ist 엔지니어의 코드 생산 능력보다, 특정 도메인의 정답을 알아보고 검증할 수 있는 사람이 더 큰 가치를 갖게 된다는 얘기다.

ai-ml

OpenRouter, 시리즈 B에서 1억1300만 달러 조달…멀티 모델 AI 인프라 판 커진다

OpenRouter가 알파벳 성장펀드 CapitalG 주도로 1억1300만 달러 규모 시리즈 B 투자를 받았다. 최근 6개월간 주간 처리량이 5조 토큰에서 25조 토큰으로 5배 늘었고, 올해 1천조 토큰 이상을 처리하는 속도로 성장 중이라고 밝혔다.

ai-ml

테슬라 FSD, 중국서 첫 집단 사기 소송 심리 시작

중국 베이징 법원이 테슬라의 풀 셀프 드라이빙 판매 약속을 둘러싼 소비자 사기 소송 첫 심리를 열었다. 원고 10명은 2019~2021년에 약 5만6천 위안을 내고 FSD를 샀지만, 실제 중국 출시 기능은 구형 하드웨어 차량을 배제했고 완전 자율주행도 제공하지 못했다고 주장한다. 중국 소비자보호법상 사기로 인정되면 환불뿐 아니라 3배 배상까지 이어질 수 있어 파장이 크다.

ai-ml

안도르 제작자, 1,500쪽 대본 공개 접은 이유는 “AI 학습 데이터 되기 싫어서”

스타워즈 드라마 안도르의 쇼러너 토니 길로이가 준비해둔 1,500쪽짜리 대본·콘셉트 아트 공개 계획을 접었다. 이유는 단순하다. 공개하는 순간 AI 모델 학습 데이터로 빨려 들어갈 수 있다는 우려 때문이다. 헐리우드 창작자와 스튜디오, AI 기업 사이의 저작권·학습 데이터 갈등이 다시 선명하게 드러난 사례다.