---
title: "목적 없는 AI 자동화, 토큰 비용 폭탄으로 돌아온다"
published: 2026-05-22T06:05:05.296Z
canonical: https://jeff.news/article/3102
---
# 목적 없는 AI 자동화, 토큰 비용 폭탄으로 돌아온다

굿어스데이터 추창호 기술그룹장은 AI 에이전트와 자동화 도구를 무작정 붙이면 토큰 사용량과 클라우드 비용이 통제 불능으로 튈 수 있다고 지적했다. 최신 모델보다 데이터 전처리와 비용 시뮬레이션, 사람의 운영 관리가 AX 성패를 가른다는 얘기다.

## AI 자동화, 문제는 ‘도입’이 아니라 ‘계산서’임

- 굿어스데이터 추창호 기술그룹장은 AI 자동화를 목적 없이 밀어붙이면 클라우드 비용부터 터질 수 있다고 봄
  - AI 에이전트와 자동화 도구가 늘면서 기업 내부의 토큰 사용량이 폭발적으로 증가하는 흐름이라는 것
  - 예전엔 사용량 기반으로 어느 정도 비용 예측이 됐지만, 이제는 개인 단위 자동화 도구까지 섞이면서 예측 난이도가 확 올라감

- 해외에선 이미 AI 에이전트를 과하게 쓰다가 운영비가 서비스 구독료를 넘어서는 사례가 나오는 중임
  - 최신 AI 모델로 업그레이드한 뒤 토큰 사용량이 7배 이상 늘어 서비스를 중단한 사례도 언급됨
  - 클라우드 처음 도입할 때 “인프라 비용 줄겠지” 했다가 운영비가 더 늘었던 패턴과 비슷하다는 비유가 꽤 현실적임

> [!IMPORTANT]
> 이 기사의 핵심은 “AI 자동화를 하지 말자”가 아니라, 자동화 전에 토큰 사용량과 클라우드 예산을 먼저 시뮬레이션하자는 쪽임.

- 굿어스데이터는 이 시행착오를 줄이기 위해 LLM 도입 전용 ‘플레이그라운드’ 환경을 제공한다고 함
  - 고객사가 글로벌 모델, 국산 오픈소스 모델, 여러 LLM 아키텍처를 직접 테스트하는 구조임
  - 실제 업무에 붙였을 때 토큰이 얼마나 타는지, 클라우드 인프라 예산이 어느 정도 나오는지 미리 보는 비용 검증 플랫폼에 가까움

## 최신 모델보다 데이터가 더 세다는 얘기

- 추 그룹장은 AI 성능을 좌우하는 가장 큰 변수로 데이터 품질과 전처리를 꼽음
  - 지난해 자체 AI 모델 벤치마킹에서 최신 모델 알고리즘보다 데이터 정제와 전처리 기술의 영향이 더 컸다고 설명함
  - 데이터가 아무리 많아도 정제가 안 돼 있으면 고성능 모델도 엉뚱한 답을 낼 수 있다는 얘기임

- 금융권 사례는 꽤 구체적임
  - 불완전 판매 방지 시스템에서 하루 수천~수만 건씩 쌓이는 음성 녹취 데이터를 100% 텍스트로 변환함
  - 이후 규정 준수 여부를 체크하는데, 야간 시간대에 제한된 토큰 리밋 안에서 대량 처리가 되도록 스케줄링 파이프라인을 최적화했다고 함

- 교육 쪽에선 네이버클라우드 인프라 기반의 인공지능 디지털교과서(AIDT) 플랫폼 운영을 지원함
  - 동영상 교육 콘텐츠의 연사 발언을 텍스트로 뽑고 다국어로 번역하는 작업을 수행함
  - 고객사 검수팀에서 오류 피드백을 한 번도 받지 않았다고 밝힘
  - 지난해 파트너 비즈데이에서 매출 성장률 등 2개 부문을 수상했다는 성과도 덧붙임

- 방송사 쪽에서도 실시간 자막과 취재 데이터베이스화 수요가 이어지고 있다고 함
  - 결국 AI 도입 포인트가 “멋진 데모”에서 “대량 데이터를 안정적으로 처리하는 운영 시스템”으로 내려오고 있는 셈임

## 멀티 에이전트가 개발자를 바로 대체하긴 아직 빡셈

- 추 그룹장은 AI 에이전트가 인간 개발자를 대체할 수 있다는 주장에는 꽤 회의적임
  - 요즘은 여러 AI 에이전트를 기획, 코딩, 리뷰(QA)처럼 회사 조직도 비슷하게 나눠 배치하는 구조가 주목받고 있음
  - 그런데 실제로 돌려보면 서로 자기 일이 아니라고 책임을 넘기고 루프만 도는 현상이 생긴다고 함

> [!WARNING]
> 멀티 에이전트 구조는 그럴듯해 보여도, 맥락 정의와 책임 소재가 흐리면 결과물이 안 나오고 비용만 태울 수 있음.

- 결국 중간에 사람이 들어와 맥락을 정의하고 가이드라인을 줘야 한다는 게 기사에서 반복되는 결론임
  - 결과물에 책임지는 주체는 여전히 사람이라는 것
  - AI 도입 뒤 비용 대비 효율이 안 나와 다시 사람을 뽑는 빅테크 사례도 이 맥락에서 언급됨

- 굿어스데이터는 앞으로 네이버클라우드의 프리미엄 서비스 파트너(UMSP) 지위를 바탕으로 해외 진출도 준비 중임
  - 대상 지역으로 동남아와 중동이 언급됨
  - 일부 지역에서 미국산 기술 의존도를 낮추려는 움직임이 있어, 한국 기업과 오픈소스 모델 활용에 기회가 생길 수 있다는 전망임

---

## 기술 맥락

- 이 기사에서 실제 선택지는 “최신 LLM을 바로 붙일까”가 아니라 “업무별로 어떤 모델과 운영 구조가 비용 대비 맞을까”예요. 토큰 기반 과금은 자동화가 늘수록 숨어서 커지기 때문에, 도입 전에 플레이그라운드로 사용량을 재보는 게 중요한 거예요.

- 데이터 전처리가 강조되는 이유는 모델이 아무리 좋아도 입력 데이터가 지저분하면 결과가 흔들리기 때문이에요. 금융권 녹취처럼 하루 수천~수만 건이 쌓이는 업무에서는 모델 선택보다 변환, 정제, 스케줄링이 더 직접적인 품질 변수로 작동해요.

- 멀티 에이전트가 아직 애매하다는 말도 단순한 회의론은 아니에요. 기획, 코딩, 리뷰를 나눠도 각 에이전트가 책임 범위와 맥락을 이해하지 못하면 루프가 생기고, 그 루프가 다시 토큰 비용으로 이어지거든요.

- 그래서 기업 AI 운영의 핵심은 모델 성능, 데이터 파이프라인, 비용 통제, 사람의 검수 체계를 같이 설계하는 쪽에 가까워요. 자동화 자체보다 자동화가 실패했을 때 멈추고 수정할 수 있는 운영 장치가 더 중요해지는 흐름이에요.

## 핵심 포인트

- AI 자동화 확산으로 기업 내 토큰 사용량이 폭증하고 비용 예측이 어려워짐
- 최신 모델보다 데이터 품질과 전처리가 실제 성능에 더 큰 영향을 줄 수 있음
- 멀티 에이전트가 개발자를 대체하려면 아직 사람의 맥락 정의와 감독이 필수임
- 금융권 녹취 분석, 교육 콘텐츠 번역, 방송 데이터베이스화 같은 실제 적용 사례가 나옴

## 인사이트

AI 도입의 병목이 모델 성능에서 운영 경제성으로 넘어가고 있다는 신호임. 한국 기업 입장에선 “무슨 모델 쓸까”보다 “토큰과 데이터 파이프라인을 어떻게 통제할까”가 더 현실적인 질문이 됨.
