AI 에이전트, 화면 보고 클릭하게 하면 구조화 API보다 45배 비싸다
Reflex가 같은 어드민 작업을 비전 에이전트와 구조화 API 에이전트로 돌려 비교했더니, 화면 기반 방식은 평균 17분과 55만 입력 토큰을 먹었다. 반면 API 방식은 Sonnet 기준 20초 안팎, Haiku 기준 8초 미만에 끝났고 호출 수도 매번 8번으로 고정됐다.
- 1
비전 에이전트는 스크린샷을 보고 클릭하느라 평균 55만 입력 토큰을 사용함
- 2
API 에이전트는 같은 애플리케이션 로직을 구조화 응답으로 받아 8번 호출로 작업을 끝냄
- 3
처음 프롬프트에서 비전 에이전트는 페이지 아래에 있는 리뷰 3개를 놓쳤고, 14단계짜리 UI 안내를 추가해야 성공함
- 4
저자는 내부 도구라면 비전 에이전트보다 자동 생성 API 표면을 붙이는 쪽이 비용상 유리하다고 봄
에이전트 자동화에서 진짜 비용은 모델 지능만이 아니라 인터페이스 형태에서 나온다는 얘기다. 내가 만든 내부 툴이면 픽셀을 읽게 할 게 아니라, UI가 이미 호출하는 핸들러를 에이전트용 구조화 API로 열어주는 쪽이 훨씬 현실적임.
관련 기사
서울 AI 허브, 커서 해커톤으로 공공데이터 기반 도시문제 해결 실험
서울 AI 허브가 Cursor 국내 공식 빌더 커뮤니티 Team Human과 함께 6월 27일 ‘Cursor Hackathon Seoul vol.3’를 연다. 참가자들은 생성형 AI와 서울시 공공데이터를 활용해 교통, 환경, 복지, 안전 같은 도시문제를 해결하는 서비스를 약 8시간 안에 구현하게 된다.
소버린 AI, 이제 ‘국산’보다 ‘통제권’ 기준을 따질 때
한국의 독자 AI 파운데이션 모델 프로젝트를 둘러싼 논쟁이 ‘외산 기술을 썼느냐’에 갇히면서 정작 중요한 기준 논의가 밀렸다는 지적이 나왔다. 전문가들은 소버린 AI의 핵심을 원산지 증명이 아니라 모델 가중치, 학습 과정, 데이터, 라이선스, 배포·운영 통제권을 국내 주체가 실제로 갖고 있는지로 봐야 한다고 말한다.
중국, AI를 가정과 상점에 밀어 넣는 ‘AI 플러스 소비’ 프로젝트 가동
중국 정부가 내수 침체를 돌파하기 위해 ‘AI 플러스 소비’ 활성화 계획을 내놨다. 휴머노이드, 실버 케어 로봇, 드론 배송, 스마트 홈, AI 체험 센터, 이자 보조금까지 묶어 AI 제품을 일상 소비재로 밀어붙이겠다는 전략이다.
AI 데이터센터 짓느라 빚내는 빅테크, 이제 금리도 신경 써야 함
아마존, 알파벳, 마이크로소프트, 메타 같은 하이퍼스케일러들이 AI 인프라에 올해 약 7천500억 달러를 쏟아부을 전망이다. 투자 규모가 너무 커지면서 잉여현금흐름만으로는 부족해졌고, 빅테크도 채권 발행과 금리 변화에 민감한 기업이 되고 있다.
알파폴드 노벨상 주역 존 점퍼, 구글 딥마인드 떠나 앤트로픽 합류
알파폴드 개발로 2024년 노벨 화학상을 받은 존 점퍼 구글 딥마인드 부사장이 앤트로픽으로 이직한다. 제미나이 공동 개발자 노엄 샤지어의 오픈AI 이직에 이어 구글 핵심 AI 인재 유출이 이어지는 모양새다.
댓글
댓글
댓글을 불러오는 중...