---
title: "구글, 메타에 팔던 제미나이 용량도 배분제로 돌렸다"
published: 2026-07-05T16:05:04.732Z
canonical: https://jeff.news/article/4670
---
# 구글, 메타에 팔던 제미나이 용량도 배분제로 돌렸다

구글이 메타에 제공하던 제미나이 모델 용량을 3월부터 제한했다. 클라우드 AI 수요가 폭증하면서 돈을 더 낸다고 원하는 만큼 연산 자원을 확보할 수 있다는 전제가 흔들리고 있다.

- 구글이 메타에 제공하던 제미나이 용량을 3월쯤 제한함. 이유는 간단함. 수요가 공급을 이겨버림
  - 메타는 구매하려던 제미나이 용량을 전부 받지 못한다는 통보를 받았고, 이 여파로 내부 AI 프로젝트 여러 개가 밀림
  - 영향받은 영역은 페이스북과 인스타그램 전반의 코딩, 광고 도구, 콘텐츠 조정 작업임
  - 관리자들은 엔지니어들에게 AI 토큰을 더 아껴 쓰라고 지시함. 돈 아끼자는 얘기라기보다, 쓸 수 있는 모델 용량 자체가 부족해진 상황에 가까움

- 이번 일이 묘한 건 피해자가 메타라는 점임. 자체 모델 라마를 가진 회사도 구글 모델을 빌려 쓰고 있었던 셈
  - 메타가 제미나이에 기대던 이유는 사기 탐지와 유해 게시물 필터링 성능에서 자체 라마 모델보다 나았기 때문
  - 그러니까 “우리도 모델 있음”만으로는 끝이 아님. 실제 프로덕션 업무마다 더 잘 맞는 모델이 있고, 그 모델의 공급량이 제품 일정에 바로 영향을 줌
  - 메타는 올해 AI에 최대 1,350억달러를 투입하는 중인데도, 외부 모델 용량 제한 때문에 내부 전환 속도를 앞당기게 됨

> [!IMPORTANT]
> 구글 클라우드 수주잔고는 4,600억달러에 육박했고, 클라우드 매출은 분기 기준 처음 200억달러를 넘김. 문제는 수요가 없는 게 아니라, 팔고 싶어도 충분히 못 파는 쪽에 가까움.

- 구글은 5월부터 이 제한을 더 공식화함. 이제 접근 권한은 “얼마를 낼 수 있냐”보다 “실제로 남은 용량이 있냐”에 맞춰 조정됨
  - 기존 클라우드 감각으로 보면 엔터프라이즈 계약을 크게 맺으면 필요한 만큼 자원을 받을 수 있을 것 같지만, AI 추론 인프라에서는 그 전제가 흔들리고 있음
  - 순다르 피차이도 실적 발표에서 단기적으로 “연산 제약” 상태라고 언급함
  - 외부 AI 플랫폼 위에 서비스를 올리는 회사 입장에서는 계약서보다 실제 할당량이 더 중요한 변수가 된다는 뜻임

- 구글도 손 놓고 있는 건 아님. 다만 돈을 쏟아도 격차가 바로 줄어드는 구조가 아님
  - 보도에 따르면 구글은 약 11만 개 엔비디아 GPU를 확보하기 위해 스페이스X에 매달 약 9억2천만달러를 내기로 함
  - 그런데 이건 임시방편에 가깝다는 평가가 붙음
  - 구글은 확정된 수요 1달러당 신규 용량에 약 40센트만 쓰고 있어, 밀린 수요를 따라잡기보다 격차가 더 벌어질 가능성이 있음

- 개발자 입장에서 핵심은 이거임. AI 기능을 만들 때 모델 선택만 보면 안 되고, 공급 안정성까지 아키텍처 변수로 봐야 함
  - 특정 외부 모델 하나에 강하게 묶이면, 성능이 좋아도 할당량 제한 하나로 제품 릴리스가 밀릴 수 있음
  - 자체 모델, 외부 모델, 백업 모델, 작업별 라우팅 전략이 점점 더 중요해질 수밖에 없음
  - 특히 광고, 보안, 콘텐츠 조정처럼 대량 추론이 필요한 영역은 “모델이 되냐”보다 “계속 충분히 돌릴 수 있냐”가 더 빡센 질문이 됨

---

## 기술 맥락

- 이번 선택의 핵심은 구글이 제미나이 접근을 가격 기반 판매가 아니라 용량 기반 배분으로 바꿨다는 점이에요. AI 모델은 소프트웨어처럼 무한 복제되는 느낌이 있지만, 실제 추론은 GPU와 데이터센터 전력, 네트워크, 운영 여유분을 계속 잡아먹거든요.

- 메타가 영향을 크게 받은 이유는 사용 규모가 일반 고객보다 훨씬 컸기 때문이에요. 코딩 보조, 광고 도구, 콘텐츠 조정처럼 매일 대량으로 호출되는 업무에 외부 모델을 붙이면, 작은 제한도 내부 프로젝트 일정 전체로 번질 수 있어요.

- 라마 같은 자체 모델이 있어도 제미나이를 쓴 건 작업별 성능 차이가 있었기 때문이에요. 특히 사기나 유해 게시물 탐지처럼 오탐과 미탐 비용이 큰 영역에서는 “우리 모델을 쓰자”보다 “지금 제일 잘 맞는 모델을 쓰자”가 더 현실적인 선택이 될 수 있어요.

- 그래서 AI 제품을 만드는 팀은 앞으로 모델 성능표만 볼 게 아니라 공급 리스크도 같이 봐야 해요. 특정 모델 장애나 할당량 제한에 대비해 백업 모델, 요청 라우팅, 토큰 예산 관리 같은 운영 설계가 제품 품질의 일부가 되는 흐름이에요.

## 핵심 포인트

- 구글은 메타가 원한 제미나이 용량을 전부 공급할 수 없다고 통보했다
- 메타 내부의 코딩, 광고 도구, 콘텐츠 조정 관련 AI 프로젝트가 지연됐다
- 구글 클라우드 수주잔고는 4,600억달러에 육박했고 클라우드 매출은 분기 200억달러를 넘겼다
- 구글은 약 11만 개 엔비디아 GPU 확보를 위해 스페이스X에 매달 9억2천만달러를 내는 계약까지 맺은 것으로 전해졌다

## 인사이트

이건 단순히 구글과 메타 사이의 공급 문제가 아니라, AI 서비스를 외부 모델 위에 올리는 회사들이 마주할 새 병목을 보여준다. 앞으로는 모델 성능만큼이나 연산 자원 확보 전략이 제품 일정의 핵심 변수가 될 가능성이 크다.
