---
title: "구글 클라우드 Next '26 — 8세대 TPU $/성능 80%↑, 분당 토큰 160억 돌파"
published: 2026-04-23T06:05:04.360Z
canonical: https://jeff.news/article/1891
---
# 구글 클라우드 Next '26 — 8세대 TPU $/성능 80%↑, 분당 토큰 160억 돌파

구글 클라우드가 라스베이거스 Next 2026에서 '에이전틱 엔터프라이즈' 시대를 선언했다. 8세대 TPU(학습용 8t, 추론용 8i)를 공개하며 달러당 성능 80% 향상을 내세웠고, Vertex AI를 Gemini Enterprise Agent Platform으로 확장했다. 모델 가든에 Claude Opus 4.7을 추가하고 위즈와 보안 통합을 강화했다.

- 구글 클라우드가 4월 22일(현지시간) 라스베이거스에서 **'구글 클라우드 넥스트 2026'** 개최, "에이전틱 엔터프라이즈" 시대 공식 선언
  - 토마스 쿠리안 CEO — "챗봇 수준을 넘어 스스로 인지·추론·행동하는 자율형 에이전트 시대"
  - 국내 적용 사례 — 카카오뱅크(금융 규제 충족 + 생산성), **CJ올리브영**(비개발 직군 포함 전사 에이전트 구축)

> [!IMPORTANT]
> 분당 토큰 처리량이 지난 분기 100억 → 이번 분기 **160억 이상**. 지난 12개월간 330개 이상 고객이 각각 1조 토큰+, 35개 기업은 10조 토큰+ 처리. 구글 자사 AI 수요 폭증세 확인.

### Gemini Enterprise Agent Platform — Vertex AI의 진화

- 버텍스 AI(Vertex AI)가 에이전트 플랫폼으로 확장
  - 모델 선택·구축 + 에이전트 생성 + 통합 + DevOps + 오케스트레이션 + 보안 통합
  - 기술팀이 개발한 에이전트를 제미나이 엔터프라이즈 앱을 통해 직원에게 배포
  - IT 운영 체계와 연동해 제어권·거버넌스·보안 유지
- **모델 가든(Model Garden)** — 200개 이상 모델 선택지
  - 구글 — Gemini 3.1 Pro, Gemini 3.1 Flash Image("나노 바나나 2"), Lyria 3
  - 타사 — **앤트로픽 Claude Opus 4.7**(최신), Sonnet, Haiku 지원
- CJ올리브영 사례 — 비개발자도 에이전트 구축
  - MD·마케팅 담당자가 시장 조사, 고객 데이터 분석 자동화
  - 매장 실시간 재고 관리 + 진열 최적화
  - 글로벌 확장 시 국가별 언어·현지 고객 특성 맞춤 상품 정보 제공

### 8세대 TPU — TPU 8t / TPU 8i

- 학습용 **TPU 8t**, 추론용 **TPU 8i** 별도 공개
  - 이전 세대 대비 **달러당 성능 80% 향상**
  - 같은 비용으로 거의 2배 수요 처리 가능
  - 두 칩 모두 올해 내 정식 출시(GA) 예정

### 보안 — Wiz 통합 + Fraud Defense

- 구글 위협 인텔리전스 + **위즈(Wiz)** 클라우드·AI 보안 플랫폼 결합
  - 제미나이 기반 분석·조사 에이전트가 **500만 건 이상 경보** 처리
  - 기존 30분 수동 분석 → **60초**로 단축
- 위즈 통합 범위 확장 — 멀티클라우드·멀티 에이전트 스튜디오 커버
  - Databricks, AWS Agentcore, Gemini Enterprise Agent Platform, Azure Copilot Studio, Salesforce Agentforce
  - 어떤 도구로 에이전트 개발해도 전체 환경 가시성 확보
- 보안 운영 플랫폼(Google Security Operations)에 신규 에이전트 3종 추가
- **Google Cloud Fraud Defense** — 기존 reCAPTCHA 진화, GA 출시
  - 봇·사람·에이전트의 정당성·권한 식별 전용
  - 조만간 계정 생성·로그인부터 결제·체크아웃까지 AI 에이전트 전용 기능 프리뷰 제공

### Workspace Intelligence

- 회의록·이메일·파일에 녹아있는 의미·맥락을 심층 파악하는 지능형 레이어
  - 개별 사용자 환경에 맞춰 업무 방식 재설계
  - 정보 격차와 업무 파편화 해소 지향

- 쿠리안 CEO 마무리 — "AI 하이퍼컴퓨터=확장 기반, 데이터 클라우드=맥락, 에이전틱 디펜스=보안, 에이전트 플랫폼=오케스트레이션. 기술적 준비 끝, 이제 기업이 성장 엔진을 구축할 때"

---

## 기술 맥락

TPU 8세대에서 학습용(8t)과 추론용(8i)을 별도 제품군으로 분리한 게 흥미로운 선택이에요. 기존엔 같은 칩으로 둘 다 했지만, 추론 워크로드가 폭증하면서(엔터프라이즈 에이전트가 늘수록 추론 토큰이 기하급수적으로 쌓임) 두 용도의 최적화 방향이 갈라지게 됐거든요. NVIDIA도 Blackwell 세대에서 비슷한 분화 움직임을 보이고 있어서 이게 업계 공통 트렌드예요.

"달러당 성능 80% 향상"이라는 수치가 중요한 이유는 구글 클라우드가 Gemini 토큰 가격 경쟁력을 유지할 수 있는 구조적 근거가 되기 때문이에요. 중국 오픈소스 모델이 API 가격을 바닥까지 끌어내리는 상황에서, 자체 칩으로 추론 비용을 줄이지 않으면 공격적 가격 정책이 불가능해요. AWS가 Trainium/Inferentia에 투자하는 이유도 같은 맥락이에요.

Gemini Enterprise Agent Platform이 기존 Vertex AI에서 이름을 바꾼 것도 포지셔닝 신호예요. Vertex AI는 엔지니어용 ML 플랫폼이었는데, 이걸 에이전트 플랫폼으로 리브랜딩하면서 타깃을 개발팀에서 전체 기업 IT 조직으로 확장했거든요. CJ올리브영의 "비개발자가 직접 에이전트 구축" 사례가 이 전략의 쇼케이스예요.

Wiz의 멀티 에이전트 스튜디오 보안 가시성 확보가 실질적으로 의미 있는 이유는, 기업이 AWS Bedrock, Azure Copilot, Salesforce Agentforce 같은 여러 플랫폼에서 각자 에이전트를 돌리는 게 현실이기 때문이에요. 에이전트가 어디서 어떤 권한으로 돌고 있는지 통합 관점에서 못 보면 쉐도우 IT가 보안 사고로 번지기 쉬운데, Wiz Security Graph가 그 단일 뷰를 제공하겠다는 거예요.

reCAPTCHA가 Fraud Defense로 진화한 것도 AI 에이전트 시대 특유의 변화예요. 기존 reCAPTCHA는 "사람 vs 봇" 구분이 전부였는데, 이제는 "악성 봇 vs 권한 있는 AI 에이전트"를 구분해야 하거든요. 정당한 구매 대행 에이전트는 통과시키고 크레덴셜 스터핑 봇은 막는 식이요.

## 핵심 포인트

- 8세대 TPU 8t(학습)/8i(추론) 공개 — 달러당 성능 이전 세대 대비 80% 향상
- Vertex AI를 Gemini Enterprise Agent Platform으로 확장, 200개+ 모델 지원
- 모델 가든에 Claude Opus 4.7·Sonnet·Haiku 등 앤트로픽 모델 포함
- 분당 토큰 처리량 지난 분기 100억→이번 분기 160억 돌파
- Wiz 통합으로 Databricks·AWS Agentcore·Azure Copilot·Agentforce 멀티 에이전트 보안 가시성 확보
- reCAPTCHA가 Google Cloud Fraud Defense로 진화 — 봇·사람·AI 에이전트 권한 식별
- 국내 도입 사례 — 카카오뱅크(금융 규제 + 생산성), CJ올리브영(전사 에이전트)

## 인사이트

TPU를 학습용과 추론용으로 분리한 건 에이전트 시대 추론 워크로드 폭증에 대응하는 구조적 분화다. Claude Opus 4.7을 모델 가든에 넣으면서 '구글 모델만' 파는 게 아니라 멀티 모델 허브로 포지셔닝 전환 중이다. CJ올리브영의 '비개발자가 직접 에이전트 구축' 사례가 Vertex AI→Gemini Enterprise Agent Platform 리브랜딩의 실제 쇼케이스.
