구글 클라우드 Next '26 — 8세대 TPU $/성능 80%↑, 분당 토큰 160억 돌파

ai-ml 2026-04-23 약 8분

 tags

#google-cloud #ai-agent #tpu #gemini #wiz

vote

북마크

구글 클라우드가 라스베이거스 Next 2026에서 '에이전틱 엔터프라이즈' 시대를 선언했다. 8세대 TPU(학습용 8t, 추론용 8i)를 공개하며 달러당 성능 80% 향상을 내세웠고, Vertex AI를 Gemini Enterprise Agent Platform으로 확장했다. 모델 가든에 Claude Opus 4.7을 추가하고 위즈와 보안 통합을 강화했다.

1
8세대 TPU 8t(학습)/8i(추론) 공개 — 달러당 성능 이전 세대 대비 80% 향상
2
Vertex AI를 Gemini Enterprise Agent Platform으로 확장, 200개+ 모델 지원
3
모델 가든에 Claude Opus 4.7·Sonnet·Haiku 등 앤트로픽 모델 포함
4
분당 토큰 처리량 지난 분기 100억→이번 분기 160억 돌파
5
Wiz 통합으로 Databricks·AWS Agentcore·Azure Copilot·Agentforce 멀티 에이전트 보안 가시성 확보
6
reCAPTCHA가 Google Cloud Fraud Defense로 진화 — 봇·사람·AI 에이전트 권한 식별
7
국내 도입 사례 — 카카오뱅크(금융 규제 + 생산성), CJ올리브영(전사 에이전트)

구글 클라우드가 4월 22일(현지시간) 라스베이거스에서 '구글 클라우드 넥스트 2026' 개최, "에이전틱 엔터프라이즈" 시대 공식 선언
- 토마스 쿠리안 CEO — "챗봇 수준을 넘어 스스로 인지·추론·행동하는 자율형 에이전트 시대"
- 국내 적용 사례 — 카카오뱅크(금융 규제 충족 + 생산성), CJ올리브영(비개발 직군 포함 전사 에이전트 구축)

❗중요

> 분당 토큰 처리량이 지난 분기 100억 → 이번 분기 160억 이상. 지난 12개월간 330개 이상 고객이 각각 1조 토큰+, 35개 기업은 10조 토큰+ 처리. 구글 자사 AI 수요 폭증세 확인.

Gemini Enterprise Agent Platform — Vertex AI의 진화

버텍스 AI(Vertex AI)가 에이전트 플랫폼으로 확장
- 모델 선택·구축 + 에이전트 생성 + 통합 + DevOps + 오케스트레이션 + 보안 통합
- 기술팀이 개발한 에이전트를 제미나이 엔터프라이즈 앱을 통해 직원에게 배포
- IT 운영 체계와 연동해 제어권·거버넌스·보안 유지
모델 가든(Model Garden) — 200개 이상 모델 선택지
- 구글 — Gemini 3.1 Pro, Gemini 3.1 Flash Image("나노 바나나 2"), Lyria 3
- 타사 — 앤트로픽 Claude Opus 4.7(최신), Sonnet, Haiku 지원
CJ올리브영 사례 — 비개발자도 에이전트 구축
- MD·마케팅 담당자가 시장 조사, 고객 데이터 분석 자동화
- 매장 실시간 재고 관리 + 진열 최적화
- 글로벌 확장 시 국가별 언어·현지 고객 특성 맞춤 상품 정보 제공

8세대 TPU — TPU 8t / TPU 8i

학습용 TPU 8t, 추론용 TPU 8i 별도 공개
- 이전 세대 대비 달러당 성능 80% 향상
- 같은 비용으로 거의 2배 수요 처리 가능
- 두 칩 모두 올해 내 정식 출시(GA) 예정

보안 — Wiz 통합 + Fraud Defense

구글 위협 인텔리전스 + 위즈(Wiz) 클라우드·AI 보안 플랫폼 결합
- 제미나이 기반 분석·조사 에이전트가 500만 건 이상 경보 처리
- 기존 30분 수동 분석 → 60초로 단축
위즈 통합 범위 확장 — 멀티클라우드·멀티 에이전트 스튜디오 커버
- Databricks, AWS Agentcore, Gemini Enterprise Agent Platform, Azure Copilot Studio, Salesforce Agentforce
- 어떤 도구로 에이전트 개발해도 전체 환경 가시성 확보
보안 운영 플랫폼(Google Security Operations)에 신규 에이전트 3종 추가
Google Cloud Fraud Defense — 기존 reCAPTCHA 진화, GA 출시
- 봇·사람·에이전트의 정당성·권한 식별 전용
- 조만간 계정 생성·로그인부터 결제·체크아웃까지 AI 에이전트 전용 기능 프리뷰 제공

Workspace Intelligence

회의록·이메일·파일에 녹아있는 의미·맥락을 심층 파악하는 지능형 레이어
- 개별 사용자 환경에 맞춰 업무 방식 재설계
- 정보 격차와 업무 파편화 해소 지향
쿠리안 CEO 마무리 — "AI 하이퍼컴퓨터=확장 기반, 데이터 클라우드=맥락, 에이전틱 디펜스=보안, 에이전트 플랫폼=오케스트레이션. 기술적 준비 끝, 이제 기업이 성장 엔진을 구축할 때"

기술 맥락

TPU 8세대에서 학습용(8t)과 추론용(8i)을 별도 제품군으로 분리한 게 흥미로운 선택이에요. 기존엔 같은 칩으로 둘 다 했지만, 추론 워크로드가 폭증하면서(엔터프라이즈 에이전트가 늘수록 추론 토큰이 기하급수적으로 쌓임) 두 용도의 최적화 방향이 갈라지게 됐거든요. NVIDIA도 Blackwell 세대에서 비슷한 분화 움직임을 보이고 있어서 이게 업계 공통 트렌드예요.

"달러당 성능 80% 향상"이라는 수치가 중요한 이유는 구글 클라우드가 Gemini 토큰 가격 경쟁력을 유지할 수 있는 구조적 근거가 되기 때문이에요. 중국 오픈소스 모델이 API 가격을 바닥까지 끌어내리는 상황에서, 자체 칩으로 추론 비용을 줄이지 않으면 공격적 가격 정책이 불가능해요. AWS가 Trainium/Inferentia에 투자하는 이유도 같은 맥락이에요.

Gemini Enterprise Agent Platform이 기존 Vertex AI에서 이름을 바꾼 것도 포지셔닝 신호예요. Vertex AI는 엔지니어용 ML 플랫폼이었는데, 이걸 에이전트 플랫폼으로 리브랜딩하면서 타깃을 개발팀에서 전체 기업 IT 조직으로 확장했거든요. CJ올리브영의 "비개발자가 직접 에이전트 구축" 사례가 이 전략의 쇼케이스예요.

Wiz의 멀티 에이전트 스튜디오 보안 가시성 확보가 실질적으로 의미 있는 이유는, 기업이 AWS Bedrock, Azure Copilot, Salesforce Agentforce 같은 여러 플랫폼에서 각자 에이전트를 돌리는 게 현실이기 때문이에요. 에이전트가 어디서 어떤 권한으로 돌고 있는지 통합 관점에서 못 보면 쉐도우 IT가 보안 사고로 번지기 쉬운데, Wiz Security Graph가 그 단일 뷰를 제공하겠다는 거예요.

reCAPTCHA가 Fraud Defense로 진화한 것도 AI 에이전트 시대 특유의 변화예요. 기존 reCAPTCHA는 "사람 vs 봇" 구분이 전부였는데, 이제는 "악성 봇 vs 권한 있는 AI 에이전트"를 구분해야 하거든요. 정당한 구매 대행 에이전트는 통과시키고 크레덴셜 스터핑 봇은 막는 식이요.

TPU를 학습용과 추론용으로 분리한 건 에이전트 시대 추론 워크로드 폭증에 대응하는 구조적 분화다. Claude Opus 4.7을 모델 가든에 넣으면서 '구글 모델만' 파는 게 아니라 멀티 모델 허브로 포지셔닝 전환 중이다. CJ올리브영의 '비개발자가 직접 에이전트 구축' 사례가 Vertex AI→Gemini Enterprise Agent Platform 리브랜딩의 실제 쇼케이스.

이전 기사 (P)

다음 기사 (N)

댓글을 불러오는 중...

ai-ml 2026-06-07

메디인테크, 일본 독점 내시경 시장에 AI 로봇 내시경으로 도전

KERI 기술 기반 스핀오프 기업 메디인테크가 서울대병원, 서울대, DGIST와 함께 AI 기반 로봇 내시경 플랫폼 개발에 들어감. 2026년부터 2031년까지 총 228억여원이 투입되는 과제로, 일본 기업이 95% 이상 점유한 연성 전자내시경 시장을 정면으로 겨냥함.

ai-ml 2026-06-07

스페이스X, 구글에 47조원 규모 AI 인프라 빌려주며 클라우드 사업자 변신 시동

스페이스X가 기업공개를 앞두고 구글과 약 47조원 규모의 AI 데이터센터 임대 계약을 맺었다. 구글은 2026년 10월부터 2029년 6월까지 매월 약 1조4000억원을 내고, 스페이스X는 엔비디아 GPU 11만 개를 포함한 연산 자원을 제공할 예정이다. 우주기업으로 알려진 스페이스X가 AI 인프라 사업 성장성을 투자자에게 보여주려는 움직임으로 읽힌다.

ai-ml 2026-06-07

인터랙티브 브로커스, 자연어로 거래 지시 만드는 AI 에이전트 트레이딩 출시

인터랙티브 브로커스가 클라우드 기반 AI 에이전트 트레이딩을 내놓고, 고객이 자연어로 계좌 관리와 거래 지시 생성을 할 수 있게 했다. 핵심은 170개 이상 글로벌 시장의 실제 계좌 데이터를 바탕으로 다중 자산 거래 접근성을 낮추는 데 있다. 다만 투자 관점에서는 참여도 확대라는 기대와 AI 생성 지시에 따른 운영·규제 리스크가 같이 따라붙는다.

ai-ml 2026-06-07

애플, 차세대 시리에 구글 제미나이와 엔비디아 클라우드까지 끌어온다

애플이 차세대 시리를 온디바이스 AI 중심으로 만들되, 복잡한 요청은 구글 클라우드와 엔비디아 AI 칩으로 처리하는 방안을 준비 중이라는 보도다. 핵심은 애플 특유의 프라이버시 기조를 지키면서도, 대형 AI 모델이 필요한 성능을 어떻게 확보하느냐다.

ai-ml 2026-06-06

정부의 ‘모두의 AI’, 한국형 챗지피티보다 더 큰 질문은 기술 주권과 지속 운영비

정부가 2028년까지 1조 2450억 원을 투입해 대국민 무료 대화형 AI 서비스 ‘모두의 AI’를 추진한다. 독자 AI 파운데이션 모델, 독립 벤치마크, 오픈소스 생태계, 노년층 친화 UI, 3300만 명 교육이 핵심 축이다. 다만 장기 운영 비용과 실제 기술 독립성 검증이 성패를 가를 가능성이 크다.

구글 클라우드 Next '26 — 8세대 TPU $/성능 80%↑, 분당 토큰 160억 돌파

요약

핵심 포인트

핵심 개념

분석

Gemini Enterprise Agent Platform — Vertex AI의 진화

8세대 TPU — TPU 8t / TPU 8i

보안 — Wiz 통합 + Fraud Defense

Workspace Intelligence

기술 맥락

인사이트

댓글

댓글

구글 클라우드 Next '26 — 8세대 TPU $/성능 80%↑, 분당 토큰 160억 돌파

요약

핵심 포인트

핵심 개념

분석

Gemini Enterprise Agent Platform — Vertex AI의 진화

8세대 TPU — TPU 8t / TPU 8i

보안 — Wiz 통합 + Fraud Defense

Workspace Intelligence

기술 맥락

인사이트

댓글

댓글

관련 기사