본문으로 건너뛰기
피드

구글 클라우드 Next '26 — 8세대 TPU $/성능 80%↑, 분당 토큰 160억 돌파

ai-ml 약 8분

구글 클라우드가 라스베이거스 Next 2026에서 '에이전틱 엔터프라이즈' 시대를 선언했다. 8세대 TPU(학습용 8t, 추론용 8i)를 공개하며 달러당 성능 80% 향상을 내세웠고, Vertex AI를 Gemini Enterprise Agent Platform으로 확장했다. 모델 가든에 Claude Opus 4.7을 추가하고 위즈와 보안 통합을 강화했다.

  • 1

    8세대 TPU 8t(학습)/8i(추론) 공개 — 달러당 성능 이전 세대 대비 80% 향상

  • 2

    Vertex AI를 Gemini Enterprise Agent Platform으로 확장, 200개+ 모델 지원

  • 3

    모델 가든에 Claude Opus 4.7·Sonnet·Haiku 등 앤트로픽 모델 포함

  • 4

    분당 토큰 처리량 지난 분기 100억→이번 분기 160억 돌파

  • 5

    Wiz 통합으로 Databricks·AWS Agentcore·Azure Copilot·Agentforce 멀티 에이전트 보안 가시성 확보

  • 6

    reCAPTCHA가 Google Cloud Fraud Defense로 진화 — 봇·사람·AI 에이전트 권한 식별

  • 7

    국내 도입 사례 — 카카오뱅크(금융 규제 + 생산성), CJ올리브영(전사 에이전트)

  • 구글 클라우드가 4월 22일(현지시간) 라스베이거스에서 '구글 클라우드 넥스트 2026' 개최, "에이전틱 엔터프라이즈" 시대 공식 선언
    • 토마스 쿠리안 CEO — "챗봇 수준을 넘어 스스로 인지·추론·행동하는 자율형 에이전트 시대"
    • 국내 적용 사례 — 카카오뱅크(금융 규제 충족 + 생산성), CJ올리브영(비개발 직군 포함 전사 에이전트 구축)

중요

> 분당 토큰 처리량이 지난 분기 100억 → 이번 분기 160억 이상. 지난 12개월간 330개 이상 고객이 각각 1조 토큰+, 35개 기업은 10조 토큰+ 처리. 구글 자사 AI 수요 폭증세 확인.

Gemini Enterprise Agent Platform — Vertex AI의 진화

  • 버텍스 AI(Vertex AI)가 에이전트 플랫폼으로 확장
    • 모델 선택·구축 + 에이전트 생성 + 통합 + DevOps + 오케스트레이션 + 보안 통합
    • 기술팀이 개발한 에이전트를 제미나이 엔터프라이즈 앱을 통해 직원에게 배포
    • IT 운영 체계와 연동해 제어권·거버넌스·보안 유지
  • 모델 가든(Model Garden) — 200개 이상 모델 선택지
    • 구글 — Gemini 3.1 Pro, Gemini 3.1 Flash Image("나노 바나나 2"), Lyria 3
    • 타사 — 앤트로픽 Claude Opus 4.7(최신), Sonnet, Haiku 지원
  • CJ올리브영 사례 — 비개발자도 에이전트 구축
    • MD·마케팅 담당자가 시장 조사, 고객 데이터 분석 자동화
    • 매장 실시간 재고 관리 + 진열 최적화
    • 글로벌 확장 시 국가별 언어·현지 고객 특성 맞춤 상품 정보 제공

8세대 TPU — TPU 8t / TPU 8i

  • 학습용 TPU 8t, 추론용 TPU 8i 별도 공개
    • 이전 세대 대비 달러당 성능 80% 향상
    • 같은 비용으로 거의 2배 수요 처리 가능
    • 두 칩 모두 올해 내 정식 출시(GA) 예정

보안 — Wiz 통합 + Fraud Defense

  • 구글 위협 인텔리전스 + 위즈(Wiz) 클라우드·AI 보안 플랫폼 결합
    • 제미나이 기반 분석·조사 에이전트가 500만 건 이상 경보 처리
    • 기존 30분 수동 분석 → 60초로 단축
  • 위즈 통합 범위 확장 — 멀티클라우드·멀티 에이전트 스튜디오 커버
    • Databricks, AWS Agentcore, Gemini Enterprise Agent Platform, Azure Copilot Studio, Salesforce Agentforce
    • 어떤 도구로 에이전트 개발해도 전체 환경 가시성 확보
  • 보안 운영 플랫폼(Google Security Operations)에 신규 에이전트 3종 추가
  • Google Cloud Fraud Defense — 기존 reCAPTCHA 진화, GA 출시
    • 봇·사람·에이전트의 정당성·권한 식별 전용
    • 조만간 계정 생성·로그인부터 결제·체크아웃까지 AI 에이전트 전용 기능 프리뷰 제공

Workspace Intelligence

  • 회의록·이메일·파일에 녹아있는 의미·맥락을 심층 파악하는 지능형 레이어

    • 개별 사용자 환경에 맞춰 업무 방식 재설계
    • 정보 격차와 업무 파편화 해소 지향
  • 쿠리안 CEO 마무리 — "AI 하이퍼컴퓨터=확장 기반, 데이터 클라우드=맥락, 에이전틱 디펜스=보안, 에이전트 플랫폼=오케스트레이션. 기술적 준비 끝, 이제 기업이 성장 엔진을 구축할 때"


기술 맥락

TPU 8세대에서 학습용(8t)과 추론용(8i)을 별도 제품군으로 분리한 게 흥미로운 선택이에요. 기존엔 같은 칩으로 둘 다 했지만, 추론 워크로드가 폭증하면서(엔터프라이즈 에이전트가 늘수록 추론 토큰이 기하급수적으로 쌓임) 두 용도의 최적화 방향이 갈라지게 됐거든요. NVIDIA도 Blackwell 세대에서 비슷한 분화 움직임을 보이고 있어서 이게 업계 공통 트렌드예요.

"달러당 성능 80% 향상"이라는 수치가 중요한 이유는 구글 클라우드가 Gemini 토큰 가격 경쟁력을 유지할 수 있는 구조적 근거가 되기 때문이에요. 중국 오픈소스 모델이 API 가격을 바닥까지 끌어내리는 상황에서, 자체 칩으로 추론 비용을 줄이지 않으면 공격적 가격 정책이 불가능해요. AWS가 Trainium/Inferentia에 투자하는 이유도 같은 맥락이에요.

Gemini Enterprise Agent Platform이 기존 Vertex AI에서 이름을 바꾼 것도 포지셔닝 신호예요. Vertex AI는 엔지니어용 ML 플랫폼이었는데, 이걸 에이전트 플랫폼으로 리브랜딩하면서 타깃을 개발팀에서 전체 기업 IT 조직으로 확장했거든요. CJ올리브영의 "비개발자가 직접 에이전트 구축" 사례가 이 전략의 쇼케이스예요.

Wiz의 멀티 에이전트 스튜디오 보안 가시성 확보가 실질적으로 의미 있는 이유는, 기업이 AWS Bedrock, Azure Copilot, Salesforce Agentforce 같은 여러 플랫폼에서 각자 에이전트를 돌리는 게 현실이기 때문이에요. 에이전트가 어디서 어떤 권한으로 돌고 있는지 통합 관점에서 못 보면 쉐도우 IT가 보안 사고로 번지기 쉬운데, Wiz Security Graph가 그 단일 뷰를 제공하겠다는 거예요.

reCAPTCHA가 Fraud Defense로 진화한 것도 AI 에이전트 시대 특유의 변화예요. 기존 reCAPTCHA는 "사람 vs 봇" 구분이 전부였는데, 이제는 "악성 봇 vs 권한 있는 AI 에이전트"를 구분해야 하거든요. 정당한 구매 대행 에이전트는 통과시키고 크레덴셜 스터핑 봇은 막는 식이요.

TPU를 학습용과 추론용으로 분리한 건 에이전트 시대 추론 워크로드 폭증에 대응하는 구조적 분화다. Claude Opus 4.7을 모델 가든에 넣으면서 '구글 모델만' 파는 게 아니라 멀티 모델 허브로 포지셔닝 전환 중이다. CJ올리브영의 '비개발자가 직접 에이전트 구축' 사례가 Vertex AI→Gemini Enterprise Agent Platform 리브랜딩의 실제 쇼케이스.

댓글

댓글

댓글을 불러오는 중...

ai-ml

Claude 25배 싼 Kimi K2.6 풀렸다 — 엔지니어 국가의 물량전, 한국은 A·B·C 중 어디 설 건가

중국 문샷AI가 1조 파라미터 Kimi K2.6을 오픈소스로 공개했다. SWE-Bench Pro에서 Claude Opus 4.6을 앞서고 API 가격은 1/4 수준이다. 댄 왕의 <Breakneck>를 빌려 '짓는 나라(중국) vs 막는 나라(미국)' 구도를 제시하며, 미국 B2C의 구조적 적자와 한국의 세 가지 전략적 선택(A·B·C)을 짚는 칼럼.

ai-ml

엔비디아, 서울에서 'OpenClaw' 첫 공개…DGX 스파크로 로컬 에이전트 수요 선점

엔비디아가 자율형 AI 에이전트 시장의 첫 글로벌 거점으로 한국을 택해 서울에서 '네모트론 디벨로퍼 데이즈 2026'을 열었다. 오픈소스 프레임워크 OpenClaw, 보안 런타임 OpenShell, 엔터프라이즈 서비스 NemoClaw로 이어지는 3층 스택과 1200억 파라미터 모델을 API 비용 없이 돌리는 DGX 스파크를 풀스택으로 엮어 수요를 흡수한다.

ai-ml

삼성SDS, 2031년까지 10조 쏜다…AI DC에 5조·M&A에 4조, 구글과 소버린 AI 협력

삼성SDS가 2031년까지 총 10조원을 투입해 AI 풀스택 기업으로 전환한다. AI 인프라 5조, 서비스·플랫폼 1조, M&A 4조로 나뉘며 이미 구미 60MW 데이터센터에 2.1조가 집행 중이다. 구글과 GDC·제미나이 엔터프라이즈 기반 소버린 AI 파트너십도 체결했다.

ai-ml

스탠퍼드 AI 인덱스 '한국 주목할 모델' 5→8개로 정정…과기정통부가 이의제기

스탠퍼드대 HAI의 'AI 인덱스 2026' 보고서에서 한국의 주목할 만한 AI 모델 수가 5개에서 8개로 정정된다. 과기정통부가 근거 DB인 에포크 AI에 8개로 등재된 점을 들어 이의를 제기한 결과다. 추가된 3개는 SKT A.X K1, NC AI 배키, 네이버 하이퍼클로바 X 시드 32B 싱크다.

ai-ml

"신입 진입 차단"…국가AI전략위, AI 시대 인재·교육 대전환 포럼 개최

국가AI전략위원회가 AI 확산에 따른 인재 양성·교육체계 개편 방향을 논의하는 포럼을 개최했다. 전문가들은 AI로 인해 청년 노동시장에서 진입 차단과 경력 사다리 약화가 발생한다고 진단하며, 취업 지원 조기화와 AI 협업 중심 훈련 전환을 대안으로 제시했다.