본문으로 건너뛰기
피드

구글 클라우드 넥스트 '26 총정리 — 에이전트 플랫폼·8세대 TPU·위즈 합류 후 첫 보안

ai-ml 약 8분

구글 클라우드 넥스트 '26 Day 1에서 토마스 키리안 CEO가 '에이전트의 시대'를 선언하며 제미나이 엔터프라이즈 에이전트 플랫폼, 학습/추론 분리 설계된 8세대 TPU, 에이전틱 데이터 클라우드, 위즈 합류 후 첫 자율 보안 AI, 7.5억 달러 파트너 펀드를 공개했다. 구글 신규 코드의 75%가 AI 생성이라는 수치와 함께 엔터프라이즈 AI가 실험 단계를 지났음을 선언한 행사다.

  • 1

    구글 신규 코드의 75%가 AI 생성 (1년 전 25%에서 3배 증가)

  • 2

    제미나이 엔터프라이즈 유료 MAU 전 분기 대비 40% 성장, 고객의 75%가 AI 제품 활용

  • 3

    8세대 TPU를 학습용(TPU 8t)과 추론용(TPU 8i)으로 사상 처음 분리 설계

  • 4

    에이전틱 데이터 클라우드 공개 — 라이트닝 엔진이 오픈소스 Spark 대비 최대 4.5배 빠름

  • 5

    320억 달러에 인수한 Wiz가 합류 후 첫 통합 발표, 위협 헌팅·탐지 엔지니어링 에이전트 공개

  • 6

    7.5억 달러 파트너 펀드로 에이전트 배포 속도 경쟁에 베팅

  • 구글 클라우드 CEO 토마스 키리안이 넥스트 '26 키노트 첫마디로 선언 — "파일럿의 시대는 끝났다, 에이전트의 시대가 왔다"
    • 라스베이거스 만달레이 베이에 3만 2000명 집결, 단순 제품 발표가 아니라 엔터프라이즈 AI 다음 장의 청사진 제시
  • 순다르 피차이가 공개한 충격 수치 — 구글이 신규로 작성하는 코드의 75%가 AI 생성
    • 불과 1년 전 25%에서 세 배로 뛴 수치
    • "우리는 항상 자사 기술의 '고객 제로(customer zero)'가 되는 것이 목표"라고 강조

중요

> 2026년 1분기 기준 구글 클라우드 고객의 약 75%가 AI 제품을 활용 중이고, 제미나이 엔터프라이즈 유료 MAU는 전 분기 대비 40% 성장. 수치만 놓고 보면 엔터프라이즈 AI는 이미 실험 단계를 지났음.

1. 제미나이 엔터프라이즈 에이전트 플랫폼 — 수천 개 에이전트 관리 문제로

  • 버텍스 AI의 진화 형태로, 구축(Build)·확장(Scale)·거버넌스(Govern)·최적화(Optimize)를 하나로 묶은 플랫폼
    • 구축: 비기술자용 저코드 '에이전트 스튜디오' + 코드 우선 방식의 업그레이드된 ADK(Agent Development Kit)
    • 확장: 며칠씩 상태를 유지하는 장기 실행 에이전트를 지원하는 '에이전트 런타임' + 장기 맥락 저장용 '메모리 뱅크'
    • 거버넌스: 에이전트 ID·레지스트리·게이트웨이로 내부든 파트너든 모든 에이전트에 추적 가능한 신원 부여
  • 피차이는 화두 자체가 바뀌었다고 지적 — "'에이전트를 만들 수 있나?'에서 '수천 개를 어떻게 관리하나?'로"
    • 이게 이번 행사의 관통 메시지. 개별 기능이 아니라 운영의 관제탑이 핵심

2. 8세대 TPU — 사상 처음으로 학습/추론 분리 설계

  • 구글이 역대 처음으로 TPU를 학습용(TPU 8t)과 추론용(TPU 8i) 두 종류로 분리 설계
    • 워크로드 특성이 달라진 현실을 하드웨어 레벨에서 인정한 셈

3. 에이전틱 데이터 클라우드 — "문맥 없는 추론은 추측일 뿐"

  • 최고 제품·사업 책임자 카르틱 나레인이 데이터 플랫폼 전면 재설계 발표
    • "Reasoning without context is just guessing"이라는 문구로 방향 제시
  • 핵심은 지식 카탈로그(Knowledge Catalog) — 기업 비즈니스 데이터와 시맨틱을 통합 맥락 그래프로 구성, 에이전트가 실시간 접근
  • 부속 기능들도 공격적
    • 스마트 스토리지: 파일이 에이전트에 닿기 전 자동 태깅·메타데이터 보강, 오브젝트 컨텍스트 API 포함
    • 라이트닝 엔진: Apache Spark 기반, 오픈소스 대비 최대 4.5배 빠른 서버리스 엔진
    • 크로스클라우드 레이크하우스: AWS나 애저 데이터를 복사 없이 조회

4. 위즈(Wiz) 합류 후 첫 보안 발표 — 자율 방어 AI

  • 320억 달러에 인수한 클라우드 보안 기업 Wiz가 구글 클라우드 제품군에 정식 합류한 이후 첫 통합 발표
  • COO 프랜시스 드수자는 "인간 분석가가 AI 주도 공격 속도를 못 따라간다"며 자율 방어 필요성 강조
  • 구글 시큐리티 오퍼레이션스에 에이전트 3종 추가
    • 위협 헌팅 에이전트: 기존 방어를 우회하는 새 공격 패턴을 사전 탐지 (프리뷰)
    • 탐지 엔지니어링 에이전트: 탐지 공백을 찾아 새 룰 생성 (프리뷰)
    • 서드파티 컨텍스트 에이전트: 외부 데이터로 워크플로 보강
  • 위즈 쪽 신기능도 공개
    • 바이브 코딩 플랫폼 러브어블(Lovable)과 통합, AI 생성 코드 취약점을 IDE에서 즉시 탐지
    • AI BOM(AI Bill of Materials): AI 프레임워크·모델·IDE 확장을 자동 목록화 — 섀도 AI 관리용
    • reCAPTCHA의 진화판 '구글 클라우드 프로드 디펜스'

5. 7억 5천만 달러 파트너 펀드 — 배포 속도 전쟁

  • 파트너들이 기업 고객에게 AI 에이전트를 더 많이 판매하도록 지원하는 7억 5천만 달러 규모 신규 예산
    • 제미나이 PoC 비용, 구글 현장 배포 엔지니어(FDE) 지원, 클라우드 크레딧, 배포 리베이트 등
    • 스타트업부터 대형 컨설팅사까지 모두 활용 가능
  • 이미 생태계는 두터움
    • 세일즈포스·SAP·서비스나우·워크데이가 제미나이를 제품에 깊이 통합
    • 러브어블·어틀라시안·오라클·팔로알토 네트웍스·리플릿 등 수천 개 파트너가 마켓플레이스에 에이전트 등록
    • 파트너 에이전트를 제미나이 엔터프라이즈 앱에서 직접 검색·배포 가능
  • 메시지는 명확 — 에이전트 시장 전쟁터는 이제 기술력에서 배포 속도와 생태계 커버리지로 이동

기술 맥락

  • TPU를 학습과 추론으로 쪼갠 이유 — 학습은 대규모 병렬 연산에 메모리 대역폭이 핵심이고, 추론은 지연시간과 배치 효율이 중요한데 두 워크로드의 최적 설계가 달라요. 엔비디아 H100/B200도 결국 비슷한 고민을 하는 중이고, 구글이 이걸 하드웨어 레벨에서 명확히 분리했다는 건 추론 트래픽이 이미 학습을 초과하는 단계에 들어섰다는 신호예요.

  • "수천 개 에이전트를 어떻게 관리하나"의 진짜 의미 — 기업이 에이전트를 부서마다, 업무마다 만들기 시작하면 금방 관리 불가 지옥에 빠져요. 어떤 에이전트가 어떤 권한으로 무슨 데이터에 접근하는지 추적이 안 되거든요. 에이전트 ID·레지스트리·게이트웨이는 IAM을 에이전트에 적용한 거고, 이게 없으면 프로덕션에서 감사·규제 대응이 불가능해요.

  • 라이트닝 엔진이 왜 Spark 대비 4.5배 빠른가 — 기존 Spark는 JVM 위에서 돌면서 데이터 셔플링 비용이 컸는데, 서버리스로 돌리면서 클라우드 네이티브 스토리지(오브젝트 스토리지)와 최적화된 실행 계획을 결합한 구조예요. 분석 쿼리를 에이전트가 실시간으로 던져야 하는 시대에 지연시간을 줄이는 게 핵심이거든요.

  • AI BOM이 필요해진 배경 — 바이브 코딩 도구들이 퍼지면서 개발자가 어떤 모델·프레임워크·플러그인을 쓰는지 조직이 몰라요. 'SBOM(소프트웨어 자재 명세)'의 AI 버전인 셈인데, 유럽 AI Act나 미국 행정명령 같은 규제에 대응하려면 이게 없으면 감사가 안 돼요. Wiz가 이걸 자동 수집한다는 건 보안팀 업무 부담을 크게 줄이는 기능이에요.

  • 파트너 펀드 7.5억 달러의 전략적 의미 — 구글 클라우드가 자체 영업력만으로는 엔터프라이즈 현장을 커버하기 어렵다는 인정이에요. SI·컨설팅 기업을 제미나이의 전진 배치 인력으로 삼아서 AWS나 애저가 선점한 레거시 계정에 침투하겠다는 건데, 세일즈 모션의 핵심이 "기술 자랑"에서 "현장 배포"로 이동했다는 업계 전반의 흐름을 보여주는 사례예요.

경쟁의 축이 '모델 성능'에서 '수천 개 에이전트를 어떻게 거버넌스할 것인가'로 옮겨간 것이 이번 행사의 핵심. TPU 분리 설계나 AI BOM 같은 디테일은 엔터프라이즈 AI가 실험을 넘어 규제·감사 대응이 필요한 단계에 들어섰음을 보여준다.

댓글

댓글

댓글을 불러오는 중...

ai-ml

Anthropic 포스트모템 — Claude Code 품질 저하 원인 3가지 공개, 구독자 전원 사용량 리셋

Anthropic이 지난 한 달간 쏟아진 'Claude Code가 멍청해졌다'는 리포트의 원인을 3가지 독립적인 변경으로 특정했다. reasoning effort 기본값을 medium으로 낮춘 결정, 캐싱 최적화 버그로 추론 기록이 매 턴 삭제된 버그, verbosity를 줄이려는 시스템 프롬프트가 코딩 품질을 3% 깎은 이슈다. 4월 20일 v2.1.116에서 모두 수정됐고 구독자 전원 사용량 한도가 리셋됐다.

ai-ml

삼성SDS, 구글 분산형 클라우드로 국방·공공 AI 시장 뚫는다

삼성SDS가 구글 클라우드 넥스트 2026에서 파트너십을 체결하고 국방·공공·금융 등 규제산업 공략에 나섰다. 한국 시장에 처음 도입되는 구글 분산형 클라우드(GDC)를 핵심 병기로 내세워 고객사 내부에 AI 인프라를 직접 배치, 데이터 외부 유출을 물리적으로 차단한다. SCP와 제미나이 엔터프라이즈를 결합한 에이전틱 AI로 업무 시간을 30분에서 5분으로 단축한다는 청사진을 공개했다.

ai-ml

ChatGPT 독주 끝났다 — 2026 AI 플랫폼 3강+오픈소스 역습 총정리

2026년 AI 플랫폼 시장이 OpenAI·구글·Anthropic의 3강 체제로 재편되는 가운데 중국 오픈소스와 xAI 그록이 가세해 춘추전국시대가 본격화됐다. ChatGPT 점유율은 40% 아래로 떨어졌고, 클로드는 기업용 LLM 지출 40%로 1위, 딥시크는 GPT-5.4의 90% 성능을 50분의 1 비용에 제공한다. 경쟁의 축이 단일 모델 성능에서 에이전트 생태계 설계로 이동했다.

ai-ml

AI 코딩 도구 'Over-Editing' 문제 정량 측정 — GPT-5.4가 가장 심하고 Claude Opus 4.6이 가장 얌전

Cursor, Copilot, Claude Code 같은 AI 코딩 도구가 버그 한 줄만 고쳐달라는 요청에 함수 절반을 다시 쓰는 'Over-Editing' 문제를 정량화한 연구. 400개 문제를 프로그램적으로 오염시켜 최소 수정 기준을 수학적으로 정의하고, 프론티어 모델들을 Pass@1과 편집 최소성 두 축으로 비교했다. RL 훈련으로 over-editing을 개선하면서도 일반 코딩 능력을 보존할 수 있음을 보였다.

ai-ml

구글 클라우드 Next '26 — 8세대 TPU $/성능 80%↑, 분당 토큰 160억 돌파

구글 클라우드가 라스베이거스 Next 2026에서 '에이전틱 엔터프라이즈' 시대를 선언했다. 8세대 TPU(학습용 8t, 추론용 8i)를 공개하며 달러당 성능 80% 향상을 내세웠고, Vertex AI를 Gemini Enterprise Agent Platform으로 확장했다. 모델 가든에 Claude Opus 4.7을 추가하고 위즈와 보안 통합을 강화했다.