본문으로 건너뛰기
피드

구글, 제미나이 3.5 플래시와 24시간 에이전트로 AI 가격·속도 싸움에 불 붙였다

ai-ml 약 7분
vote
0
댓글
북마크

구글이 구글 I/O에서 경량 AI 모델 ‘제미나이 3.5 플래시’와 상시 동작 에이전트 ‘제미나이 스파크’를 공개했다. 플래시는 일부 에이전트, 코딩, 금융 분석 벤치마크에서 강한 성능을 보이면서도 출력 속도가 최상위 모델보다 4배 빠르다는 점을 내세운다. 구글은 월 3200조 토큰 처리, 제미나이 앱 월간 이용자 9억명, AI 모드 월 이용자 10억명이라는 규모도 함께 공개했다.

  • 1

    제미나이 3.5 플래시는 경량 모델이지만 에이전트, 코딩, 금융 분석 영역에서 강한 성능을 보였다고 구글은 설명했다.

  • 2

    모델콘텍스트프로토콜과 금융 분석 벤치마크에서는 제미나이, 지피티, 클로드의 최상위 공개 모델을 앞섰다고 소개됐다.

  • 3

    터미널 환경 코딩 벤치마크에서는 지피티 5.5에 버금갔지만, SWE-벤치 프로에서는 클로드 오퍼스 4.7과 지피티 5.5보다 낮았다.

  • 4

    제미나이 스파크는 노트북이나 스마트폰을 닫아도 24시간 이메일 요약, 일일 브리핑, 장기 작업을 수행하는 능동형 에이전트다.

  • 5

    구글은 울트라 요금제를 월 249.99달러에서 100∼200달러로 낮추며 오픈AI, 앤트로픽과 가격대를 맞췄다.

  • 구글이 구글 I/O에서 제미나이 3.5 플래시를 공개함

    • 경량 모델인데도 에이전트, 코딩, 금융 분석 영역에서 기존 최고 모델인 제미나이 3.1 프로보다 뛰어난 성능을 보였다고 설명함
    • 특히 모델콘텍스트프로토콜과 금융 분석 벤치마크에서는 제미나이, 지피티, 클로드의 최상위 공개 모델을 모두 앞섰다고 소개됨
    • 이날부터 모든 사용자가 사용할 수 있음
  • 코딩 성능은 ‘빠른데 꽤 잘함’ 쪽에 가까움

    • 터미널 환경 벤치마크에서는 지피티 5.5에 버금가는 점수를 얻음
    • 다만 일반적인 코딩 능력 지표인 SWE-벤치 프로에서는 클로드 오퍼스 4.7과 지피티 5.5에 못 미침
    • 구글이 강조하는 포인트는 최고 성능 절대값보다, 최상위 모델보다 출력 속도가 4배 빠른 경량 모델이라는 점임

중요

> 순다르 피차이는 하루 1조 토큰을 쓰는 기업이 업무량의 80%를 플래시 모델로 옮기면 연간 10억 달러 이상을 절감할 수 있다고 설명함. 이건 모델 성능 싸움이 아니라 토큰 경제 싸움이라는 얘기임.

  • 다음 달에는 제미나이 3.5 프로도 나올 예정임

    • 플래시가 속도와 비용 효율 쪽이라면, 프로는 더 무거운 고성능 작업을 맡는 포지션이 될 가능성이 큼
    • 기업 입장에서는 모든 요청을 최고 모델에 태우는 대신, 작업 성격에 따라 플래시와 프로를 나눠 쓰는 구성이 더 현실적임
  • 구글은 능동형 에이전트 ‘제미나이 스파크’도 공개함

    • 사용자가 노트북이나 스마트폰을 닫아도 24시간 동작함
    • 이메일 요약, 일일 브리핑 작성, 반복 업무, 복잡한 코딩, 장기 작업 등에 쓸 수 있다고 소개됨
    • 울트라 요금제 가입자에게 시범 서비스 형태로 제공됨
  • 검색창도 25년 만에 크게 바뀜

    • 텍스트뿐 아니라 이미지, 파일, 영상을 첨부해 검색할 수 있음
    • 결과 화면에는 이해를 돕는 시각 도구나 위젯이 즉석에서 생성됨
    • 검색 결과 상단의 AI 개요에서 챗봇 형태의 AI 모드로 자연스럽게 넘어가는 대화창도 도입됨
  • 쇼핑 쪽에는 ‘유니버설 카트’가 들어감

    • 검색, 제미나이, 유튜브, 지메일을 가로지르며 가격을 추적함
    • 조건이 맞으면 결제까지 처리하는 지능형 장바구니임
    • 올여름 미국에 먼저 도입될 예정임
  • 제미나이 옴니는 멀티모달 생성 쪽을 노림

    • 텍스트, 오디오, 이미지, 동영상 등 모든 형태의 입력과 출력을 처리한다고 소개됨
    • 기존 비오가 텍스트를 영상으로 바꾸는 역할 중심이었다면, 제미나이 옴니는 기존 영상의 캐릭터를 바꾸거나 스타일을 변환하는 기능도 갖춤
    • 물리 법칙을 이해해 더 사실적인 영상을 구현할 수 있다고 구글은 설명함
  • AI 생성물 표시에는 신스ID를 계속 밀고 있음

    • 제미나이 옴니로 생성한 동영상에는 AI 생성물임을 구분할 수 있는 디지털 워터마크 신스ID가 적용됨
    • 기존 파트너인 엔비디아 외에 오픈AI와 카카오도 동참한다고 소개됨
    • AI 조작 콘텐츠를 막기 위한 표준 경쟁에서도 구글이 판을 키우는 모양새임
  • 가격 정책도 공격적으로 바뀜

    • 개발자와 중상위 사용자를 겨냥한 울트라 요금제는 기존 월 249.99달러에서 100∼200달러로 내려감
    • 오픈AI와 앤트로픽의 최상위 구독 요금제와 같은 가격대임
    • 고성능 모델 접근권을 비싸게 유지하기보다, 사용량을 키우는 쪽으로 무게를 둔 듯함
  • 구글이 공개한 사용량 숫자도 꽤 큼

    • 구글은 자사 서비스에서 월 3200조 개 이상의 토큰을 처리한다고 밝힘
    • 1년 전 480조 개에서 약 7배 늘어난 규모임
    • 제미나이 앱 월간 이용자는 1년 전 4억명에서 9억명으로 두 배 이상 증가함
    • 검색의 AI 모드는 출시 1년 만에 월 이용자 10억명을 넘김

기술 맥락

  • 구글이 플래시 모델을 강조하는 이유는 기업 AI 비용 구조 때문이에요. 모든 요청을 최고 성능 모델에 보내면 품질은 좋을 수 있지만, 토큰 비용과 응답 지연이 금방 병목이 되거든요.

  • 그래서 제미나이 3.5 플래시는 ‘대부분의 업무를 충분히 잘, 훨씬 빠르게’ 처리하는 모델로 포지셔닝돼요. 피차이가 말한 하루 1조 토큰 기업의 연간 10억 달러 절감 예시는 이 선택의 경제적 이유를 숫자로 보여줘요.

  • 모델콘텍스트프로토콜 벤치마크를 내세운 것도 중요해요. 이제 모델은 채팅창에서 답만 하는 게 아니라 외부 도구, 파일, 업무 시스템과 연결돼야 해서 에이전트 실행 능력이 실제 제품 경쟁력이 되고 있어요.

  • 제미나이 스파크는 그 흐름의 사용자 제품 버전이에요. 사용자가 기기를 닫아도 이메일 요약이나 장기 작업을 계속한다는 건, AI가 요청을 기다리는 도구에서 상시 실행되는 작업자로 바뀌고 있다는 뜻이에요.

  • 신스ID는 생성 품질만큼 출처 표시가 중요해졌다는 신호예요. 영상 생성 모델이 기존 영상의 캐릭터와 스타일을 바꿀 수 있다면, 누가 만들었고 AI 생성물인지 추적하는 장치가 없으면 콘텐츠 신뢰가 무너질 수 있거든요.

구글의 메시지는 성능 1등만 외치는 게 아니라 ‘대부분의 업무는 더 싸고 빠른 모델로 돌리자’에 가깝다. 기업 입장에서는 최고 모델보다 토큰 예산과 지연시간이 더 큰 병목이 되는 순간이 많아서, 플래시 계열의 포지셔닝이 꽤 실전적이다.

댓글

댓글

댓글을 불러오는 중...

ai-ml

유튜브, AI 생성 영상에 자동 라벨 붙인다

유튜브가 사실적으로 보이거나 의미 있게 AI로 변경·생성된 콘텐츠에 더 눈에 띄는 라벨을 적용하고, 제작자가 AI 사용 여부를 밝히지 않아도 내부 신호로 감지되면 자동 라벨을 붙이겠다고 밝혔다. 다만 라벨만으로 추천 노출이나 수익화 자격이 바뀌지는 않으며, 제작자는 YouTube Studio에서 잘못된 판정을 수정할 수 있다.

ai-ml

테크 CEO들의 'AI 만능론', 숫자는 아직 그렇게 말하지 않는다

테크 업계에서 AI를 이유로 한 대규모 감원과 조직 재편이 이어지는 가운데, Box 창업자 애런 레비는 CEO들이 실제 업무의 마지막 1마일을 모른 채 AI 에이전트의 능력을 과대평가하고 있다고 지적했다. 2026년 첫 5개월 동안 이미 11만5430명이 해고됐고, 여러 연구는 AI 도입이 체감 생산성만큼 실제 생산성을 끌어올렸다는 근거가 아직 약하다고 말한다.

ai-ml

오픈AI와 앤트로픽, 코딩 에이전트로 드디어 돈 되는 시장을 찾은 듯

사이먼 윌리슨은 오픈AI와 앤트로픽이 코딩 에이전트와 기업용 과금으로 진짜 제품-시장 적합성을 찾았다고 봐. 개인 구독자에게는 월 100달러 플랜이 싸게 느껴지지만, 기업 고객은 이제 사용량 기준 토큰 가격을 그대로 내기 시작했고 이게 대형 고객 예산을 빠르게 흔들고 있다는 얘기야.

ai-ml

컴팔과 GMI 클라우드, 대규모 추론용 AI 인프라 구축 협력

컴팔이 실리콘밸리 기반 AI 인프라 기업 GMI 클라우드와 협력해 대규모 추론과 에이전틱 AI 워크로드에 맞춘 GPU 서버 인프라를 구축한다고 발표했어. COMPUTEX 2026에서는 NVIDIA HGX B300을 지원하는 Compal SGX30-2 같은 고성능 AI 서버 플랫폼도 선보일 예정이야.

ai-ml

AI 쓰면 편해진다더니, 직장인들은 ‘AI 과부하’에 지쳐가는 중

국내 직장인들이 AI 전환 압박, AI 답변 검증 부담, 대체 불안 때문에 피로감을 호소하고 있어. 중앙일보 설문에서는 5284명 중 31.6%가 ‘AI 답변 검증에 시간이 더 걸릴 때’를 가장 지치는 순간으로 꼽았고, 기업들은 무작정 AI 사용량을 밀어붙이는 방식에서 업무 방식 재설계로 넘어가야 한다는 지적이 나와.