본문으로 건너뛰기
피드

구글 젬마4 출시 - 31B로 오픈모델 3위, 2B는 모바일에서 오프라인 구동

ai-ml 약 5분
vote
0
댓글
북마크

구글이 제미나이3 기반 오픈소스 모델 젬마4를 4종(2B/4B/26B/31B) 공개함. 31B 모델이 아레나 리더보드 오픈모델 3위를 기록했으며, 에이전트 워크플로우와 멀티모달 기능을 기본 내장하고 아파치 2.0 라이선스로 배포됨.

  • 1

    제미나이3 기반 오픈소스 모델 4종(2B/4B/26B/31B) 공개

  • 2

    경량 모델이 20배 큰 타사 모델 성능을 상회한다고 주장

  • 3

    에이전트 워크플로우 툴 호출 및 시각/오디오 멀티모달 기본 지원

  • 4

    31B 모델 아레나 리더보드 오픈모델 3위, 26B 모델 6위

  • 5

    아파치 2.0 라이선스로 상업적 활용 자유로움

  • 6

    모바일/IoT 오프라인 구동으로 엣지 AI 생태계 확장 목적

ℹ️참고

구글이 제미나이3 기반 오픈소스 모델 '젬마4'를 공개함. 31B 모델이 오픈모델 리더보드 3위를 기록하면서, 경량 모델이 20배 큰 모델 성능을 넘어서는 효율을 보여줌.

  • 제미나이3 기술 기반의 오픈소스 모델 4종 출시

    • 구글이 자사 최신 AI 모델 제미나이3와 동일한 기술 기반으로 개발한 오픈소스 모델 젬마4를 공개함
    • 파라미터 기준 2B, 4B 경량 버전과 26B, 31B 거대 버전 총 4개 모델로 구성됨
    • 경량 모델이 타사 20배 큰 모델의 성능을 뛰어넘는다는 것이 구글 측 설명임
  • 에이전트 워크플로우 + 멀티모달 기본 내장

    • 단순 채팅을 넘어 에이전트 기반 워크플로우용 툴 호출을 기본 지원함
    • 시각/오디오 처리 기능이 내장되어 별도 파이프라인 없이 멀티모달 활용이 가능함
    • 모바일, IoT 기기에서 오프라인 구동이 가능해 엣지 디바이스 배포에 적합함
  • 리더보드 성능 검증 완료

    • 31B 모델이 아레나 AI 텍스트 리더보드에서 오픈 모델 중 세계 3위 기록함
    • 26B 모델도 6위를 기록하며 파라미터 대비 높은 효율을 입증함
    • 적은 하드웨어 자원으로 프런티어급 추론 능력과 멀티모달 기능을 활용할 수 있게 됨
  • 아파치 2.0 라이선스, 상업적 활용 자유로움

    • 개발자 커뮤니티 피드백을 반영해 아파치 2.0 라이선스로 배포됨
    • 구글 딥마인드의 제미나이 안전 프로토콜을 준수해 투명성과 보안성을 확보함
    • 필요에 따라 파인튜닝이 가능해 다양한 도메인 적용이 용이함
  • 피지컬 AI/엣지 생태계 확장이 핵심 목적

    • 인터넷 연결 없이 동작하는 온디바이스 AI 생태계 주도가 구글의 전략적 목표임
    • 엣지단에서 구동 가능한 수준의 경량화와 효율성을 갖춤
    • 오픈소스 모델을 통해 개발자 생태계를 확보하고 플랫폼 영향력을 넓히려는 의도임
graph LR
    A[제미나이3 기술] --> B[젬마4 모델]
    B --> C[경량: 2B / 4B]
    B --> D[거대: 26B / 31B]
    C --> E[모바일 / IoT
온디바이스 구동] D --> F[서버 / 클라우드
프런티어급 추론] E --> G[에이전트 워크플로우
+ 멀티모달] F --> G G --> H[아파치 2.0
오픈소스 생태계]

기술 맥락

  • 젬마 vs 제미나이: 제미나이는 구글의 상용 클로즈드 모델이고, 젬마는 동일 기술 기반의 오픈소스 버전임. 젬마4가 제미나이3 기반이라는 것은 최신 아키텍처가 오픈소스로 빠르게 이전되고 있다는 의미임
  • 아레나 리더보드 순위의 의미: LMSYS 아레나는 실사용자 블라인드 투표 기반 벤치마크로, 합성 벤치마크 대비 실제 활용 성능과 상관관계가 높음. 31B 모델이 3위라는 것은 파라미터 수 대비 매우 높은 효율임
  • 온디바이스 AI 트렌드: 2B/4B급 모델의 모바일/IoT 탑재는 프라이버시, 레이턴시, 오프라인 요구사항을 충족함. 애플 인텔리전스, 퀄컴 AI 허브 등과 경쟁하는 구글의 엣지 AI 전략의 핵심 무기임
  • 아파치 2.0 라이선스: 메타의 라마(커스텀 라이선스)와 달리 상업적 사용에 제한이 거의 없어 스타트업과 기업 도입 장벽이 낮음. 개발자 생태계 확보에 유리한 선택임

구글이 아파치 2.0으로 풀면서 메타 라마 대비 라이선스 우위를 확보함. 2B/4B 경량 모델의 온디바이스 구동 지원은 엣지 AI 생태계 선점을 위한 핵심 전략임.

댓글

댓글

댓글을 불러오는 중...

ai-ml

유튜브, AI 생성 영상에 자동 라벨 붙인다

유튜브가 사실적으로 보이거나 의미 있게 AI로 변경·생성된 콘텐츠에 더 눈에 띄는 라벨을 적용하고, 제작자가 AI 사용 여부를 밝히지 않아도 내부 신호로 감지되면 자동 라벨을 붙이겠다고 밝혔다. 다만 라벨만으로 추천 노출이나 수익화 자격이 바뀌지는 않으며, 제작자는 YouTube Studio에서 잘못된 판정을 수정할 수 있다.

ai-ml

테크 CEO들의 'AI 만능론', 숫자는 아직 그렇게 말하지 않는다

테크 업계에서 AI를 이유로 한 대규모 감원과 조직 재편이 이어지는 가운데, Box 창업자 애런 레비는 CEO들이 실제 업무의 마지막 1마일을 모른 채 AI 에이전트의 능력을 과대평가하고 있다고 지적했다. 2026년 첫 5개월 동안 이미 11만5430명이 해고됐고, 여러 연구는 AI 도입이 체감 생산성만큼 실제 생산성을 끌어올렸다는 근거가 아직 약하다고 말한다.

ai-ml

오픈AI와 앤트로픽, 코딩 에이전트로 드디어 돈 되는 시장을 찾은 듯

사이먼 윌리슨은 오픈AI와 앤트로픽이 코딩 에이전트와 기업용 과금으로 진짜 제품-시장 적합성을 찾았다고 봐. 개인 구독자에게는 월 100달러 플랜이 싸게 느껴지지만, 기업 고객은 이제 사용량 기준 토큰 가격을 그대로 내기 시작했고 이게 대형 고객 예산을 빠르게 흔들고 있다는 얘기야.

ai-ml

컴팔과 GMI 클라우드, 대규모 추론용 AI 인프라 구축 협력

컴팔이 실리콘밸리 기반 AI 인프라 기업 GMI 클라우드와 협력해 대규모 추론과 에이전틱 AI 워크로드에 맞춘 GPU 서버 인프라를 구축한다고 발표했어. COMPUTEX 2026에서는 NVIDIA HGX B300을 지원하는 Compal SGX30-2 같은 고성능 AI 서버 플랫폼도 선보일 예정이야.

ai-ml

AI 쓰면 편해진다더니, 직장인들은 ‘AI 과부하’에 지쳐가는 중

국내 직장인들이 AI 전환 압박, AI 답변 검증 부담, 대체 불안 때문에 피로감을 호소하고 있어. 중앙일보 설문에서는 5284명 중 31.6%가 ‘AI 답변 검증에 시간이 더 걸릴 때’를 가장 지치는 순간으로 꼽았고, 기업들은 무작정 AI 사용량을 밀어붙이는 방식에서 업무 방식 재설계로 넘어가야 한다는 지적이 나와.