본문으로 건너뛰기
피드

구글, 오픈소스 AI 모델 '젬마4' 공개 — 31B 모델이 오픈 리더보드 3위

ai-ml 약 6분
vote
0
댓글
북마크

구글 딥마인드가 오픈소스 AI 모델 젬마4를 4가지 크기(E2B, E4B, 26B MoE, 31B Dense)로 공개함. 31B Dense가 오픈모델 리더보드 3위, AIME 89.2%, GPQA Diamond 84.3% 달성. 26B MoE는 38억개 활성 파라미터로 82.3% GPQA 기록하며 효율성 입증. Apache 2.0 라이선스 전환으로 상업적 활용 제약도 사라짐.

  • 1

    젬마4 31B Dense가 AIME 89.2%, CodeForces ELO 2150, GPQA Diamond 84.3%로 오픈모델 리더보드 3위 기록

  • 2

    26B MoE 모델이 38억개 활성 파라미터만으로 GPQA 82.3% 달성 — 키미 K2.5 대비 8배 적은 컴퓨팅으로 5포인트 차이

  • 3

    Apache 2.0 라이선스 전환으로 포크·파인튜닝·상업적 활용 제약 완전 해소

  • 4

    E4B 엣지 모델은 16GB RAM 노트북에서 구동 가능, 128K 컨텍스트 윈도 지원

젬마4 개요

  • 구글 딥마인드가 오픈소스 AI 모델 젬마 4(Gemma 4) 공개함
  • 허깅페이스 CTO 줄리앙 쇼몽이 "구글이 게임에 다시 들어왔다"고 평가할 정도로 반응이 좋음
  • 젬마 시리즈 자체는 4억회 다운로드, 10만개 이상 커뮤니티 파생 모델 보유하고 있었지만, 실전에서는 딥시크·큐원(Qwen)·라마 등에 밀려왔음
  • 이번 젬마4로 분위기 반전 가능할지 주목됨

모델 라인업 (4가지 크기)

  • E2B (Effective 2B params) — 엣지 모델, 스마트폰/라즈베리파이에서 구동 가능
  • E4B (Effective 4B params) — 엣지 모델, 16GB RAM 노트북이면 바로 돌릴 수 있음
    • 음성 인식도 클라우드 없이 기기에서 직접 처리함
  • 26B MoE (Mixture of Experts, 4B active) — 총 252억개 파라미터 중 추론 시 38억개만 활성화
  • 31B Dense — 오픈모델 전체 리더보드 3위 기록 중인 플래그십 모델

컨텍스트 윈도

  • 엣지 모델: 128K 토큰
  • 대형 모델(26B MoE, 31B Dense): 256K 토큰
  • 코드베이스 전체를 프롬프트 하나에 넣을 수 있는 수준임

벤치마크 성능

중요

> AIME (수학 경시대회): Gemma3 27B 20.8% → Gemma4 31B 89.2% CodeForces ELO: 110 → 2150 GPQA Diamond (박사급 과학): 84.3% (인간 전문가 정답률 ~65%)

  • 이전 세대 대비 성능이 전 영역에서 대폭 개선됨
  • GPQA Diamond 84.3%는 Claude Opus 4.6(91.3%), GPT-5.2(92.4%)보다 7~8포인트 낮지만, 두 모델은 수백억 파라미터 규모의 대형 독점 모델임
  • 반면 많은 개발자가 일상적으로 쓰는 Claude Sonnet 4.6(74.1%)을 10포인트 넘게 앞섬
  • 31B 파라미터로 노트북에서 돌아가면서 이 정도 성능이라는 게 핵심임

26B MoE의 효율성

중요

> 26B MoE는 38억개 파라미터만 활성화하면서 GPQA Diamond 82.3% 달성 — 키미 K2.5는 활성 파라미터 320억개(8배)로 87.6% 기록. 5포인트 차이에 8배 컴퓨팅 비용.

  • 오픈 리더보드 6위 기록
  • MoE 아키텍처의 효율성을 극단적으로 보여주는 사례임
  • 추론 비용 관점에서 가성비가 압도적임

라이선스 변경: Apache 2.0

  • 기존 젬마 모델은 구글 자체 라이선스(사용 제한 있었음) → 젬마4부터 Apache 2.0 적용
  • 쿠버네티스, 텐서플로와 동일한 라이선스임
  • 사용 제한 없음, 신고 의무 없음, 상업적 활용 자유
  • 포크·파인튜닝 마음대로 가능
  • 모델·데이터·배포를 모두 직접 소유할 수 있음
  • 스타트업/기업이 AI 제품 만들 때 가장 큰 걸림돌 중 하나가 사라진 셈

오픈소스 AI 경쟁 구도

  • 그동안 오픈소스 AI 리더보드 상위권은 딥시크 등 중국 모델이 장악해왔음
  • 미국 진영은 메타 라마, 엔비디아 네모트론 정도였음
  • 젬마4 31B 3위, 26B MoE 6위로 구글이 오픈소스 모델 레이스에 본격 가세함
  • "Claude Opus 4.6이나 GPT-5.2를 이길 수는 없지만, API 비용 없이·데이터 유출 없이·벤더 종속 없이 쓸 수 있는 최선의 모델이 뭐냐는 질문에서 젬마4는 강력한 후보가 됐다"는 평가

기술 맥락

MoE(Mixture of Experts) 아키텍처가 왜 중요하냐면, 모델 전체 파라미터 중 일부만 활성화해서 추론하는 방식이거든요. 젬마4 26B MoE가 252억개 중 38억개만 쓰면서 GPQA 82.3%를 찍었다는 건, 같은 성능을 훨씬 적은 컴퓨팅으로 뽑아낸다는 뜻이에요. 엣지 디바이스에서 AI를 돌리려면 이런 효율성이 필수적이고, E4B가 16GB RAM 노트북에서 구동된다는 건 로컬 AI 시대가 정말 가까워졌다는 신호예요.

라이선스 변경도 꽤 의미가 커요. 기존 구글 자체 라이선스는 상업적 사용에 제약이 있어서 기업들이 프로덕션에 쓰기 부담스러웠거든요. Apache 2.0으로 바뀌면서 파인튜닝한 모델을 자유롭게 배포·판매할 수 있게 됐어요. 메타 라마의 커뮤니티 라이선스보다도 제약이 적어서, 오픈소스 AI 생태계에서 젬마4의 채택률이 빠르게 올라갈 가능성이 있어요.

오픈소스 AI 리더보드 상위권을 중국 모델이 장악한 상황에서, 구글이 Apache 2.0 라이선스와 MoE 효율성을 앞세워 본격 경쟁에 나섰음. 특히 엣지 모델의 로컬 구동 가능성은 API 비용·데이터 유출·벤더 종속 없는 AI 활용 시대를 앞당기는 신호임.

댓글

댓글

댓글을 불러오는 중...

ai-ml

유튜브, AI 생성 영상에 자동 라벨 붙인다

유튜브가 사실적으로 보이거나 의미 있게 AI로 변경·생성된 콘텐츠에 더 눈에 띄는 라벨을 적용하고, 제작자가 AI 사용 여부를 밝히지 않아도 내부 신호로 감지되면 자동 라벨을 붙이겠다고 밝혔다. 다만 라벨만으로 추천 노출이나 수익화 자격이 바뀌지는 않으며, 제작자는 YouTube Studio에서 잘못된 판정을 수정할 수 있다.

ai-ml

테크 CEO들의 'AI 만능론', 숫자는 아직 그렇게 말하지 않는다

테크 업계에서 AI를 이유로 한 대규모 감원과 조직 재편이 이어지는 가운데, Box 창업자 애런 레비는 CEO들이 실제 업무의 마지막 1마일을 모른 채 AI 에이전트의 능력을 과대평가하고 있다고 지적했다. 2026년 첫 5개월 동안 이미 11만5430명이 해고됐고, 여러 연구는 AI 도입이 체감 생산성만큼 실제 생산성을 끌어올렸다는 근거가 아직 약하다고 말한다.

ai-ml

오픈AI와 앤트로픽, 코딩 에이전트로 드디어 돈 되는 시장을 찾은 듯

사이먼 윌리슨은 오픈AI와 앤트로픽이 코딩 에이전트와 기업용 과금으로 진짜 제품-시장 적합성을 찾았다고 봐. 개인 구독자에게는 월 100달러 플랜이 싸게 느껴지지만, 기업 고객은 이제 사용량 기준 토큰 가격을 그대로 내기 시작했고 이게 대형 고객 예산을 빠르게 흔들고 있다는 얘기야.

ai-ml

컴팔과 GMI 클라우드, 대규모 추론용 AI 인프라 구축 협력

컴팔이 실리콘밸리 기반 AI 인프라 기업 GMI 클라우드와 협력해 대규모 추론과 에이전틱 AI 워크로드에 맞춘 GPU 서버 인프라를 구축한다고 발표했어. COMPUTEX 2026에서는 NVIDIA HGX B300을 지원하는 Compal SGX30-2 같은 고성능 AI 서버 플랫폼도 선보일 예정이야.

ai-ml

AI 쓰면 편해진다더니, 직장인들은 ‘AI 과부하’에 지쳐가는 중

국내 직장인들이 AI 전환 압박, AI 답변 검증 부담, 대체 불안 때문에 피로감을 호소하고 있어. 중앙일보 설문에서는 5284명 중 31.6%가 ‘AI 답변 검증에 시간이 더 걸릴 때’를 가장 지치는 순간으로 꼽았고, 기업들은 무작정 AI 사용량을 밀어붙이는 방식에서 업무 방식 재설계로 넘어가야 한다는 지적이 나와.