---
title: "구글, 오픈소스 AI 모델 '젬마4' 공개 — 31B 모델이 오픈 리더보드 3위"
published: 2026-04-10T08:14:03.348Z
canonical: https://jeff.news/article/1649
---
# 구글, 오픈소스 AI 모델 '젬마4' 공개 — 31B 모델이 오픈 리더보드 3위

구글 딥마인드가 오픈소스 AI 모델 젬마4를 4가지 크기(E2B, E4B, 26B MoE, 31B Dense)로 공개함. 31B Dense가 오픈모델 리더보드 3위, AIME 89.2%, GPQA Diamond 84.3% 달성. 26B MoE는 38억개 활성 파라미터로 82.3% GPQA 기록하며 효율성 입증. Apache 2.0 라이선스 전환으로 상업적 활용 제약도 사라짐.

## 젬마4 개요

- 구글 딥마인드가 오픈소스 AI 모델 **젬마 4(Gemma 4)** 공개함
- 허깅페이스 CTO 줄리앙 쇼몽이 "구글이 게임에 다시 들어왔다"고 평가할 정도로 반응이 좋음
- 젬마 시리즈 자체는 4억회 다운로드, 10만개 이상 커뮤니티 파생 모델 보유하고 있었지만, 실전에서는 딥시크·큐원(Qwen)·라마 등에 밀려왔음
- 이번 젬마4로 분위기 반전 가능할지 주목됨

## 모델 라인업 (4가지 크기)

- **E2B** (Effective 2B params) — 엣지 모델, 스마트폰/라즈베리파이에서 구동 가능
- **E4B** (Effective 4B params) — 엣지 모델, 16GB RAM 노트북이면 바로 돌릴 수 있음
  - 음성 인식도 클라우드 없이 기기에서 직접 처리함
- **26B MoE** (Mixture of Experts, 4B active) — 총 252억개 파라미터 중 추론 시 **38억개만 활성화**
- **31B Dense** — 오픈모델 전체 리더보드 **3위** 기록 중인 플래그십 모델

### 컨텍스트 윈도

- 엣지 모델: **128K 토큰**
- 대형 모델(26B MoE, 31B Dense): **256K 토큰**
- 코드베이스 전체를 프롬프트 하나에 넣을 수 있는 수준임

## 벤치마크 성능

> [!IMPORTANT]
> **AIME (수학 경시대회):** Gemma3 27B 20.8% → Gemma4 31B **89.2%**
> **CodeForces ELO:** 110 → **2150**
> **GPQA Diamond (박사급 과학):** **84.3%** (인간 전문가 정답률 ~65%)

- 이전 세대 대비 성능이 전 영역에서 대폭 개선됨
- GPQA Diamond 84.3%는 Claude Opus 4.6(91.3%), GPT-5.2(92.4%)보다 7~8포인트 낮지만, 두 모델은 수백억 파라미터 규모의 대형 독점 모델임
- 반면 많은 개발자가 일상적으로 쓰는 Claude Sonnet 4.6(74.1%)을 **10포인트 넘게** 앞섬
- 31B 파라미터로 노트북에서 돌아가면서 이 정도 성능이라는 게 핵심임

## 26B MoE의 효율성

> [!IMPORTANT]
> 26B MoE는 **38억개 파라미터만 활성화**하면서 GPQA Diamond **82.3%** 달성 — 키미 K2.5는 활성 파라미터 320억개(8배)로 87.6% 기록. **5포인트 차이에 8배 컴퓨팅 비용**.

- 오픈 리더보드 **6위** 기록
- MoE 아키텍처의 효율성을 극단적으로 보여주는 사례임
- 추론 비용 관점에서 가성비가 압도적임

## 라이선스 변경: Apache 2.0

- 기존 젬마 모델은 구글 자체 라이선스(사용 제한 있었음) → 젬마4부터 **Apache 2.0** 적용
- 쿠버네티스, 텐서플로와 동일한 라이선스임
- 사용 제한 없음, 신고 의무 없음, 상업적 활용 자유
- 포크·파인튜닝 마음대로 가능
- 모델·데이터·배포를 모두 직접 소유할 수 있음
- 스타트업/기업이 AI 제품 만들 때 가장 큰 걸림돌 중 하나가 사라진 셈

## 오픈소스 AI 경쟁 구도

- 그동안 오픈소스 AI 리더보드 상위권은 딥시크 등 중국 모델이 장악해왔음
- 미국 진영은 메타 라마, 엔비디아 네모트론 정도였음
- 젬마4 31B 3위, 26B MoE 6위로 구글이 오픈소스 모델 레이스에 본격 가세함
- "Claude Opus 4.6이나 GPT-5.2를 이길 수는 없지만, API 비용 없이·데이터 유출 없이·벤더 종속 없이 쓸 수 있는 최선의 모델이 뭐냐는 질문에서 젬마4는 강력한 후보가 됐다"는 평가

---

### 기술 맥락

MoE(Mixture of Experts) 아키텍처가 왜 중요하냐면, 모델 전체 파라미터 중 일부만 활성화해서 추론하는 방식이거든요. 젬마4 26B MoE가 252억개 중 38억개만 쓰면서 GPQA 82.3%를 찍었다는 건, 같은 성능을 훨씬 적은 컴퓨팅으로 뽑아낸다는 뜻이에요. 엣지 디바이스에서 AI를 돌리려면 이런 효율성이 필수적이고, E4B가 16GB RAM 노트북에서 구동된다는 건 로컬 AI 시대가 정말 가까워졌다는 신호예요.

라이선스 변경도 꽤 의미가 커요. 기존 구글 자체 라이선스는 상업적 사용에 제약이 있어서 기업들이 프로덕션에 쓰기 부담스러웠거든요. Apache 2.0으로 바뀌면서 파인튜닝한 모델을 자유롭게 배포·판매할 수 있게 됐어요. 메타 라마의 커뮤니티 라이선스보다도 제약이 적어서, 오픈소스 AI 생태계에서 젬마4의 채택률이 빠르게 올라갈 가능성이 있어요.

## 핵심 포인트

- 젬마4 31B Dense가 AIME 89.2%, CodeForces ELO 2150, GPQA Diamond 84.3%로 오픈모델 리더보드 3위 기록
- 26B MoE 모델이 38억개 활성 파라미터만으로 GPQA 82.3% 달성 — 키미 K2.5 대비 8배 적은 컴퓨팅으로 5포인트 차이
- Apache 2.0 라이선스 전환으로 포크·파인튜닝·상업적 활용 제약 완전 해소
- E4B 엣지 모델은 16GB RAM 노트북에서 구동 가능, 128K 컨텍스트 윈도 지원

## 인사이트

오픈소스 AI 리더보드 상위권을 중국 모델이 장악한 상황에서, 구글이 Apache 2.0 라이선스와 MoE 효율성을 앞세워 본격 경쟁에 나섰음. 특히 엣지 모델의 로컬 구동 가능성은 API 비용·데이터 유출·벤더 종속 없는 AI 활용 시대를 앞당기는 신호임.