구글, 오픈소스 AI 모델 '젬마4' 공개 — 31B 모델이 오픈 리더보드 3위

ai-ml 2026-04-10 약 6분

 tags

#gemma #open-source #google #llm #moe

vote

북마크

구글 딥마인드가 오픈소스 AI 모델 젬마4를 4가지 크기(E2B, E4B, 26B MoE, 31B Dense)로 공개함. 31B Dense가 오픈모델 리더보드 3위, AIME 89.2%, GPQA Diamond 84.3% 달성. 26B MoE는 38억개 활성 파라미터로 82.3% GPQA 기록하며 효율성 입증. Apache 2.0 라이선스 전환으로 상업적 활용 제약도 사라짐.

1
젬마4 31B Dense가 AIME 89.2%, CodeForces ELO 2150, GPQA Diamond 84.3%로 오픈모델 리더보드 3위 기록
2
26B MoE 모델이 38억개 활성 파라미터만으로 GPQA 82.3% 달성 — 키미 K2.5 대비 8배 적은 컴퓨팅으로 5포인트 차이
3
Apache 2.0 라이선스 전환으로 포크·파인튜닝·상업적 활용 제약 완전 해소
4
E4B 엣지 모델은 16GB RAM 노트북에서 구동 가능, 128K 컨텍스트 윈도 지원

젬마4 개요

구글 딥마인드가 오픈소스 AI 모델 젬마 4(Gemma 4) 공개함
허깅페이스 CTO 줄리앙 쇼몽이 "구글이 게임에 다시 들어왔다"고 평가할 정도로 반응이 좋음
젬마 시리즈 자체는 4억회 다운로드, 10만개 이상 커뮤니티 파생 모델 보유하고 있었지만, 실전에서는 딥시크·큐원(Qwen)·라마 등에 밀려왔음
이번 젬마4로 분위기 반전 가능할지 주목됨

모델 라인업 (4가지 크기)

E2B (Effective 2B params) — 엣지 모델, 스마트폰/라즈베리파이에서 구동 가능
E4B (Effective 4B params) — 엣지 모델, 16GB RAM 노트북이면 바로 돌릴 수 있음
- 음성 인식도 클라우드 없이 기기에서 직접 처리함
26B MoE (Mixture of Experts, 4B active) — 총 252억개 파라미터 중 추론 시 38억개만 활성화
31B Dense — 오픈모델 전체 리더보드 3위 기록 중인 플래그십 모델

컨텍스트 윈도

엣지 모델: 128K 토큰
대형 모델(26B MoE, 31B Dense): 256K 토큰
코드베이스 전체를 프롬프트 하나에 넣을 수 있는 수준임

벤치마크 성능

❗중요

> AIME (수학 경시대회): Gemma3 27B 20.8% → Gemma4 31B 89.2% CodeForces ELO: 110 → 2150 GPQA Diamond (박사급 과학): 84.3% (인간 전문가 정답률 ~65%)

이전 세대 대비 성능이 전 영역에서 대폭 개선됨
GPQA Diamond 84.3%는 Claude Opus 4.6(91.3%), GPT-5.2(92.4%)보다 7~8포인트 낮지만, 두 모델은 수백억 파라미터 규모의 대형 독점 모델임
반면 많은 개발자가 일상적으로 쓰는 Claude Sonnet 4.6(74.1%)을 10포인트 넘게 앞섬
31B 파라미터로 노트북에서 돌아가면서 이 정도 성능이라는 게 핵심임

26B MoE의 효율성

❗중요

> 26B MoE는 38억개 파라미터만 활성화하면서 GPQA Diamond 82.3% 달성 — 키미 K2.5는 활성 파라미터 320억개(8배)로 87.6% 기록. 5포인트 차이에 8배 컴퓨팅 비용.

오픈 리더보드 6위 기록
MoE 아키텍처의 효율성을 극단적으로 보여주는 사례임
추론 비용 관점에서 가성비가 압도적임

라이선스 변경: Apache 2.0

기존 젬마 모델은 구글 자체 라이선스(사용 제한 있었음) → 젬마4부터 Apache 2.0 적용
쿠버네티스, 텐서플로와 동일한 라이선스임
사용 제한 없음, 신고 의무 없음, 상업적 활용 자유
포크·파인튜닝 마음대로 가능
모델·데이터·배포를 모두 직접 소유할 수 있음
스타트업/기업이 AI 제품 만들 때 가장 큰 걸림돌 중 하나가 사라진 셈

오픈소스 AI 경쟁 구도

그동안 오픈소스 AI 리더보드 상위권은 딥시크 등 중국 모델이 장악해왔음
미국 진영은 메타 라마, 엔비디아 네모트론 정도였음
젬마4 31B 3위, 26B MoE 6위로 구글이 오픈소스 모델 레이스에 본격 가세함
"Claude Opus 4.6이나 GPT-5.2를 이길 수는 없지만, API 비용 없이·데이터 유출 없이·벤더 종속 없이 쓸 수 있는 최선의 모델이 뭐냐는 질문에서 젬마4는 강력한 후보가 됐다"는 평가

기술 맥락

MoE(Mixture of Experts) 아키텍처가 왜 중요하냐면, 모델 전체 파라미터 중 일부만 활성화해서 추론하는 방식이거든요. 젬마4 26B MoE가 252억개 중 38억개만 쓰면서 GPQA 82.3%를 찍었다는 건, 같은 성능을 훨씬 적은 컴퓨팅으로 뽑아낸다는 뜻이에요. 엣지 디바이스에서 AI를 돌리려면 이런 효율성이 필수적이고, E4B가 16GB RAM 노트북에서 구동된다는 건 로컬 AI 시대가 정말 가까워졌다는 신호예요.

라이선스 변경도 꽤 의미가 커요. 기존 구글 자체 라이선스는 상업적 사용에 제약이 있어서 기업들이 프로덕션에 쓰기 부담스러웠거든요. Apache 2.0으로 바뀌면서 파인튜닝한 모델을 자유롭게 배포·판매할 수 있게 됐어요. 메타 라마의 커뮤니티 라이선스보다도 제약이 적어서, 오픈소스 AI 생태계에서 젬마4의 채택률이 빠르게 올라갈 가능성이 있어요.

오픈소스 AI 리더보드 상위권을 중국 모델이 장악한 상황에서, 구글이 Apache 2.0 라이선스와 MoE 효율성을 앞세워 본격 경쟁에 나섰음. 특히 엣지 모델의 로컬 구동 가능성은 API 비용·데이터 유출·벤더 종속 없는 AI 활용 시대를 앞당기는 신호임.

이전 기사 (P)

다음 기사 (N)

댓글을 불러오는 중...

ai-ml 2026-07-13

애플 새 음성 인식 API, 온디바이스 영어 전사에서 위스퍼 스몰까지 이겼다

애플의 새 음성 인식 API인 스피치애널라이저가 리브리스피치 벤치마크에서 기존 SFSpeechRecognizer는 물론 위스퍼 스몰보다도 낮은 단어 오류율을 기록했어. 깨끗한 음성에서는 2.12%, noisy 음성에서는 4.56%로, 기존 애플 API 대비 오류율을 3.5~4배 줄였고 위스퍼 스몰보다 약 3배 빠르게 돌았어. 다만 영어·애플 플랫폼·OS 26 조건의 결과라, 다국어와 크로스플랫폼에서는 여전히 위스퍼의 장점이 남아 있어.

ai-ml 2026-07-13

AI를 진짜 잘 쓰는 기업, 미국 증시에서 연 30% 프리미엄 받는다는 연구

예일대와 로체스터대 연구진이 기업의 실제 대형 언어 모델 사용 데이터를 분석했더니, AI 활용도가 높은 상위 20% 기업이 하위 20%보다 주당 평균 0.64% 높은 초과수익률을 냈다. 단순히 AI 기업이냐가 아니라, 업무에 AI를 얼마나 깊게 쓰는지가 시장 가치에 반영되고 있다는 얘기다.

ai-ml 2026-07-13

ZTE, AI 에이전트폰으로 스마트폰 재도전…진짜 승부처는 앱 생태계

ZTE가 바이트댄스의 더우바오를 탑재한 AI 에이전트 스마트폰으로 시장 재진입을 노린다. 핵심은 사용자가 명령하면 AI가 여러 앱을 직접 열고 조작하는 방식인데, 위챗·타오바오·알리페이 같은 플랫폼과 충돌하면서 생태계 문제가 가장 큰 변수로 떠올랐다.

ai-ml 2026-07-13

노벨상 학자들까지 “AI 경제 충격, 지금 제도 안 만들면 늦다”

노벨 경제학상 수상자 15명을 포함한 학자와 기술 업계 인사 약 200명이 AI가 향후 10년 안에 경제를 급격히 바꿀 수 있다며 정책 대응을 촉구했다. 이들은 산업혁명보다 큰 변화가 훨씬 짧은 시간에 올 수 있고, 대규모 일자리 대체와 생활 수준 향상이라는 양면성이 동시에 존재한다고 봤다.

ai-ml 2026-07-13

NHN, AI 데이터센터 매출 기대감에 목표주가 5만6000원으로 상향

한국투자증권이 NHN의 목표주가를 4만5000원에서 5만6000원으로 올리고 투자의견 매수를 유지했다. 핵심 근거는 양평 AI 데이터센터 가동, 공공·민간 GPU 클러스터 수주 확대, 클라우드 사업부 신규 매출 반영이다.

구글, 오픈소스 AI 모델 '젬마4' 공개 — 31B 모델이 오픈 리더보드 3위

요약

핵심 포인트

분석

젬마4 개요

모델 라인업 (4가지 크기)

컨텍스트 윈도

벤치마크 성능

26B MoE의 효율성

라이선스 변경: Apache 2.0

오픈소스 AI 경쟁 구도

기술 맥락

인사이트

댓글

댓글

구글, 오픈소스 AI 모델 '젬마4' 공개 — 31B 모델이 오픈 리더보드 3위

요약

핵심 포인트

분석

젬마4 개요

모델 라인업 (4가지 크기)

컨텍스트 윈도

벤치마크 성능

26B MoE의 효율성

라이선스 변경: Apache 2.0

오픈소스 AI 경쟁 구도

기술 맥락

인사이트

댓글

댓글

관련 기사