---
title: "구글, 오픈소스 AI 모델 '젬마 4' 공개 — 라즈베리 파이부터 서버까지, 에이전트 기능까지 탑재"
published: 2026-04-03T13:05:04.085Z
canonical: https://jeff.news/article/1511
---
# 구글, 오픈소스 AI 모델 '젬마 4' 공개 — 라즈베리 파이부터 서버까지, 에이전트 기능까지 탑재

구글 딥마인드가 젬미니 3 기반 오픈소스 AI 모델 젬마 4를 4가지 크기로 공개함. 라즈베리 파이 같은 엣지 기기에서도 구동 가능하며, 멀티모달 추론과 에이전트 워크플로우를 지원. MMLU 다국어 85.2%, AIME 2026 수학 89.2% 등 전 세대 대비 큰 성능 향상을 보임.

- 구글 딥마인드가 차세대 오픈소스 AI 모델 **젬마 4(Gemma 4)**를 공개함 — 젬미니 3 연구 기술 기반으로, "매개변수당 지능 극대화"를 설계 목표로 잡음
  - 4가지 크기로 출시: 모바일/IoT용 E2B·E4B부터 최강 성능의 31B까지
  - 라즈베리 파이, 젯슨 나노 같은 엣지 기기에서도 지연 없이 돌아간다고 함

> [!IMPORTANT]
> 벤치마크에서 젬마 4 31B가 전 세대 젬마 3 27B를 모든 영역에서 압도 — MMLU 다국어 **85.2%**, AIME 2026 수학 **89.2%** 기록

- 멀티모달 + 에이전트까지 지원하는 게 이번 모델의 큰 변화
  - 오디오·시각 이해를 포함한 멀티모달 추론 기능 탑재
  - 140개 언어 지원
  - 자율 에이전트가 앱을 탐색하고 작업을 완료하는 에이전트 워크플로우 기능까지 포함

- 오픈소스 생태계 지원이 빵빵함
  - 허깅 페이스, 올라마, 캐글, LM 스튜디오, 도커 등 주요 플랫폼에서 바로 다운로드 가능
  - JAX, 버텍스 AI, 케라스, 구글 AI 엣지, GKE 등에서 실행·배포 지원
  - 완전 오프라인 실행 가능 — 프라이버시와 성능 둘 다 잡겠다는 포지셔닝
  - 독점 모델과 동일한 인프라 보안 프로토콜을 적용했다고 구글이 강조

---

## 기술 맥락

- "매개변수당 지능 극대화"라는 건 같은 파라미터 수 대비 더 높은 성능을 낸다는 뜻이에요. 모델을 무작정 키우는 대신 효율을 높이겠다는 접근인데, 이게 온디바이스 AI에서는 특히 중요하거든요. 기기의 메모리와 연산력이 제한적이니까요

- 에이전트 워크플로우 기능이 이번에 새로 들어갔는데, 이건 모델이 단순히 텍스트를 생성하는 걸 넘어서 앱을 직접 탐색하고 작업을 수행할 수 있다는 의미예요. 오픈소스 모델에서 에이전트까지 지원하는 건 생태계 확장 면에서 꽤 의미 있는 변화예요

- E2B 같은 초소형 모델이 라즈베리 파이에서 돌아간다는 건, 클라우드 없이 엣지에서 AI 추론을 하겠다는 시나리오가 현실화되고 있다는 거예요. IoT 기기나 임베디드 시스템에서 로컬 AI를 돌리려는 개발자들에게는 꽤 실용적인 선택지가 될 수 있어요

## 핵심 포인트

- 젬미니 3 연구 기술 기반, 매개변수당 지능 극대화 목표
- E2B/E4B/27B/31B 4가지 크기로 출시, 엣지부터 서버까지 커버
- MMLU 다국어 85.2%, AIME 2026 수학 89.2% 기록
- 멀티모달 추론 + 에이전트 워크플로우 + 140개 언어 지원
- 허깅 페이스, 올라마, 캐글 등 주요 플랫폼에서 즉시 다운로드 가능

## 인사이트

오픈소스 AI 모델에 에이전트 기능까지 들어간 건 상당히 의미 있는 변화임. 온디바이스 AI 시장에서 매개변수 효율이 곧 경쟁력인 시대에, 젬마 4의 크기별 라인업 전략이 로컬 AI 개발자 생태계에 큰 영향을 줄 수 있음.