---
title: "소규모 모델 3개로 GPT-5급 성능을 뽑아내는 NSED 프로토콜, 오픈소스로 공개됨"
published: 2026-02-18T23:21:15.000Z
canonical: https://jeff.news/article/999
---
# 소규모 모델 3개로 GPT-5급 성능을 뽑아내는 NSED 프로토콜, 오픈소스로 공개됨

여러 소형 AI 모델이 병렬로 작업하고 교차 평가하는 NSED 프로토콜이 오픈소스로 공개됨. 20B+8B+12B 모델 3개로 소비자 하드웨어에서 AIME 2025 84%를 달성해 DeepSeek-R1 동급, GPT-5와 1점 차 성능을 보여줌.

- NSED(N-Way Self-Evaluating Deliberation)는 여러 AI 모델이 병렬로 작업하고 서로 교차 평가하면서 최종 답변에 수렴하는 프로토콜임
- 핵심 성과가 인상적함: 20B+8B+12B 모델 3개를 소비자급 하드웨어에서 돌려 AIME 2025 벤치마크 84% 달성. DeepSeek-R1과 동급이고 GPT-5와는 고작 1점 차이
- 같은 모델 조합으로 단순 다수결 투표하면 54%밖에 안 나옴. 교차 평가가 핵심이라는 뜻
- 64GB VRAM으로 80~140GB급 단일 거대 모델의 추론 성능을 재현한다는 게 포인트. 프론티어 모델 돌리려고 H100 사재기할 필요가 줄어듦
- Rust로 구현되어 있고 NATS 메시징 버스를 통신 레이어로 사용함. Ollama, vLLM 등 다양한 백엔드 지원
- 에이전트마다 제안·평가·점수·추론 과정이 전부 기록되므로 감사 추적이 가능하고, 실행 중 가이드 주입이나 토큰/비용 예산 설정도 됨
- 라이선스는 BSL 1.1: 연매출 $1M 미만이면 무료, 그 이상은 상용 라이선스 필요. 4년 후 AGPL-3.0으로 자동 전환
- "작은 모델 여러 개가 거대 모델 한 개를 이긴다"는 Mixture-of-Models 접근이 실제 벤치마크로 증명된 사례. 셀프호스팅 AI의 가성비가 한 단계 올라갈 수 있음

## 핵심 포인트

- NSED는 여러 AI 모델이 병렬 작업 후 교차 평가하며 최종 답변에 수렴하는 Mixture-of-Models 프로토콜
- 20B+8B+12B 모델 3개로 AIME 2025 84% 달성 (단순 다수결은 54%)
- 64GB VRAM으로 80~140GB급 단일 모델 성능 재현
- Rust 구현, NATS 메시징 버스, Ollama/vLLM 지원
- BSL 1.1 라이선스: 연매출 $1M 미만 무료, 4년 후 AGPL-3.0 전환

## 인사이트

작은 모델 여러 개의 협업이 거대 모델 한 개를 대체할 수 있다는 것이 벤치마크로 증명됨. 셀프호스팅 AI의 가성비 공식이 바뀔 수 있는 사례.