---
title: "코히어, 폐쇄형 코딩 AI 겨냥한 오픈소스 모델 ‘노스 미니 코드’ 공개"
published: 2026-06-12T07:05:03.651Z
canonical: https://jeff.news/article/4058
---
# 코히어, 폐쇄형 코딩 AI 겨냥한 오픈소스 모델 ‘노스 미니 코드’ 공개

코히어가 개발자용 오픈소스 코딩 모델 ‘노스 미니 코드’를 공개했다. 30B 파라미터 혼합전문가 구조, 256K 컨텍스트, 아파치 2.0 라이선스를 앞세워 기업이 자체 환경에서 돌릴 수 있는 코딩 에이전트 수요를 노린다.

- 코히어가 첫 에이전틱 코딩 모델 ‘노스 미니 코드’를 오픈소스로 공개함
  - 지난 9일 출시됐고, 허깅페이스에서 가중치를 받을 수 있음
  - 코히어 API, 모델 볼트, 오픈라우터 같은 경로로도 사용 가능함
  - 라이선스는 아파치 2.0이라 기업 입장에서도 검토 장벽이 비교적 낮은 편임

- 스펙은 꽤 공격적임. 전체 30B 파라미터, 활성 3B 파라미터짜리 혼합전문가 구조임
  - 컨텍스트 길이는 256K, 최대 생성 길이는 64K까지 제시됨
  - 최소 하드웨어 사양은 FP8 기준 H100 1장으로 안내됨
  - “대형 폐쇄형 모델 말고 우리 환경에서 돌릴 수 있는 코딩 모델 없나?” 하는 기업 개발 조직을 정면으로 겨냥한 느낌임

- 코히어가 말하는 용도는 단순 코드 생성이 아님
  - 에이전틱 소프트웨어 엔지니어링, 터미널 작업, 코드 리뷰, 시스템 아키텍처 파악까지 포함됨
  - 요즘 코딩 에이전트가 저장소 탐색, 명령 실행, 테스트 수행까지 들어오면서 내부 코드와 개발 로그가 모델에 직접 연결되는 구조가 됨
  - 그래서 기업 입장에서는 “성능 좋음”만으로는 부족하고, 코드가 어디서 처리되는지와 추론 로그가 어떻게 남는지가 훨씬 중요해짐

> [!IMPORTANT]
> 코히어가 내세우는 핵심은 코딩 성능만이 아니라 배포 통제임. 내부망이나 온프레미스에서 돌릴 수 있는 선택지가 늘어나는 게 이 뉴스의 진짜 포인트임.

- 성능 주장도 꽤 구체적임
  - 코히어 내부 테스트 기준으로 노스 미니 코드는 데브스트랄 스몰 2보다 최대 2.8배 높은 출력 처리량을 기록함
  - 토큰 간 지연 시간도 30% 우위였다고 함
  - 다만 첫 토큰 생성 시간은 일부 조건에서 데브스트랄 스몰 2가 앞섰다고 인정됨

- 이번 출시는 코히어의 소버린 AI 전략이 개발자 도구로 확장된 사례로 볼 수 있음
  - 코히어는 지난 4월 독일 AI 기업 알레프알파와 결합 계획을 발표했음
  - 알레프알파는 유럽 공공·규제 산업 고객 기반을 가진 회사임
  - 빅테크 중심 AI 생태계의 대안을 만들겠다는 구상이 이제 코딩 에이전트 영역까지 내려온 셈임

- 실제 도입은 벤치마크만으로 결정되진 않을 듯함
  - 코딩 모델은 긴 컨텍스트 처리, 저장소 이해도, 테스트 자동화, 보안 취약점 탐지, 개발 도구 연동성이 같이 평가됨
  - 코히어가 오픈코드 호환성을 강조한 것도 실제 개발 워크플로 안에서 써먹히는 모델이 되겠다는 신호임
  - 메타, 미스트랄, 딥시크 같은 개방형 모델 진영과 오픈AI, 앤트로픽, 구글 같은 폐쇄형 진영 사이 경쟁도 더 빡세질 전망임

---

## 기술 맥락

- 코히어가 고른 방향은 “가장 큰 모델”이 아니라 “기업이 직접 통제할 수 있는 코딩 모델”이에요. 코딩 에이전트는 내부 저장소와 터미널, 테스트 로그를 건드리기 때문에 외부 폐쇄형 API에 전부 맡기기 부담스러운 조직이 많거든요.

- 혼합전문가 구조를 쓴 이유도 비용과 지연 시간을 같이 잡기 위해서예요. 전체 파라미터는 30B로 크게 가져가되 실제 추론 때는 3B만 활성화하면, 기업 입장에서는 성능 대비 인프라 비용을 계산하기 쉬워져요.

- 256K 컨텍스트와 64K 생성 길이는 저장소 단위 작업을 염두에 둔 스펙이에요. 파일 몇 개 자동완성하는 수준이면 과한 숫자지만, 아키텍처 파악이나 대규모 코드 리뷰에서는 긴 컨텍스트가 바로 제품성으로 이어져요.

- 결국 경쟁 포인트는 벤치마크 점수 하나가 아니에요. 개발 도구 연동, 로그 통제, 내부망 배포, 보안 검증까지 통과해야 실제 조직에서 “써도 된다”는 판단이 나오거든요.

## 핵심 포인트

- 노스 미니 코드는 30B 전체 파라미터와 3B 활성 파라미터를 가진 혼합전문가 구조 모델이다.
- 컨텍스트 길이는 256K, 최대 생성 길이는 64K이며 아파치 2.0 라이선스로 공개됐다.
- 코히어는 데브스트랄 스몰 2 대비 최대 2.8배 높은 출력 처리량과 30% 낮은 토큰 간 지연 시간을 주장했다.
- 기업 내부 코드와 로그를 외부 폐쇄형 모델에 맡기기 꺼리는 조직을 겨냥한 소버린 AI 전략의 확장으로 볼 수 있다.

## 인사이트

코딩 AI 경쟁이 단순히 ‘누가 코드를 더 잘 짜나’에서 ‘우리 코드가 어디서 처리되나’로 넘어가는 중이다. 성능만큼이나 배포 통제, 로그 관리, 온프레미스 운용성이 구매 포인트가 되는 흐름이라 꽤 현실적인 승부수다.
