코히어, 폐쇄형 코딩 AI에 맞설 오픈소스 모델 ‘노스 미니 코드’ 공개

ai-ml 2026-06-12 약 5분

 tags

#coding-agent #open-source #llm #moe #sovereign-ai

vote

북마크

코히어가 첫 에이전틱 코딩 모델 ‘노스 미니 코드’를 오픈소스로 공개했다. 30B 파라미터, 활성 3B 파라미터의 혼합전문가 구조에 256K 컨텍스트를 지원하며, 기업이 자체 환경에서 코딩 에이전트를 운영하려는 수요를 겨냥한다.

1
노스 미니 코드는 아파치 2.0 라이선스로 공개된 개발자용 오픈소스 코딩 모델
2
30B 전체 파라미터, 활성 3B 파라미터의 혼합전문가 구조와 256K 컨텍스트 지원
3
동일 조건에서 데브스트랄 스몰 2보다 최대 2.8배 높은 출력 처리량과 30% 낮은 토큰 간 지연 시간 기록
4
기업 내부망과 온프레미스 환경에서 소스코드와 개발 로그 통제를 원하는 조직을 겨냥

코히어가 첫 에이전틱 코딩 모델 ‘노스 미니 코드’를 오픈소스로 공개함
- 개발자가 자체 환경에서 돌릴 수 있는 코딩 모델을 내세워, 오픈AI·앤트로픽·구글 같은 폐쇄형 대형언어모델(LLM) 의존도를 낮추려는 기업 수요를 겨냥함
- 지난 4월 독일 알레프알파와 결합하며 내세운 소버린 AI 전략을 개발자 도구 영역으로 확장한 흐름으로 읽힘
스펙만 보면 ‘작게 돌리는 큰 모델’ 쪽에 가깝다
- 전체 30B 파라미터, 활성 3B 파라미터의 혼합전문가(MoE) 구조
- 컨텍스트 길이 256K, 최대 생성 길이 64K
- 라이선스는 아파치 2.0이고, 허깅페이스 가중치 다운로드·코히어 API·모델 볼트·오픈라우터 등을 통해 사용 가능
- 최소 하드웨어는 FP8 기준 H100 1개로 제시됨

❗중요

> 핵심은 “오픈소스 코딩 모델” 자체보다 “기업이 코드를 자기 통제권 안에서 처리할 수 있느냐”에 있음. 코딩 에이전트가 저장소와 터미널까지 만지는 순간, 모델 배포 위치가 보안 정책의 일부가 됨.

코히어가 노린 사용처는 단순 코드 자동완성이 아님
- 코드 생성뿐 아니라 에이전틱 소프트웨어 엔지니어링, 터미널 작업, 코드 리뷰, 시스템 아키텍처 파악에 최적화했다고 설명함
- 요즘 코딩 에이전트가 저장소 탐색, 명령 실행, 테스트 수행까지 맡는 걸 보면 꽤 현실적인 포지셔닝임
- 이 과정에서 소스코드, 개발 로그, 내부 시스템 구조가 모델과 직접 연결되기 때문에 기업 입장에선 보안과 통제가 중요해짐
성능 홍보 포인트는 속도와 비용 효율임
- 코히어 내부 테스트 기준, 노스 미니 코드는 동일 하드웨어와 동시성 조건에서 데브스트랄 스몰 2보다 최대 2.8배 높은 출력 처리량을 기록함
- 토큰 간 지연 시간도 30% 우위였다고 밝힘
- 다만 첫 토큰 생성 시간은 일부 조건에서 데브스트랄 스몰 2가 앞섰다고 함. 즉 “항상 더 빠르다”라기보단 처리량 쪽 강점을 강조한 셈
기업 도입 기준은 벤치마크 점수 하나로 끝나지 않음
- 코딩 모델은 장기 컨텍스트 처리, 저장소 이해도, 테스트 자동화, 보안 취약점 탐지, 개발 도구 연동성까지 같이 봐야 함
- 특히 내부망이나 온프레미스에서 운용하려는 조직은 추론 로그가 어디에 남는지, 기존 개발 도구와 얼마나 안정적으로 붙는지를 더 민감하게 볼 수밖에 없음
- 코히어가 오픈코드 호환성을 강조한 것도 실제 개발 워크플로 안에 넣기 위한 포석으로 보임
오픈소스 코딩 모델 경쟁은 더 빡세질 가능성이 큼
- 폐쇄형 진영에선 오픈AI, 앤트로픽, 구글이 코딩 에이전트 시장을 키우고 있음
- 개방형 진영에선 메타, 미스트랄, 딥시크 같은 모델들이 계속 압박 중임
- 코히어는 여기에 “기업이 직접 통제 가능한 코딩 에이전트”라는 각도로 끼어든 셈이라, 개발 조직 입장에선 선택지가 하나 더 늘어난 상황임

기술 맥락

코히어의 선택은 단순히 코딩 모델을 하나 더 낸 게 아니라, 모델 운영 위치를 기업 쪽으로 당겨오려는 전략이에요. 코딩 에이전트는 저장소와 터미널, 테스트 로그를 직접 다루기 때문에 일반 챗봇보다 훨씬 민감한 데이터를 만지거든요.
혼합전문가 구조를 쓴 이유도 비용과 성능의 타협점 때문이에요. 전체 모델은 30B지만 실제 활성 파라미터는 3B라서, 큰 모델의 여지를 남기면서도 추론 부담을 낮추려는 설계로 볼 수 있어요.
256K 컨텍스트는 대형 저장소를 읽는 코딩 에이전트에서 꽤 중요한 숫자예요. 함수 하나만 보는 자동완성과 달리, 에이전트는 여러 파일의 의존성과 테스트 흐름을 같이 봐야 하니까요.
다만 기업이 실제로 쓰려면 벤치마크보다 개발 도구 연동성이 더 중요해질 수 있어요. 코드 리뷰, 테스트 실행, 취약점 탐지까지 자연스럽게 이어져야 개발자가 “쓸 만하다”고 느끼거든요.

코딩 AI 경쟁의 포인트가 ‘누가 더 똑똑한가’에서 ‘코드를 어디서 처리하고 누가 통제하는가’로 넘어가는 흐름이 보인다. 기업 개발 조직 입장에선 성능표만큼이나 배포 방식, 로그 관리, 도구 연동성이 진짜 도입 기준이 될 가능성이 크다.

이전 기사 (P)

다음 기사 (N)

댓글을 불러오는 중...

ai-ml 2026-07-27

앤트로픽, “오픈 웨이트 모델 금지하자는 얘기 한 적 없다”

앤트로픽 CEO 다리오 아모데이가 오픈 웨이트 모델을 둘러싼 논란에 직접 입장을 냈다. 핵심은 오픈 웨이트 자체를 금지하자는 게 아니라, 강력한 칩의 중국 유입 차단, 대규모 증류 작업 규제, 고성능 모델의 출시 전 안전성 테스트가 필요하다는 주장이다.

ai-ml 2026-07-27

엔비디아·마이크로소프트, 미국에 오픈소스 AI 규제 자제 요청

엔비디아, 마이크로소프트, 메타, IBM 등 주요 기술 기업들이 미국 의원들에게 오픈소스 AI 모델을 성급하게 규제하지 말라고 요청했다. 이들은 폐쇄형 모델만으로 보안을 보장할 수 없고, 오픈소스 모델이 비용 통제와 보안 검증에 필요하다고 주장했다.

ai-ml 2026-07-27

서울아산병원은 AI로 뇌 MR 판독 시간을 14.3% 줄였다

서울아산병원이 영상의학과 병리진단 영역에서 AI를 실제 임상 업무에 적용한 사례를 소개한 글이다. 뇌 MR 판독 시간은 건당 66.9초에서 57.3초로 줄었고, Ki-67 병리 판독은 기존 10분가량 걸리던 작업이 5초 내외로 단축됐다.

ai-ml 2026-07-27

일본·대만이 구마모토에 피지컬 AI 반도체 거점을 만든다

일본 미쓰이 부동산이 2030년 구마모토 사이언스 파크에 피지컬 AI 반도체 개발 거점인 PASTEC을 세우기로 했다. 일본·대만 기업과 연구진, TSMC, 소재·장비·후공정 업체가 공동 클린룸을 활용해 제조·물류·로봇용 AI 반도체 시제품 제작까지 노린다는 내용이다.

ai-ml 2026-07-27

AI가 책까지 쓰는 시대, ‘사람이 썼다’가 프리미엄이 됐다

코히어, 폐쇄형 코딩 AI에 맞설 오픈소스 모델 ‘노스 미니 코드’ 공개

요약

핵심 포인트

핵심 개념

분석

기술 맥락

인사이트

댓글

댓글

코히어, 폐쇄형 코딩 AI에 맞설 오픈소스 모델 ‘노스 미니 코드’ 공개

요약

핵심 포인트

핵심 개념

분석

기술 맥락

인사이트

댓글

댓글

관련 기사