본문으로 건너뛰기
피드

코히어, 폐쇄형 코딩 AI에 맞설 오픈소스 모델 ‘노스 미니 코드’ 공개

ai-ml 약 5분
vote
0
댓글
북마크

코히어가 첫 에이전틱 코딩 모델 ‘노스 미니 코드’를 오픈소스로 공개했다. 30B 파라미터, 활성 3B 파라미터의 혼합전문가 구조에 256K 컨텍스트를 지원하며, 기업이 자체 환경에서 코딩 에이전트를 운영하려는 수요를 겨냥한다.

  • 1

    노스 미니 코드는 아파치 2.0 라이선스로 공개된 개발자용 오픈소스 코딩 모델

  • 2

    30B 전체 파라미터, 활성 3B 파라미터의 혼합전문가 구조와 256K 컨텍스트 지원

  • 3

    동일 조건에서 데브스트랄 스몰 2보다 최대 2.8배 높은 출력 처리량과 30% 낮은 토큰 간 지연 시간 기록

  • 4

    기업 내부망과 온프레미스 환경에서 소스코드와 개발 로그 통제를 원하는 조직을 겨냥

  • 코히어가 첫 에이전틱 코딩 모델 ‘노스 미니 코드’를 오픈소스로 공개함

    • 개발자가 자체 환경에서 돌릴 수 있는 코딩 모델을 내세워, 오픈AI·앤트로픽·구글 같은 폐쇄형 대형언어모델(LLM) 의존도를 낮추려는 기업 수요를 겨냥함
    • 지난 4월 독일 알레프알파와 결합하며 내세운 소버린 AI 전략을 개발자 도구 영역으로 확장한 흐름으로 읽힘
  • 스펙만 보면 ‘작게 돌리는 큰 모델’ 쪽에 가깝다

    • 전체 30B 파라미터, 활성 3B 파라미터의 혼합전문가(MoE) 구조
    • 컨텍스트 길이 256K, 최대 생성 길이 64K
    • 라이선스는 아파치 2.0이고, 허깅페이스 가중치 다운로드·코히어 API·모델 볼트·오픈라우터 등을 통해 사용 가능
    • 최소 하드웨어는 FP8 기준 H100 1개로 제시됨

중요

> 핵심은 “오픈소스 코딩 모델” 자체보다 “기업이 코드를 자기 통제권 안에서 처리할 수 있느냐”에 있음. 코딩 에이전트가 저장소와 터미널까지 만지는 순간, 모델 배포 위치가 보안 정책의 일부가 됨.

  • 코히어가 노린 사용처는 단순 코드 자동완성이 아님

    • 코드 생성뿐 아니라 에이전틱 소프트웨어 엔지니어링, 터미널 작업, 코드 리뷰, 시스템 아키텍처 파악에 최적화했다고 설명함
    • 요즘 코딩 에이전트가 저장소 탐색, 명령 실행, 테스트 수행까지 맡는 걸 보면 꽤 현실적인 포지셔닝임
    • 이 과정에서 소스코드, 개발 로그, 내부 시스템 구조가 모델과 직접 연결되기 때문에 기업 입장에선 보안과 통제가 중요해짐
  • 성능 홍보 포인트는 속도와 비용 효율임

    • 코히어 내부 테스트 기준, 노스 미니 코드는 동일 하드웨어와 동시성 조건에서 데브스트랄 스몰 2보다 최대 2.8배 높은 출력 처리량을 기록함
    • 토큰 간 지연 시간도 30% 우위였다고 밝힘
    • 다만 첫 토큰 생성 시간은 일부 조건에서 데브스트랄 스몰 2가 앞섰다고 함. 즉 “항상 더 빠르다”라기보단 처리량 쪽 강점을 강조한 셈
  • 기업 도입 기준은 벤치마크 점수 하나로 끝나지 않음

    • 코딩 모델은 장기 컨텍스트 처리, 저장소 이해도, 테스트 자동화, 보안 취약점 탐지, 개발 도구 연동성까지 같이 봐야 함
    • 특히 내부망이나 온프레미스에서 운용하려는 조직은 추론 로그가 어디에 남는지, 기존 개발 도구와 얼마나 안정적으로 붙는지를 더 민감하게 볼 수밖에 없음
    • 코히어가 오픈코드 호환성을 강조한 것도 실제 개발 워크플로 안에 넣기 위한 포석으로 보임
  • 오픈소스 코딩 모델 경쟁은 더 빡세질 가능성이 큼

    • 폐쇄형 진영에선 오픈AI, 앤트로픽, 구글이 코딩 에이전트 시장을 키우고 있음
    • 개방형 진영에선 메타, 미스트랄, 딥시크 같은 모델들이 계속 압박 중임
    • 코히어는 여기에 “기업이 직접 통제 가능한 코딩 에이전트”라는 각도로 끼어든 셈이라, 개발 조직 입장에선 선택지가 하나 더 늘어난 상황임

기술 맥락

  • 코히어의 선택은 단순히 코딩 모델을 하나 더 낸 게 아니라, 모델 운영 위치를 기업 쪽으로 당겨오려는 전략이에요. 코딩 에이전트는 저장소와 터미널, 테스트 로그를 직접 다루기 때문에 일반 챗봇보다 훨씬 민감한 데이터를 만지거든요.

  • 혼합전문가 구조를 쓴 이유도 비용과 성능의 타협점 때문이에요. 전체 모델은 30B지만 실제 활성 파라미터는 3B라서, 큰 모델의 여지를 남기면서도 추론 부담을 낮추려는 설계로 볼 수 있어요.

  • 256K 컨텍스트는 대형 저장소를 읽는 코딩 에이전트에서 꽤 중요한 숫자예요. 함수 하나만 보는 자동완성과 달리, 에이전트는 여러 파일의 의존성과 테스트 흐름을 같이 봐야 하니까요.

  • 다만 기업이 실제로 쓰려면 벤치마크보다 개발 도구 연동성이 더 중요해질 수 있어요. 코드 리뷰, 테스트 실행, 취약점 탐지까지 자연스럽게 이어져야 개발자가 “쓸 만하다”고 느끼거든요.

코딩 AI 경쟁의 포인트가 ‘누가 더 똑똑한가’에서 ‘코드를 어디서 처리하고 누가 통제하는가’로 넘어가는 흐름이 보인다. 기업 개발 조직 입장에선 성능표만큼이나 배포 방식, 로그 관리, 도구 연동성이 진짜 도입 기준이 될 가능성이 크다.

댓글

댓글

댓글을 불러오는 중...

ai-ml

플랜바이, 건축 설계 AI 자동화 들고 북미 AEC 시장 공략

플랜바이테크놀로지스가 AIA 컨퍼런스 온 아키텍처 & 디자인 2026에서 건축 시각화 플랫폼 플라나와 외관 설계 워크플로우 플랫폼 플래드를 북미 시장에 공개한다. 클라우드 AI 렌더링, 노드 기반 설계, 위성 지도 연동을 앞세워 반복 시안 작업과 고비용 렌더링 문제를 줄이겠다는 그림이다.

ai-ml

AI 인프라 사이클, 한국은 이제 ‘모델’보다 ‘공장’을 봐야 한다

AI 투자는 단순한 서버 증설이 아니라 지능·추론·코딩 비용을 낮추는 새 생산함수에 대한 설비투자로 봐야 한다는 분석이다. 미국 중심으로 시작된 GPU·데이터센터 투자 사이클이 한국에서는 HBM, 전력·냉각, 통신, 클라우드, SI, 로봇·자동화까지 확장될 수 있다는 게 핵심이다. 다만 실제 투자 사이클로 인정받으려면 전력 수전, GPU 조달, 앵커 테넌트 확보가 확인돼야 한다.

ai-ml

비즈니스 AI, 결국 승부는 모델보다 데이터 품질

생성형 AI를 업무에 쓰려면 프롬프트만 잘 쓰는 걸로는 부족하고, AI가 참고하는 데이터의 품질과 범위를 관리해야 한다는 내용이다. 최신 반도체, 서버, 알고리즘보다 먼저 봐야 할 건 AI가 무엇을 학습하고 어떤 맥락을 보고 답하는지라는 점을 짚는다.

ai-ml

AI가 화면 밖으로 나왔다, 인간형 로봇 공장 투입이 본격화되는 중

챗봇과 이미지 생성 중심이던 AI 투자 열기가 로봇, 자율주행, 물류 자동화 같은 현실 세계로 옮겨가고 있다는 분석이 나왔다. 2026년 상반기 로봇 기업 투자액은 558억 달러로 이미 전년도 연간 기록의 거의 두 배에 달했고, BMW·토요타·아마존·테슬라·엔비디아가 전면에 서 있다.

ai-ml

어렵던 블록체인, 이제 AI 비서가 붙는 중

블록체인은 관심도 면에서 AI에 밀린 것처럼 보이지만, 디지털 자산의 보유와 이전을 기록하는 인프라 역할은 여전히 남아 있어. 문제는 지갑, 시드 문구, 서명, 수수료 같은 사용 경험이 너무 어렵다는 점이고, AI가 이 복잡한 절차를 사람 말로 풀어주는 인터페이스가 될 수 있다는 내용이야.