---
title: "디노티시아, 기업 맞춤형 오픈소스 언어모델 ‘DNA 3.0’ 공개"
published: 2026-06-02T04:05:03.524Z
canonical: https://jeff.news/article/3604
---
# 디노티시아, 기업 맞춤형 오픈소스 언어모델 ‘DNA 3.0’ 공개

디노티시아가 알리바바 클라우드의 큐원 계열 모델을 기반으로 사후학습과 튜닝을 적용한 ‘DNA 3.0’ 모델군을 허깅페이스에 공개했다. 0.8B부터 122B-A10B까지 다양한 크기로 제공하며, 한국어 답변 안정성, 기업 페르소나, 에이전트 업무 활용을 강조한 모델군이다.

## 기업용으로 다시 튜닝한 오픈 모델

- 디노티시아가 기업·기관 맞춤형 AI 언어모델군 ‘DNA 3.0’을 허깅페이스에 공개함
  - 디노티시아는 장기기억 인공지능과 반도체 기반 AI 인프라 기술을 개발하는 회사임
  - 이번 공개 모델은 기업 데이터 기반 질의응답과 AI 에이전트 활용을 겨냥함

- DNA 3.0은 알리바바 클라우드의 큐원(Qwen) 3.5·3.6 계열을 기반으로 함
  - 공개 모델의 기본 성능을 가져오되, 디노티시아가 자체 사후학습과 튜닝을 적용함
  - 기관과 기업이 자기 데이터, 업무 목적, 응답 기준에 맞게 조정해 쓰는 방향임
  - 요즘 흔한 “오픈 모델 + 기업용 후처리” 전략의 국내 사례라고 보면 됨

- 핵심은 모델 성능표보다 실제 업무 환경에서의 답변 품질을 손본 쪽임
  - 기업 정보와 제품 맥락을 반영한 페르소나 학습을 적용함
  - 사용자의 질문 의도에 맞는 답변을 제공하도록 조정했다고 밝힘
  - 큐원 계열에서 나타날 수 있는 일부 응답 제약과 한국어 답변 내 언어 혼입 현상을 줄이는 데도 초점을 맞춤

> [!NOTE]
> 기업용 모델에서 “한국어를 잘함”은 단순 번역 품질 문제가 아님. 회의록, 제품 문서, 고객 응대, 내부 정책처럼 맥락이 섞인 데이터를 안정적으로 다루는지가 더 중요함.

## 모델 크기 선택지도 꽤 넓음

- 공개된 DNA 3.0 모델군은 경량 모델부터 중대형 전문가혼합(MoE) 모델까지 포함함
  - 세부 모델은 0.8B, 2B, 4B, 9B, 27B, 35B-A3B, 122B-A10B로 구성됨
  - 사용 환경, 비용 조건, 추론 인프라에 따라 골라 쓸 수 있게 한 구조임

- 35B-A3B와 122B-A10B는 전문가혼합 방식을 적용함
  - 질문마다 필요한 일부 전문가 모델만 활성화함
  - 전체 모델 규모의 이점을 가져가면서도 추론에 필요한 연산 부담을 낮추는 방식임
  - “큰 모델은 좋은데 비용이 무섭다”는 기업 도입 현실을 의식한 선택임

- 이전 세대 DNA 모델의 기능도 이어받았다고 함
  - 긴 문맥 처리
  - 추론 과정 보존
  - 도구 활용
  - 코딩 지원

## 씨홀스 클라우드와 붙여서 쓰는 그림

- DNA 3.0은 디노티시아의 AI 데이터 플랫폼 ‘씨홀스 클라우드(Seahorse Cloud)’에 적용돼 있음
  - 씨홀스 클라우드는 기업 문서와 비정형 데이터를 AI가 활용할 수 있는 지식 자산으로 바꾸는 플랫폼임
  - 의미 기반 검색과 업무 맥락을 반영한 답변 생성을 지원함
  - 여기서 DNA 3.0은 기업 데이터 기반 질의응답과 AI 에이전트 기능을 맡음

- 디노티시아가 보는 방향은 “데이터 저장·검색”에서 “업무 수행용 AI 지식 기반”으로 넘어가는 쪽임
  - 기업 내부 데이터가 그냥 파일 서버에 쌓이는 게 아니라, 에이전트가 실제 답변과 작업에 활용하는 재료가 되는 구조임
  - 정무경 대표도 조직 데이터와 업무 맥락에 맞게 모델을 조정할 수 있어야 실제 업무 활용이 가능하다고 설명함

- DNA 라인업의 흐름도 점점 에이전트 쪽으로 이동 중임
  - 2024년 12월 DNA 1.0은 한국어 성능 평가와 오픈소스 공개에 초점을 맞춤
  - DNA-R1은 한국어 논리 추론 특화 모델임
  - DNA 2.0은 툴 콜링과 에이전틱 AI 구현에 집중함
  - DNA 3.0은 큐원 기반 기업 맞춤형 튜닝과 씨홀스 클라우드 적용을 강화한 후속 모델임

---

## 기술 맥락

- DNA 3.0의 기술적 선택은 기초 모델을 처음부터 새로 만드는 게 아니라, 공개된 큐원 계열을 가져와 기업 환경에 맞게 사후학습하는 쪽이에요. 자체 기초 모델 개발은 비용이 크기 때문에, 이미 검증된 오픈 모델 위에서 한국어와 업무 맥락을 다듬는 게 현실적인 전략이거든요.

- 사후학습이 중요한 이유는 기업용 AI가 일반 챗봇과 다르게 움직여야 하기 때문이에요. 제품명, 내부 용어, 답변 톤, 보안상 말하면 안 되는 내용, 문서 검색 결과 반영 방식까지 조직마다 다르니까요.

- 전문가혼합 모델을 포함한 것도 비용 문제와 연결돼요. 122B급 모델은 전체 규모만 보면 무겁지만, 실제 추론 때 일부 전문가만 활성화하면 더 큰 모델의 장점을 일부 가져오면서 연산량을 줄일 수 있어요.

- 씨홀스 클라우드와의 결합은 모델 단독 공개보다 더 실무적인 포인트예요. 기업 데이터는 보통 문서, 표, 비정형 텍스트로 흩어져 있어서 모델만 있다고 답이 나오지 않거든요. 검색과 데이터 정리, 에이전트 실행 흐름까지 붙어야 업무 도구가 돼요.

## 핵심 포인트

- 큐원 3.5·3.6 기반으로 사후학습과 튜닝을 적용한 기업 맞춤형 언어모델군 공개
- 0.8B, 2B, 4B, 9B, 27B, 35B-A3B, 122B-A10B 등 다양한 크기 제공
- 35B-A3B와 122B-A10B는 전문가혼합 구조로 필요한 일부 전문가만 활성화
- 한국어 답변 내 언어 혼입과 일부 응답 제약을 줄이는 방향으로 조정
- 씨홀스 클라우드에 적용해 기업 데이터 질의응답과 AI 에이전트 기능 지원

## 인사이트

국내 기업용 언어모델 경쟁이 ‘모델 하나 잘 만들기’보다 ‘기존 오픈 모델을 업무 환경에 맞게 얼마나 잘 길들이느냐’로 이동 중임. 특히 한국어 안정성, 페르소나, 기업 데이터 연결은 실제 도입에서 성능표보다 더 자주 걸리는 문제임.