본문으로 건너뛰기
피드

디노티시아, 기업 맞춤형 오픈소스 언어모델 ‘DNA 3.0’ 공개

ai-ml 약 6분
vote
0
댓글
북마크

디노티시아가 알리바바 클라우드의 큐원 계열 모델을 기반으로 사후학습과 튜닝을 적용한 ‘DNA 3.0’ 모델군을 허깅페이스에 공개했다. 0.8B부터 122B-A10B까지 다양한 크기로 제공하며, 한국어 답변 안정성, 기업 페르소나, 에이전트 업무 활용을 강조한 모델군이다.

  • 1

    큐원 3.5·3.6 기반으로 사후학습과 튜닝을 적용한 기업 맞춤형 언어모델군 공개

  • 2

    0.8B, 2B, 4B, 9B, 27B, 35B-A3B, 122B-A10B 등 다양한 크기 제공

  • 3

    35B-A3B와 122B-A10B는 전문가혼합 구조로 필요한 일부 전문가만 활성화

  • 4

    한국어 답변 내 언어 혼입과 일부 응답 제약을 줄이는 방향으로 조정

  • 5

    씨홀스 클라우드에 적용해 기업 데이터 질의응답과 AI 에이전트 기능 지원

기업용으로 다시 튜닝한 오픈 모델

  • 디노티시아가 기업·기관 맞춤형 AI 언어모델군 ‘DNA 3.0’을 허깅페이스에 공개함

    • 디노티시아는 장기기억 인공지능과 반도체 기반 AI 인프라 기술을 개발하는 회사임
    • 이번 공개 모델은 기업 데이터 기반 질의응답과 AI 에이전트 활용을 겨냥함
  • DNA 3.0은 알리바바 클라우드의 큐원(Qwen) 3.5·3.6 계열을 기반으로 함

    • 공개 모델의 기본 성능을 가져오되, 디노티시아가 자체 사후학습과 튜닝을 적용함
    • 기관과 기업이 자기 데이터, 업무 목적, 응답 기준에 맞게 조정해 쓰는 방향임
    • 요즘 흔한 “오픈 모델 + 기업용 후처리” 전략의 국내 사례라고 보면 됨
  • 핵심은 모델 성능표보다 실제 업무 환경에서의 답변 품질을 손본 쪽임

    • 기업 정보와 제품 맥락을 반영한 페르소나 학습을 적용함
    • 사용자의 질문 의도에 맞는 답변을 제공하도록 조정했다고 밝힘
    • 큐원 계열에서 나타날 수 있는 일부 응답 제약과 한국어 답변 내 언어 혼입 현상을 줄이는 데도 초점을 맞춤

ℹ️참고

> 기업용 모델에서 “한국어를 잘함”은 단순 번역 품질 문제가 아님. 회의록, 제품 문서, 고객 응대, 내부 정책처럼 맥락이 섞인 데이터를 안정적으로 다루는지가 더 중요함.

모델 크기 선택지도 꽤 넓음

  • 공개된 DNA 3.0 모델군은 경량 모델부터 중대형 전문가혼합(MoE) 모델까지 포함함

    • 세부 모델은 0.8B, 2B, 4B, 9B, 27B, 35B-A3B, 122B-A10B로 구성됨
    • 사용 환경, 비용 조건, 추론 인프라에 따라 골라 쓸 수 있게 한 구조임
  • 35B-A3B와 122B-A10B는 전문가혼합 방식을 적용함

    • 질문마다 필요한 일부 전문가 모델만 활성화함
    • 전체 모델 규모의 이점을 가져가면서도 추론에 필요한 연산 부담을 낮추는 방식임
    • “큰 모델은 좋은데 비용이 무섭다”는 기업 도입 현실을 의식한 선택임
  • 이전 세대 DNA 모델의 기능도 이어받았다고 함

    • 긴 문맥 처리
    • 추론 과정 보존
    • 도구 활용
    • 코딩 지원

씨홀스 클라우드와 붙여서 쓰는 그림

  • DNA 3.0은 디노티시아의 AI 데이터 플랫폼 ‘씨홀스 클라우드(Seahorse Cloud)’에 적용돼 있음

    • 씨홀스 클라우드는 기업 문서와 비정형 데이터를 AI가 활용할 수 있는 지식 자산으로 바꾸는 플랫폼임
    • 의미 기반 검색과 업무 맥락을 반영한 답변 생성을 지원함
    • 여기서 DNA 3.0은 기업 데이터 기반 질의응답과 AI 에이전트 기능을 맡음
  • 디노티시아가 보는 방향은 “데이터 저장·검색”에서 “업무 수행용 AI 지식 기반”으로 넘어가는 쪽임

    • 기업 내부 데이터가 그냥 파일 서버에 쌓이는 게 아니라, 에이전트가 실제 답변과 작업에 활용하는 재료가 되는 구조임
    • 정무경 대표도 조직 데이터와 업무 맥락에 맞게 모델을 조정할 수 있어야 실제 업무 활용이 가능하다고 설명함
  • DNA 라인업의 흐름도 점점 에이전트 쪽으로 이동 중임

    • 2024년 12월 DNA 1.0은 한국어 성능 평가와 오픈소스 공개에 초점을 맞춤
    • DNA-R1은 한국어 논리 추론 특화 모델임
    • DNA 2.0은 툴 콜링과 에이전틱 AI 구현에 집중함
    • DNA 3.0은 큐원 기반 기업 맞춤형 튜닝과 씨홀스 클라우드 적용을 강화한 후속 모델임

기술 맥락

  • DNA 3.0의 기술적 선택은 기초 모델을 처음부터 새로 만드는 게 아니라, 공개된 큐원 계열을 가져와 기업 환경에 맞게 사후학습하는 쪽이에요. 자체 기초 모델 개발은 비용이 크기 때문에, 이미 검증된 오픈 모델 위에서 한국어와 업무 맥락을 다듬는 게 현실적인 전략이거든요.

  • 사후학습이 중요한 이유는 기업용 AI가 일반 챗봇과 다르게 움직여야 하기 때문이에요. 제품명, 내부 용어, 답변 톤, 보안상 말하면 안 되는 내용, 문서 검색 결과 반영 방식까지 조직마다 다르니까요.

  • 전문가혼합 모델을 포함한 것도 비용 문제와 연결돼요. 122B급 모델은 전체 규모만 보면 무겁지만, 실제 추론 때 일부 전문가만 활성화하면 더 큰 모델의 장점을 일부 가져오면서 연산량을 줄일 수 있어요.

  • 씨홀스 클라우드와의 결합은 모델 단독 공개보다 더 실무적인 포인트예요. 기업 데이터는 보통 문서, 표, 비정형 텍스트로 흩어져 있어서 모델만 있다고 답이 나오지 않거든요. 검색과 데이터 정리, 에이전트 실행 흐름까지 붙어야 업무 도구가 돼요.

국내 기업용 언어모델 경쟁이 ‘모델 하나 잘 만들기’보다 ‘기존 오픈 모델을 업무 환경에 맞게 얼마나 잘 길들이느냐’로 이동 중임. 특히 한국어 안정성, 페르소나, 기업 데이터 연결은 실제 도입에서 성능표보다 더 자주 걸리는 문제임.

댓글

댓글

댓글을 불러오는 중...

ai-ml

네이버클라우드, 엔비디아와 손잡고 ‘AI 팩토리’ 판 키운다

네이버클라우드가 엔비디아와 글로벌 AI 팩토리 구축 협력을 공식화했다. 하이퍼클로바X 고도화, 초거대언어모델 최적화 공동 연구, 소버린 AI와 피지컬 AI까지 묶인 꽤 큰 판의 협력이다.

ai-ml

네이버클라우드, 엔비디아와 AI 팩토리 동맹…하이퍼클로바X부터 서울 월드 모델까지 간다

네이버클라우드가 엔비디아의 AI 팩토리 전략에 올라타면서 단순 GPU 구매자가 아니라 AI 인프라·모델·서비스를 같이 만드는 파트너로 포지셔닝하고 있음. 하이퍼클로바X 고도화, 피지컬 AI, 소버린 AI까지 묶인 협력이라 국내 클라우드·AI 인프라 시장에 꽤 큰 신호임.

ai-ml

쿠콘, AI 에이전트 결제 표준 쪽으로 발 올림

쿠콘이 리눅스 재단 산하 글로벌 에이전틱 AI 오픈소스 재단인 AAIF에 실버 멤버로 합류했다. AI 에이전트가 상품 검색을 넘어 결제까지 수행하는 흐름에 맞춰 결제 인프라와 MCP 기반 데이터 사업을 글로벌 표준 쪽으로 맞추려는 움직임이다.

ai-ml

엔비디아, 피지컬 AI용 오픈 월드 모델 ‘코스모스 3’ 공개

엔비디아가 로봇, 자율주행차, 스마트 공간 개발을 겨냥한 오픈소스 월드 모델 ‘코스모스 3’를 공개했다. 비전 추론, 월드 생성, 액션 예측을 하나로 묶은 구조이며, 16B 나노와 64B 슈퍼 모델, 학습 코드, 배포 도구, 합성 데이터셋까지 함께 제공한다.

ai-ml

쿠콘, 에이전틱 AI 오픈소스 재단 AAIF 합류…결제·데이터 표준 노린다

쿠콘이 리눅스재단 산하 에이전틱 AI 오픈소스 재단 AAIF에 실버 멤버로 합류했다. AI 에이전트 결제, 모델 컨텍스트 프로토콜 기반 데이터 사업, 스테이블코인 결제 확장을 엮어 글로벌 결제·데이터 인프라 기업으로 가겠다는 구상이다.