---
title: "소버린 AI, 이제 ‘국산’보다 ‘통제권’ 기준을 따질 때"
published: 2026-06-20T21:00:01.847Z
canonical: https://jeff.news/article/4133
---
# 소버린 AI, 이제 ‘국산’보다 ‘통제권’ 기준을 따질 때

한국의 독자 AI 파운데이션 모델 프로젝트를 둘러싼 논쟁이 ‘외산 기술을 썼느냐’에 갇히면서 정작 중요한 기준 논의가 밀렸다는 지적이 나왔다. 전문가들은 소버린 AI의 핵심을 원산지 증명이 아니라 모델 가중치, 학습 과정, 데이터, 라이선스, 배포·운영 통제권을 국내 주체가 실제로 갖고 있는지로 봐야 한다고 말한다.

- 한국의 소버린 AI 논쟁이 다시 뜨거워진 배경은 미국 정부가 자국 AI 기업 앤트로픽의 ‘미토스5’와 ‘페이블5’ 모델에 외국인 접근 제한을 걸었다는 점임
  - 특정 국가나 기업의 정책 변화로 AI 모델 접근권이 흔들릴 수 있다는 우려가 커진 셈
  - 그래서 “국가 차원에서 외부 변수에 덜 흔들리는 AI 운영 권한이 필요하다”는 주장이 힘을 얻고 있음

- 한국에서 가장 큰 논쟁거리는 과기정통부의 독자 AI 파운데이션 모델 프로젝트, 이른바 ‘독파모’임
  - 목표는 외국 기술 의존도를 낮추고 한국 자체 AI 역량과 생태계를 키우는 것
  - 국내 주요 AI 기업들이 컨소시엄으로 참여했고, 대국민 평가까지 붙으면서 관심이 꽤 컸음

- 그런데 1차 평가에서 네이버클라우드가 탈락하면서 논쟁이 확 튀었음
  - 네이버클라우드의 ‘하이퍼클로바X 시드 32B 싱크’가 중국 알리바바의 ‘큐웬’ 모델 인코더를 활용했다는 점이 문제가 됨
  - 결과적으로 “독자성 취지에 맞지 않는다”는 이유로 2차 평가에 못 올라감
  - 여기서 질문이 생김: 외부 기술을 어디까지 쓰면 독자 AI가 아닌 걸까?

> [!IMPORTANT]
> 기사에서 말하는 핵심은 ‘외산 기술을 일부 썼느냐’가 아니라 ‘외부 접근이 끊겨도 국내 주체가 모델을 유지하고 고도화할 수 있느냐’임.

## 독자성 논쟁이 ‘중국산’ 프레임에 갇힘

- 전문가들은 독자성의 기준을 원산지 증명처럼 보면 안 된다고 봄
  - 국산 기업이 만들었는지, 외국 기술을 참고했는지, 오픈소스를 썼는지만으로 판단하기 어렵다는 얘기
  - 더 중요한 건 모델 가중치, 학습 과정, 데이터, 라이선스, 배포·운영 통제권을 누가 쥐고 있느냐임

- 독파모 논란에서 아쉬운 지점은 공통 기준을 만들 기회를 놓쳤다는 점임
  - 어떤 외부 기술은 허용 가능한 참고인지
  - 어떤 요소부터는 독자성을 훼손하는 의존인지
  - 이런 기준 논의보다 ‘중국 기술을 썼다’는 프레임과 기업별 탈락 결과에 관심이 쏠림

- KAIST 김숙경 교수는 독자성을 글로벌 오픈소스와의 단절이 아니라 핵심 통제권 문제로 봐야 한다고 말함
  - 오픈소스를 쓰더라도 라이선스 제약이나 외부 통제로부터 자유로운지 봐야 함
  - 국내 주체가 모델 구조와 학습 전략을 이해하고 수정할 수 있는지도 중요함
  - 자체 데이터로 고도화하고, 보안·배포·운영을 통제할 수 있어야 진짜 의미가 있음

## 오픈소스 없이 AI 개발? 현실적으로 빡셈

- 업계 전문가들은 오픈소스 없이 AI 모델을 개발하는 건 현실성이 낮다고 봄
  - 모델 구조, 학습 프레임워크, 토크나이저, 데이터 처리 파이프라인, 추론 최적화 도구, 평가 도구까지 전부 글로벌 오픈소스 생태계와 연결돼 있음
  - 모든 소프트웨어 구성요소와 알고리즘, 도구를 자체 개발하는 방식은 비용과 속도 양쪽에서 불리함

- 오픈소스는 ‘공짜라서 쓰는 것’만도 아님
  - 오픈로직의 ‘2026 오픈소스 현황 보고서’에 따르면 조직의 98%가 최근 1년간 오픈소스 사용을 유지하거나 확대함
  - 오픈소스 선택 이유 중 ‘벤더 종속 회피’가 55.35%에 달함
  - 즉 오픈소스는 비용 절감 도구이면서 동시에 기술 선택권과 디지털 자율성을 확보하는 수단임

- 그래서 소버린 AI를 외부와의 단절로 해석하면 오히려 뒤처질 수 있음
  - 오픈소스를 전략적으로 활용하되 라이선스, 보안, 데이터, 운영권을 관리하는 쪽이 현실적임
  - 잘 쓰면 오픈소스는 주권을 해치는 요소가 아니라 통제권을 넓히는 도구가 될 수 있음

## ‘독자냐 아니냐’ 말고 단계별로 봐야 함

- 첫 번째 방식은 아키텍처 설계부터 사전학습까지 전부 독자적으로 하는 것임
  - 모델 구조와 핵심 알고리즘을 자체 설계하고 초기 가중치부터 자체 데이터로 학습함
  - 통제권은 가장 강하지만 비용과 시간이 엄청남
  - 국방, 안보, 금융 같은 핵심 공공 인프라에는 이상적일 수 있지만, 개발이 끝날 때쯤 글로벌 빅테크와 격차가 더 벌어질 위험도 있음

- 두 번째 방식은 공개 논문이나 검증된 구현을 참고하되 가중치는 초기화하고 자체 데이터로 처음부터 학습하는 것임
  - 글로벌 생태계와 호환성을 유지하면서도 핵심 학습 경험과 가중치 형성 과정은 국내 주체가 확보할 수 있음
  - 다만 아키텍처 독창성은 제한될 수 있어서, 어떤 구조를 참고했고 어떤 데이터로 학습했는지 투명하게 검증해야 함

- 세 번째 방식은 이미 학습된 모델 위에 추가 학습이나 미세조정을 얹는 것임
  - 산업 특화 AI, 버티컬 AI, 사내 자동화, 고객 서비스형 AI에는 가장 빠르고 현실적인 방식일 수 있음
  - 비용이 낮고 서비스 적용도 쉬움
  - 하지만 국가대표급 독자 파운데이션 모델이라고 부르기엔 한계가 있음. 원 모델의 라이선스, 업데이트 정책, 배포 조건, 접근권 변화에 계속 영향을 받기 때문임

- 결론은 소버린 AI가 ‘모든 걸 국산화하자’는 구호가 아니라는 것임
  - 빼앗기면 안 되는 데이터가 있는 영역
  - 외부에 판단권을 맡기기 어려운 영역
  - 외부 지원이나 공개가 끊겨도 계속 고도화해야 하는 영역
  - 이런 곳에서 어느 수준의 통제권이 필요한지 산업별로 다르게 정해야 함

---

## 기술 맥락

- 이번 논쟁의 핵심 선택지는 ‘모델을 직접 만들 것인가, 오픈소스를 활용할 것인가’가 아니라 ‘어느 단계까지 우리가 통제할 것인가’예요. 왜냐하면 AI 모델은 아키텍처, 데이터, 가중치, 학습 파이프라인, 배포 환경이 모두 얽혀 있어서 한 군데만 국산이라고 전체가 독립되는 구조가 아니거든요.

- 설계부터 사전학습까지 전부 직접 하면 통제권은 가장 강해요. 대신 비용과 시간이 너무 커서, 글로벌 모델 성능이 계속 올라가는 상황에서는 완성 시점에 이미 뒤처질 수 있어요. 그래서 국방·금융처럼 외부 의존 리스크가 치명적인 영역에 더 어울리는 선택이에요.

- 공개 아키텍처를 참고하되 가중치를 초기화하고 자체 데이터로 학습하는 방식은 중간 지점이에요. 왜냐하면 검증된 구조를 쓰면서도 실제 모델이 배운 내용과 가중치 형성 과정은 국내 주체가 가져갈 수 있기 때문이에요. 이 경우에는 어떤 구조와 데이터를 썼는지 검증 체계가 같이 따라와야 해요.

- 이미 학습된 모델을 가져와 미세조정하는 방식은 서비스 개발에는 제일 현실적이에요. 다만 원 모델의 라이선스나 배포 정책이 바뀌면 영향을 받을 수 있어서, 국가 차원의 독자 파운데이션 모델이라고 부르기에는 조심해야 해요.

## 핵심 포인트

- 소버린 AI의 핵심은 모든 걸 국산화하는 게 아니라 핵심 영역에서 통제권을 확보하는 것
- 오픈소스 없는 AI 개발은 현실적으로 어렵고, 문제는 활용과 의존을 구분하는 기준
- 독자성은 설계부터 사전학습, 자체 데이터 학습, 기존 모델 미세조정 등 단계별로 나눠 봐야 함
- 국방·금융 같은 민감 영역과 일반 공공·업무 자동화 영역은 서로 다른 기준이 필요

## 인사이트

이 논쟁은 한국 AI 정책이 감정적 ‘국산 기술’ 프레임에서 벗어나 실제 운영 가능한 기준을 만들 수 있느냐의 문제다. 개발자 입장에서도 앞으로 공공·금융 AI 프로젝트에서 모델 출처보다 라이선스, 데이터, 가중치, 운영권을 더 자주 묻게 될 가능성이 크다.