---
title: "크래프톤이 AI 모델 브랜드 'Raon' 만들고 음성·비전 모델 4종 오픈소스로 풀었음"
published: 2026-04-05T04:05:03.934Z
canonical: https://jeff.news/article/1542
---
# 크래프톤이 AI 모델 브랜드 'Raon' 만들고 음성·비전 모델 4종 오픈소스로 풀었음

크래프톤이 자체 AI 브랜드 'Raon'을 론칭하고 음성 LLM, 실시간 음성대화, TTS, 비전 인코더 4종을 허깅페이스에 오픈소스로 공개함. 10B 이하급에서 한국어·영어 모두 1위 성능을 주장하며, 특히 한국어 음성 AI 생태계에 의미 있는 기여.

- 크래프톤이 자체 AI 모델 브랜드 **'Raon(라온)'**을 론칭하고, 첫 모델 4종을 허깅페이스에 오픈소스로 공개함
  - '라온'은 "즐거움"이라는 순우리말에서 따온 이름. 게임 회사답게 AI로 재미를 만들겠다는 방향성
  - 음성 LLM, 실시간 음성대화, TTS, 비전 인코더 총 4종 구성

## 공개 모델 상세

- **Raon-Speech**: 9B 파라미터 규모 음성 언어 모델
  - 10B 이하급 공개 모델 중 영어·한국어 모두 글로벌 1위 성능이라고 주장
- **Raon-SpeechChat**: 국내 최초 Full-duplex(실시간 양방향) 음성 대화 모델
  - 동시에 듣고 말하는 게 가능한 구조라 실시간 대화 UX에 적합
- **Raon-OpenTTS**: 공개 음성 데이터만으로 학습한 TTS 모델
  - 학습 데이터까지 같이 공개해서 재현성 확보에 신경 씀
- **Raon-VisionEncoder**: 이미지→AI 처리용 정보 변환 비전 인코더
  - 일부 태스크에서 구글 SigLIP2보다 나은 성능을 보였다고 함

> [!IMPORTANT]
> 한국 게임사가 멀티모달 AI 모델을 오픈소스로 공개한 건 상당히 이례적. 특히 한국어 음성 모델은 선택지가 적어서 실무에서 써볼 만한 가치가 있음

> [!TIP]
> 허깅페이스에서 바로 받아볼 수 있으니, 한국어 음성 관련 프로젝트 진행 중이라면 벤치마크 비교해볼 것

---

## 기술 맥락

한국어 음성 AI 쪽은 사실 선택지가 많지 않거든요. OpenAI Whisper가 한국어도 지원하긴 하는데, 한국어 특화 모델이라고 보기엔 좀 애매하고요. 크래프톤이 9B 규모에서 한국어 1위를 찍었다는 건 꽤 의미 있는 숫자예요. Full-duplex 음성 대화 모델도 국내에선 처음인데, 게임 NPC 대화 같은 데 바로 쓸 수 있을 것 같아요. 무엇보다 학습 데이터까지 공개한 TTS는 연구자 입장에서 진짜 반가운 소식이에요.

## 핵심 포인트

- 크래프톤 AI 브랜드 'Raon' 공식 론칭, 4종 모델 허깅페이스 오픈소스 공개
- Raon-Speech: 9B 파라미터, 10B 이하급 영어·한국어 1위 성능 주장
- Raon-SpeechChat: 국내 최초 Full-duplex 실시간 양방향 음성 대화 모델
- Raon-OpenTTS: 공개 데이터만으로 학습한 TTS, 학습 데이터까지 공개
- Raon-VisionEncoder: 일부 태스크에서 구글 SigLIP2 상회 성능

## 인사이트

한국 게임사가 멀티모달 AI를 오픈소스로 공개한 건 이례적이고, 한국어 음성 모델 선택지가 적은 상황에서 실무 활용 가치가 높음
