---
title: "루닛 16B 모델이 클로드 3.5를 이겼고, KAIST K-Fold는 알파폴드3보다 30배 빠르다"
published: 2026-03-31T07:05:02.677Z
canonical: https://jeff.news/article/1416
---
# 루닛 16B 모델이 클로드 3.5를 이겼고, KAIST K-Fold는 알파폴드3보다 30배 빠르다

의료·바이오 특화 AI 파운데이션 모델 2종이 중간평가를 통과함. 루닛의 16B 모델은 클로드 3.5 소네트를 의학 Q&A에서 앞섰고, KAIST K-Fold는 알파폴드3 대비 30배 빠른 단백질 구조 예측을 달성함. 4월 초 허깅페이스 오픈소스 공개 예정.

의료·바이오 특화 AI 파운데이션 모델 2종이 중간평가를 통과함. 루닛 컨소시엄의 16B 모델은 클로드 3.5 소네트(100B~1T급)를 의학 분야에서 앞섰고, KAIST 컨소시엄의 K-Fold는 알파폴드3 수준 정확도에 30배 빠른 속도를 달성함. 두 모델 모두 From Scratch 방식으로 개발됐으며, 4월 초 허깅페이스 오픈소스 공개 예정임.

## 루닛 컨소시엄 — 16B 의과학 파운데이션 모델

- 16B 파라미터 규모의 의과학 특화 모델을 From Scratch로 개발함
- **앤트로픽 클로드 3.5 소네트(100B~1T급) 대비 우수한 성능**을 기록한 영역:
  - 의학 논문 기반 질의·응답 정확도
  - AI 답변의 출처·근거 일치성
  - 과학 연구용 코드 작성·분석 수행 능력
- 임상 의사결정 지원 에이전트 시스템(CDSS) 구축:
  - 최신 논문 기반 의학 추론 수행
  - 환자 상태와 근거를 함께 검토하며 진단·치료 판단 보조
  - 의사에게 필요한 정보를 빠르고 정확하게 제시
- **일산병원 임상 실증** (2~3월, 국민건강보험공단 일산병원):
  - 응급실 환자 위급도 5단계 분류에서 높은 정확도 달성
  - 진단명 **94.0%** 일치
  - 이상약물반응 판단 정확도 및 보고서 작성 성능도 우수
  - 현장 의료진으로부터 "실제 진료 현장에서 활용 가능한 수준"이라는 평가를 받음

## KAIST 컨소시엄 — 2B K-Fold 바이오 파운데이션 모델

- 2B 파라미터 규모의 단백질 복합체 구조 예측 모델 'K-Fold'를 개발함
- 단백질-단백질, 저분자, 핵산 포함 분자 복합체의 3차원 구조 예측 정확도가 **알파폴드3에 근접한 수준**으로 평가됨

> [!IMPORTANT]
> K-Fold는 알파폴드3 대비 **최대 30배 이상 빠른 속도**로 단백질·복합체 구조를 예측함. 기존 30분 소요 → 평균 1분 이내로 단축.

- **새로운 생성 모델링 방식** 적용:
  - 기존 방식: 분자의 최종 구조만 예측
  - K-Fold: 분자들의 물리적 결합 과정에서 구조가 어떻게 변화하는지까지 함께 예측
- 데이터가 희소한 신규 약물 복합체에 대한 예측 정확도도 향상됨
- 약물 결합에 따른 단백질 구조 변화 예측이 중요한 **신약 개발 분야**에서 K-Fold 기반 서비스형 신약개발(DaaS)의 새로운 가능성을 제시함

## 평가 결과 및 향후 계획

- 두 컨소시엄 모두 **80점 이상** 획득 (2단계 지원 조건: 70점 이상)
- 한국정보통신기술협회(TTA)가 두 모델 모두 **From Scratch 학습**임을 검증함
- GPU 지원: 컨소시엄당 **B200 256장**, 4월 1일~9월 9일까지 2단계 계속 지원
- **4월 초 허깅페이스에 오픈소스로 공개** 예정

---

### 기술 맥락

16B 파라미터 모델이 100B~1T급 범용 모델을 이겼다는 게 왜 대단한 건지 설명해 드릴게요.

보통 AI 모델은 파라미터 수가 클수록 성능이 좋다고 알려져 있거든요. 클로드 3.5 소네트 같은 범용 모델은 수천억 개의 파라미터로 모든 분야를 커버하려고 하죠. 그런데 루닛의 16B 모델은 **도메인 특화(domain specialization)** 전략을 택한 거예요. 의학 논문, 임상 데이터, 약물 정보 등 의과학 데이터에 집중적으로 학습시키면 파라미터 수가 훨씬 적어도 해당 분야에서는 범용 초대형 모델을 이길 수 있다는 걸 실제로 증명한 셈이에요.

**From Scratch**라는 건 기존 오픈소스 모델(예: Llama, Mistral)을 파인튜닝한 게 아니라 모델 아키텍처 설계부터 사전학습까지 전부 자체적으로 했다는 뜻이에요. 이게 중요한 이유는, 파인튜닝만으로는 근본적인 도메인 지식 습득에 한계가 있거든요. 처음부터 의학 지식 체계에 맞게 설계하면 모델이 의학적 맥락을 훨씬 깊이 이해할 수 있어요. 다만 그만큼 기술력과 컴퓨팅 자원이 필요해서 진입 장벽이 높죠.

KAIST의 K-Fold가 30배 빠른 속도를 달성한 것도 주목할 부분이에요. 신약 개발에서는 수만~수십만 개의 단백질 조합을 스크리닝해야 하는데, 건당 30분이면 사실상 대규모 탐색이 불가능하거든요. 1분으로 줄어들면 하루에 처리할 수 있는 후보 물질 수가 완전히 달라져요. 게다가 결합 과정의 구조 변화까지 예측한다는 건, 단순히 "최종 형태"만 보는 게 아니라 약물이 실제로 어떻게 작용하는지를 시뮬레이션할 수 있다는 의미예요.

두 모델 모두 **4월 초 허깅페이스에 오픈소스로 공개**된다는 건 한국 AI 생태계에 상당히 의미 있는 일이에요. 한국에서 From Scratch로 개발한 도메인 특화 모델이 글로벌 벤치마크를 넘는 성능을 보이고, 그걸 오픈소스로 풀면 국내 스타트업이나 연구기관들이 이를 기반으로 추가 연구·서비스 개발을 할 수 있거든요. 특히 의료·바이오는 데이터 접근 자체가 어려운 분야라서, 고품질 사전학습 모델이 공개되는 것만으로도 후속 연구의 진입 장벽이 크게 낮아질 거예요.

## 핵심 포인트

- 루닛 16B 의과학 모델, 100B~1T급 범용 모델 대비 의학 논문 Q&A에서 우수
- 일산병원 임상 실증 — 응급실 환자 분류 정확도 높고 진단명 94% 일치
- KAIST K-Fold, 알파폴드3 수준 정확도에 30배 빠른 속도 (30분→1분)
- From Scratch 개발, 4월 초 허깅페이스 오픈소스 공개 예정
- GPU B200 256장씩 9월까지 지속 지원

## 인사이트

도메인 특화 소형 모델이 범용 초대형 모델을 이기는 사례가 한국에서 나왔다는 점이 핵심
