본문으로 건너뛰기
피드

루닛 16B 모델이 클로드 3.5를 이겼고, KAIST K-Fold는 알파폴드3보다 30배 빠르다

ai-ml 약 6분
vote
0
댓글
북마크

의료·바이오 특화 AI 파운데이션 모델 2종이 중간평가를 통과함. 루닛의 16B 모델은 클로드 3.5 소네트를 의학 Q&A에서 앞섰고, KAIST K-Fold는 알파폴드3 대비 30배 빠른 단백질 구조 예측을 달성함. 4월 초 허깅페이스 오픈소스 공개 예정.

  • 1

    루닛 16B 의과학 모델, 100B~1T급 범용 모델 대비 의학 논문 Q&A에서 우수

  • 2

    일산병원 임상 실증 — 응급실 환자 분류 정확도 높고 진단명 94% 일치

  • 3

    KAIST K-Fold, 알파폴드3 수준 정확도에 30배 빠른 속도 (30분→1분)

  • 4

    From Scratch 개발, 4월 초 허깅페이스 오픈소스 공개 예정

  • 5

    GPU B200 256장씩 9월까지 지속 지원

의료·바이오 특화 AI 파운데이션 모델 2종이 중간평가를 통과함. 루닛 컨소시엄의 16B 모델은 클로드 3.5 소네트(100B~1T급)를 의학 분야에서 앞섰고, KAIST 컨소시엄의 K-Fold는 알파폴드3 수준 정확도에 30배 빠른 속도를 달성함. 두 모델 모두 From Scratch 방식으로 개발됐으며, 4월 초 허깅페이스 오픈소스 공개 예정임.

루닛 컨소시엄 — 16B 의과학 파운데이션 모델

  • 16B 파라미터 규모의 의과학 특화 모델을 From Scratch로 개발함
  • 앤트로픽 클로드 3.5 소네트(100B~1T급) 대비 우수한 성능을 기록한 영역:
    • 의학 논문 기반 질의·응답 정확도
    • AI 답변의 출처·근거 일치성
    • 과학 연구용 코드 작성·분석 수행 능력
  • 임상 의사결정 지원 에이전트 시스템(CDSS) 구축:
    • 최신 논문 기반 의학 추론 수행
    • 환자 상태와 근거를 함께 검토하며 진단·치료 판단 보조
    • 의사에게 필요한 정보를 빠르고 정확하게 제시
  • 일산병원 임상 실증 (2~3월, 국민건강보험공단 일산병원):
    • 응급실 환자 위급도 5단계 분류에서 높은 정확도 달성
    • 진단명 94.0% 일치
    • 이상약물반응 판단 정확도 및 보고서 작성 성능도 우수
    • 현장 의료진으로부터 "실제 진료 현장에서 활용 가능한 수준"이라는 평가를 받음

KAIST 컨소시엄 — 2B K-Fold 바이오 파운데이션 모델

  • 2B 파라미터 규모의 단백질 복합체 구조 예측 모델 'K-Fold'를 개발함
  • 단백질-단백질, 저분자, 핵산 포함 분자 복합체의 3차원 구조 예측 정확도가 알파폴드3에 근접한 수준으로 평가됨

중요

> K-Fold는 알파폴드3 대비 최대 30배 이상 빠른 속도로 단백질·복합체 구조를 예측함. 기존 30분 소요 → 평균 1분 이내로 단축.

  • 새로운 생성 모델링 방식 적용:
    • 기존 방식: 분자의 최종 구조만 예측
    • K-Fold: 분자들의 물리적 결합 과정에서 구조가 어떻게 변화하는지까지 함께 예측
  • 데이터가 희소한 신규 약물 복합체에 대한 예측 정확도도 향상됨
  • 약물 결합에 따른 단백질 구조 변화 예측이 중요한 신약 개발 분야에서 K-Fold 기반 서비스형 신약개발(DaaS)의 새로운 가능성을 제시함

평가 결과 및 향후 계획

  • 두 컨소시엄 모두 80점 이상 획득 (2단계 지원 조건: 70점 이상)
  • 한국정보통신기술협회(TTA)가 두 모델 모두 From Scratch 학습임을 검증함
  • GPU 지원: 컨소시엄당 B200 256장, 4월 1일~9월 9일까지 2단계 계속 지원
  • 4월 초 허깅페이스에 오픈소스로 공개 예정

기술 맥락

16B 파라미터 모델이 100B~1T급 범용 모델을 이겼다는 게 왜 대단한 건지 설명해 드릴게요.

보통 AI 모델은 파라미터 수가 클수록 성능이 좋다고 알려져 있거든요. 클로드 3.5 소네트 같은 범용 모델은 수천억 개의 파라미터로 모든 분야를 커버하려고 하죠. 그런데 루닛의 16B 모델은 도메인 특화(domain specialization) 전략을 택한 거예요. 의학 논문, 임상 데이터, 약물 정보 등 의과학 데이터에 집중적으로 학습시키면 파라미터 수가 훨씬 적어도 해당 분야에서는 범용 초대형 모델을 이길 수 있다는 걸 실제로 증명한 셈이에요.

From Scratch라는 건 기존 오픈소스 모델(예: Llama, Mistral)을 파인튜닝한 게 아니라 모델 아키텍처 설계부터 사전학습까지 전부 자체적으로 했다는 뜻이에요. 이게 중요한 이유는, 파인튜닝만으로는 근본적인 도메인 지식 습득에 한계가 있거든요. 처음부터 의학 지식 체계에 맞게 설계하면 모델이 의학적 맥락을 훨씬 깊이 이해할 수 있어요. 다만 그만큼 기술력과 컴퓨팅 자원이 필요해서 진입 장벽이 높죠.

KAIST의 K-Fold가 30배 빠른 속도를 달성한 것도 주목할 부분이에요. 신약 개발에서는 수만~수십만 개의 단백질 조합을 스크리닝해야 하는데, 건당 30분이면 사실상 대규모 탐색이 불가능하거든요. 1분으로 줄어들면 하루에 처리할 수 있는 후보 물질 수가 완전히 달라져요. 게다가 결합 과정의 구조 변화까지 예측한다는 건, 단순히 "최종 형태"만 보는 게 아니라 약물이 실제로 어떻게 작용하는지를 시뮬레이션할 수 있다는 의미예요.

두 모델 모두 4월 초 허깅페이스에 오픈소스로 공개된다는 건 한국 AI 생태계에 상당히 의미 있는 일이에요. 한국에서 From Scratch로 개발한 도메인 특화 모델이 글로벌 벤치마크를 넘는 성능을 보이고, 그걸 오픈소스로 풀면 국내 스타트업이나 연구기관들이 이를 기반으로 추가 연구·서비스 개발을 할 수 있거든요. 특히 의료·바이오는 데이터 접근 자체가 어려운 분야라서, 고품질 사전학습 모델이 공개되는 것만으로도 후속 연구의 진입 장벽이 크게 낮아질 거예요.

도메인 특화 소형 모델이 범용 초대형 모델을 이기는 사례가 한국에서 나왔다는 점이 핵심

댓글

댓글

댓글을 불러오는 중...

ai-ml

유튜브, AI 생성 영상에 자동 라벨 붙인다

유튜브가 사실적으로 보이거나 의미 있게 AI로 변경·생성된 콘텐츠에 더 눈에 띄는 라벨을 적용하고, 제작자가 AI 사용 여부를 밝히지 않아도 내부 신호로 감지되면 자동 라벨을 붙이겠다고 밝혔다. 다만 라벨만으로 추천 노출이나 수익화 자격이 바뀌지는 않으며, 제작자는 YouTube Studio에서 잘못된 판정을 수정할 수 있다.

ai-ml

테크 CEO들의 'AI 만능론', 숫자는 아직 그렇게 말하지 않는다

테크 업계에서 AI를 이유로 한 대규모 감원과 조직 재편이 이어지는 가운데, Box 창업자 애런 레비는 CEO들이 실제 업무의 마지막 1마일을 모른 채 AI 에이전트의 능력을 과대평가하고 있다고 지적했다. 2026년 첫 5개월 동안 이미 11만5430명이 해고됐고, 여러 연구는 AI 도입이 체감 생산성만큼 실제 생산성을 끌어올렸다는 근거가 아직 약하다고 말한다.

ai-ml

오픈AI와 앤트로픽, 코딩 에이전트로 드디어 돈 되는 시장을 찾은 듯

사이먼 윌리슨은 오픈AI와 앤트로픽이 코딩 에이전트와 기업용 과금으로 진짜 제품-시장 적합성을 찾았다고 봐. 개인 구독자에게는 월 100달러 플랜이 싸게 느껴지지만, 기업 고객은 이제 사용량 기준 토큰 가격을 그대로 내기 시작했고 이게 대형 고객 예산을 빠르게 흔들고 있다는 얘기야.

ai-ml

컴팔과 GMI 클라우드, 대규모 추론용 AI 인프라 구축 협력

컴팔이 실리콘밸리 기반 AI 인프라 기업 GMI 클라우드와 협력해 대규모 추론과 에이전틱 AI 워크로드에 맞춘 GPU 서버 인프라를 구축한다고 발표했어. COMPUTEX 2026에서는 NVIDIA HGX B300을 지원하는 Compal SGX30-2 같은 고성능 AI 서버 플랫폼도 선보일 예정이야.

ai-ml

AI 쓰면 편해진다더니, 직장인들은 ‘AI 과부하’에 지쳐가는 중

국내 직장인들이 AI 전환 압박, AI 답변 검증 부담, 대체 불안 때문에 피로감을 호소하고 있어. 중앙일보 설문에서는 5284명 중 31.6%가 ‘AI 답변 검증에 시간이 더 걸릴 때’를 가장 지치는 순간으로 꼽았고, 기업들은 무작정 AI 사용량을 밀어붙이는 방식에서 업무 방식 재설계로 넘어가야 한다는 지적이 나와.