본문으로 건너뛰기
피드

심평원, 전 국민 진료정보 기반 의료 AI 만든다

ai-ml 약 7분
vote
0
댓글
북마크

심평원이 전 국민 건강보험 진료정보와 공통데이터모델(CDM)을 기반으로 보건의료 특화 생성형 AI를 만들겠다고 밝혔다. 목표는 단순 질의응답이 아니라 연구 설계, SQL 생성, 통계분석, 결과 산출까지 돕는 연구지원 플랫폼으로 가는 것이다.

  • 1

    2026년 연구지원 AI, 2027년 분석지원 AI, 2028년 연구수행 AI로 단계적 고도화를 추진한다

  • 2

    CDM 구조, KCD 질병코드, EDI 코드, Concept ID 같은 의료 데이터 체계를 AI 학습 기반으로 활용한다

  • 3

    데이터 신청부터 제공까지 한 달 이상 걸리던 절차를 저위험 데이터 기준 1~2주, 향후 일주일 내로 줄이는 방안도 추진한다

  • 심평원이 전 국민 건강보험 진료정보를 기반으로 보건의료 특화 생성형 AI를 만들겠다고 나섬

    • 그냥 검색해주는 챗봇이 아니라, 연구 설계부터 통계분석, SQL 코드 생성, 연구 결과 산출까지 가는 ‘AI 파운데이션 모델’이 목표임
    • 심평원은 기존의 데이터 제공기관 역할에서 AI 기반 연구지원 플랫폼으로 넘어가겠다는 그림을 그리고 있음
  • 핵심은 공통데이터모델(CDM)임

    • CDM은 기관마다 제각각인 의료 데이터를 같은 구조와 용어 체계로 표준화한 국제 표준 데이터 모델임
    • 심평원은 이미 2022년에 국내 최초로 전 국민 표본 기반 CDM 데이터를 개방한 적이 있음
    • 이번 AI에는 환자 정보(PERSON), 방문 정보(VISIT), 진단 정보(CONDITION) 같은 테이블 구조와 KCD 질병코드, EDI 코드, Concept ID 체계 등이 학습 데이터로 들어감
  • 로드맵은 2026년부터 2028년까지 3단계로 잡힘

    • 2026년 1단계는 연구지원 AI 모델임. 연구자가 데이터 구조나 연구 설계 관련 질문을 하면 실시간으로 답하는 수준을 목표로 함
    • 2027년 2단계는 분석지원 AI 모델임. 연구 목적을 설명하면 SQL 작성이나 통계분석 코드 생성을 자동으로 도와주는 쪽으로 확장됨
    • 2028년 3단계는 연구수행 AI 모델임. 연구자가 분석 목표를 넣으면 AI가 직접 데이터를 분석해서 결과값까지 산출하는 게 목표임
  • 예시가 꽤 현실적임. 연구자가 “대장암 환자의 남녀 환자 수를 분석하는 SQL 코드를 작성해 달라”고 하면 AI가 CDM 구조에 맞춰 쿼리를 만들어주는 식임

    • 이어서 “대장암 환자의 성별 분포를 표로 작성해 달라”고 요청하면 분석 결과까지 도출하는 방향을 보고 있음
    • 의료 연구자 입장에서는 데이터 구조 이해, 쿼리 작성, 분석 설계에서 시간을 크게 줄일 수 있음

중요

> 이 사업의 포인트는 “의료 챗봇”이 아니라 “국가 단위 의료 데이터 연구 자동화”에 가까움. 데이터 구조를 아는 AI가 연구 설계와 분석 과정을 직접 보조하는 쪽이라 영향 범위가 훨씬 큼.

  • 데이터 이용 절차도 같이 손보겠다는 계획이 나옴

    • 현재 연구자들은 데이터 신청부터 제공까지 한 달 이상 걸리는 경우가 많고, 복잡한 데이터 구조를 이해하다가 신청을 포기하는 사례도 있다고 함
    • 분석 과정에서 중복 데이터가 생겨 오류가 나는 경우도 적지 않다고 언급됨
    • 이를 줄이기 위해 ‘HIRA Data Playground’라는 가칭의 사전 탐색 환경을 추진함
  • HIRA Data Playground는 데이터 신청 전에 실제 분석 환경에서 구조와 변수를 미리 확인하게 해주는 장치임

    • 연구자는 어떤 데이터를 신청해야 하는지, 변수는 어떻게 구성돼 있는지 미리 살펴볼 수 있음
    • 심평원은 데이터 위험도에 따라 심의 절차를 다르게 적용하는 가명정보 처리 가이드라인도 도입하려고 함
    • 저위험 데이터는 12주, 중위험 데이터는 23주 수준으로 제공 기간을 줄이고, 경험이 쌓이면 저위험 데이터는 일주일 내 제공도 가능하다고 봄
  • 인프라 쪽에서는 2027년 클라우드 전환이 큰 축임

    • 2015년에 구축된 보건의료빅데이터 개방시스템을 전면 개편할 계획임
    • 공공데이터 Open API 전용 시스템, 연구분석용 데이터베이스 교체, 원격분석 시스템 고도화, 데이터 구축 시스템 통합, 기관 간 데이터 공유 체계 구축이 포함됨
    • 하루 300만 건 이상 처리되는 공공데이터 서비스를 클라우드 기반으로 바꿔 AI 활용과 데이터 개방 확대 수요에 대응하겠다는 얘기임
  • 데이터 거버넌스도 숙제임

    • 현재 보건의료 분야 결합전문기관은 심평원, 국민건강보험공단, 국립암센터 등 3곳임
    • 같은 데이터를 결합하더라도 기관별로 각각 심의와 결합 절차를 거쳐야 해서 비효율이 생김
    • 심평원은 장기적으로 국가 단위 공동심사 체계가 더 효율적일 수 있다고 보고 있음
  • 연구자 수요가 높은 데이터 개방도 확대됨

    • 비교연구에 쓸 수 있는 대조군 데이터는 올해 9월부터 제공할 계획임
    • 사망원인정보는 통계청이 보유하고 있어 관련 기관과 협의 중임
    • 심평원은 사망원인 데이터가 결합되면 연구 활용도가 크게 올라갈 것으로 보고 있음
  • 의료 현장 적용 사례도 같이 언급됨

    • 현재 운영 중인 응급진료지원 데이터 서비스는 응급실 의료진에게 환자의 수술 이력과 복약 정보를 제공해 진료와 환자 안전을 돕고 있음
    • 앞으로 지자체와 협력해 응급환자 이송, 수용, 전원체계 개선에도 활용할 계획임
    • 예비 부모가 전국 분만 가능 의료기관 현황을 확인할 수 있는 정보 공개 서비스도 추진 중임

기술 맥락

  • 이번 선택의 핵심은 의료 데이터를 그냥 검색 대상으로 두지 않고, CDM 위에서 AI가 분석 가능한 구조로 이해하게 만들겠다는 점이에요. 의료 연구는 데이터 컬럼 하나를 잘못 이해해도 결과가 틀어지기 때문에, 모델이 테이블 구조와 표준 용어를 아는 게 중요하거든요.

  • 3단계 로드맵도 꽤 현실적인 편이에요. 처음부터 “AI가 연구 결과를 내준다”로 가면 검증 부담이 너무 크니, 2026년에는 구조와 방법론 질의응답, 2027년에는 SQL과 통계 코드 생성, 2028년에 실제 분석 결과 산출로 가는 식이에요.

  • HIRA Data Playground는 단순 편의 기능이 아니라 데이터 신청 실패 비용을 줄이는 장치에 가까워요. 연구자가 신청 전에 변수와 구조를 확인할 수 있어야 불필요한 신청, 중복 데이터 생성, 분석 오류를 줄일 수 있거든요.

  • 클라우드 전환도 AI 때문에 더 중요해져요. 하루 300만 건 이상 처리되는 공공데이터 서비스를 계속 기존 구조로 끌고 가면 Open API 확대, 원격분석 고도화, 기관 간 데이터 공유를 동시에 감당하기 어렵기 때문이에요.

국가 단위 의료 데이터에 생성형 AI를 붙이는 시도라서 기술적으로도, 거버넌스 측면에서도 파장이 꽤 큼. 다만 의료 데이터는 민감도가 워낙 높아서 모델 성능보다 접근 통제, 심의 체계, 결과 검증이 진짜 승부처가 될 가능성이 높다.

댓글

댓글

댓글을 불러오는 중...

ai-ml

기업 AI 투자, 이제 비용절감보다 성장과 새 사업모델로 간다

아코디스 보고서에 따르면 기업의 AI 투자는 효율화 중심에서 성장, 혁신, 신규 비즈니스 모델 쪽으로 무게가 옮겨가고 있다. 다만 AI 도입 속도와 별개로, CTO들이 기업 전체에 AI를 확장할 수 있다는 자신감은 3년 연속 떨어졌다. 핵심 병목은 모델 성능보다 운영 모델, 거버넌스, 책임 구분 같은 조직 문제에 가깝다.

ai-ml

그록, 6억5천만 달러 조달하고 ‘AI 추론 클라우드’ 운영사로 피벗

그록이 6억5천만 달러 규모의 신규 성장 자본을 유치하고 AI 추론 클라우드 운영에 회사를 집중하겠다고 밝혔음. 자체 칩 기술은 엔비디아에 넘어가고, 그록은 엔비디아 LPX 시스템까지 활용해 13개 데이터센터를 2027년 말까지 200MW 규모로 확장할 계획임.

ai-ml

제타, 팔란티어 파운드리 기반으로 AI 데이터 클라우드 재구축한다

AI 마케팅 플랫폼 기업 제타 글로벌이 팔란티어와 전략적 제휴를 맺고 자체 데이터 클라우드를 재구축하기로 했음. 팔란티어의 파운드리를 기반으로 빅데이터 처리 속도와 예측 정확도를 높이겠다는 기대가 나오면서 제타 주가는 장중 5.66% 상승했음.

ai-ml

일본, 미국·중국 AI 의존 줄이려 프랑스·인도와 'AI 주권' 전선 만든다

일본이 프랑스, 인도, 브라질, 말레이시아, 영국 등과 AI 주권 협의체를 만들며 미국·중국 중심 AI 질서에서 빠져나오려는 움직임을 보이고 있다. 핵심은 자국 데이터, 인프라, 모델을 외부 플랫폼에 종속시키지 않고 관리하자는 것이며, 방위·스마트시티·광물 탐사·농업까지 경제 안보 영역으로 확장되고 있다.

ai-ml

코어라인소프트, 독일 폐암검진 급여화 타고 의료 AI 워크플로우 확장

코어라인소프트가 독일의 저선량 CT 기반 폐암 조기 검진 급여화에 맞춰 의료영상 AI 사업을 확대하고 있다. 독일 민트메디컬과 협력해 흉부 CT 분석 결과를 구조화 리포팅과 결절 관리 워크플로우에 연결하고, 올해 독일 누적 계약 44건을 확보했다.