일본 병원, 재활 요약지 작성에 생성형 인공지능 써보니 시간은 57% 줄고 오류는 81.8%에서 나왔다

ai-ml 2026-06-21 약 6분

 tags

#healthcare-ai #generative-ai #vba #hallucination #workflow

vote

북마크

일본의 290병상 종합병원 연구진이 재활 요약지 작성에 생성형 인공지능과 엑셀 매크로를 결합한 워크플로를 도입해 실제 임상 현장에서 평가했음. 작성 시간 중앙값은 23분에서 10분으로 줄었지만, 무작위 검토한 문서 11건 중 9건에서 오류가 발견돼 사람의 최종 검토가 필수라는 결론이 나왔음.

1
재활 요약지 작성 시간 중앙값이 23.0분에서 10.0분으로 줄어 약 57% 단축됐음
2
사용성 점수 중앙값은 83.75였고 응답자 18명 중 15명이 수용 가능한 수준으로 평가했음
3
검토 문서 11건 중 9건에서 오류가 나왔고, 환각 19건과 누락 1건이 보고됐음

일본의 한 종합병원에서 재활 요약지 작성에 생성형 인공지능을 넣어봤고, 결과가 꽤 현실적임
- 교토 소세이카이 종합병원 재활의학과 연구진이 실제 임상 업무 흐름 안에서 평가했음
- 연구는 국제 의학학술지 큐리어스에 게재됐고, 대상 병원은 290병상 규모임
구성은 생성형 인공지능과 엑셀 매크로를 섞은 방식임
- 전자의무기록 정보를 바탕으로 인공지능이 9개 항목의 텍스트를 생성함
- 엑셀의 브이비에이 매크로가 생성된 내용을 재활 요약지 템플릿에 자동으로 옮김
- 이후 치료사가 내용을 확인하고 수정해서 문서를 완성함

sequenceDiagram
    participant 전자의무기록
    participant 생성형인공지능
    participant 엑셀매크로
    participant 치료사
    participant 재활요약지
    전자의무기록->>생성형인공지능: 환자 정보 기반 초안 생성 요청
    생성형인공지능->>엑셀매크로: 9개 항목 텍스트 전달
    엑셀매크로->>재활요약지: 템플릿에 자동 전사
    치료사->>재활요약지: 후보 선택, 확인, 수정
    치료사->>재활요약지: 최종 문서 확정

이건 치료사를 대체하는 자동화가 아니라 문서 작성 보조 시스템에 가까움
- 인공지능은 초안과 일부 후보 항목을 제시함
- 치료사는 임상적으로 맞는 정보를 선택하고 최종 검토를 수행함
- 즉 사람을 빼는 게 아니라, 사람이 검토할 초안을 빠르게 만드는 구조임
시간 절감 효과는 확실히 나왔음
- 물리치료사, 작업치료사, 언어치료사 21명의 작성 시간 중앙값이 도입 전 23.0분에서 도입 후 10.0분으로 줄었음
- 약 57% 단축이고, 통계적으로도 유의한 감소가 확인됐음
- 단, 이 10분에는 인공지능 생성 시간뿐 아니라 치료사의 확인, 수정, 후보 선택, 마무리까지 포함돼 있음

❗중요

> 시간은 57% 줄었지만, 인공지능이 혼자 10분 만에 완성했다는 뜻은 아님. 사람이 검토해서 완성하는 전체 워크플로가 빨라졌다는 의미임.

사용성 평가는 꽤 좋았음
- 시스템 사용성 척도 점수 중앙값은 83.75였음
- 응답자 18명 중 15명이 이 시스템을 수용 가능한 수준으로 평가했음
- 현장 사용자가 아예 못 쓸 물건으로 보지는 않았다는 뜻임
문제는 안전성임. 여기서 숫자가 확 깸
- 무작위로 뽑은 인공지능 생성 재활 요약지 11건을 전문가가 검토했음
- 그중 9건, 비율로는 81.8%에서 최소 1건 이상의 오류가 확인됐음
- 오류는 존재하지 않는 정보를 만들어내는 환각과 필요한 정보를 빠뜨리는 누락으로 나뉨
오류 유형도 의료 문서에서는 꽤 민감함
- 연구에서는 환각 19건, 누락 1건이 보고됐음
- 전자의무기록에 없는 합병증을 추가하거나, 증상만 근거로 질병명을 만들어내는 오류가 문제였음
- 오류가 자주 나온 항목은 신체 기능, 합병증, 질병명이었음

⚠️주의

> 신체 기능, 진단명, 합병증은 환자 관리에 바로 영향을 줄 수 있는 항목임. 이런 영역에서 인공지능 출력물을 그대로 붙여넣는 건 위험함.

연구진도 프롬프트를 대충 쓴 게 아님
- 사용된 프롬프트는 반복 개선을 거친 버전 4.0이었음
- 기재가 없는 항목은 추정하지 말 것, 신체 기능란에 경과나 개선 표현을 넣지 말 것 같은 지시가 포함됐음
- 그래도 오류가 나왔다는 점이 포인트임
결론은 꽤 명확함. 의료 문서에서 인공지능은 속도를 올려주지만, 책임을 가져가지는 못함
- 개인정보 보호, 프롬프트 설계, 오류 검토 체계, 최종 책임 주체를 같이 정비해야 함
- 특히 환자 관리에 영향을 주는 항목은 치료사의 면밀한 검토가 필수임

기술 맥락

이 연구의 선택은 완전 자동 문서 작성이 아니라 사람 검토가 포함된 문서 보조 워크플로예요. 의료 문서는 틀렸을 때 비용이 너무 크기 때문에, 인공지능을 최종 작성자로 두기보다 초안 작성자로 두는 게 현실적인 선택이에요.
왜 엑셀 매크로까지 같이 썼냐면, 병원 현장에는 이미 정해진 문서 양식과 반복 입력 흐름이 있거든요. 생성형 인공지능이 문장을 만들고, 매크로가 템플릿 전사를 맡으면 기존 업무 도구를 크게 바꾸지 않고도 시간을 줄일 수 있어요.
대안은 전자의무기록 시스템에 인공지능 기능을 깊게 통합하는 방식인데, 그건 개발과 승인 부담이 커요. 이번 방식은 비교적 가볍게 붙일 수 있지만, 대신 치료사가 최종 검토하는 절차가 반드시 남아야 해요.
환각이 특히 중요한 이유는 의료 문서의 오류가 단순 오타가 아니라 임상 판단으로 이어질 수 있기 때문이에요. 전자의무기록에 없는 합병증이나 질병명이 생기면 다음 치료자가 환자를 다르게 이해할 수 있어요.
그래서 이 사례의 핵심은 인공지능 도입 자체가 아니라 검증 루프 설계예요. 시간 절감 수치만 보고 도입하면 위험하고, 어떤 항목을 사람이 반드시 확인할지까지 정해야 실제 현장에서 쓸 수 있어요.

의료 인공지능의 현실적인 위치가 잘 드러나는 사례임. 시간은 확실히 줄여주지만, 진단명이나 합병증처럼 환자 관리에 영향을 주는 항목에서 환각이 나오면 바로 사고로 이어질 수 있어서 검증 워크플로가 제품의 본체가 돼야 함.

이전 기사 (P)

다음 기사 (N)

댓글을 불러오는 중...

ai-ml 2026-06-21

알파벳, AI 인프라에 1,850억 달러 베팅…구글 클라우드가 성장축으로 부상

모틀리풀은 알파벳이 AI 인프라에 대규모 설비투자를 이어가면서 향후 5년간 주가가 두 배 이상 오를 여지가 있다고 분석했다. 올해 설비투자는 1,800억~1,900억 달러로 예상되며, 구글 클라우드 매출은 1분기에 전년 대비 63% 증가했다.

ai-ml 2026-06-21

넥슨은 AI 에이전트를 ‘소유’하려 했고, 크래프톤은 AI 도구를 ‘관리’하기로 했다

NDC 2026 대담에서 넥슨과 크래프톤이 사내 AI 전환 전략을 꽤 솔직하게 공개했다. 넥슨은 오픈소스 AI 에이전트 오픈클로의 전사 도입을 시도했다가 보안·운영·비용 문제로 보류했고, 크래프톤은 상용 AI 도구를 대시보드로 관리하는 방식을 택했다.

ai-ml 2026-06-21

야타브, 규제 산업용 인공지능 신뢰·검증 플랫폼을 비바테크에서 공개

야타브가 비바테크 2026에서 규제 산업을 겨냥한 인공지능 신뢰·검증 플랫폼을 공개했음. 입력 위협 방어, 답변 진위 검증, 기업 내부 지식 기반 검색·추론, 업무 자동화, 산업별 전용 모델 구축까지 한 플랫폼으로 묶는 전략임.

ai-ml 2026-06-21

안양시가 피지컬 인공지능 산업 키우겠다고 두 번째 전략 회의 열었다

안양시가 제조업, 로봇, 인공지능을 결합한 피지컬 인공지능 산업 생태계 조성을 논의했음. 아직 구체적인 기술 구현이나 예산이 나온 단계는 아니지만, 지역 제조 기반을 인공지능 산업 전략으로 연결하려는 정책 초기 움직임으로 볼 수 있음.

ai-ml 2026-06-21

인공지능 모델도 수출통제 대상이 됐다, 한국 기업엔 꽤 큰 경고

미국 정부가 안보 우려를 이유로 앤트로픽의 최신 인공지능 모델 일부 접근을 제한하면서, 통제 대상이 반도체와 그래픽처리장치를 넘어 모델 사용권으로 확장되는 흐름이 드러났음. 한국 기업과 공공기관은 해외 폐쇄형 인공지능을 쓰는 것 자체보다, 그 접근이 갑자기 끊겼을 때 핵심 업무가 계속 돌아가게 설계돼 있는지를 봐야 함.

일본 병원, 재활 요약지 작성에 생성형 인공지능 써보니 시간은 57% 줄고 오류는 81.8%에서 나왔다

요약

핵심 포인트

핵심 개념

분석

기술 맥락

인사이트

댓글

댓글

일본 병원, 재활 요약지 작성에 생성형 인공지능 써보니 시간은 57% 줄고 오류는 81.8%에서 나왔다

요약

핵심 포인트

핵심 개념

분석

기술 맥락

인사이트

댓글

댓글

관련 기사