---
title: "일본 병원, 재활 요약지 작성에 생성형 인공지능 써보니 시간은 57% 줄고 오류는 81.8%에서 나왔다"
published: 2026-06-21T20:30:02.020Z
canonical: https://jeff.news/article/4171
---
# 일본 병원, 재활 요약지 작성에 생성형 인공지능 써보니 시간은 57% 줄고 오류는 81.8%에서 나왔다

일본의 290병상 종합병원 연구진이 재활 요약지 작성에 생성형 인공지능과 엑셀 매크로를 결합한 워크플로를 도입해 실제 임상 현장에서 평가했음. 작성 시간 중앙값은 23분에서 10분으로 줄었지만, 무작위 검토한 문서 11건 중 9건에서 오류가 발견돼 사람의 최종 검토가 필수라는 결론이 나왔음.

- 일본의 한 종합병원에서 재활 요약지 작성에 생성형 인공지능을 넣어봤고, 결과가 꽤 현실적임
  - 교토 소세이카이 종합병원 재활의학과 연구진이 실제 임상 업무 흐름 안에서 평가했음
  - 연구는 국제 의학학술지 큐리어스에 게재됐고, 대상 병원은 290병상 규모임

- 구성은 생성형 인공지능과 엑셀 매크로를 섞은 방식임
  - 전자의무기록 정보를 바탕으로 인공지능이 9개 항목의 텍스트를 생성함
  - 엑셀의 브이비에이 매크로가 생성된 내용을 재활 요약지 템플릿에 자동으로 옮김
  - 이후 치료사가 내용을 확인하고 수정해서 문서를 완성함

```mermaid
sequenceDiagram
    participant 전자의무기록
    participant 생성형인공지능
    participant 엑셀매크로
    participant 치료사
    participant 재활요약지
    전자의무기록->>생성형인공지능: 환자 정보 기반 초안 생성 요청
    생성형인공지능->>엑셀매크로: 9개 항목 텍스트 전달
    엑셀매크로->>재활요약지: 템플릿에 자동 전사
    치료사->>재활요약지: 후보 선택, 확인, 수정
    치료사->>재활요약지: 최종 문서 확정
```

- 이건 치료사를 대체하는 자동화가 아니라 문서 작성 보조 시스템에 가까움
  - 인공지능은 초안과 일부 후보 항목을 제시함
  - 치료사는 임상적으로 맞는 정보를 선택하고 최종 검토를 수행함
  - 즉 사람을 빼는 게 아니라, 사람이 검토할 초안을 빠르게 만드는 구조임

- 시간 절감 효과는 확실히 나왔음
  - 물리치료사, 작업치료사, 언어치료사 21명의 작성 시간 중앙값이 도입 전 23.0분에서 도입 후 10.0분으로 줄었음
  - 약 57% 단축이고, 통계적으로도 유의한 감소가 확인됐음
  - 단, 이 10분에는 인공지능 생성 시간뿐 아니라 치료사의 확인, 수정, 후보 선택, 마무리까지 포함돼 있음

> [!IMPORTANT]
> 시간은 57% 줄었지만, 인공지능이 혼자 10분 만에 완성했다는 뜻은 아님. 사람이 검토해서 완성하는 전체 워크플로가 빨라졌다는 의미임.

- 사용성 평가는 꽤 좋았음
  - 시스템 사용성 척도 점수 중앙값은 83.75였음
  - 응답자 18명 중 15명이 이 시스템을 수용 가능한 수준으로 평가했음
  - 현장 사용자가 아예 못 쓸 물건으로 보지는 않았다는 뜻임

- 문제는 안전성임. 여기서 숫자가 확 깸
  - 무작위로 뽑은 인공지능 생성 재활 요약지 11건을 전문가가 검토했음
  - 그중 9건, 비율로는 81.8%에서 최소 1건 이상의 오류가 확인됐음
  - 오류는 존재하지 않는 정보를 만들어내는 환각과 필요한 정보를 빠뜨리는 누락으로 나뉨

- 오류 유형도 의료 문서에서는 꽤 민감함
  - 연구에서는 환각 19건, 누락 1건이 보고됐음
  - 전자의무기록에 없는 합병증을 추가하거나, 증상만 근거로 질병명을 만들어내는 오류가 문제였음
  - 오류가 자주 나온 항목은 신체 기능, 합병증, 질병명이었음

> [!WARNING]
> 신체 기능, 진단명, 합병증은 환자 관리에 바로 영향을 줄 수 있는 항목임. 이런 영역에서 인공지능 출력물을 그대로 붙여넣는 건 위험함.

- 연구진도 프롬프트를 대충 쓴 게 아님
  - 사용된 프롬프트는 반복 개선을 거친 버전 4.0이었음
  - 기재가 없는 항목은 추정하지 말 것, 신체 기능란에 경과나 개선 표현을 넣지 말 것 같은 지시가 포함됐음
  - 그래도 오류가 나왔다는 점이 포인트임

- 결론은 꽤 명확함. 의료 문서에서 인공지능은 속도를 올려주지만, 책임을 가져가지는 못함
  - 개인정보 보호, 프롬프트 설계, 오류 검토 체계, 최종 책임 주체를 같이 정비해야 함
  - 특히 환자 관리에 영향을 주는 항목은 치료사의 면밀한 검토가 필수임

---

## 기술 맥락

- 이 연구의 선택은 완전 자동 문서 작성이 아니라 사람 검토가 포함된 문서 보조 워크플로예요. 의료 문서는 틀렸을 때 비용이 너무 크기 때문에, 인공지능을 최종 작성자로 두기보다 초안 작성자로 두는 게 현실적인 선택이에요.

- 왜 엑셀 매크로까지 같이 썼냐면, 병원 현장에는 이미 정해진 문서 양식과 반복 입력 흐름이 있거든요. 생성형 인공지능이 문장을 만들고, 매크로가 템플릿 전사를 맡으면 기존 업무 도구를 크게 바꾸지 않고도 시간을 줄일 수 있어요.

- 대안은 전자의무기록 시스템에 인공지능 기능을 깊게 통합하는 방식인데, 그건 개발과 승인 부담이 커요. 이번 방식은 비교적 가볍게 붙일 수 있지만, 대신 치료사가 최종 검토하는 절차가 반드시 남아야 해요.

- 환각이 특히 중요한 이유는 의료 문서의 오류가 단순 오타가 아니라 임상 판단으로 이어질 수 있기 때문이에요. 전자의무기록에 없는 합병증이나 질병명이 생기면 다음 치료자가 환자를 다르게 이해할 수 있어요.

- 그래서 이 사례의 핵심은 인공지능 도입 자체가 아니라 검증 루프 설계예요. 시간 절감 수치만 보고 도입하면 위험하고, 어떤 항목을 사람이 반드시 확인할지까지 정해야 실제 현장에서 쓸 수 있어요.

## 핵심 포인트

- 재활 요약지 작성 시간 중앙값이 23.0분에서 10.0분으로 줄어 약 57% 단축됐음
- 사용성 점수 중앙값은 83.75였고 응답자 18명 중 15명이 수용 가능한 수준으로 평가했음
- 검토 문서 11건 중 9건에서 오류가 나왔고, 환각 19건과 누락 1건이 보고됐음

## 인사이트

의료 인공지능의 현실적인 위치가 잘 드러나는 사례임. 시간은 확실히 줄여주지만, 진단명이나 합병증처럼 환자 관리에 영향을 주는 항목에서 환각이 나오면 바로 사고로 이어질 수 있어서 검증 워크플로가 제품의 본체가 돼야 함.