---
title: "수의학도가 병리 슬라이드 AI를 직접 만들며 배운 것들"
published: 2026-05-18T07:05:01.895Z
canonical: https://jeff.news/article/2849
---
# 수의학도가 병리 슬라이드 AI를 직접 만들며 배운 것들

건국대 수의학도가 비교병리학 실습에서 출발해 조직학 학습 보조 AI인 HiNT를 만들고, 서울대 BMI 연구실 인턴십으로 디지털 병리학 연구까지 확장한 경험담이다. WSI 데이터, 주석 처리, 계층적 세그멘테이션, 설명 가능한 AI까지 실제 의료 AI 개발에서 부딪히는 현실적인 문제들이 꽤 구체적으로 나온다.

- 수의학도가 병리학 실습에서 느낀 문제의식이 AI 도구 개발로 이어진 케이스임
  - 병리학은 조직 슬라이드를 보고 정상 조직과 병변을 비교해 질병 원인을 찾는 분야임
  - 문제는 판독이 숙련도에 많이 의존하고, 특정 세포나 구조물은 특수 염색까지 필요해서 학습 난도가 높다는 점임

- 이 고민이 조직학·병리학 학습 보조 AI인 HiNT 프로젝트로 이어짐
  - 건국대 수의학과, 스마트ICT융합공학과, 컴퓨터공학과 학생들이 팀을 꾸렸고 건국대 학술공모전에서 대상을 받음
  - 목표는 수의대생이 조직 슬라이드를 공부할 때 옆에서 도와주는 일종의 copilot을 만드는 것이었음

- 첫 번째 큰 결정은 분석 대상을 피부가 아니라 간 조직으로 바꾼 것임
  - 피부는 종간 차이가 커서 흥미롭지만, 교육과 실무 양쪽에서 범용성이 높은 건 간 조직이라는 조언을 받음
  - 연구 주제는 재미뿐 아니라 실현 가능성과 사용자 필요에 맞춰야 한다는 꽤 현실적인 교훈이 여기서 나옴

- 진짜 병목은 모델보다 데이터였음
  - Whole Slide Image(WSI) scanner로 조직 슬라이드 전체를 스캔한 이미지를 사용했는데, 용량이 너무 커서 컴퓨터가 멈추려 할 정도였다고 함
  - 팀은 QuPath로 간 조직 사진 속 구조물에 주석(annotation)을 달고, 이걸 모델의 정답지로 넘기는 식으로 학습 데이터를 만들었음
  - 잘못된 구조물이 하나라도 섞이면 모델 정확도가 크게 떨어져서 팀원끼리 교차검증하고 박사급 연구자 검증도 받았음

> [!IMPORTANT]
> AI 모듈 개발 전에 주석 처리만 3~4주가 걸렸다는 대목이 핵심임. 의료 AI에서 데이터 라벨 품질은 부가 작업이 아니라 사실상 제품의 기반임.

- 모델 설계도 병리학자의 실제 판독 흐름을 흉내 내는 방향으로 잡음
  - 이미지 전체를 한 번에 분류하는 대신, 저배율에서 큰 구조를 보고 고배율에서 세부 병변을 보는 과정을 모방함
  - 이를 위해 계층적 세그멘테이션(Hierarchical Segmentation)을 도입함
  - ResNet34로 간 소엽의 대략적인 구조를 파악하고, EfficientNet-B4로 세부 병변을 잡는 이중 구조를 설계함

- 구현은 연구용 모델에서 끝나지 않고 실제 사용 환경까지 고려함
  - Hugging Face와 FastAPI를 연동해 학생들이 모바일에서도 판독 결과를 확인할 수 있게 만들었음
  - 단순히 논문용 데모가 아니라 학습자가 쓰는 도구로 만들려 했다는 점이 포인트임

- 이후 서울대병원 융합의학기술원 의생명정보학 연구실 인턴십으로 디지털 병리학 쪽 경험을 확장함
  - 학부 프로젝트에서 쓴 알고리즘이 실제 연구 현장에서는 어떻게 최적화되고 검증되는지 확인함
  - WSI 데이터뿐 아니라 공간전사체(Spatial transcriptomics), 다중 인스턴스 학습(MIL), 멀티모달 분석 같은 접근도 접함
  - 단순히 잘 맞히는 AI가 아니라 병리학자가 믿을 수 있는 설명 가능한 AI(xAI)를 만드는 과정이 중요하다는 점을 배움

- 결론은 꽤 명확함. AI가 수의사를 대체한다기보다 진단 근거를 더 단단하게 만드는 도구가 될 수 있다는 것임
  - 특히 종마다 미세한 차이를 구분해야 하는 수의 병리에서는 도메인 지식을 가진 사람이 AI 개발에 직접 들어가는 게 중요함
  - 의학 지식을 공학적 언어로 번역하는 능력도 모델 성능만큼 중요한 역량으로 드러남

---

## 기술 맥락

- 이 글에서 중요한 선택은 병리 판독을 단순 이미지 분류 문제로 보지 않았다는 점이에요. 실제 병리학자는 슬라이드를 한 번에 판단하지 않고, 큰 구조를 먼저 본 뒤 세부 병변을 확인하거든요.

- 그래서 팀은 계층적 세그멘테이션을 골랐어요. ResNet34로 간 소엽의 큰 구조를 보고 EfficientNet-B4로 세부 병변을 잡게 한 건, 모델 구조를 사람의 판독 절차에 맞추려는 선택이에요.

- WSI 데이터가 까다로운 이유는 해상도와 용량 때문이에요. 슬라이드 전체를 스캔한 이미지라서 정보량은 풍부하지만, 학부 프로젝트 수준에서는 저장, 처리, 학습 파이프라인 전부가 부담으로 튀어나와요.

- 또 하나 중요한 건 라벨링이에요. 병리 이미지에서는 정답을 다는 사람이 애매한 구조물을 잘못 표시하면 모델도 그대로 잘못 배워요. 그래서 3~4주 동안 주석을 달고 교차검증한 과정이 모델 학습만큼 중요한 작업이었던 거예요.

- 서울대 BMI 연구실에서 접한 공간전사체, 다중 인스턴스 학습, 설명 가능한 AI는 이 프로젝트가 교육용 도구에서 실제 디지털 병리 연구로 넘어갈 때 필요한 확장 포인트예요. 병원 현장에서 쓰려면 정확도뿐 아니라 근거, 검증, 신뢰성이 같이 따라와야 하거든요.

## 핵심 포인트

- 조직학·병리학 학습을 돕는 AI 도구 HiNT를 학생 팀이 개발했고 건국대 학술공모전 대상을 받음
- WSI 이미지 용량과 라벨링 품질 문제가 가장 큰 병목이었고, 주석 처리에만 3~4주가 걸림
- ResNet34와 EfficientNet-B4를 조합해 저배율에서 고배율로 이어지는 병리 판독 흐름을 모방함
- 서울대 BMI 연구실에서는 공간전사체, 다중 인스턴스 학습, 설명 가능한 AI 같은 실제 디지털 병리 연구 흐름을 경험함

## 인사이트

의료 AI에서 모델 구조만큼 중요한 게 데이터 큐레이션과 도메인 전문가의 검증이라는 점이 잘 드러나는 글이다. 특히 병리처럼 정답 라벨 자체가 어려운 분야에서는 개발자와 전문가의 협업 방식이 성능의 대부분을 좌우한다.