본문으로 건너뛰기
피드

칼텍, 세포 분할 파운데이션 모델 'CellSAM' 오픈소스 공개

ai-ml 약 4분

칼텍 연구진이 다양한 생물학 이미지에서 세포를 자동 식별하는 범용 파운데이션 모델 CellSAM을 네이처 메서즈에 공개했다. 단일 모델로 종양세포·박테리아·면역세포를 모두 커버하고 세포 간 상호작용과 공간 구조까지 분석 가능하다. 연구자 누구나 무료로 쓸 수 있게 오픈소스로 풀었다.

  • 1

    단일 모델로 다양한 세포 유형을 커버하는 최초의 범용 세포 분할 파운데이션 모델

  • 2

    수백만 세포를 다양한 조건에서 추적해 희귀 세포 상태·형태 변화·치료 반응 관계 분석 가능

  • 3

    기존엔 도메인별 전용 모델이 필요했던 수작업 라벨링 병목을 해소

  • 4

    네이처 메서즈 게재, 연구자에게 무료 공개

  • 칼텍(Caltech) 연구진이 생물 이미지에서 세포를 자동 식별하는 범용 AI 셀SAM(CellSAM, Cell Segment Anything Model) 을 공개, 오픈소스로 풀었음
    • 단일 모델로 다양한 생물학 이미지에 적용 가능한 최초의 범용 세포 분할(segmentation) 파운데이션 모델
    • 연구는 네이처 메서즈에 "CellSAM: A Foundation Model for Cell Segmentation" 제목으로 게재
    • 데이비드 반 발렌 교수와 이송 위 교수 연구팀 협업
  • 기존엔 학생들이 현미경 이미지 하나하나 보면서 세포 수작업으로 라벨링하거나 알고리즘 오류를 수정해야 했음
    • 암 조직 분석, 면역세포 관찰처럼 정확도가 중요한 도메인에서는 연구 병목의 주요 원인
    • "이제 하나의 모델로 다양한 응용 분야에서 이 작업을 할 수 있게 됐다" — 반 발렌 교수

뭐가 다른가

  • 서로 다른 세포 유형을 식별할 뿐 아니라 위치와 상호작용, 공간적 구조까지 분석 가능
    • 종양세포, 박테리아, 면역세포 등 다양한 형태 커버
    • 고해상도 이미징 발전으로 데이터가 폭발적으로 늘어난 현실과 맞물림
  • 방대한 수작업 라벨링 데이터로 학습되어, 이전엔 불가능했던 규모의 질문까지 던질 수 있게 됨
    • 수백만 개 세포를 다양한 조건에서 추적 → 희귀 세포 상태나 미세한 형태 변화와 치료 반응의 관계까지 분석
    • 특정 면역치료가 환자마다 다른 효과를 보이는 이유 같은 정밀의학 연구에도 활용 가능

무료 공개, 연구 생태계 확산 노림수

  • 연구자 누구나 쓸 수 있게 무료 공개 — 학계와 산업계 확산 기대
    • 다양한 생물학 데이터를 계속 추가 학습시켜 모델 업데이트 예정
  • 이송 위 교수 "기존 워크플로 효율화를 넘어 이전에는 불가능했던 규모의 생물학적 질문을 탐구할 수 있게 한다"

기술 맥락

제목의 SAM은 메타(Meta)가 2023년 공개한 Segment Anything Model에서 따온 거예요. SAM은 "아무 이미지에서 아무 객체나 분할"하는 범용 세그멘테이션 모델로 컴퓨터 비전 판도를 바꾼 파운데이션 모델이거든요. CellSAM은 이걸 세포 이미지 도메인에 특화시킨 파생 모델이라고 보면 돼요.

세포 분할(cell segmentation)이 왜 중요하냐 하면, 현미경 이미지 한 장에 세포가 수천~수만 개 들어있는데, 이걸 일일이 경계선 그리고 종류별로 라벨링하는 작업이 생명과학 연구의 가장 큰 병목이에요. 암 연구든 면역 연구든 결국 "어느 세포가 어디서 뭘 하고 있나"를 세는 일에서 출발하거든요.

'파운데이션 모델' 접근이 의미 있는 건, 기존에는 도메인마다(유방암, 뇌세포, 박테리아 등) 전용 모델을 따로 학습시켜야 했어요. CellSAM은 단일 모델로 이 모든 걸 커버하면서 개별 태스크 정확도도 유지하겠다는 거예요. 바이오 AI에서 GPT 같은 파운데이션 모델 전략이 드디어 통한다는 신호로 읽을 수 있어요.

메타의 SAM을 세포 이미징 도메인에 특화시킨 파생 모델로, 바이오 AI에서 파운데이션 모델 전략이 실제로 통한다는 신호다. 수작업 라벨링에 막혔던 연구가 빠르게 풀릴 여지가 크다.

댓글

댓글

댓글을 불러오는 중...

ai-ml

Godot 관리자 비명 "AI가 생성한 쓰레기 PR 리뷰에 기진맥진"

생성형 AI 코드가 쏟아지면서 고도 엔진 수석 관리자는 '검토·거절 과정이 소모적'이라 토로했고, 2026 상반기 Game Developer 설문에선 생성형 AI 도입률이 36%에서 29%로 반전, 개발자 47%가 AI가 게임 품질을 저하시킬 것이라 응답했다. 감지가 어려운 '조용한 실패'가 장기 프로젝트 안정성을 위협한다는 지적이 핵심이다.

ai-ml

코넬대 "시각장애인용 AI, 후속 질문 정확도 56.6%에 그쳤다"

코넬 공대 연구진이 GPT-4o 기반 시각 보조 앱 VisionPal로 시각장애인 20명 대상 2주간 실사용 테스트를 진행한 결과, 기본 사물 인식은 잘 하지만 약 복용량·요리법 같은 맥락 질문에서는 무너졌다. 후속 질문 정확도는 56.6%, 그중 22.2%는 잘못된 정보를 담고 있어 안전 문제로 직결될 수 있다고 지적했다. 연구팀은 멀티모달 LLM이 갖춰야 할 9가지 핵심 역량을 제시했다.

ai-ml

크래프톤, AI 브랜드 'Raon' 론칭…음성·TTS·비전 모델 4종 허깅페이스에 오픈소스 공개

크래프톤이 AI 모델 브랜드 Raon(라온)을 론칭하고 음성 언어모델·실시간 양방향 음성모델·TTS·비전 인코더 4종을 허깅페이스에 오픈소스로 공개했다. 9B 규모의 Raon-Speech는 10B 이하급에서 영어·한국어 모두 글로벌 1위, Raon-SpeechChat은 국내 최초 실시간 Full-duplex 음성모델이다.

ai-ml

오픈클로(OpenClaw)로 슬랙 AI 비서 만들기 — 설치부터 봇 연동까지 실전 가이드

오픈소스 AI 에이전트 런타임 OpenClaw를 활용해 슬랙 AI 비서를 직접 세팅하는 과정을 단계별로 정리한 실전 튜토리얼이다. 터미널과 Claude Code 설치, OpenClaw 설치, 슬랙 봇 토큰 발급, 매니페스트 구성, 웹 UI에서 에이전트 관리까지 필요한 모든 절차를 다룬다.

ai-ml

MIT 출신 창업팀이 만든 오픈프로틴AI, 단백질 설계 노코드 플랫폼 오픈소스 공개

MIT 출신이 창업한 OpenProtein.AI가 단백질 언어모델 PoET을 비롯한 단백질 설계 도구들을 오픈소스로 공개했다. 머신러닝 전문 지식 없이도 웹 인터페이스로 단백질 서열 라이브러리를 생성·검증할 수 있어 신약 개발 파이프라인 단축이 기대된다. 베링거인겔하임 같은 제약사가 이미 실제 신약 설계에 도입했다.