본문으로 건너뛰기
피드

세포가 어디로 갈지와 그걸 조종하는 유전자까지 같이 찍어내는 AI 모델 ‘레그벨로’

ai-ml 약 7분

스토워스의학연구소·헬름홀츠 뮌헨·뮌헨공대·옥스퍼드대 공동연구팀이 세포 운명과 핵심 조절 유전자를 동시에 예측하는 AI 모델 레그벨로를 공개했다. 기존 RNA 속도 분석과 유전자 조절 네트워크 분석을 딥러닝으로 합쳐, 제브라피시 배아 실험에서 색소세포 형성 관련 유전자 tfec와 새 조절 인자 elf1을 찾아냈다.

  • 1

    레그벨로는 RNA 발현 변화와 유전자 조절 관계를 한 모델에서 같이 계산한다

  • 2

    제브라피시 신경능선 세포에서 tfec와 elf1의 기능 예측을 크리스퍼와 단일세포 퍼터브시퀀싱으로 검증했다

  • 3

    여섯 가지 생물학 시스템에서 잠재 시간, 변화 속도, 최종 세포 상태, 계통 인자 예측 성능이 기존 기법과 같거나 더 높았다

  • 4

    줄기세포 유도, 종양 성장 경로 예측, 오가노이드 연구, 세포 치료 쪽으로 확장 가능성이 있다

세포 운명 예측과 조절 유전자 찾기를 한 번에 묶은 모델

  • 세포가 앞으로 혈액세포, 신경세포, 색소세포 같은 어떤 방향으로 분화할지 예측하고, 그 길을 밀어주는 핵심 유전자까지 같이 찾는 AI 모델이 나옴

    • 이름은 레그벨로(RegVelo)
    • 미국 스토워스의학연구소, 독일 헬름홀츠 뮌헨·뮌헨공대, 영국 옥스퍼드대 공동연구팀이 개발했고 국제학술지 셀(Cell)에 발표함
  • 기존 단일세포 분석은 각각 장단점이 갈렸음

    • RNA 속도(RNA velocity)는 세포가 앞으로 어느 방향으로 변할지 추정하는 데 강점이 있음
    • 유전자 조절 네트워크 분석은 어떤 유전자가 어떤 유전자에 영향을 주는지 보는 데 강점이 있음
    • 문제는 둘을 따로 보면 “세포가 어디로 갈지”와 “누가 그 방향을 조종하는지”를 동시에 잡기 어렵다는 점임
  • 레그벨로는 이 둘을 딥러닝 모델 하나로 합친 접근임

    • 세포 안 RNA 발현 변화와 유전자 간 조절 관계를 동시에 계산함
    • 그래서 특정 세포가 어떤 경로를 밟을지, 그 경로를 유도하는 핵심 조절 유전자가 뭔지 같이 예측함

중요

> 포인트는 “분화 방향 예측”만이 아니라 “건드려볼 만한 유전자 후보 선별”까지 한 번에 한다는 점임. 수백~수천 개 후보를 실험실에서 전부 검증하는 건 현실적으로 빡세니까, 먼저 계산으로 줄여주는 가치가 큼.

제브라피시 배아에서 실제 검증까지 함

  • 연구팀은 레그벨로를 제브라피시 배아의 신경능선 세포에 적용해 봄

    • 신경능선 세포는 척추동물 배아 초기에 생겨서 얼굴, 심장, 말초신경계, 색소세포 등 여러 조직으로 갈라지는 세포 집단임
    • 세포 운명 결정과 조절 유전자 예측을 테스트하기 딱 좋은 시스템인 셈
  • 레그벨로는 색소세포 형성을 이끄는 초기 조절 유전자 tfec를 찾아냄

    • tfec는 색소세포 형성과 관련된 초기 조절 인자로 예측됨
    • 연구팀은 이 예측을 크리스퍼(CRISPR-Cas9)와 단일세포 퍼터브시퀀싱(Perturb-seq)으로 확인함
  • 더 흥미로운 건 기존에 알려지지 않았던 조절 인자 elf1도 새로 발굴했다는 점임

    • 모델이 이미 알려진 답만 맞힌 게 아니라 새로운 후보까지 제시했다는 얘기임
    • elf1 역시 유전자 교란 실험과 단일세포 분석으로 실제 기능을 확인함

여섯 가지 생물학 시스템에서도 비교 성능을 확인

  • 연구팀은 제브라피시 신경능선 발달 말고도 여러 시스템에 레그벨로를 적용함

    • 세포주기
    • 췌장 내분비세포 발생
    • 혈액세포 형성
    • 근육 형성
    • 후뇌 발달
    • 제브라피시 신경능선 발달까지 총 여섯 가지 생물학 시스템을 봄
  • 비교 지표도 단순 정확도 하나가 아니라 꽤 실전적인 항목들임

    • 잠재 시간 추정: 세포가 발달 과정에서 내부적으로 어느 시점쯤 와 있는지 보는 값
    • 세포 변화 속도
    • 최종 세포 상태 예측
    • 계통 연관 인자 규명
  • 결과적으로 널리 쓰이는 기존 분석 기법들과 비교했을 때 동등하거나 더 높은 성능을 보였다고 함

    • 즉 “새 모델 만들었다”에서 끝나는 게 아니라, 기존 도구 대비 쓸 이유를 성능 지표로 보여준 셈
    • 특히 여러 생물학 시스템에서 확인했다는 점이 모델 범용성 주장에 힘을 실어줌

어디에 쓸 수 있나

  • 가장 직접적인 응용처는 줄기세포를 원하는 세포 유형으로 정밀하게 유도하는 쪽임

    • 원하는 세포로 가게 하려면 어떤 조절 유전자를 건드려야 하는지 후보를 좁힐 수 있음
    • 심근 조직 회복, 피부 이식, 연골 재생 같은 세포 치료 연구와도 연결될 수 있음
  • 종양 세포의 성장 경로 예측에도 활용 가능성이 언급됨

    • 암세포가 어떤 방향으로 변하고, 어떤 유전자가 그 경로를 밀고 있는지 알면 개입 지점을 찾는 데 도움이 될 수 있음
    • 물론 실제 임상 적용까지는 훨씬 먼 길이지만, 연구용 선별 도구로는 꽤 매력적임
  • 연구팀은 앞으로 크로마틴 구조 데이터와 단백질 활성 정보까지 통합할 계획임

    • 지금은 RNA 발현과 유전자 조절 관계를 중심으로 본 모델임
    • 여기에 다층 분자 정보가 붙으면 세포 운명 예측이 더 입체적으로 바뀔 수 있음

기술 맥락

  • 레그벨로의 선택은 “세포의 미래 방향”과 “그 방향을 만드는 원인”을 따로 보던 분석을 합치려는 시도예요. 단일세포 데이터는 워낙 복잡해서 방향만 맞혀도 쓸모가 있지만, 실제 실험자는 결국 어떤 유전자를 건드릴지 알아야 하거든요.

  • RNA velocity만 쓰면 세포가 어느 쪽으로 움직이는지는 볼 수 있지만, 조절 유전자 후보를 바로 얻기 어렵다는 한계가 있어요. 반대로 유전자 조절 네트워크만 보면 관계는 보이지만 시간에 따른 세포 상태 변화가 약해져요. 레그벨로는 이 둘을 한 모델에 넣어서 예측과 원인 후보를 같이 뽑는 쪽을 택한 거예요.

  • 이 접근이 중요한 이유는 실험 비용 때문이에요. 수백 개 넘는 유전자를 하나씩 교란해서 확인하는 건 시간도 돈도 너무 많이 들어요. 컴퓨터 시뮬레이션으로 후보를 먼저 줄이면, 실험실에서는 가능성이 높은 타깃부터 검증할 수 있어요.

  • 이번 연구에서 크리스퍼와 퍼터브시퀀싱으로 tfec와 elf1을 확인한 것도 그래서 의미가 커요. 딥러닝 모델이 생물학적으로 그럴듯한 패턴을 찾는 데서 끝난 게 아니라, 실제 세포에서 기능 검증까지 이어졌기 때문이에요.

생명과학 쪽 AI가 단순 분류기를 넘어 ‘무슨 일이 일어날지’와 ‘뭘 건드리면 바뀔지’를 같이 묻는 방향으로 가고 있다. 실험 비용이 비싼 분야일수록 이런 후보 선별 모델의 체감 가치는 꽤 클 수밖에 없다.

댓글

댓글

댓글을 불러오는 중...

ai-ml

제미나이 도구 호출 능력을 2,600만 파라미터 모델로 증류한 니들 공개

Cactus Compute가 Gemini 3.1의 도구 호출 능력을 2,600만 파라미터짜리 초소형 모델 Needle로 증류해 공개했다. 맥이나 PC에서 로컬 파인튜닝까지 가능하고, 프로덕션 환경에서는 프리필 6,000 토큰/초, 디코드 1,200 토큰/초를 낸다고 주장한다. 개인용 AI 기기에서 함수 호출만 빠르게 처리하는 작은 모델 실험으로 보면 꽤 흥미로운 공개다.

ai-ml

딥시크 V4 인덱서, 6기가바이트 메모리로 백만 토큰까지 밀어붙인 논문

딥시크 V3.2와 V4의 압축 희소 어텐션에서 병목이 되는 인덱서 단계를 스트리밍 방식으로 바꿔, 기존 구현이 6만5536 토큰에서 메모리 부족으로 죽던 문제를 104만8576 토큰까지 확장했다. 핵심은 전체 점수 텐서를 만들지 않고 청크 단위로 top-k를 나눠 계산한 뒤 병합하는 방식이며, 단일 엔비디아 H200에서 피크 메모리 6.21기가바이트를 기록했다. 다만 논문은 인덱서 단계만 다루며, 실제 체크포인트 기반 종단간 성능이나 더 빠른 어텐션 커널을 주장하진 않는다.

ai-ml

챗지피티가 학습에 좋다던 유명 논문, 결국 철회됨

챗지피티가 학생 학습 성과에 큰 도움이 된다고 주장했던 논문이 출판 약 1년 만에 철회됐어. 스프링거 네이처는 분석의 불일치와 결론 신뢰 부족을 이유로 들었고, 문제의 논문은 이미 500회 넘게 인용된 뒤였어.

ai-ml

샘 올트먼, 법정에서 “머스크가 오픈AI 지배권을 자녀에게 넘기려 했다”고 증언

샘 올트먼이 캘리포니아 오클랜드 연방법원 배심원 앞에서 일론 머스크가 오픈AI의 장기 지배권을 원했고, 사망 후엔 자녀에게 넘기는 방안까지 언급했다고 증언했다. 머스크는 오픈AI가 비영리로 출발했는데도 영리화됐다고 소송을 제기했지만, 올트먼은 오히려 머스크가 영리 전환과 테슬라 편입을 밀었다는 취지로 반박했다.

ai-ml

혜전대, AI로 스마트팜 생산·가공·유통 교육 모델 만든다

혜전대가 2026년 교육부·한국연구재단의 AID 전환 중점 전문대학 지원사업에 충남 지역 연합형 사업단으로 선정됐다. 연암대와 역할을 나눠 스마트팜 생산부터 가공·유통까지 전주기를 디지털화하는 교육 모델을 만들겠다는 내용이다.