---
title: "MIT 출신 창업팀이 만든 오픈프로틴AI, 단백질 설계 노코드 플랫폼 오픈소스 공개"
published: 2026-04-18T09:00:01.893Z
canonical: https://jeff.news/article/1778
---
# MIT 출신 창업팀이 만든 오픈프로틴AI, 단백질 설계 노코드 플랫폼 오픈소스 공개

MIT 출신이 창업한 OpenProtein.AI가 단백질 언어모델 PoET을 비롯한 단백질 설계 도구들을 오픈소스로 공개했다. 머신러닝 전문 지식 없이도 웹 인터페이스로 단백질 서열 라이브러리를 생성·검증할 수 있어 신약 개발 파이프라인 단축이 기대된다. 베링거인겔하임 같은 제약사가 이미 실제 신약 설계에 도입했다.

- MIT 출신 연구진이 차린 OpenProtein.AI가 단백질 설계용 파운데이션 모델과 도구 세트를 오픈소스로 풀었음 — 머신러닝 지식 없이도 단백질을 설계할 수 있는 '노코드' 플랫폼이 목표
  - 창업자는 2020년 MIT 졸업생 트리스탄 베플러(CEO)와 전 MIT 교수 팀 루 박사
  - 현재 제약·바이오 기업뿐 아니라 학계 연구자들도 사전 신청으로 플랫폼 접근 가능
  - "생물학 시스템을 설명하는 하나의 '언어'를 만드는 게 목표"라는 게 창업자의 말

### 핵심 모델 — PoET (Protein Evolutionary Transformer)
- 단백질 군(群) 데이터를 기반으로 학습된 단백질 언어 모델(Protein Language Model)
  - 진화적 제약 조건을 이해해서 관련 단백질 집합을 생성할 수 있음
  - 새 데이터가 들어와도 재학습 없이 반영 가능 — in-context learning 개념을 단백질 도메인에 적용한 셈
- 연구자 입장에선 컴퓨터상에서 단백질 서열 라이브러리를 만들고 예측·구조 분석 도구로 검증해서 실험 후보를 걸러낼 수 있음 → 실험실 비용·시간 크게 단축
- 웹 인터페이스로 데이터 업로드~모델 활용~설계~분석까지 한 번에. 코드 쓰고 싶은 사람용 API도 따로 제공

### 실제 도입 사례와 차세대 모델
- 독일 제약사 베링거인겔하임이 2025년부터 도입해서 암·자가면역질환·염증질환 치료용 단백질 설계에 쓰고 있음 — 최근 협력 범위를 확대
- 최신 모델 PoET-2는 기존 대형 모델 대비 훨씬 적은 컴퓨트·데이터로 더 높은 성능 — 효율성과 확장성을 동시에 잡았다는 평가
- 팀 루 박사는 "단백질이 여러 생물학적 메커니즘과 동시에 상호작용하거나 기능이 변화하는 동적 특성을 예측·설계하는 영역이 다음 혁신 포인트"라고 언급

### 왜 오픈소스인가
- 특정 기업·기관에 AI 자원이 쏠리면 연구자 접근성이 막히고 혁신 속도가 느려진다는 문제 의식
- AI 신약 개발 판에서 '개방성(Open Access)'을 핵심 경쟁력으로 내세운 포지셔닝
- 생명과학 연구의 민주화 — 머신러닝 박사가 없어도 단백질 설계를 돌려볼 수 있다는 게 판이 바뀌는 지점

## 핵심 포인트

- MIT 출신 베플러·팀 루 박사가 설립, 제약·바이오·학계용 노코드 단백질 설계 플랫폼 오픈
- 핵심 모델 PoET은 단백질 군 데이터를 학습한 트랜스포머, 재학습 없이 새 데이터 반영 가능
- 후속 모델 PoET-2는 기존 대형 모델 대비 훨씬 적은 컴퓨트로 더 높은 성능 달성
- 베링거인겔하임이 2025년부터 암·자가면역·염증 치료제 설계에 플랫폼 실사용 중
- 개방성(Open Access) 전략으로 AI 신약 생태계 민주화를 지향

## 인사이트

AlphaFold 이후 단백질 설계가 LLM 스타일로 옮겨가는 흐름이 또 한 단계 넘어간 느낌이다. 노코드로 접근성을 낮추고 오픈소스로 풀어버리는 전략이 제약사들 눈엔 매력적일 수밖에 없음.
