---
title: "삼성·현대차·LG·SK가 ‘로봇의 뇌’ 스타트업 컨피그에 400억 넣었다"
published: 2026-05-15T23:05:03.449Z
canonical: https://jeff.news/article/2768
---
# 삼성·현대차·LG·SK가 ‘로봇의 뇌’ 스타트업 컨피그에 400억 넣었다

컨피그인텔리전스가 로봇 파운데이션 모델 개발을 내세워 시드 단계에서 400억원을 유치했어. 삼성벤처투자가 주도하고 현대차, LG, SK, 카카오, GS, 네이버·소프트뱅크 합작 펀드까지 들어온 라운드라, 국내 대기업들이 피지컬 AI 인프라를 선점하려는 움직임으로 읽혀.

- 국내 4대 그룹 계열 자본이 한 로봇 AI 스타트업에 몰렸음
  - 컨피그인텔리전스가 시드 단계에서 400억원을 유치함
  - 프리시드까지 합치면 누적 투자액은 500억원
  - 라운드는 삼성벤처투자가 주도했고 현대차 제로원벤처스, LG테크놀로지벤처스, SK텔레콤아메리카가 참여함
  - 카카오벤처스, GS퓨처스, 네이버·소프트뱅크 합작 Z벤처캐피탈, 미래에셋벤처투자, 산업은행도 이름을 올림

- 이 회사가 노리는 건 흔히 말하는 ‘로봇의 뇌’임
  - 개발 중인 기술은 로봇 파운데이션 모델(RFM)
  - RFM은 대규모 데이터와 범용 AI를 기반으로 다양한 물리 환경과 작업을 이해하고 학습하는 모델임
  - 목표는 특정 로봇 하나가 아니라 여러 로봇에 공통 적용 가능한 지능형 제어 모델을 만드는 것임

- 기술 접근은 월드모델과 VLA를 섞는 방식임
  - 월드모델은 영상을 생성해 다음 상황을 예측하는 접근임
  - VLA(Vision-Language-Action)는 시각 정보와 언어 지시를 이해한 뒤 행동으로 옮기는 방식임
  - 투자자들은 두 방법론을 결합하면 단일 방식보다 다양한 환경에서 안정적인 성능을 낼 수 있다고 봄

> [!IMPORTANT]
> 컨피그가 강조받는 지점은 모델 이름보다 데이터 파이프라인임. 로봇은 웹 텍스트처럼 인터넷에서 학습 데이터를 긁어올 수 없어서, 실제 인간 동작 데이터를 어떻게 모으고 정제하느냐가 병목임.

- 숫자로 보면 데이터 확보량이 꽤 세다
  - 컨피그는 베트남에 300여명 규모의 공장 법인을 직접 운영함
  - 여기서 10만시간 이상의 인간 동작 데이터를 확보했다고 밝힘
  - 중국 애지봇이 오픈소스로 공개한 로봇 학습용 데이터셋 3000시간보다 33배 이상 많다는 비교가 나옴
  - 단순히 많이 모은 게 아니라, 로봇이 학습할 수 있는 형태로 정제하는 파이프라인이 차별점으로 언급됨

- 창업팀 이력도 투자 판단에 크게 작용한 듯함
  - 서민준 대표는 네이버, 메타, 트웰브랩스를 거친 뒤 카이스트 AI대학원 교수로 재직 중인 AI 연구자임
  - 손형목 CTO는 하버드 물리학 박사 출신으로 웨이모에서 자율주행 인지 시스템 성능 개선과 검증을 맡았음
  - 이기민 CSO는 UC버클리 인공지능연구소, 구글을 거쳐 카이스트 교수를 겸임 중임

- 투자금은 모델 고도화와 데이터 정제, 검증에 들어갈 예정임
  - 가장 큰 비용은 R&D 인건비
  - GPU 학습비용, 로봇 구매 비용, 데이터 수집 비용도 포함됨
  - 회사는 영상 데이터가 원석에 가까워 정제 없이 쓰기 어렵다고 보고, 정제 기술과 모델 검증에 자금을 집중할 계획임

- 컨피그는 로봇 하드웨어 제조사가 되려는 건 아님
  - 직접 로봇을 만드는 대신 피지컬 AI 기업이나 공장에서 쓰는 로봇에 지능을 공급하려는 방향임
  - 클라우드 기반 서비스형 로봇(RaaS) 상용화에 속도를 낼 계획임
  - 테크크런치는 이 회사를 ‘로봇계의 TSMC’라고 표현했는데, 로봇 AI를 가능하게 하는 데이터 인프라 공급자라는 의미임

---

## 기술 맥락

- 로봇 파운데이션 모델이 어려운 이유는 언어 모델처럼 인터넷 텍스트를 긁어 학습시키기 어렵기 때문이에요. 로봇은 물체를 집고, 놓고, 밀고, 실패하는 물리 행동 데이터가 필요하고 이 데이터는 직접 만들어야 해요.

- 컨피그가 베트남에 300명 규모 공장 법인을 운영한다는 점이 그래서 중요해요. 10만시간 이상의 인간 동작 데이터를 확보했다는 건 모델 아키텍처만이 아니라 데이터 생산 체계를 회사 안에 넣었다는 뜻이거든요.

- 월드모델과 VLA를 결합하는 선택도 현실적인 절충이에요. 월드모델은 다음 상황 예측에 강하고, VLA는 사람이 내린 지시를 행동으로 바꾸는 데 강해서 둘을 같이 쓰면 물리 환경 변화와 명령 이해를 함께 다룰 수 있어요.

- 하드웨어를 만들지 않고 RaaS로 가겠다는 방향은 사업적으로도 의미가 있어요. 로봇 본체는 제조사마다 다르지만, 행동 데이터와 제어 지능을 공통 인프라로 공급하면 여러 현장에 확장할 여지가 생기니까요.

## 핵심 포인트

- 컨피그인텔리전스가 시드 라운드 400억원, 누적 500억원을 유치함
- 월드모델과 VLA를 결합해 다양한 로봇에 적용 가능한 로봇 파운데이션 모델을 개발 중임
- 베트남 공장 법인을 통해 300명 규모로 10만시간 이상의 인간 동작 데이터를 확보함
- 하드웨어 제조 대신 클라우드 기반 서비스형 로봇과 데이터 인프라 공급에 집중할 계획임

## 인사이트

로보틱스에서 모델보다 더 병목인 건 결국 ‘쓸 만한 행동 데이터’라는 점이 다시 드러난 기사야. 국내 제조 대기업들이 한꺼번에 들어온 건 단순 재무 투자가 아니라, 공장과 물류 현장에서 쓸 피지컬 AI 스택을 미리 잡겠다는 신호에 가깝다.
