본문으로 건너뛰기
피드

“한국은 로봇 밀도 세계 1위”…피지컬 AI 데이터 싸움에서 제조업이 무기 될 수 있음

ai-ml 약 9분
vote
0
댓글
북마크

김주형 UIUC 교수는 피지컬 AI 시대의 핵심 경쟁력이 실제 로봇 작업 데이터에 있다고 봤어. 한국은 인구 규모로 데이터 물량전을 하긴 어렵지만, 자동차·선박·반도체 같은 강한 제조 현장에서 특화 데이터를 모을 수 있다는 분석이야.

  • 1

    피지컬 AI는 대규모 언어 모델 같은 지능과 실제 몸을 가진 로봇을 연결하는 기술

  • 2

    현재 가장 부족한 건 시뮬레이션이나 영상 데이터가 아니라 실제 로봇이 물리 세계에서 작업하며 만든 데이터

  • 3

    텔레오퍼레이션은 사람이 로봇을 직접 조종해 성공 작업 데이터를 쌓는 방식

  • 4

    한국은 인구 대비 로봇 수 세계 1위라 제조업 기반 로봇 데이터 수집에 유리한 조건을 갖고 있음

  • 5

    다만 제조 현장 데이터를 외부 기업이 가져가게 두면 핵심 자산을 잃을 수 있다는 경고도 나옴

피지컬 AI에서 진짜 부족한 건 ‘몸으로 한 일’의 데이터임

  • 김주형 UIUC 교수는 피지컬 AI 시대에 한국의 승부처가 제조업 데이터라고 봄

    • 김 교수는 삼성전자와 디즈니 리서치를 거쳤고, 현재 UIUC에서 지능형 로봇연구실 KIMLAB을 이끌고 있음
    • 2026 밸류팩처링 국제학술대회(ICV2026) 기조강연 뒤 인터뷰에서 “한국은 인구 대비 로봇 수 세계 1위”라고 강조함
  • 피지컬 AI는 똑똑한 AI와 실제 몸을 가진 로봇을 연결하는 기술임

    • 대규모 언어 모델(LLM)은 지능은 뛰어나지만 몸이 없음
    • 반대로 공장 산업용 로봇은 몸은 있지만 지능이 낮음
    • 이 둘을 연결하려면 로봇이 실제 물리 세계에서 작업하며 만든 데이터가 필요함
  • 문제는 바로 그 데이터가 제일 부족하다는 점임

    • 시뮬레이션 데이터, 텍스트 데이터, 영상 데이터는 만들 수 있음
    • 하지만 로봇이 실제 물건을 잡고, 옮기고, 조립하고, 실패하고, 다시 성공하는 데이터는 아직 충분하지 않음

중요

> 피지컬 AI의 병목은 모델 크기보다 실제 작업 데이터임. 로봇이 물리 세계에서 성공한 동작을 얼마나 많이 모으느냐가 성능을 가를 가능성이 큼.

텔레오퍼레이션은 로봇판 라벨링 작업임

  • 김 교수가 말한 핵심 수집 방식은 텔레오퍼레이션(teleoperation)임

    • 사람이 웨어러블 장치를 착용하고 로봇을 직접 조종함
    • 그 과정에서 로봇의 동작 데이터가 쌓이고, 성공한 에피소드가 많아질수록 로봇이 같은 작업을 스스로 반복할 수 있게 됨
  • 김 교수는 이 과정을 고양이·개 이미지 라벨링에 비유함

    • 예전에 이미지 AI를 만들 때 사진마다 “이건 고양이”, “이건 개”라고 정답을 붙였던 것과 비슷하다는 얘기임
    • 로봇에게는 “이 물건을 이렇게 집어 옮기면 성공”이라는 정답 동작 데이터가 필요함
  • 강연장에서는 실제 로봇 시연도 진행됨

    • DGIST 박경서 교수 연구실이 KIMLAB의 오픈소스를 활용해 한 달 만에 구현한 시스템이 무대에 올라옴
    • 사람이 웨어러블 슈트를 입고 움직이면 그 동작이 휴머노이드 로봇에 전달되는 방식임
  • KIMLAB의 텔레오퍼레이션 시스템 ‘차일드(CHILD)’는 아기띠에서 착안함

    • 아기띠를 맨 어른이 움직이면 아기도 같이 움직이는 것처럼, 사람의 작업 공간 안에 로봇의 작업 공간을 자연스럽게 포함시키는 아이디어임
    • 시연에서는 슈트를 입은 사람이 움직이자 중국 유니트리의 휴머노이드 로봇 G1이 즉각 따라 움직임
sequenceDiagram
    participant 조종자
    participant 웨어러블슈트
    participant 차일드시스템
    participant 휴머노이드로봇
    participant 작업데이터
    조종자->>웨어러블슈트: 상체·하체 움직임 입력
    웨어러블슈트->>차일드시스템: 실시간 동작 신호 전달
    차일드시스템->>휴머노이드로봇: 로봇 관절 동작으로 변환
    휴머노이드로봇->>작업데이터: 성공한 작업 에피소드 저장
    작업데이터->>휴머노이드로봇: 반복 학습에 활용

한국의 카드: 인구가 아니라 제조 현장

  • 텔레오퍼레이션 데이터는 결국 사람 수와도 연결됨

    • 많은 사람이 로봇을 조종할수록 더 많은 작업 데이터를 빠르게 쌓을 수 있음
    • 그래서 단순 물량전으로 가면 인구가 많은 나라가 유리하고, 한국은 불리할 수밖에 없음
  • 김 교수가 제조업 데이터를 보자고 한 이유가 여기 있음

    • 한국은 자동차, 선박, 반도체처럼 이미 강한 산업 분야가 있음
    • 공장에서 부품을 조립하고, 선박을 용접하고, 반도체 장비를 다루는 실제 작업 데이터는 한국이 잘 모을 수 있는 영역임
  • 특히 한국은 자동화된 산업 현장이 많다는 점이 강점으로 언급됨

    • 김 교수 표현대로 인구 대비 로봇 수가 세계 1위라는 건 이미 로봇이 들어간 현장이 많다는 뜻임
    • 피지컬 AI용 데이터 수집을 실험실이 아니라 산업 현장에서 바로 고민할 수 있는 기반이 있다는 얘기임

⚠️주의

> 제조 현장 데이터를 외부 기업이 대신 모으게 했다가 그 데이터 소유권까지 넘기면 진짜 큰 문제임. 피지컬 AI 시대에는 데이터 자체가 경쟁력이라, 누가 갖느냐가 기술력만큼 중요해짐.

한국 로봇 연구 위상도 꽤 올라와 있음

  • 국제 로봇·AI 학회들이 한국을 계속 찾는 흐름도 언급됨

    • 로봇 분야 최대 학회인 국제로봇자동화학술대회(ICRA)가 내년 5월 한국에서 열림
    • 올해 7월 국제머신러닝학술대회(ICML), 작년 휴머노이드 로봇학회와 로봇 러닝 컨퍼런스까지 굵직한 학회들이 이어짐
  • 김 교수는 한국이 규모 대비 로봇 연구를 정말 잘하고 있다고 평가함

    • 큰 학회들이 연달아 한국에서 열리는 건 쉬운 일이 아니라고 봄
    • 연구 역량과 산업 기반이 함께 있다는 점이 피지컬 AI 경쟁에서 중요한 배경이 됨

AI 도구는 컨닝이 아니라 새 도구라는 관점

  • 김 교수는 AI 도구 사용을 꺼리는 학생 일화도 소개함

    • 한 기계공학 전공 학생이 AI 도구를 쓰는 게 “컨닝 같다”고 말했다고 함
    • 김 교수는 자신이 학생 때 컴퍼스와 자로 제도를 배우고, 대학에서 2D 캐드, 대학원에서 3D 캐드를 배웠다며 “그럼 그것도 컨닝이냐”고 반문함
  • 그의 결론은 단순함. 도구가 바뀐 것뿐임

    • 특히 엔지니어링 분야에서는 AI 도구를 못 쓰면 경쟁에서 밀릴 수밖에 없다고 봄
    • 개발자에게도 꽤 익숙한 얘기임. IDE, 자동완성, 생성형 AI까지 결국 생산성 도구의 연장선이라는 관점임
  • 다만 자동화가 여유를 보장하지는 않는다는 지적도 나옴

    • 1920~60년대 미국에서 세탁기와 전자레인지가 보급된 뒤 가사노동 시간이 오히려 늘었다는 연구를 예로 듦
    • 청결 기준이 높아지면서 빨래 횟수가 늘어난 것처럼, AI 도구도 시간을 아껴주지만 그만큼 더 많은 일을 하게 만들 수 있음
    • 김 교수는 3시간 걸리던 일이 30분 만에 끝난다고 해서 쉬게 되는 게 아니고, AI 도구를 많이 쓰는 연구자들이 일이 훨씬 늘었다고 말한다고 전함
  • KIMLAB의 로봇 시스템은 모두 오픈소스로 공개돼 있음

    • 김 교수는 만들어놓은 것을 사람들이 많이 쓰는 게 좋다고 봄
    • 데이터 수집과 피지컬 AI 발전을 위한 연구를 계속하겠다고 밝힘

기술 맥락

  • 피지컬 AI에서 중요한 선택은 “더 큰 모델을 만들자”가 아니라 “실제 로봇 작업 데이터를 어떻게 모을 것인가”예요. LLM은 말과 추론에는 강하지만 물리 세계에서 물건을 잡고 옮기는 경험이 없기 때문에, 로봇이 몸으로 수행한 성공 데이터가 따로 필요하거든요.

  • 텔레오퍼레이션을 쓰는 이유는 정답 데이터를 비교적 명확하게 만들 수 있기 때문이에요. 사람이 웨어러블 슈트로 로봇을 조종하면, 로봇 입장에서는 어떤 상황에서 어떤 관절 움직임을 했을 때 작업이 성공했는지 기록할 수 있어요. 이미지 분류에서 라벨을 붙이던 일을 로봇 동작으로 옮긴 셈이에요.

  • 한국이 제조업 데이터를 봐야 한다는 주장에는 현실적인 제약이 깔려 있어요. 인구 규모로 데이터 수집량을 밀어붙이기는 어렵지만, 자동차·선박·반도체처럼 자동화가 많이 된 현장에서는 고품질 작업 데이터를 모을 가능성이 높거든요.

  • 그래서 데이터 소유권이 핵심이에요. 외부 업체가 자동화 시스템을 깔아주면서 작업 데이터를 가져가면, 한국 제조 현장의 강점이 피지컬 AI 학습 자산으로 바뀌는 순간 그 가치를 남이 가져갈 수 있어요.

피지컬 AI 경쟁은 모델을 누가 더 크게 만드느냐보다 ‘누가 진짜 작업 데이터를 갖고 있느냐’로 갈 가능성이 큼. 한국 제조업은 여기에 꽤 좋은 출발점을 갖고 있지만, 데이터 소유권을 놓치면 장점이 그대로 빠져나갈 수 있음.

댓글

댓글

댓글을 불러오는 중...

ai-ml

유튜브, AI 생성 영상에 자동 라벨 붙인다

유튜브가 사실적으로 보이거나 의미 있게 AI로 변경·생성된 콘텐츠에 더 눈에 띄는 라벨을 적용하고, 제작자가 AI 사용 여부를 밝히지 않아도 내부 신호로 감지되면 자동 라벨을 붙이겠다고 밝혔다. 다만 라벨만으로 추천 노출이나 수익화 자격이 바뀌지는 않으며, 제작자는 YouTube Studio에서 잘못된 판정을 수정할 수 있다.

ai-ml

테크 CEO들의 'AI 만능론', 숫자는 아직 그렇게 말하지 않는다

테크 업계에서 AI를 이유로 한 대규모 감원과 조직 재편이 이어지는 가운데, Box 창업자 애런 레비는 CEO들이 실제 업무의 마지막 1마일을 모른 채 AI 에이전트의 능력을 과대평가하고 있다고 지적했다. 2026년 첫 5개월 동안 이미 11만5430명이 해고됐고, 여러 연구는 AI 도입이 체감 생산성만큼 실제 생산성을 끌어올렸다는 근거가 아직 약하다고 말한다.

ai-ml

오픈AI와 앤트로픽, 코딩 에이전트로 드디어 돈 되는 시장을 찾은 듯

사이먼 윌리슨은 오픈AI와 앤트로픽이 코딩 에이전트와 기업용 과금으로 진짜 제품-시장 적합성을 찾았다고 봐. 개인 구독자에게는 월 100달러 플랜이 싸게 느껴지지만, 기업 고객은 이제 사용량 기준 토큰 가격을 그대로 내기 시작했고 이게 대형 고객 예산을 빠르게 흔들고 있다는 얘기야.

ai-ml

컴팔과 GMI 클라우드, 대규모 추론용 AI 인프라 구축 협력

컴팔이 실리콘밸리 기반 AI 인프라 기업 GMI 클라우드와 협력해 대규모 추론과 에이전틱 AI 워크로드에 맞춘 GPU 서버 인프라를 구축한다고 발표했어. COMPUTEX 2026에서는 NVIDIA HGX B300을 지원하는 Compal SGX30-2 같은 고성능 AI 서버 플랫폼도 선보일 예정이야.

ai-ml

AI 쓰면 편해진다더니, 직장인들은 ‘AI 과부하’에 지쳐가는 중

국내 직장인들이 AI 전환 압박, AI 답변 검증 부담, 대체 불안 때문에 피로감을 호소하고 있어. 중앙일보 설문에서는 5284명 중 31.6%가 ‘AI 답변 검증에 시간이 더 걸릴 때’를 가장 지치는 순간으로 꼽았고, 기업들은 무작정 AI 사용량을 밀어붙이는 방식에서 업무 방식 재설계로 넘어가야 한다는 지적이 나와.