본문으로 건너뛰기
피드

리얼월드·엔비디아, 휴머노이드 손 성능 재는 ‘덱스벤치’ 만든다

ai-ml 약 5분
vote
0
댓글
북마크

피지컬 AI 스타트업 리얼월드가 엔비디아와 함께 휴머노이드 로봇 손의 성능 벤치마크인 덱스벤치를 출범했다. 5지 손 조작을 5개 도메인과 18개 태스크로 나눠 측정하고, 엔비디아 아이작 랩 생태계와 통합하는 것이 핵심이다. 로봇 경쟁이 하드웨어와 모델 성능을 넘어 표준 경쟁으로 넘어가고 있다는 신호다.

  • 1

    리얼월드와 엔비디아가 휴머노이드 손 조작 성능 벤치마크와 데이터 포맷 표준화를 추진함

  • 2

    덱스벤치는 파지 다양성, 공간 정밀도, 시간 정밀도, 접촉 정밀도, 상황 인식 등 5개 도메인과 18개 원자 태스크로 구성됨

  • 3

    엔비디아 아이작 랩과 아이작 랩-아레나에 통합해 시뮬레이션과 실제 환경에서 반복 검증하는 구조를 목표로 함

  • 4

    휴머노이드 로봇 분야가 이제 성능 주장보다 같은 조건에서 재현 가능한 평가 기준을 요구하는 단계로 가고 있음

  • 리얼월드가 엔비디아와 손잡고 휴머노이드 로봇 ‘손’의 표준 벤치마크를 만들겠다고 나섬

    • 이름은 덱스벤치(DexBench) 이니셔티브
    • 핵심은 덱스터리티 성능 평가, 5지 휴머노이드 조작용 데이터 포맷 표준화, 엔비디아 아이작 랩 및 아이작 랩-아레나 통합임
  • 이건 단순한 협업 발표라기보다 휴머노이드 경쟁이 표준화 국면으로 넘어가고 있다는 신호에 가까움

    • 중국은 올해 초 ‘휴머노이드 로봇 및 임바디드 AI 표준 체계’ 2026년판을 발표하며 국가 차원의 기준과 안전·윤리 로드맵을 제시함
    • 미국 실리콘밸리와 유럽도 테스트베드와 가이드라인 정비에 속도를 내는 중임
    • 이제는 로봇이 멋지게 움직이는 영상만으로 부족하고, 같은 조건에서 재현 가능한 성능을 보여줘야 하는 단계임
  • 덱스벤치는 실제 산업 현장의 손동작 업무를 기준으로 설계됐음

    • 조립, 분류, 포장, 피킹 같은 작업이 기반임
    • 파지 다양성, 공간 정밀도, 시간 정밀도, 접촉 정밀도, 상황 인식이라는 5개 핵심 도메인을 잡음
    • 이걸 다시 18개 원자 태스크로 쪼개 로봇 손의 조작 능력을 더 세밀하게 평가하려는 구조임

중요

> 덱스벤치의 포인트는 “우리 로봇 손 잘함”이 아니라, 같은 과제와 같은 조건에서 덱스터리티를 비교하자는 데 있음.

  • 엔비디아 아이작 랩-아레나와 결합하는 점도 꽤 중요함
    • 동일한 시나리오를 시뮬레이션과 실제 환경에서 반복 검증하는 구조를 목표로 함
    • 지금까지는 기업과 연구실마다 테스트 조건이 달라 성능 비교가 애매했는데, 덱스벤치는 공통 잣대를 제공하겠다는 구상임
    • 데이터 포맷도 5지 덱스터리티 휴머노이드용으로 공동 설계해 아이작 랩 파이프라인과 호환되게 만들 계획임
sequenceDiagram
    participant 연구자
    participant 덱스벤치
    participant 아이작랩
    participant 실제로봇
    participant 평가데이터
    연구자->>덱스벤치: 18개 조작 태스크 선택
    덱스벤치->>아이작랩: 동일 시나리오를 시뮬레이션에 배치
    아이작랩->>평가데이터: 위치·접촉·시간 정밀도 기록
    덱스벤치->>실제로봇: 같은 태스크를 실제 환경에서 실행
    실제로봇->>평가데이터: 실제 수행 결과 저장
    평가데이터->>연구자: 공통 지표로 성능 비교
  • 리얼월드는 이걸 ‘로봇 손의 공통 언어’로 보고 있음
    • 류중희 대표는 정밀한 움직임을 측정하고 재현하는 공통 언어 없이는 덱스터리티 AI 상용화에 한계가 있다고 말함
    • 엔비디아도 측정 가능하고 재현 가능한 정밀 조작 능력이 산업 환경에서 로보틱스 도입을 확대하는 데 필수적이라고 봄
    • 결국 덱스벤치는 벤치마크이면서 동시에 데이터 인프라, 생태계 락인, 표준 주도권이 걸린 카드임

기술 맥락

  • 휴머노이드 손에서 어려운 건 단순히 손가락이 5개 달렸다는 게 아니에요. 물체를 잡는 힘, 접촉 위치, 움직이는 타이밍, 상황 판단이 모두 맞아야 실제 산업 현장에서 쓸 수 있거든요.

  • 덱스벤치가 5개 도메인과 18개 태스크로 나눈 이유도 여기에 있어요. 로봇이 물건을 집었다는 결과만 보면 쉬워 보이지만, 같은 물체를 얼마나 다양한 방식으로 잡는지, 얼마나 정확한 위치에 놓는지, 접촉을 얼마나 안정적으로 유지하는지가 모두 따로 측정돼야 해요.

  • 엔비디아 아이작 랩과 붙는 것도 전략적으로 중요해요. 시뮬레이션에서 학습한 동작이 실제 로봇에서도 통하는지를 반복해서 봐야 하는데, 이 과정이 표준화되면 연구 결과 비교가 훨씬 쉬워져요.

  • 표준 벤치마크는 기술적으로는 평가 도구지만, 산업적으로는 생태계의 중심이 될 수 있어요. 많은 팀이 같은 포맷으로 데이터를 만들고 같은 파이프라인에서 검증하면, 그 주변 도구와 모델도 자연스럽게 같이 커지거든요.

휴머노이드 로봇은 이제 ‘우리 손이 더 정교함’ 같은 데모 경쟁만으로는 부족해지는 분위기임. 같은 과제, 같은 조건, 같은 데이터 포맷이 생기면 연구와 제품 비교가 훨씬 냉정해지고, 그 표준을 누가 잡느냐가 생태계 주도권으로 이어질 수 있음.

댓글

댓글

댓글을 불러오는 중...

ai-ml

AI 비용 폭탄, 답은 더 큰 클라우드가 아니라 ‘로컬 우선 추론’일 수 있다

기업 생성형 AI 시범사업의 95%가 측정 가능한 손익 효과를 내지 못했다는 MIT 분석을 바탕으로, 기사에서는 비용 문제의 핵심이 모델 성능보다 업무 흐름과 추론 비용에 있다고 짚는다. 대안으로는 쉬운 작업을 기기나 자체 서버에서 먼저 처리하고, 어려운 작업만 클라우드로 보내는 로컬 우선 추론 전략이 제시된다. 실제 사례에서는 문서 4,700건 처리 중 70~80%를 로컬에서 걸러 클라우드 호출 비용 75%, 처리 시간 55%를 줄였다.

ai-ml

구글-스페이스X 초대형 클라우드 계약이 애저 가격 상승 신호로 읽히는 이유

구글이 스페이스X에 클라우드 컴퓨팅 용량 비용으로 월 9억 2천만 달러를 받기로 한 계약이 AI 인프라 수요와 가격 강세의 신호로 해석되고 있다. BNP 파리바는 이런 흐름이 마이크로소프트 애저의 계약 갱신 가격에도 반영되면 애저 성장률이 40% 중반까지 올라갈 수 있다고 봤다. 코파일럿 피드백 개선도 언급됐지만, 기업 고객 확산은 점진적으로 나타날 가능성이 크다.

ai-ml

엔비디아 생태계에 올라탄 한국 의료 AI, 소버린 AI와 스마트 병원을 노린다

젠슨 황 방한과 엔비디아 간담회를 계기로 국내 의료 AI 기업들이 글로벌 AI 생태계의 파트너로 부각됐다는 내용이다. 루닛은 의료 특화 파운데이션 모델, 메디컬아이피는 의료 디지털 트윈, 메디아나는 병원 데이터와 피지컬 AI를 연결한 스마트 병원 모델을 내세우고 있다.

ai-ml

AI 로봇이 습도까지 보고 나사 조인다, 제조업 일자리 변화가 이미 시작됐다

창원의 가전부품 제조업체 신성델타테크는 AI 로봇과 비전 AI를 도입해 과거 100명이 하던 일을 60명이 처리할 수 있게 됐다고 밝혔다. 제조 현장뿐 아니라 전문·과학·기술서비스업에서도 취업자 감소가 나타나며 AI 자동화가 지식노동까지 흔들고 있다. 전문가들은 산업별 직무 재설계와 숙련 전수 체계가 필요하다고 지적한다.

ai-ml

미국 연방 판사 61.6%가 AI를 쓰지만, 판결문 작성은 거의 안 맡긴다

미국 연방 판사 설문에서 61.6%가 업무에 AI를 써본 적이 있다고 답했다. 하지만 주 용도는 법률 검색과 문서 검토였고, 판결문·명령서 초안 작성이나 실제 의사결정에 쓰는 비율은 각각 1.8%에 그쳤다. 한국 법원도 AI 도입을 준비 중이지만 보안과 사법 윤리 때문에 활용 범위는 조심스럽게 제한되는 분위기다.