본문으로 건너뛰기
피드

엔비디아 베라 루빈 양산 시작, 100만 GPU AI 팩토리 판 깐다

ai-ml 약 9분
vote
0
댓글
북마크

엔비디아가 에이전틱 AI 워크로드를 겨냥한 베라 루빈 플랫폼 양산에 들어갔다. 5개 전용 랙을 하나의 대규모 AI 슈퍼컴퓨터처럼 묶고, 이전 세대 그레이스 블랙웰 대비 10배 높은 에이전트 처리량을 내세운다.

  • 1

    베라 루빈은 베라 CPU, 루빈 GPU, 블루필드-4, 스펙트럼-6 이더넷 랙 등을 통합한 랙스케일 플랫폼

  • 2

    30개국 350개 이상 공장, 대만 150개 파트너가 생산 확대에 참여

  • 3

    스펙트럼-X 이더넷 포토닉스는 전력 효율 5배, AI 가동 시간 5배, 배포 시간 1.3배 개선을 주장

  • 4

    블루필드-4와 DOCA는 800Gb/s 네트워크 격리, 제로 트러스트 정책, 런타임 위협 탐지, 종단간 암호화를 제공

엔비디아가 베라 루빈을 양산 단계로 올림

  • 엔비디아가 전 세계 에이전틱 AI 팩토리를 겨냥한 베라 루빈(Vera Rubin) 플랫폼 양산을 시작함

    • 대상 고객은 AI 연구소, 클라우드 제공업체, 하이퍼스케일러임
    • 대만의 주요 서버 제조사와 글로벌 공급망 기업들이 베라 루빈 기반 시스템을 대규모로 제조 중임
    • 양산 제품 출하는 올해 가을부터 시작될 예정임
  • 베라 루빈은 GPU 하나가 아니라 POD 규모 플랫폼으로 묶어서 파는 구조임

    • 5개의 전용 랙이 하나의 대규모 AI 슈퍼컴퓨터처럼 작동함
    • 구성 요소는 베라 CPU, 루빈 GPU, 블루필드-4 DPU, 스펙트럼-6 이더넷 랙, 스토리지 쪽 구성까지 포함됨
    • 엔비디아는 대규모 환경에서 이전 세대 그레이스 블랙웰(Grace Blackwell) 대비 에이전트 처리량이 10배 높다고 밝힘

중요

> 핵심 숫자는 “10배 에이전트 처리량”임. 엔비디아가 말하는 다음 병목은 단순 토큰 생성 속도가 아니라, 에이전트가 추론·검색·도구 호출을 반복하는 전체 처리량임.

  • 젠슨 황은 에이전틱 AI를 “새로운 유형의 워크로드”라고 규정함
    • 프롬프트 하나가 추론, 검색, 도구 활용, 응답 생성으로 이어지는 수천 단계의 여정을 만들 수 있다는 설명임
    • 그러니까 서버 한두 대 빠르게 만드는 문제가 아니라, 대규모 인텔리전스를 굴리는 공장형 인프라가 필요하다는 논리임

생산망도 이미 크게 깔아둠

  • 베라 루빈은 3세대 엔비디아 MGX 랙스케일 시스템임

    • 오픈소스 MGX 설계를 기반으로 생산 생태계를 확장 중임
    • 30개국 350개 이상 공장에서 생산 확대가 진행되고 있음
    • 대만에서만 150개 파트너가 참여한다는 숫자가 꽤 큼
  • 참여사 목록도 서버·스토리지·클라우드 인프라 쪽을 거의 총동원한 느낌임

    • 델, HPE, 레노버, 슈퍼마이크로가 포함됨
    • 폭스콘, 기가바이트, 콴타 클라우드 테크놀로지(QCT), 위스트론, 위윈 같은 제조 파트너도 들어감
    • 넷앱, 바스트 데이터, 웨카, 미니오, DDN 같은 스토리지·데이터 인프라 회사도 언급됨

100만 GPU 클러스터를 위한 네트워크가 핵심 포인트

  • 베라 루빈 플랫폼은 스케일아웃과 스케일어크로스 AI 팩토리 배포를 염두에 둠

    • 이를 위해 스펙트럼-X 이더넷 포토닉스(Spectrum-X Ethernet Photonics)를 도입함
    • 엔비디아는 이걸 200Gb/s 서데스(SerDes)를 탑재한 세계 최초의 공동 패키징 광학(CPO) 기반 스위치라고 소개함
    • 목표는 100만 GPU 규모 AI 팩토리를 위한 네트워크 패브릭임
  • 스펙트럼-X 이더넷 포토닉스가 내세우는 수치도 공격적임

    • 기존 트랜시버 기반 네트워크 대비 전력 효율 5배 개선
    • AI 가동 시간 5배 증가
    • 배포 시간 1.3배 단축
    • 코어위브, 람다, 오라클 클라우드 인프라스트럭처 등이 초기 파트너로 언급됨
sequenceDiagram
    participant 사용자
    participant 에이전트
    participant 도구와검색
    participant 베라루빈
    participant 보안계층
    사용자->>에이전트: 목표가 담긴 프롬프트 입력
    에이전트->>도구와검색: 필요한 정보와 도구 호출
    도구와검색-->>에이전트: 검색 결과와 실행 결과 반환
    에이전트->>베라루빈: 추론과 응답 생성을 반복 처리
    베라루빈->>보안계층: 데이터 격리와 암호화 적용
    보안계층-->>에이전트: 검증된 실행 환경 제공
    에이전트-->>사용자: 최종 응답 반환

보안은 멀티테넌트 AI 공장 기준으로 설계

  • 베라 루빈에는 블루필드-4 DPU도 통합됨

    • 최대 800Gb/s 소프트웨어 정의 네트워킹을 제공함
    • 내장형 멀티테넌트 격리 기능이 포함됨
    • 고객은 100만 GPU AI 클러스터 전반에서 네트워크 운영과 테넌트 제어를 더 세밀하게 가져갈 수 있다는 설명임
  • 엔비디아는 AI 팩토리가 기업 고유 데이터, 규제 대상 콘텐츠, 미션 크리티컬 모델을 처리하게 된다고 봄

    • 그래서 공유 클라우드나 멀티테넌트 환경을 기본적으로 신뢰하지 않는 보안 모델이 필요하다는 입장임
    • 베라 루빈은 랙스케일 신뢰 실행 환경(TEE)을 위해 풀스택 컨피덴셜 컴퓨팅 기반으로 설계됐다고 밝힘
    • 베라 CPU, 루빈 GPU, NVLink 네트워킹, 보안 기능을 통합하고 고속 인터커넥트 전반에서 데이터를 암호화함

중요

> 엔비디아가 보안을 전면에 놓은 건 의미가 큼. 에이전트가 기업 내부 데이터와 도구를 직접 다루기 시작하면, GPU 성능만큼 테넌트 격리와 실행 환경 검증이 중요해짐.

  • DOCA 소프트웨어 플랫폼은 이 보안 기능을 랙과 AI 팩토리 계층 전반에 적용하는 역할임
    • 블루필드-4 하드웨어에서 직접 정책을 적용함
    • 데이터, 에이전트, 컨텍스트 메모리, AI 추론을 보호한다는 설명임
    • CPU 리소스를 쓰지 않고도 최대 800Gb/s 속도로 멀티테넌트 네트워크 격리, 제로 트러스트 정책, 런타임 위협 탐지, 종단간 암호화를 지원함

DSX는 데이터센터 설계까지 묶는 카드

  • 엔비디아 DSX 플랫폼은 베라 루빈 AI 팩토리의 설계와 운영 기반으로 제시됨

    • 레퍼런스 설계, 시뮬레이션, 인프라 소프트웨어, 설비, 생태계 기술을 통합함
    • 목표는 토큰 비용을 낮추는 에너지 효율적인 AI 팩토리 구축과 운영임
    • 실리콘과 시스템부터 수명주기 관리, 멀티테넌트 운영까지 스택 전체를 일관되게 조율한다는 메시지임
  • 이 발표의 진짜 포인트는 엔비디아가 칩을 넘어서 AI 인프라 전체를 제품화하고 있다는 점임

    • GPU, CPU, DPU, 네트워크, 보안, 스토리지, 운영 소프트웨어, 데이터센터 레퍼런스까지 한 묶음으로 감
    • 클라우드 사업자나 대형 AI 연구소 입장에서는 직접 조합하는 부담을 줄이는 대신, 엔비디아 스택 의존도는 더 깊어질 수 있음
    • 한국의 클라우드·AI 인프라 팀도 결국 비슷한 질문을 마주하게 됨. GPU를 얼마나 사느냐보다, 그걸 어떤 네트워크와 운영 모델로 묶느냐가 비용과 성능을 좌우함

기술 맥락

  • 베라 루빈의 선택은 “GPU를 더 빠르게”가 아니라 “에이전트 워크로드 전체를 더 많이 처리하게” 만드는 쪽이에요. 에이전틱 AI는 한 번의 요청 안에서 검색, 도구 호출, 추론이 여러 번 반복되거든요. 그래서 단일 칩 성능보다 랙 단위 처리량과 네트워크 병목 제거가 더 중요해져요.

  • 엔비디아가 공동 패키징 광학(CPO) 기반 스위치를 강조한 이유도 여기에 있어요. GPU가 100만 개 규모로 커지면 데이터 이동 비용과 전력이 계산 성능만큼 큰 문제가 돼요. 전력 효율 5배, 가동 시간 5배 같은 수치는 클러스터 운영비와 직결되기 때문에 클라우드 사업자 입장에선 꽤 민감한 포인트예요.

  • 블루필드-4와 DOCA를 같이 내세운 건 멀티테넌트 환경을 겨냥한 선택이에요. AI 팩토리는 여러 고객의 데이터와 모델을 한 인프라에서 돌릴 수밖에 없어요. 이때 CPU가 아니라 DPU에서 네트워크 격리, 암호화, 제로 트러스트 정책을 처리하면 성능 손실을 줄이면서 보안 경계를 더 단단하게 만들 수 있어요.

  • DSX까지 붙인 건 데이터센터 구축 자체를 제품화하려는 전략에 가까워요. 칩만 공급하면 고객이 전력, 냉각, 네트워크, 운영 자동화를 직접 맞춰야 해요. 엔비디아는 이 복잡도를 레퍼런스 설계와 운영 소프트웨어로 묶어서, 대형 고객이 더 빨리 AI 팩토리를 짓게 만들려는 거예요.

엔비디아가 이제 GPU 단품 회사가 아니라 ‘AI 데이터센터 전체 설계’를 파는 회사라는 게 더 선명해진 발표임. 모델 경쟁이 커질수록 병목은 칩 하나가 아니라 랙, 네트워크, 보안, 운영 자동화 전체로 이동하고 있음.

댓글

댓글

댓글을 불러오는 중...

ai-ml

젠슨 황 키노트에 네이버클라우드 등장, 엔비디아 AI 인프라 파트너로 부각

젠슨 황 엔비디아 최고경영자가 GTC 타이페이 2026 기조연설에서 네이버클라우드를 AI 네이티브 클라우드 주요 파트너로 소개했다. 하이퍼클로바X, 네이버 월드모델, AI 팩토리, 데이터센터 각까지 함께 언급되며 네이버의 AI 인프라 협력이 다시 주목받고 있다.

ai-ml

중국 AI, 한국 시장에 초저가로 진입…데이터 안보 리스크도 같이 커진다

미국 AI 기업이 선점한 한국 생성형 AI 시장에 미니맥스, 지푸AI 같은 중국 기업들이 가격과 콘텐츠 특화 기능을 앞세워 들어오고 있어. 토큰 비용은 미국 주요 모델 대비 최대 20분의 1 수준까지 내려가지만, 데이터 안보와 AI 공급망 종속 리스크도 같이 커진다는 게 핵심이야.

ai-ml

인텔, OpenVINO로 로봇용 피지컬 AI 배포 난이도 낮춘다

인텔이 컴퓨텍스 2026에 맞춰 OpenVINO 피지컬 AI 프레임워크와 로보틱스 AI 스위트 전략을 공개했어. 핵심은 로봇마다 따로 맞추던 센서, 추론, 제어 스택을 인텔 칩과 오픈소스 프레임워크 기반으로 단순화해 현장 배포를 쉽게 만들겠다는 거야.

ai-ml

엔비디아, 로봇·자율주행·공장 AI용 오픈소스 에이전트 스킬 공개

엔비디아가 컴퓨텍스 2026과 GTC 타이베이에서 피지컬 인공지능 개발용 오픈소스 에이전트 스킬과 도구 모음을 공개했다. 코스모스, 옴니버스, 아이작, 메트로폴리스, 젯슨 같은 엔비디아 스택을 코딩 에이전트가 직접 호출해 데이터 생성, 시뮬레이션, 학습, 평가, 배포를 자동화하게 만드는 구상이다.

ai-ml

국가AI전략위, AI 3대 강국 로드맵에 99개 과제와 9.9조 예산 공개

국가AI전략위원회가 출범 이후 성과로 대한민국 인공지능행동계획, 정부 AI 예산 통합 공개, 재해복구 체계 강화, 한-UAE 협력 확대를 제시했다. 99개 실행과제와 326개 정책권고, 41개 부처 741개 사업 9조9000억원 규모 예산이 핵심 숫자다.