---
title: "엔비디아 베라 루빈 양산 시작, 100만 GPU AI 팩토리 판 깐다"
published: 2026-06-01T06:05:01.366Z
canonical: https://jeff.news/article/3543
---
# 엔비디아 베라 루빈 양산 시작, 100만 GPU AI 팩토리 판 깐다

엔비디아가 에이전틱 AI 워크로드를 겨냥한 베라 루빈 플랫폼 양산에 들어갔다. 5개 전용 랙을 하나의 대규모 AI 슈퍼컴퓨터처럼 묶고, 이전 세대 그레이스 블랙웰 대비 10배 높은 에이전트 처리량을 내세운다.

## 엔비디아가 베라 루빈을 양산 단계로 올림

- 엔비디아가 전 세계 에이전틱 AI 팩토리를 겨냥한 베라 루빈(Vera Rubin) 플랫폼 양산을 시작함
  - 대상 고객은 AI 연구소, 클라우드 제공업체, 하이퍼스케일러임
  - 대만의 주요 서버 제조사와 글로벌 공급망 기업들이 베라 루빈 기반 시스템을 대규모로 제조 중임
  - 양산 제품 출하는 올해 가을부터 시작될 예정임

- 베라 루빈은 GPU 하나가 아니라 POD 규모 플랫폼으로 묶어서 파는 구조임
  - 5개의 전용 랙이 하나의 대규모 AI 슈퍼컴퓨터처럼 작동함
  - 구성 요소는 베라 CPU, 루빈 GPU, 블루필드-4 DPU, 스펙트럼-6 이더넷 랙, 스토리지 쪽 구성까지 포함됨
  - 엔비디아는 대규모 환경에서 이전 세대 그레이스 블랙웰(Grace Blackwell) 대비 에이전트 처리량이 10배 높다고 밝힘

> [!IMPORTANT]
> 핵심 숫자는 “10배 에이전트 처리량”임. 엔비디아가 말하는 다음 병목은 단순 토큰 생성 속도가 아니라, 에이전트가 추론·검색·도구 호출을 반복하는 전체 처리량임.

- 젠슨 황은 에이전틱 AI를 “새로운 유형의 워크로드”라고 규정함
  - 프롬프트 하나가 추론, 검색, 도구 활용, 응답 생성으로 이어지는 수천 단계의 여정을 만들 수 있다는 설명임
  - 그러니까 서버 한두 대 빠르게 만드는 문제가 아니라, 대규모 인텔리전스를 굴리는 공장형 인프라가 필요하다는 논리임

## 생산망도 이미 크게 깔아둠

- 베라 루빈은 3세대 엔비디아 MGX 랙스케일 시스템임
  - 오픈소스 MGX 설계를 기반으로 생산 생태계를 확장 중임
  - 30개국 350개 이상 공장에서 생산 확대가 진행되고 있음
  - 대만에서만 150개 파트너가 참여한다는 숫자가 꽤 큼

- 참여사 목록도 서버·스토리지·클라우드 인프라 쪽을 거의 총동원한 느낌임
  - 델, HPE, 레노버, 슈퍼마이크로가 포함됨
  - 폭스콘, 기가바이트, 콴타 클라우드 테크놀로지(QCT), 위스트론, 위윈 같은 제조 파트너도 들어감
  - 넷앱, 바스트 데이터, 웨카, 미니오, DDN 같은 스토리지·데이터 인프라 회사도 언급됨

## 100만 GPU 클러스터를 위한 네트워크가 핵심 포인트

- 베라 루빈 플랫폼은 스케일아웃과 스케일어크로스 AI 팩토리 배포를 염두에 둠
  - 이를 위해 스펙트럼-X 이더넷 포토닉스(Spectrum-X Ethernet Photonics)를 도입함
  - 엔비디아는 이걸 200Gb/s 서데스(SerDes)를 탑재한 세계 최초의 공동 패키징 광학(CPO) 기반 스위치라고 소개함
  - 목표는 100만 GPU 규모 AI 팩토리를 위한 네트워크 패브릭임

- 스펙트럼-X 이더넷 포토닉스가 내세우는 수치도 공격적임
  - 기존 트랜시버 기반 네트워크 대비 전력 효율 5배 개선
  - AI 가동 시간 5배 증가
  - 배포 시간 1.3배 단축
  - 코어위브, 람다, 오라클 클라우드 인프라스트럭처 등이 초기 파트너로 언급됨

```mermaid
sequenceDiagram
    participant 사용자
    participant 에이전트
    participant 도구와검색
    participant 베라루빈
    participant 보안계층
    사용자->>에이전트: 목표가 담긴 프롬프트 입력
    에이전트->>도구와검색: 필요한 정보와 도구 호출
    도구와검색-->>에이전트: 검색 결과와 실행 결과 반환
    에이전트->>베라루빈: 추론과 응답 생성을 반복 처리
    베라루빈->>보안계층: 데이터 격리와 암호화 적용
    보안계층-->>에이전트: 검증된 실행 환경 제공
    에이전트-->>사용자: 최종 응답 반환
```

## 보안은 멀티테넌트 AI 공장 기준으로 설계

- 베라 루빈에는 블루필드-4 DPU도 통합됨
  - 최대 800Gb/s 소프트웨어 정의 네트워킹을 제공함
  - 내장형 멀티테넌트 격리 기능이 포함됨
  - 고객은 100만 GPU AI 클러스터 전반에서 네트워크 운영과 테넌트 제어를 더 세밀하게 가져갈 수 있다는 설명임

- 엔비디아는 AI 팩토리가 기업 고유 데이터, 규제 대상 콘텐츠, 미션 크리티컬 모델을 처리하게 된다고 봄
  - 그래서 공유 클라우드나 멀티테넌트 환경을 기본적으로 신뢰하지 않는 보안 모델이 필요하다는 입장임
  - 베라 루빈은 랙스케일 신뢰 실행 환경(TEE)을 위해 풀스택 컨피덴셜 컴퓨팅 기반으로 설계됐다고 밝힘
  - 베라 CPU, 루빈 GPU, NVLink 네트워킹, 보안 기능을 통합하고 고속 인터커넥트 전반에서 데이터를 암호화함

> [!IMPORTANT]
> 엔비디아가 보안을 전면에 놓은 건 의미가 큼. 에이전트가 기업 내부 데이터와 도구를 직접 다루기 시작하면, GPU 성능만큼 테넌트 격리와 실행 환경 검증이 중요해짐.

- DOCA 소프트웨어 플랫폼은 이 보안 기능을 랙과 AI 팩토리 계층 전반에 적용하는 역할임
  - 블루필드-4 하드웨어에서 직접 정책을 적용함
  - 데이터, 에이전트, 컨텍스트 메모리, AI 추론을 보호한다는 설명임
  - CPU 리소스를 쓰지 않고도 최대 800Gb/s 속도로 멀티테넌트 네트워크 격리, 제로 트러스트 정책, 런타임 위협 탐지, 종단간 암호화를 지원함

## DSX는 데이터센터 설계까지 묶는 카드

- 엔비디아 DSX 플랫폼은 베라 루빈 AI 팩토리의 설계와 운영 기반으로 제시됨
  - 레퍼런스 설계, 시뮬레이션, 인프라 소프트웨어, 설비, 생태계 기술을 통합함
  - 목표는 토큰 비용을 낮추는 에너지 효율적인 AI 팩토리 구축과 운영임
  - 실리콘과 시스템부터 수명주기 관리, 멀티테넌트 운영까지 스택 전체를 일관되게 조율한다는 메시지임

- 이 발표의 진짜 포인트는 엔비디아가 칩을 넘어서 AI 인프라 전체를 제품화하고 있다는 점임
  - GPU, CPU, DPU, 네트워크, 보안, 스토리지, 운영 소프트웨어, 데이터센터 레퍼런스까지 한 묶음으로 감
  - 클라우드 사업자나 대형 AI 연구소 입장에서는 직접 조합하는 부담을 줄이는 대신, 엔비디아 스택 의존도는 더 깊어질 수 있음
  - 한국의 클라우드·AI 인프라 팀도 결국 비슷한 질문을 마주하게 됨. GPU를 얼마나 사느냐보다, 그걸 어떤 네트워크와 운영 모델로 묶느냐가 비용과 성능을 좌우함

---

## 기술 맥락

- 베라 루빈의 선택은 “GPU를 더 빠르게”가 아니라 “에이전트 워크로드 전체를 더 많이 처리하게” 만드는 쪽이에요. 에이전틱 AI는 한 번의 요청 안에서 검색, 도구 호출, 추론이 여러 번 반복되거든요. 그래서 단일 칩 성능보다 랙 단위 처리량과 네트워크 병목 제거가 더 중요해져요.

- 엔비디아가 공동 패키징 광학(CPO) 기반 스위치를 강조한 이유도 여기에 있어요. GPU가 100만 개 규모로 커지면 데이터 이동 비용과 전력이 계산 성능만큼 큰 문제가 돼요. 전력 효율 5배, 가동 시간 5배 같은 수치는 클러스터 운영비와 직결되기 때문에 클라우드 사업자 입장에선 꽤 민감한 포인트예요.

- 블루필드-4와 DOCA를 같이 내세운 건 멀티테넌트 환경을 겨냥한 선택이에요. AI 팩토리는 여러 고객의 데이터와 모델을 한 인프라에서 돌릴 수밖에 없어요. 이때 CPU가 아니라 DPU에서 네트워크 격리, 암호화, 제로 트러스트 정책을 처리하면 성능 손실을 줄이면서 보안 경계를 더 단단하게 만들 수 있어요.

- DSX까지 붙인 건 데이터센터 구축 자체를 제품화하려는 전략에 가까워요. 칩만 공급하면 고객이 전력, 냉각, 네트워크, 운영 자동화를 직접 맞춰야 해요. 엔비디아는 이 복잡도를 레퍼런스 설계와 운영 소프트웨어로 묶어서, 대형 고객이 더 빨리 AI 팩토리를 짓게 만들려는 거예요.

## 핵심 포인트

- 베라 루빈은 베라 CPU, 루빈 GPU, 블루필드-4, 스펙트럼-6 이더넷 랙 등을 통합한 랙스케일 플랫폼
- 30개국 350개 이상 공장, 대만 150개 파트너가 생산 확대에 참여
- 스펙트럼-X 이더넷 포토닉스는 전력 효율 5배, AI 가동 시간 5배, 배포 시간 1.3배 개선을 주장
- 블루필드-4와 DOCA는 800Gb/s 네트워크 격리, 제로 트러스트 정책, 런타임 위협 탐지, 종단간 암호화를 제공

## 인사이트

엔비디아가 이제 GPU 단품 회사가 아니라 ‘AI 데이터센터 전체 설계’를 파는 회사라는 게 더 선명해진 발표임. 모델 경쟁이 커질수록 병목은 칩 하나가 아니라 랙, 네트워크, 보안, 운영 자동화 전체로 이동하고 있음.