엔비디아 베라 루빈 양산 시작, 100만 GPU AI 팩토리 판 깐다

ai-ml 2026-06-01 약 9분

 tags

#nvidia #gpu #networking #confidential-computing #ai-infrastructure

vote

북마크

엔비디아가 에이전틱 AI 워크로드를 겨냥한 베라 루빈 플랫폼 양산에 들어갔다. 5개 전용 랙을 하나의 대규모 AI 슈퍼컴퓨터처럼 묶고, 이전 세대 그레이스 블랙웰 대비 10배 높은 에이전트 처리량을 내세운다.

1
베라 루빈은 베라 CPU, 루빈 GPU, 블루필드-4, 스펙트럼-6 이더넷 랙 등을 통합한 랙스케일 플랫폼
2
30개국 350개 이상 공장, 대만 150개 파트너가 생산 확대에 참여
3
스펙트럼-X 이더넷 포토닉스는 전력 효율 5배, AI 가동 시간 5배, 배포 시간 1.3배 개선을 주장
4
블루필드-4와 DOCA는 800Gb/s 네트워크 격리, 제로 트러스트 정책, 런타임 위협 탐지, 종단간 암호화를 제공

엔비디아가 베라 루빈을 양산 단계로 올림

엔비디아가 전 세계 에이전틱 AI 팩토리를 겨냥한 베라 루빈(Vera Rubin) 플랫폼 양산을 시작함
- 대상 고객은 AI 연구소, 클라우드 제공업체, 하이퍼스케일러임
- 대만의 주요 서버 제조사와 글로벌 공급망 기업들이 베라 루빈 기반 시스템을 대규모로 제조 중임
- 양산 제품 출하는 올해 가을부터 시작될 예정임
베라 루빈은 GPU 하나가 아니라 POD 규모 플랫폼으로 묶어서 파는 구조임
- 5개의 전용 랙이 하나의 대규모 AI 슈퍼컴퓨터처럼 작동함
- 구성 요소는 베라 CPU, 루빈 GPU, 블루필드-4 DPU, 스펙트럼-6 이더넷 랙, 스토리지 쪽 구성까지 포함됨
- 엔비디아는 대규모 환경에서 이전 세대 그레이스 블랙웰(Grace Blackwell) 대비 에이전트 처리량이 10배 높다고 밝힘

❗중요

> 핵심 숫자는 “10배 에이전트 처리량”임. 엔비디아가 말하는 다음 병목은 단순 토큰 생성 속도가 아니라, 에이전트가 추론·검색·도구 호출을 반복하는 전체 처리량임.

젠슨 황은 에이전틱 AI를 “새로운 유형의 워크로드”라고 규정함
- 프롬프트 하나가 추론, 검색, 도구 활용, 응답 생성으로 이어지는 수천 단계의 여정을 만들 수 있다는 설명임
- 그러니까 서버 한두 대 빠르게 만드는 문제가 아니라, 대규모 인텔리전스를 굴리는 공장형 인프라가 필요하다는 논리임

생산망도 이미 크게 깔아둠

베라 루빈은 3세대 엔비디아 MGX 랙스케일 시스템임
- 오픈소스 MGX 설계를 기반으로 생산 생태계를 확장 중임
- 30개국 350개 이상 공장에서 생산 확대가 진행되고 있음
- 대만에서만 150개 파트너가 참여한다는 숫자가 꽤 큼
참여사 목록도 서버·스토리지·클라우드 인프라 쪽을 거의 총동원한 느낌임
- 델, HPE, 레노버, 슈퍼마이크로가 포함됨
- 폭스콘, 기가바이트, 콴타 클라우드 테크놀로지(QCT), 위스트론, 위윈 같은 제조 파트너도 들어감
- 넷앱, 바스트 데이터, 웨카, 미니오, DDN 같은 스토리지·데이터 인프라 회사도 언급됨

100만 GPU 클러스터를 위한 네트워크가 핵심 포인트

베라 루빈 플랫폼은 스케일아웃과 스케일어크로스 AI 팩토리 배포를 염두에 둠
- 이를 위해 스펙트럼-X 이더넷 포토닉스(Spectrum-X Ethernet Photonics)를 도입함
- 엔비디아는 이걸 200Gb/s 서데스(SerDes)를 탑재한 세계 최초의 공동 패키징 광학(CPO) 기반 스위치라고 소개함
- 목표는 100만 GPU 규모 AI 팩토리를 위한 네트워크 패브릭임
스펙트럼-X 이더넷 포토닉스가 내세우는 수치도 공격적임
- 기존 트랜시버 기반 네트워크 대비 전력 효율 5배 개선
- AI 가동 시간 5배 증가
- 배포 시간 1.3배 단축
- 코어위브, 람다, 오라클 클라우드 인프라스트럭처 등이 초기 파트너로 언급됨

sequenceDiagram
    participant 사용자
    participant 에이전트
    participant 도구와검색
    participant 베라루빈
    participant 보안계층
    사용자->>에이전트: 목표가 담긴 프롬프트 입력
    에이전트->>도구와검색: 필요한 정보와 도구 호출
    도구와검색-->>에이전트: 검색 결과와 실행 결과 반환
    에이전트->>베라루빈: 추론과 응답 생성을 반복 처리
    베라루빈->>보안계층: 데이터 격리와 암호화 적용
    보안계층-->>에이전트: 검증된 실행 환경 제공
    에이전트-->>사용자: 최종 응답 반환

보안은 멀티테넌트 AI 공장 기준으로 설계

베라 루빈에는 블루필드-4 DPU도 통합됨
- 최대 800Gb/s 소프트웨어 정의 네트워킹을 제공함
- 내장형 멀티테넌트 격리 기능이 포함됨
- 고객은 100만 GPU AI 클러스터 전반에서 네트워크 운영과 테넌트 제어를 더 세밀하게 가져갈 수 있다는 설명임
엔비디아는 AI 팩토리가 기업 고유 데이터, 규제 대상 콘텐츠, 미션 크리티컬 모델을 처리하게 된다고 봄
- 그래서 공유 클라우드나 멀티테넌트 환경을 기본적으로 신뢰하지 않는 보안 모델이 필요하다는 입장임
- 베라 루빈은 랙스케일 신뢰 실행 환경(TEE)을 위해 풀스택 컨피덴셜 컴퓨팅 기반으로 설계됐다고 밝힘
- 베라 CPU, 루빈 GPU, NVLink 네트워킹, 보안 기능을 통합하고 고속 인터커넥트 전반에서 데이터를 암호화함

❗중요

> 엔비디아가 보안을 전면에 놓은 건 의미가 큼. 에이전트가 기업 내부 데이터와 도구를 직접 다루기 시작하면, GPU 성능만큼 테넌트 격리와 실행 환경 검증이 중요해짐.

DOCA 소프트웨어 플랫폼은 이 보안 기능을 랙과 AI 팩토리 계층 전반에 적용하는 역할임
- 블루필드-4 하드웨어에서 직접 정책을 적용함
- 데이터, 에이전트, 컨텍스트 메모리, AI 추론을 보호한다는 설명임
- CPU 리소스를 쓰지 않고도 최대 800Gb/s 속도로 멀티테넌트 네트워크 격리, 제로 트러스트 정책, 런타임 위협 탐지, 종단간 암호화를 지원함

DSX는 데이터센터 설계까지 묶는 카드

엔비디아 DSX 플랫폼은 베라 루빈 AI 팩토리의 설계와 운영 기반으로 제시됨
- 레퍼런스 설계, 시뮬레이션, 인프라 소프트웨어, 설비, 생태계 기술을 통합함
- 목표는 토큰 비용을 낮추는 에너지 효율적인 AI 팩토리 구축과 운영임
- 실리콘과 시스템부터 수명주기 관리, 멀티테넌트 운영까지 스택 전체를 일관되게 조율한다는 메시지임
이 발표의 진짜 포인트는 엔비디아가 칩을 넘어서 AI 인프라 전체를 제품화하고 있다는 점임
- GPU, CPU, DPU, 네트워크, 보안, 스토리지, 운영 소프트웨어, 데이터센터 레퍼런스까지 한 묶음으로 감
- 클라우드 사업자나 대형 AI 연구소 입장에서는 직접 조합하는 부담을 줄이는 대신, 엔비디아 스택 의존도는 더 깊어질 수 있음
- 한국의 클라우드·AI 인프라 팀도 결국 비슷한 질문을 마주하게 됨. GPU를 얼마나 사느냐보다, 그걸 어떤 네트워크와 운영 모델로 묶느냐가 비용과 성능을 좌우함

기술 맥락

베라 루빈의 선택은 “GPU를 더 빠르게”가 아니라 “에이전트 워크로드 전체를 더 많이 처리하게” 만드는 쪽이에요. 에이전틱 AI는 한 번의 요청 안에서 검색, 도구 호출, 추론이 여러 번 반복되거든요. 그래서 단일 칩 성능보다 랙 단위 처리량과 네트워크 병목 제거가 더 중요해져요.
엔비디아가 공동 패키징 광학(CPO) 기반 스위치를 강조한 이유도 여기에 있어요. GPU가 100만 개 규모로 커지면 데이터 이동 비용과 전력이 계산 성능만큼 큰 문제가 돼요. 전력 효율 5배, 가동 시간 5배 같은 수치는 클러스터 운영비와 직결되기 때문에 클라우드 사업자 입장에선 꽤 민감한 포인트예요.
블루필드-4와 DOCA를 같이 내세운 건 멀티테넌트 환경을 겨냥한 선택이에요. AI 팩토리는 여러 고객의 데이터와 모델을 한 인프라에서 돌릴 수밖에 없어요. 이때 CPU가 아니라 DPU에서 네트워크 격리, 암호화, 제로 트러스트 정책을 처리하면 성능 손실을 줄이면서 보안 경계를 더 단단하게 만들 수 있어요.
DSX까지 붙인 건 데이터센터 구축 자체를 제품화하려는 전략에 가까워요. 칩만 공급하면 고객이 전력, 냉각, 네트워크, 운영 자동화를 직접 맞춰야 해요. 엔비디아는 이 복잡도를 레퍼런스 설계와 운영 소프트웨어로 묶어서, 대형 고객이 더 빨리 AI 팩토리를 짓게 만들려는 거예요.

엔비디아가 이제 GPU 단품 회사가 아니라 ‘AI 데이터센터 전체 설계’를 파는 회사라는 게 더 선명해진 발표임. 모델 경쟁이 커질수록 병목은 칩 하나가 아니라 랙, 네트워크, 보안, 운영 자동화 전체로 이동하고 있음.

이전 기사 (P)

다음 기사 (N)

댓글을 불러오는 중...

ai-ml 2026-07-13

애플 새 음성 인식 API, 온디바이스 영어 전사에서 위스퍼 스몰까지 이겼다

애플의 새 음성 인식 API인 스피치애널라이저가 리브리스피치 벤치마크에서 기존 SFSpeechRecognizer는 물론 위스퍼 스몰보다도 낮은 단어 오류율을 기록했어. 깨끗한 음성에서는 2.12%, noisy 음성에서는 4.56%로, 기존 애플 API 대비 오류율을 3.5~4배 줄였고 위스퍼 스몰보다 약 3배 빠르게 돌았어. 다만 영어·애플 플랫폼·OS 26 조건의 결과라, 다국어와 크로스플랫폼에서는 여전히 위스퍼의 장점이 남아 있어.

ai-ml 2026-07-13

AI를 진짜 잘 쓰는 기업, 미국 증시에서 연 30% 프리미엄 받는다는 연구

예일대와 로체스터대 연구진이 기업의 실제 대형 언어 모델 사용 데이터를 분석했더니, AI 활용도가 높은 상위 20% 기업이 하위 20%보다 주당 평균 0.64% 높은 초과수익률을 냈다. 단순히 AI 기업이냐가 아니라, 업무에 AI를 얼마나 깊게 쓰는지가 시장 가치에 반영되고 있다는 얘기다.

ai-ml 2026-07-13

ZTE, AI 에이전트폰으로 스마트폰 재도전…진짜 승부처는 앱 생태계

ZTE가 바이트댄스의 더우바오를 탑재한 AI 에이전트 스마트폰으로 시장 재진입을 노린다. 핵심은 사용자가 명령하면 AI가 여러 앱을 직접 열고 조작하는 방식인데, 위챗·타오바오·알리페이 같은 플랫폼과 충돌하면서 생태계 문제가 가장 큰 변수로 떠올랐다.

ai-ml 2026-07-13

노벨상 학자들까지 “AI 경제 충격, 지금 제도 안 만들면 늦다”

노벨 경제학상 수상자 15명을 포함한 학자와 기술 업계 인사 약 200명이 AI가 향후 10년 안에 경제를 급격히 바꿀 수 있다며 정책 대응을 촉구했다. 이들은 산업혁명보다 큰 변화가 훨씬 짧은 시간에 올 수 있고, 대규모 일자리 대체와 생활 수준 향상이라는 양면성이 동시에 존재한다고 봤다.

ai-ml 2026-07-13

NHN, AI 데이터센터 매출 기대감에 목표주가 5만6000원으로 상향

한국투자증권이 NHN의 목표주가를 4만5000원에서 5만6000원으로 올리고 투자의견 매수를 유지했다. 핵심 근거는 양평 AI 데이터센터 가동, 공공·민간 GPU 클러스터 수주 확대, 클라우드 사업부 신규 매출 반영이다.

엔비디아 베라 루빈 양산 시작, 100만 GPU AI 팩토리 판 깐다

요약

핵심 포인트

핵심 개념

분석

엔비디아가 베라 루빈을 양산 단계로 올림

생산망도 이미 크게 깔아둠

100만 GPU 클러스터를 위한 네트워크가 핵심 포인트

보안은 멀티테넌트 AI 공장 기준으로 설계

DSX는 데이터센터 설계까지 묶는 카드

기술 맥락

인사이트

댓글

댓글

엔비디아 베라 루빈 양산 시작, 100만 GPU AI 팩토리 판 깐다

요약

핵심 포인트

핵심 개념

분석

엔비디아가 베라 루빈을 양산 단계로 올림

생산망도 이미 크게 깔아둠

100만 GPU 클러스터를 위한 네트워크가 핵심 포인트

보안은 멀티테넌트 AI 공장 기준으로 설계

DSX는 데이터센터 설계까지 묶는 카드

기술 맥락

인사이트

댓글

댓글

관련 기사