---
title: "엔비디아 AI 클라우드, 6개 대륙으로 확장…AI 팩토리 경쟁이 더 커진다"
published: 2026-06-05T11:05:04.709Z
canonical: https://jeff.news/article/3729
---
# 엔비디아 AI 클라우드, 6개 대륙으로 확장…AI 팩토리 경쟁이 더 커진다

엔비디아가 카사바와 클라로 합류를 계기로 AI 클라우드 생태계를 6개 대륙으로 넓혔다고 밝혔어. 모델 학습, 파인튜닝, 추론, 에이전틱 AI, 피지컬 AI, 소버린 AI를 처리하는 지역별 AI 팩토리 인프라 경쟁이 본격화되는 흐름이야.

- 엔비디아가 AI 클라우드 생태계를 6개 대륙으로 확장했다고 밝혔음
  - 아프리카에서는 카사바, 남미에서는 클라로가 새로 합류함
  - 발표는 대만 컴퓨텍스 2026 기간에 열린 GTC 타이베이에서 나왔음
  - 엔비디아 표현대로라면 글로벌 AI 수요 증가에 맞춰 AI 팩토리 인프라를 넓히는 중임

- 여기서 AI 클라우드는 그냥 GPU 대여 서비스가 아니라 “토큰 수요를 처리하는 전용 생태계”에 가까움
  - 모델 훈련, 파인튜닝, 추론을 지원함
  - 에이전틱 AI, 피지컬 AI, 소버린 AI 배포까지 포함하는 풀스택 인프라로 포지셔닝함
  - 파트너사들이 토큰 비용 최소화와 와트당 처리량을 이유로 엔비디아 플랫폼을 채택하고 있다는 설명도 붙었음

> [!IMPORTANT]
> 엔비디아가 강조하는 경제성은 “GPU가 많다”가 아니라 “토큰을 얼마나 싸고 전력 효율적으로 뽑아내느냐”임. 생성형 AI 서비스가 늘수록 인프라 경쟁의 단위가 서버 대수에서 토큰 처리량으로 바뀌고 있음.

- 젠슨 황은 모든 기업과 국가가 데이터를 인텔리전스로 바꾸기 위한 AI 팩토리 인프라가 필요하다고 말했음
  - 모델 훈련부터 진행 중 추론, AI 에이전트까지 차세대 AI를 만들려면 지역·산업·개발자가 풀스택 AI 팩토리에 연결돼야 한다는 논리임
  - 이건 엔비디아가 국가 단위 소버린 AI 수요까지 정면으로 겨냥하고 있다는 얘기이기도 함

- 확장세는 동남아시아, 호주, 미주에서 특히 두드러진다고 함
  - 코어위브, 퍼머스, 아이렌, 엔스케일은 프론티어 모델과 대규모 추론용 인프라를 증설 중임
  - 파이어버드, GMI 클라우드, 인도삿 오레두 허치슨, 람다, 네이버 클라우드, 샤론 AI, 요타, YTL은 국가 AI 사업과 금융·통신·제조·교육·헬스케어 분야를 지원함
  - 한국 독자 입장에서는 네이버 클라우드가 이 글로벌 AI 클라우드 파트너 흐름 안에 들어가 있다는 점도 눈에 띔

- 호주의 퍼머스는 ‘프로젝트 사우스게이트’로 액체 냉각식 AI 팩토리를 짓고 있음
  - 지역은 타스매니아, 멜버른, 남호주, 뉴사우스웨일스임
  - AI 데이터센터가 전력과 냉각 싸움으로 가고 있다는 걸 보여주는 사례임

- 코어위브 쪽 스케일은 숫자가 꽤 세다
  - 베라 루빈과 베라 CPU를 초기 도입했음
  - 100만개 GPU 규모 AI 팩토리의 네트워킹 기반으로 스펙트럼-X 이더넷 포토닉스를 가장 먼저 적용함
  - 앤트로픽 등이 해당 인프라로 대규모 프론티어 모델을 구동하고 있음

- 네비우스는 추론과 피지컬 AI 쪽을 묶어 내세움
  - ‘토큰 팩토리’ 추론 레이어와 ‘피지컬 AI 워크벤치’를 통해 코스모스 3, 아이작 심, 아이작 GR00T를 통합했다고 함
  - 로봇·시뮬레이션·물리 세계 AI까지 엔비디아 생태계 안으로 끌어들이는 그림임

- 엔비디아 클라우드 파트너 중 엑셈플러 클라우드 자격을 획득한 곳은 6곳으로 늘었음
  - 코어위브, 크루소, 람다, 네비우스, 벌처, YTL이 해당됨
  - 인프라 구축과 운영에는 엔비디아 DSX 플랫폼이 쓰임

- DSX는 AI 데이터센터 운영을 꽤 노골적으로 제품화한 묶음임
  - DSX 심은 배포 전 검증용
  - DSX 플렉스는 전력망 연동형
  - DSX 맥스LPS는 제한된 전력에서 GPU를 최대 40% 더 가동하는 구성
  - DSX OS는 운영 자동화를 맡음

---

## 기술 맥락

- 엔비디아가 말하는 AI 클라우드는 단순한 클라우드 GPU 인스턴스가 아니에요. 모델 학습, 파인튜닝, 추론, 에이전트 실행까지 이어지는 전체 파이프라인을 특정 하드웨어와 네트워크, 운영 소프트웨어로 묶겠다는 전략이에요.

- 토큰 비용을 강조하는 이유는 생성형 AI 서비스의 비용이 결국 추론 호출에서 계속 쌓이기 때문이에요. 모델 한 번 학습하는 비용도 크지만, 사용자가 매일 요청을 보내면 토큰을 처리하는 인프라 효율이 서비스 원가를 좌우하거든요.

- 스펙트럼-X 같은 네트워킹이 중요해지는 것도 같은 이유예요. GPU가 100만개 규모로 늘어나면 개별 칩 성능보다 GPU 사이 통신 병목이 더 큰 문제가 될 수 있어요. 그래서 AI 팩토리는 컴퓨트만이 아니라 네트워크 설계까지 한 몸으로 봐야 해요.

- DSX 맥스LPS가 제한된 전력에서 GPU를 최대 40% 더 가동한다고 언급된 대목도 포인트예요. 앞으로 AI 데이터센터 경쟁은 칩을 얼마나 사느냐뿐 아니라, 전력 제약 안에서 얼마나 많은 추론을 안정적으로 처리하느냐의 싸움이 될 가능성이 커요.

## 핵심 포인트

- 엔비디아 AI 클라우드가 아프리카 카사바와 남미 클라로 합류로 6개 대륙 전역으로 확장
- AI 클라우드는 토큰 수요를 처리하기 위한 전용 생태계로 학습·파인튜닝·추론·AI 에이전트를 지원
- 코어위브는 100만개 GPU 규모 AI 팩토리 네트워킹 기반인 스펙트럼-X 이더넷 포토닉스를 초기 적용
- 엔비디아 클라우드 파트너 중 엑셈플러 클라우드 자격을 획득한 곳은 코어위브·크루소·람다·네비우스·벌처·YTL 등 6곳
- DSX 플랫폼은 배포 검증, 전력망 연동, 제한 전력 내 GPU 40% 추가 가동, 운영 자동화 구성요소를 포함

## 인사이트

엔비디아가 파는 건 이제 GPU 박스가 아니라 ‘토큰을 찍어내는 공장’ 전체에 가까워졌어. 개발자 입장에서는 모델 성능만 볼 게 아니라, 어느 지역의 어떤 AI 클라우드에서 추론 비용과 지연 시간이 맞는지가 점점 더 중요해질 듯해.