엔비디아 AI 클라우드, 6개 대륙으로 확장…AI 팩토리 경쟁 본격화

ai-ml 2026-06-04 약 9분

 tags

#nvidia #cloud #inference #robotics #datacenter

vote

북마크

엔비디아가 자사 가속 컴퓨팅, 네트워킹, AI 소프트웨어를 묶은 AI 클라우드 생태계가 전 세계로 확장되고 있다고 밝혔다. 파트너들은 모델 훈련, 파인튜닝, 추론, 에이전틱 AI, 피지컬 AI, 소버린 AI를 위한 AI 팩토리 인프라를 확대 중이다. 핵심 메시지는 이제 AI 인프라 경쟁의 기준이 단순 GPU 수가 아니라 토큰당 비용, 전력 효율, 운영 자동화, 지역별 데이터 접근성으로 옮겨가고 있다는 점이다.

1
엔비디아 AI 클라우드는 카사바와 클라로 합류로 6개 대륙으로 확장됐다고 밝혔다.
2
코어위브, 퍼머스, 네비우스 등 파트너사가 프론티어 모델, 에이전틱 AI, 피지컬 AI 워크로드를 위한 인프라를 키우고 있다.
3
코어위브는 100만 개 GPU 규모 AI 팩토리를 위한 네트워킹 기반으로 엔비디아 스펙트럼-X 이더넷 포토닉스를 도입한 초기 기업 중 하나로 소개됐다.
4
엔비디아 DSX 맥스엘피에스는 전력 제한 환경에서 고정 전력 예산 내 GPU를 최대 40% 더 많이 가동하도록 돕는다고 설명됐다.

엔비디아가 말하는 AI 클라우드는 “GPU 빌려주는 곳”보다 훨씬 큰 그림임

엔비디아 AI 클라우드 생태계가 글로벌 AI 팩토리 인프라 확장을 가속화하고 있다고 밝힘
- 대상은 기업, 스타트업, 국가, AI 연구소, 개발자까지 꽤 넓음
- 수요의 중심에는 에이전틱 AI 애플리케이션과 폭발적인 토큰 수요가 있음
- 엔비디아는 이 클라우드를 자사 가속 컴퓨팅, 네트워킹, AI 소프트웨어를 결합한 전용 클라우드 생태계로 설명함
이 인프라가 지원하려는 워크로드도 단순 훈련에만 머물지 않음
- 모델 훈련, 파인튜닝, 추론, 에이전틱 AI, 피지컬 AI, 소버린 AI 배포까지 포함됨
- 구성은 파트너사와 워크로드별로 다르지만, 공통 목표는 토큰 비용을 낮추고 와트당 처리량을 높이는 것임

❗중요

> 엔비디아가 강조하는 AI 인프라 경제성의 기준은 “GPU가 몇 개냐”가 아니라 토큰당 비용, 와트당 처리량, 가동 시간, 실제 업무에 투입 가능한 에이전트의 범위로 이동하고 있음.

생태계는 6개 대륙으로 넓어졌고, 지역 AI 인프라가 키워드임

엔비디아 AI 클라우드는 이제 6개 대륙으로 확장됐다고 설명함
- 아프리카의 카사바와 남미의 클라로가 합류하면서 지역 범위가 넓어짐
- 동남아시아, 호주, 미주 전역에서도 지역 성장이 가속화되고 있다고 밝힘
파트너 구성도 꽤 다양함
- 코어위브, 퍼머스, 아이렌, 네비우스, 엔스케일 등은 프론티어 모델 개발, 기업용 AI, 에이전틱 애플리케이션, 대규모 추론을 지원하기 위해 인프라를 확장 중임
- 파이어버드, 지엠아이 클라우드, 인도삿 오레두 허치슨, 람다, 네이버 클라우드, 샤론 AI, 요타, 와이티엘 등은 지역 산업과 국가 AI 이니셔티브를 지원하는 파트너로 소개됨
- 금융, 통신, 제조, 교육, 헬스케어, 개발자 생태계까지 대상 산업도 넓게 잡힘
정부와 규제 산업에서는 지역 AI 클라우드가 더 중요해짐
- 데이터와 사용자가 있는 곳 가까이에서 AI 인프라를 운영해야 지연 시간, 데이터 통제, 컴플라이언스 요구를 맞추기 쉬움
- 엔비디아는 이를 소버린 통제권과 현지 규제 대응의 문제로 설명함

퍼머스는 아시아·태평양에 액체 냉각 AI 팩토리를 깔고 있음

퍼머스 테크놀로지는 호주와 동남아시아 전역으로 AI 팩토리 입지를 넓히고 있음
- 대규모 훈련, 추론, 에이전틱 AI 워크로드 수요 증가에 대응하는 에너지 효율적 인프라가 목표임
- 프로젝트 사우스게이트를 통해 타스매니아, 멜버른, 남호주, 뉴사우스웨일스에 AI 팩토리를 개발 중임
- 재생 에너지, 첨단 냉각, 빠르게 가동 가능한 모듈형 인프라를 강조함
퍼머스 하이퍼큐브는 액체 냉각 기반 모듈형 AI 팩토리로 소개됨
- 엔비디아 DSX 플랫폼과 맞춰 설계됐고, AI 팩토리 구축 속도를 높이고 토큰 비용을 최소화하는 게 목적임
- 퍼머스는 냉각과 에너지를 포함한 공급망 전반에서 혁신을 계속하겠다고 밝힘

코어위브와 네비우스는 피지컬 AI와 추론 레이어로 확장 중임

코어위브는 차세대 에이전틱 AI, 피지컬 AI, 프론티어 모델 워크로드를 위해 엔비디아 AI 클라우드 플랫폼을 확장하고 있음
- 엔비디아 베라 루빈과 베라 CPU를 초기 도입한 기업으로 소개됨
- 엔비디아 스펙트럼-X 이더넷 포토닉스를 가장 먼저 도입한 기업 중 하나로, 100만 개 GPU 규모 AI 팩토리를 위한 네트워킹 기반을 제공한다고 설명됨
- 엔비디아 코스모스 3를 포함해 로보틱스와 피지컬 AI 워크플로우용 플랫폼도 확장 중임
- 앤트로픽 같은 AI 연구소도 대규모 프론티어 모델 구동에 코어위브 인프라를 활용한다고 언급됨
네비우스는 모델 훈련, 추론, 피지컬 AI 개발을 위한 풀스택 플랫폼을 밀고 있음
- 자체 네비우스 AI 클라우드, 토큰 팩토리 추론 레이어, 피지컬 AI 워크벤치를 포함함
- 피지컬 AI 워크벤치는 엔비디아 코스모스 3, 아이작 심, 아이작 그루트 같은 기술을 구성 가능한 워크플로우로 연결함
- 목표는 로보틱스와 자율 시스템 개발 팀이 시뮬레이션과 합성 데이터 단계에서 훈련과 평가 단계로 더 빠르게 넘어가게 하는 것임

DSX는 AI 팩토리 운영을 표준화하려는 플랫폼에 가까움

엔비디아 DSX는 AI 팩토리 설계, 구축, 운영을 위한 플랫폼으로 소개됨
- 검증된 레퍼런스 디자인, 시뮬레이션, 소프트웨어, 생태계 기술을 결합함
- 클라우드 제공업체가 인프라를 더 빨리 가동하고 효율적으로 운영하며 수익을 극대화하도록 돕는다는 설명임
DSX 안에서도 역할이 나뉨
- DSX 심은 배포 전 AI 팩토리를 모델링하고 검증하는 데 쓰임
- DSX 플렉스는 전력망 조건에 맞춰 워크로드를 동적으로 조정함
- DSX 맥스엘피에스는 전력이 제한된 AI 팩토리에서 고정 전력 예산 안에 GPU를 최대 40% 더 많이 가동하도록 돕는다고 설명됨
- DSX OS는 대규모 라이프사이클 관리와 운영 자동화를 담당함

💡팁

> AI 클라우드 비용을 비교할 때는 시간당 GPU 가격만 보면 부족함. 실제 서비스에서는 토큰당 비용, 전력 제약, 네트워크, 운영 자동화, 모델 배포 속도가 같이 비용을 만든다.

결론은 엔비디아가 “AI 인프라 운영 모델”까지 팔고 있다는 것

엔비디아의 메시지는 명확함. AI의 중심이 모델 개발에서 추론과 대용량 추론으로 이동하고 있다는 것
- 그래서 인프라 평가는 발표된 용량보다 플랫폼 활용도, 가동 시간, 자산 수명, 실제 업무에 투입 가능한 에이전트의 범위로 바뀐다고 봄
- 토큰당 비용은 하드웨어 성능, 소프트웨어 최적화, 생태계 지원, 실제 활용도를 반영하는 총소유비용 지표로 제시됨
개발자 입장에서는 클라우드 AI 선택 기준이 더 복잡해졌다는 뜻임
- 모델 훈련만 할 건지, 지속적인 추론 서비스를 돌릴 건지, 로봇·시뮬레이션 같은 피지컬 AI까지 갈 건지에 따라 인프라 선택지가 달라짐
- 지역 데이터 요구사항이나 규제 산업 컴플라이언스가 있으면 소버린 AI 클라우드도 고려 대상이 됨

기술 맥락

엔비디아가 선택한 방향은 단품 GPU 판매보다 AI 팩토리 전체를 같이 설계하는 쪽이에요. 훈련, 추론, 네트워킹, 냉각, 전력 조정, 운영 자동화가 따로 놀면 토큰당 비용이 올라가고 인프라 가동도 늦어지거든요.
DSX가 중요한 이유는 AI 데이터센터를 짓는 과정 자체가 복잡해졌기 때문이에요. 배포 전 시뮬레이션, 전력망 조건에 맞춘 워크로드 조정, 고정 전력 예산 안에서 GPU를 더 많이 돌리는 최적화가 없으면 대규모 인프라가 있어도 경제성이 떨어져요.
코어위브와 네비우스 사례는 AI 클라우드가 범용 GPU 임대에서 워크로드별 플랫폼으로 바뀌는 흐름을 보여줘요. 프론티어 모델 추론, 에이전트, 로보틱스, 합성 데이터 워크플로우는 필요한 네트워크와 소프트웨어 스택이 서로 다르기 때문이에요.
소버린 AI와 지역 클라우드가 같이 언급되는 것도 같은 맥락이에요. 정부나 규제 산업은 데이터가 어디에 있고 누가 운영하는지를 따져야 하니까, 단순히 가장 싼 글로벌 리전보다 현지 컴플라이언스와 데이터 접근성이 더 중요해질 수 있어요.

엔비디아가 파는 건 이제 칩 하나가 아니라 ‘AI 공장 운영체제’에 가까워지고 있다. 한국 개발자 입장에서도 클라우드 AI 비용을 볼 때 GPU 시간당 단가만 보면 안 되고, 토큰당 비용과 전력 제약, 데이터 위치, 추론 레이어까지 같이 봐야 한다.

이전 기사 (P)

다음 기사 (N)

댓글을 불러오는 중...

ai-ml 2026-07-13

애플 새 음성 인식 API, 온디바이스 영어 전사에서 위스퍼 스몰까지 이겼다

애플의 새 음성 인식 API인 스피치애널라이저가 리브리스피치 벤치마크에서 기존 SFSpeechRecognizer는 물론 위스퍼 스몰보다도 낮은 단어 오류율을 기록했어. 깨끗한 음성에서는 2.12%, noisy 음성에서는 4.56%로, 기존 애플 API 대비 오류율을 3.5~4배 줄였고 위스퍼 스몰보다 약 3배 빠르게 돌았어. 다만 영어·애플 플랫폼·OS 26 조건의 결과라, 다국어와 크로스플랫폼에서는 여전히 위스퍼의 장점이 남아 있어.

ai-ml 2026-07-13

AI를 진짜 잘 쓰는 기업, 미국 증시에서 연 30% 프리미엄 받는다는 연구

예일대와 로체스터대 연구진이 기업의 실제 대형 언어 모델 사용 데이터를 분석했더니, AI 활용도가 높은 상위 20% 기업이 하위 20%보다 주당 평균 0.64% 높은 초과수익률을 냈다. 단순히 AI 기업이냐가 아니라, 업무에 AI를 얼마나 깊게 쓰는지가 시장 가치에 반영되고 있다는 얘기다.

ai-ml 2026-07-13

ZTE, AI 에이전트폰으로 스마트폰 재도전…진짜 승부처는 앱 생태계

ZTE가 바이트댄스의 더우바오를 탑재한 AI 에이전트 스마트폰으로 시장 재진입을 노린다. 핵심은 사용자가 명령하면 AI가 여러 앱을 직접 열고 조작하는 방식인데, 위챗·타오바오·알리페이 같은 플랫폼과 충돌하면서 생태계 문제가 가장 큰 변수로 떠올랐다.

ai-ml 2026-07-13

노벨상 학자들까지 “AI 경제 충격, 지금 제도 안 만들면 늦다”

노벨 경제학상 수상자 15명을 포함한 학자와 기술 업계 인사 약 200명이 AI가 향후 10년 안에 경제를 급격히 바꿀 수 있다며 정책 대응을 촉구했다. 이들은 산업혁명보다 큰 변화가 훨씬 짧은 시간에 올 수 있고, 대규모 일자리 대체와 생활 수준 향상이라는 양면성이 동시에 존재한다고 봤다.

ai-ml 2026-07-13

NHN, AI 데이터센터 매출 기대감에 목표주가 5만6000원으로 상향

한국투자증권이 NHN의 목표주가를 4만5000원에서 5만6000원으로 올리고 투자의견 매수를 유지했다. 핵심 근거는 양평 AI 데이터센터 가동, 공공·민간 GPU 클러스터 수주 확대, 클라우드 사업부 신규 매출 반영이다.

엔비디아 AI 클라우드, 6개 대륙으로 확장…AI 팩토리 경쟁 본격화

요약

핵심 포인트

핵심 개념

분석

엔비디아가 말하는 AI 클라우드는 “GPU 빌려주는 곳”보다 훨씬 큰 그림임

생태계는 6개 대륙으로 넓어졌고, 지역 AI 인프라가 키워드임

퍼머스는 아시아·태평양에 액체 냉각 AI 팩토리를 깔고 있음

코어위브와 네비우스는 피지컬 AI와 추론 레이어로 확장 중임

DSX는 AI 팩토리 운영을 표준화하려는 플랫폼에 가까움

결론은 엔비디아가 “AI 인프라 운영 모델”까지 팔고 있다는 것

기술 맥락

인사이트

댓글

댓글

엔비디아 AI 클라우드, 6개 대륙으로 확장…AI 팩토리 경쟁 본격화

요약

핵심 포인트

핵심 개념

분석

엔비디아가 말하는 AI 클라우드는 “GPU 빌려주는 곳”보다 훨씬 큰 그림임

생태계는 6개 대륙으로 넓어졌고, 지역 AI 인프라가 키워드임

퍼머스는 아시아·태평양에 액체 냉각 AI 팩토리를 깔고 있음

코어위브와 네비우스는 피지컬 AI와 추론 레이어로 확장 중임

DSX는 AI 팩토리 운영을 표준화하려는 플랫폼에 가까움

결론은 엔비디아가 “AI 인프라 운영 모델”까지 팔고 있다는 것

기술 맥락

인사이트

댓글

댓글

관련 기사