본문으로 건너뛰기
피드

엔비디아 AI 클라우드, 6개 대륙으로 확장…AI 팩토리 경쟁 본격화

ai-ml 약 9분
vote
0
댓글
북마크

엔비디아가 자사 가속 컴퓨팅, 네트워킹, AI 소프트웨어를 묶은 AI 클라우드 생태계가 전 세계로 확장되고 있다고 밝혔다. 파트너들은 모델 훈련, 파인튜닝, 추론, 에이전틱 AI, 피지컬 AI, 소버린 AI를 위한 AI 팩토리 인프라를 확대 중이다. 핵심 메시지는 이제 AI 인프라 경쟁의 기준이 단순 GPU 수가 아니라 토큰당 비용, 전력 효율, 운영 자동화, 지역별 데이터 접근성으로 옮겨가고 있다는 점이다.

  • 1

    엔비디아 AI 클라우드는 카사바와 클라로 합류로 6개 대륙으로 확장됐다고 밝혔다.

  • 2

    코어위브, 퍼머스, 네비우스 등 파트너사가 프론티어 모델, 에이전틱 AI, 피지컬 AI 워크로드를 위한 인프라를 키우고 있다.

  • 3

    코어위브는 100만 개 GPU 규모 AI 팩토리를 위한 네트워킹 기반으로 엔비디아 스펙트럼-X 이더넷 포토닉스를 도입한 초기 기업 중 하나로 소개됐다.

  • 4

    엔비디아 DSX 맥스엘피에스는 전력 제한 환경에서 고정 전력 예산 내 GPU를 최대 40% 더 많이 가동하도록 돕는다고 설명됐다.

엔비디아가 말하는 AI 클라우드는 “GPU 빌려주는 곳”보다 훨씬 큰 그림임

  • 엔비디아 AI 클라우드 생태계가 글로벌 AI 팩토리 인프라 확장을 가속화하고 있다고 밝힘

    • 대상은 기업, 스타트업, 국가, AI 연구소, 개발자까지 꽤 넓음
    • 수요의 중심에는 에이전틱 AI 애플리케이션과 폭발적인 토큰 수요가 있음
    • 엔비디아는 이 클라우드를 자사 가속 컴퓨팅, 네트워킹, AI 소프트웨어를 결합한 전용 클라우드 생태계로 설명함
  • 이 인프라가 지원하려는 워크로드도 단순 훈련에만 머물지 않음

    • 모델 훈련, 파인튜닝, 추론, 에이전틱 AI, 피지컬 AI, 소버린 AI 배포까지 포함됨
    • 구성은 파트너사와 워크로드별로 다르지만, 공통 목표는 토큰 비용을 낮추고 와트당 처리량을 높이는 것임

중요

> 엔비디아가 강조하는 AI 인프라 경제성의 기준은 “GPU가 몇 개냐”가 아니라 토큰당 비용, 와트당 처리량, 가동 시간, 실제 업무에 투입 가능한 에이전트의 범위로 이동하고 있음.

생태계는 6개 대륙으로 넓어졌고, 지역 AI 인프라가 키워드임

  • 엔비디아 AI 클라우드는 이제 6개 대륙으로 확장됐다고 설명함

    • 아프리카의 카사바와 남미의 클라로가 합류하면서 지역 범위가 넓어짐
    • 동남아시아, 호주, 미주 전역에서도 지역 성장이 가속화되고 있다고 밝힘
  • 파트너 구성도 꽤 다양함

    • 코어위브, 퍼머스, 아이렌, 네비우스, 엔스케일 등은 프론티어 모델 개발, 기업용 AI, 에이전틱 애플리케이션, 대규모 추론을 지원하기 위해 인프라를 확장 중임
    • 파이어버드, 지엠아이 클라우드, 인도삿 오레두 허치슨, 람다, 네이버 클라우드, 샤론 AI, 요타, 와이티엘 등은 지역 산업과 국가 AI 이니셔티브를 지원하는 파트너로 소개됨
    • 금융, 통신, 제조, 교육, 헬스케어, 개발자 생태계까지 대상 산업도 넓게 잡힘
  • 정부와 규제 산업에서는 지역 AI 클라우드가 더 중요해짐

    • 데이터와 사용자가 있는 곳 가까이에서 AI 인프라를 운영해야 지연 시간, 데이터 통제, 컴플라이언스 요구를 맞추기 쉬움
    • 엔비디아는 이를 소버린 통제권과 현지 규제 대응의 문제로 설명함

퍼머스는 아시아·태평양에 액체 냉각 AI 팩토리를 깔고 있음

  • 퍼머스 테크놀로지는 호주와 동남아시아 전역으로 AI 팩토리 입지를 넓히고 있음

    • 대규모 훈련, 추론, 에이전틱 AI 워크로드 수요 증가에 대응하는 에너지 효율적 인프라가 목표임
    • 프로젝트 사우스게이트를 통해 타스매니아, 멜버른, 남호주, 뉴사우스웨일스에 AI 팩토리를 개발 중임
    • 재생 에너지, 첨단 냉각, 빠르게 가동 가능한 모듈형 인프라를 강조함
  • 퍼머스 하이퍼큐브는 액체 냉각 기반 모듈형 AI 팩토리로 소개됨

    • 엔비디아 DSX 플랫폼과 맞춰 설계됐고, AI 팩토리 구축 속도를 높이고 토큰 비용을 최소화하는 게 목적임
    • 퍼머스는 냉각과 에너지를 포함한 공급망 전반에서 혁신을 계속하겠다고 밝힘

코어위브와 네비우스는 피지컬 AI와 추론 레이어로 확장 중임

  • 코어위브는 차세대 에이전틱 AI, 피지컬 AI, 프론티어 모델 워크로드를 위해 엔비디아 AI 클라우드 플랫폼을 확장하고 있음

    • 엔비디아 베라 루빈과 베라 CPU를 초기 도입한 기업으로 소개됨
    • 엔비디아 스펙트럼-X 이더넷 포토닉스를 가장 먼저 도입한 기업 중 하나로, 100만 개 GPU 규모 AI 팩토리를 위한 네트워킹 기반을 제공한다고 설명됨
    • 엔비디아 코스모스 3를 포함해 로보틱스와 피지컬 AI 워크플로우용 플랫폼도 확장 중임
    • 앤트로픽 같은 AI 연구소도 대규모 프론티어 모델 구동에 코어위브 인프라를 활용한다고 언급됨
  • 네비우스는 모델 훈련, 추론, 피지컬 AI 개발을 위한 풀스택 플랫폼을 밀고 있음

    • 자체 네비우스 AI 클라우드, 토큰 팩토리 추론 레이어, 피지컬 AI 워크벤치를 포함함
    • 피지컬 AI 워크벤치는 엔비디아 코스모스 3, 아이작 심, 아이작 그루트 같은 기술을 구성 가능한 워크플로우로 연결함
    • 목표는 로보틱스와 자율 시스템 개발 팀이 시뮬레이션과 합성 데이터 단계에서 훈련과 평가 단계로 더 빠르게 넘어가게 하는 것임

DSX는 AI 팩토리 운영을 표준화하려는 플랫폼에 가까움

  • 엔비디아 DSX는 AI 팩토리 설계, 구축, 운영을 위한 플랫폼으로 소개됨

    • 검증된 레퍼런스 디자인, 시뮬레이션, 소프트웨어, 생태계 기술을 결합함
    • 클라우드 제공업체가 인프라를 더 빨리 가동하고 효율적으로 운영하며 수익을 극대화하도록 돕는다는 설명임
  • DSX 안에서도 역할이 나뉨

    • DSX 심은 배포 전 AI 팩토리를 모델링하고 검증하는 데 쓰임
    • DSX 플렉스는 전력망 조건에 맞춰 워크로드를 동적으로 조정함
    • DSX 맥스엘피에스는 전력이 제한된 AI 팩토리에서 고정 전력 예산 안에 GPU를 최대 40% 더 많이 가동하도록 돕는다고 설명됨
    • DSX OS는 대규모 라이프사이클 관리와 운영 자동화를 담당함

💡

> AI 클라우드 비용을 비교할 때는 시간당 GPU 가격만 보면 부족함. 실제 서비스에서는 토큰당 비용, 전력 제약, 네트워크, 운영 자동화, 모델 배포 속도가 같이 비용을 만든다.

결론은 엔비디아가 “AI 인프라 운영 모델”까지 팔고 있다는 것

  • 엔비디아의 메시지는 명확함. AI의 중심이 모델 개발에서 추론과 대용량 추론으로 이동하고 있다는 것

    • 그래서 인프라 평가는 발표된 용량보다 플랫폼 활용도, 가동 시간, 자산 수명, 실제 업무에 투입 가능한 에이전트의 범위로 바뀐다고 봄
    • 토큰당 비용은 하드웨어 성능, 소프트웨어 최적화, 생태계 지원, 실제 활용도를 반영하는 총소유비용 지표로 제시됨
  • 개발자 입장에서는 클라우드 AI 선택 기준이 더 복잡해졌다는 뜻임

    • 모델 훈련만 할 건지, 지속적인 추론 서비스를 돌릴 건지, 로봇·시뮬레이션 같은 피지컬 AI까지 갈 건지에 따라 인프라 선택지가 달라짐
    • 지역 데이터 요구사항이나 규제 산업 컴플라이언스가 있으면 소버린 AI 클라우드도 고려 대상이 됨

기술 맥락

  • 엔비디아가 선택한 방향은 단품 GPU 판매보다 AI 팩토리 전체를 같이 설계하는 쪽이에요. 훈련, 추론, 네트워킹, 냉각, 전력 조정, 운영 자동화가 따로 놀면 토큰당 비용이 올라가고 인프라 가동도 늦어지거든요.

  • DSX가 중요한 이유는 AI 데이터센터를 짓는 과정 자체가 복잡해졌기 때문이에요. 배포 전 시뮬레이션, 전력망 조건에 맞춘 워크로드 조정, 고정 전력 예산 안에서 GPU를 더 많이 돌리는 최적화가 없으면 대규모 인프라가 있어도 경제성이 떨어져요.

  • 코어위브와 네비우스 사례는 AI 클라우드가 범용 GPU 임대에서 워크로드별 플랫폼으로 바뀌는 흐름을 보여줘요. 프론티어 모델 추론, 에이전트, 로보틱스, 합성 데이터 워크플로우는 필요한 네트워크와 소프트웨어 스택이 서로 다르기 때문이에요.

  • 소버린 AI와 지역 클라우드가 같이 언급되는 것도 같은 맥락이에요. 정부나 규제 산업은 데이터가 어디에 있고 누가 운영하는지를 따져야 하니까, 단순히 가장 싼 글로벌 리전보다 현지 컴플라이언스와 데이터 접근성이 더 중요해질 수 있어요.

엔비디아가 파는 건 이제 칩 하나가 아니라 ‘AI 공장 운영체제’에 가까워지고 있다. 한국 개발자 입장에서도 클라우드 AI 비용을 볼 때 GPU 시간당 단가만 보면 안 되고, 토큰당 비용과 전력 제약, 데이터 위치, 추론 레이어까지 같이 봐야 한다.

댓글

댓글

댓글을 불러오는 중...

ai-ml

핀터레스트, AWS에 40억달러 베팅…AI 인프라 확장 본격화

핀터레스트가 2031년까지 AWS에 클라우드 비용 40억달러를 지불하는 장기 계약을 맺었다. AWS는 그래비톤과 트레이니움 같은 맞춤형 칩을 제공하고, 핀터레스트는 광고와 추천 중심의 AI 기능을 더 키우려는 흐름이다.

ai-ml

메타, 월 200달러짜리 개인용 인공지능 에이전트 ‘해치’ 준비 중

메타가 개인용 인공지능 에이전트 ‘해치’를 준비 중이며, 자연어로 앱 생성과 업무 자동화를 수행하는 범용 도구를 목표로 하고 있다. 월 199.99달러 수준의 프리미엄 요금제, 무료 대비 5~10배 사용 한도, 10여 개 기업 파일럿 뒤 7월 출시 가능성이 언급됐다.

ai-ml

중고나라, 내부 출신 개발 리더를 기술총괄로 선임하고 전사 인공지능 전환 속도냄

중고나라가 공자윤 신임 기술총괄을 내부 선임하고, 거래 안전성과 서비스 품질 개선을 위한 기술 조직 개편에 들어갔다. 인공지능 전환 전담팀과 데이터 전담팀을 신설하고, 사기 거래 탐지 모델과 개인화 추천 시스템 고도화를 추진한다.

ai-ml

ISPOR 2026, AI와 실제임상근거가 가치 기반 의료의 중심으로 들어옴

ISPOR 2026은 약가정책, 실제임상근거, 생성형 AI, 환자 중심 가치평가가 보건의료 의사결정의 핵심으로 올라왔다는 흐름을 보여준 행사였음. 개발자 관점에서는 의료 AI가 단순 자동화가 아니라 투명성, 재현 가능성, 거버넌스까지 요구받는다는 점이 포인트임.

ai-ml

메타 첫 폐쇄형 AI 모델, API 출시가 늦어지며 수익화에 빨간불

메타가 4월 공개한 폐쇄형 AI 모델 ‘뮤즈 스파크’의 개발자용 API 출시를 아직 못 하고 있다는 보도임. 라마처럼 내려받아 쓰는 개방형 모델이 아니라면 API가 곧 개발자 생태계와 과금 모델의 입구라서, 지연 자체가 메타 AI 수익화 전략의 약점으로 읽힘.