본문으로 건너뛰기
피드

엔비디아 AI 클라우드, 6개 대륙으로 확장…AI 팩토리 경쟁이 더 커진다

ai-ml 약 6분
vote
0
댓글
북마크

엔비디아가 카사바와 클라로 합류를 계기로 AI 클라우드 생태계를 6개 대륙으로 넓혔다고 밝혔어. 모델 학습, 파인튜닝, 추론, 에이전틱 AI, 피지컬 AI, 소버린 AI를 처리하는 지역별 AI 팩토리 인프라 경쟁이 본격화되는 흐름이야.

  • 1

    엔비디아 AI 클라우드가 아프리카 카사바와 남미 클라로 합류로 6개 대륙 전역으로 확장

  • 2

    AI 클라우드는 토큰 수요를 처리하기 위한 전용 생태계로 학습·파인튜닝·추론·AI 에이전트를 지원

  • 3

    코어위브는 100만개 GPU 규모 AI 팩토리 네트워킹 기반인 스펙트럼-X 이더넷 포토닉스를 초기 적용

  • 4

    엔비디아 클라우드 파트너 중 엑셈플러 클라우드 자격을 획득한 곳은 코어위브·크루소·람다·네비우스·벌처·YTL 등 6곳

  • 5

    DSX 플랫폼은 배포 검증, 전력망 연동, 제한 전력 내 GPU 40% 추가 가동, 운영 자동화 구성요소를 포함

  • 엔비디아가 AI 클라우드 생태계를 6개 대륙으로 확장했다고 밝혔음

    • 아프리카에서는 카사바, 남미에서는 클라로가 새로 합류함
    • 발표는 대만 컴퓨텍스 2026 기간에 열린 GTC 타이베이에서 나왔음
    • 엔비디아 표현대로라면 글로벌 AI 수요 증가에 맞춰 AI 팩토리 인프라를 넓히는 중임
  • 여기서 AI 클라우드는 그냥 GPU 대여 서비스가 아니라 “토큰 수요를 처리하는 전용 생태계”에 가까움

    • 모델 훈련, 파인튜닝, 추론을 지원함
    • 에이전틱 AI, 피지컬 AI, 소버린 AI 배포까지 포함하는 풀스택 인프라로 포지셔닝함
    • 파트너사들이 토큰 비용 최소화와 와트당 처리량을 이유로 엔비디아 플랫폼을 채택하고 있다는 설명도 붙었음

중요

> 엔비디아가 강조하는 경제성은 “GPU가 많다”가 아니라 “토큰을 얼마나 싸고 전력 효율적으로 뽑아내느냐”임. 생성형 AI 서비스가 늘수록 인프라 경쟁의 단위가 서버 대수에서 토큰 처리량으로 바뀌고 있음.

  • 젠슨 황은 모든 기업과 국가가 데이터를 인텔리전스로 바꾸기 위한 AI 팩토리 인프라가 필요하다고 말했음

    • 모델 훈련부터 진행 중 추론, AI 에이전트까지 차세대 AI를 만들려면 지역·산업·개발자가 풀스택 AI 팩토리에 연결돼야 한다는 논리임
    • 이건 엔비디아가 국가 단위 소버린 AI 수요까지 정면으로 겨냥하고 있다는 얘기이기도 함
  • 확장세는 동남아시아, 호주, 미주에서 특히 두드러진다고 함

    • 코어위브, 퍼머스, 아이렌, 엔스케일은 프론티어 모델과 대규모 추론용 인프라를 증설 중임
    • 파이어버드, GMI 클라우드, 인도삿 오레두 허치슨, 람다, 네이버 클라우드, 샤론 AI, 요타, YTL은 국가 AI 사업과 금융·통신·제조·교육·헬스케어 분야를 지원함
    • 한국 독자 입장에서는 네이버 클라우드가 이 글로벌 AI 클라우드 파트너 흐름 안에 들어가 있다는 점도 눈에 띔
  • 호주의 퍼머스는 ‘프로젝트 사우스게이트’로 액체 냉각식 AI 팩토리를 짓고 있음

    • 지역은 타스매니아, 멜버른, 남호주, 뉴사우스웨일스임
    • AI 데이터센터가 전력과 냉각 싸움으로 가고 있다는 걸 보여주는 사례임
  • 코어위브 쪽 스케일은 숫자가 꽤 세다

    • 베라 루빈과 베라 CPU를 초기 도입했음
    • 100만개 GPU 규모 AI 팩토리의 네트워킹 기반으로 스펙트럼-X 이더넷 포토닉스를 가장 먼저 적용함
    • 앤트로픽 등이 해당 인프라로 대규모 프론티어 모델을 구동하고 있음
  • 네비우스는 추론과 피지컬 AI 쪽을 묶어 내세움

    • ‘토큰 팩토리’ 추론 레이어와 ‘피지컬 AI 워크벤치’를 통해 코스모스 3, 아이작 심, 아이작 GR00T를 통합했다고 함
    • 로봇·시뮬레이션·물리 세계 AI까지 엔비디아 생태계 안으로 끌어들이는 그림임
  • 엔비디아 클라우드 파트너 중 엑셈플러 클라우드 자격을 획득한 곳은 6곳으로 늘었음

    • 코어위브, 크루소, 람다, 네비우스, 벌처, YTL이 해당됨
    • 인프라 구축과 운영에는 엔비디아 DSX 플랫폼이 쓰임
  • DSX는 AI 데이터센터 운영을 꽤 노골적으로 제품화한 묶음임

    • DSX 심은 배포 전 검증용
    • DSX 플렉스는 전력망 연동형
    • DSX 맥스LPS는 제한된 전력에서 GPU를 최대 40% 더 가동하는 구성
    • DSX OS는 운영 자동화를 맡음

기술 맥락

  • 엔비디아가 말하는 AI 클라우드는 단순한 클라우드 GPU 인스턴스가 아니에요. 모델 학습, 파인튜닝, 추론, 에이전트 실행까지 이어지는 전체 파이프라인을 특정 하드웨어와 네트워크, 운영 소프트웨어로 묶겠다는 전략이에요.

  • 토큰 비용을 강조하는 이유는 생성형 AI 서비스의 비용이 결국 추론 호출에서 계속 쌓이기 때문이에요. 모델 한 번 학습하는 비용도 크지만, 사용자가 매일 요청을 보내면 토큰을 처리하는 인프라 효율이 서비스 원가를 좌우하거든요.

  • 스펙트럼-X 같은 네트워킹이 중요해지는 것도 같은 이유예요. GPU가 100만개 규모로 늘어나면 개별 칩 성능보다 GPU 사이 통신 병목이 더 큰 문제가 될 수 있어요. 그래서 AI 팩토리는 컴퓨트만이 아니라 네트워크 설계까지 한 몸으로 봐야 해요.

  • DSX 맥스LPS가 제한된 전력에서 GPU를 최대 40% 더 가동한다고 언급된 대목도 포인트예요. 앞으로 AI 데이터센터 경쟁은 칩을 얼마나 사느냐뿐 아니라, 전력 제약 안에서 얼마나 많은 추론을 안정적으로 처리하느냐의 싸움이 될 가능성이 커요.

엔비디아가 파는 건 이제 GPU 박스가 아니라 ‘토큰을 찍어내는 공장’ 전체에 가까워졌어. 개발자 입장에서는 모델 성능만 볼 게 아니라, 어느 지역의 어떤 AI 클라우드에서 추론 비용과 지연 시간이 맞는지가 점점 더 중요해질 듯해.

댓글

댓글

댓글을 불러오는 중...

ai-ml

스코세이지도 생성형 AI로 스토리보드 만든다, 할리우드 금기가 흔들리는 중

마틴 스코세이지 감독이 독일 AI 스타트업 블랙포레스트랩스의 기술을 활용해 차기작 스토리보드를 만들었다고 밝혔다. 할리우드에서는 2023년 파업 이후 생성형 AI가 민감한 주제였지만, 거장 감독의 공개 지지로 제작 도구로서의 AI 논쟁이 다시 커지고 있다.

ai-ml

구글은 스페이스X GPU 11만 개를 빌리고, 미국 정부는 오픈AI 지분까지 들여다보는 중

미국 AI 경쟁이 모델 성능 싸움에서 GPU, 데이터센터, 정부 지분 구조까지 번지는 중이다. 구글은 스페이스X 데이터센터의 엔비디아 GPU 약 11만 개를 월 9억2000만 달러에 쓰기로 했고, 트럼프 행정부는 오픈AI 지분을 정부가 보유하는 방안까지 논의하고 있다.

ai-ml

AI 데이터센터 붐, 전기·물·땅을 얼마나 먹는지 숫자로 보면 꽤 세다

유엔대 보고서는 AI 데이터센터 확장이 전력, 물, 토지 사용을 빠르게 키우고 있다고 경고한다. 전 세계 데이터센터 전력 사용량은 448테라와트시 수준이고, 2030년에는 945테라와트시까지 늘어 전 세계 전력의 3%에 이를 수 있다는 분석이다. 다만 전문가들은 효율 개선, 온디바이스 컴퓨팅, 공공 AI, 환경 규제까지 함께 봐야 한다고 짚었다.

ai-ml

케임브리지대, AI가 설계한 범용 백신 1상 임상시험 완료

영국 케임브리지대 연구진이 주요 성분을 AI로 설계한 백신을 사람에게 시험한 결과를 발표했다. 목표는 코로나19, 사스, 메르스처럼 같은 계열의 여러 바이러스에 대응하는 범용 백신이며, 1상 시험에서는 안전성 확인에 초점이 맞춰졌다.

ai-ml

AI 답안이 로스쿨 교수 답안보다 더 낫다는 블라인드 테스트 결과

미국 14개 로스쿨의 계약법 교수 16명이 참여한 블라인드 평가에서 제미나이 2.5 프로와 노트북LM 답변이 인간 교수 답변보다 높은 평가를 받았다. 단순 암기가 아니라 가상 사례와 정책 질문처럼 법적 추론이 필요한 영역에서도 AI가 앞섰고, 유해한 오답 비율도 훨씬 낮았다.