본문으로 건너뛰기
피드

델 “AI 토큰 비용 폭증하면 온프레미스·분산형 클라우드가 답”

ai-ml 약 6분
vote
0
댓글
북마크

델 테크놀로지스가 AI 워크로드를 퍼블릭 클라우드에만 두기보다 기업 데이터센터, 엣지, 데스크톱까지 분산해야 한다고 주장했다. 이유는 토큰 과금 부담, 데이터 이동 비용, VM웨어 이후 하이퍼바이저 전략 재검토까지 한꺼번에 걸려 있기 때문이다.

  • 1

    델은 에이전틱 AI 확산으로 토큰 사용량과 과금 부담이 커질 것으로 봄

  • 2

    온프레미스나 데스크사이드 AI를 “토큰 생성기”처럼 보고 예측 가능한 인프라 투자로 전환하자는 논리

  • 3

    엔비디아와 협력해 로컬 환경에서 자율형 AI 에이전트를 운영하는 델 데스크사이드 에이전틱 AI를 발표

  • 4

    분산형 프라이빗 클라우드는 HCI 대비 최대 65% 비용 효율적이라고 주장

  • 5

    VM웨어 대안을 찾는 기업을 겨냥해 현재 하이퍼바이저를 지원하면서 전환 기반을 제공

토큰 비용이 인프라 설계 변수로 올라옴

  • 델 테크놀로지스는 앞으로 AI 인프라 전략에서 “데이터 위치”와 “토큰 비용”이 핵심 변수가 될 거라고 봄

    • 바룬 차브라 델 수석부사장은 델 테크놀로지스 월드(DTW) 2026에서 한국 기자들과 만나 이 내용을 강조함
    • AI 워크로드가 퍼블릭 클라우드에만 머무는 게 아니라 기업 데이터센터, 엣지, 데스크톱까지 퍼질 거라는 관점임
  • 특히 에이전틱 AI가 확산되면 토큰 과금 부담이 빠르게 커질 수 있음

    • 에이전트가 많이 실행될수록 모델 호출과 토큰 사용량도 같이 늘어남
    • 퍼블릭 클라우드나 AI 제공 기업의 API는 대부분 토큰당 과금 구조라, 사용량 한도나 비용 한도에 빠르게 닿는 사례가 나온다는 설명임
    • 차브라는 데스크사이드 장비나 서버를 사는 걸 “토큰 생성기”를 확보하는 것에 비유함

중요

> 델의 논리는 단순함. AI 호출 비용을 계속 토큰 단위로 낼지, 아니면 로컬 인프라에 투자해서 예측 가능한 비용 구조로 바꿀지 기업이 따져야 한다는 얘기임.

  • 델은 엔비디아와 협력해 AI 팩토리 포트폴리오를 확장 중임

    • 이번 행사에서는 로컬 환경에서 자율형 AI 에이전트를 구축·운영할 수 있는 ‘델 데스크사이드 에이전틱 AI’를 발표함
    • 기업 데이터를 외부로 반출하지 않고도 자율형 AI 에이전트를 실행하는 솔루션으로 소개됨
    • 변동성이 큰 클라우드 토큰 비용을 예측 가능한 인프라 투자로 전환한다는 메시지가 강함
  • 프런티어 모델도 온프레미스에서 쓰는 흐름을 언급함

    • 과거에는 제미나이, 그록, 오픈AI 같은 모델을 클라우드에서만 쓰는 식이었다고 설명함
    • 이제는 델 서버 기반 온프레미스 환경에서도 활용할 수 있도록 지원하고 있다고 밝힘

분산형 프라이빗 클라우드와 VM웨어 이후 전략

  • 델은 차세대 프라이빗 클라우드 방향으로 “분산형 인프라”를 밀고 있음

    • 케이틀린 고든 부사장은 대부분 기업 데이터가 여전히 기업 데이터센터 안에 있다고 설명함
    • AI 도입이 커져도 데이터가 있는 곳 가까이에서 처리하는 구조가 중요하다는 논리임
  • 델 프라이빗 클라우드(DPC)는 HCI의 운영 단순성과 전통적인 3계층 아키텍처의 확장성을 섞은 형태로 소개됨

    • 컴퓨팅, 스토리지, 네트워크, 가상화 계층을 독립적으로 확장할 수 있음
    • 필요한 자원만 늘릴 수 있으니, 모든 자원을 노드 단위로 같이 키워야 하는 구조보다 유연하다는 주장임
  • 비용 비교도 꽤 세게 나옴. 델은 분산형 인프라가 HCI 대비 최대 65%까지 비용 효율적이라고 말함

    • HCI에서는 컴퓨트 노드가 애플리케이션 워크로드와 스토리지 워크로드를 동시에 처리해야 함
    • 그래서 메모리, 드라이브, 코어, 하이퍼바이저 라이선스 비용이 커질 수 있음
    • 분산형 클라우드에서는 컴퓨트가 애플리케이션 워크로드에 집중하므로 노드 수와 코어 수를 줄일 여지가 있다는 설명임

ℹ️참고

> 이 전략은 브로드컴의 VM웨어 인수 이후 하이퍼바이저 비용과 종속성을 다시 보는 기업을 정조준함.

  • DPC는 “VM웨어 탈출구”를 찾는 고객도 겨냥함
    • 고든 부사장은 DPC가 VM웨어에서 벗어날 방법을 찾는 고객을 지원하기 위해 만들어졌다고 말함
    • 현재 하이퍼바이저를 지원하면서도, 향후 다른 방향으로 전환할 수 있는 비용 효율적인 기반을 제공하겠다는 입장임

기술 맥락

  • 델이 말하는 포인트는 “AI를 어디서 돌릴 것인가”예요. 예전에는 퍼블릭 클라우드 API를 호출하면 빨랐지만, 에이전틱 AI처럼 호출이 반복되는 구조에서는 토큰 비용이 계속 누적되거든요.

  • 온프레미스 AI는 그래서 비용 모델을 바꾸는 선택이에요. 매번 토큰당 비용을 내는 대신 서버나 데스크사이드 장비에 투자해서, 사용량이 늘어도 비용을 더 예측하기 쉽게 만들자는 거예요.

  • 분산형 프라이빗 클라우드 이야기는 AI뿐 아니라 가상화 비용과도 연결돼요. HCI는 운영이 단순한 대신 자원을 노드 단위로 같이 늘리는 경향이 있어서, 워크로드 특성에 따라 과투자가 생길 수 있거든요.

  • DPC가 VM웨어 이후 전략으로 언급되는 이유도 여기에 있어요. 기존 하이퍼바이저를 바로 버리기 어렵지만, 비용과 종속성을 줄일 수 있는 다음 기반은 준비해야 하니까요.

  • 결국 이 기사는 클라우드 대 온프레미스의 단순 대결이 아니에요. 데이터 위치, 토큰 과금, GPU 활용, 하이퍼바이저 라이선스까지 합쳐서 AI 인프라의 총비용을 다시 계산해야 한다는 얘기에 가까워요.

AI 인프라 논의가 이제 “GPU 어디서 빌릴까”를 넘어 “토큰 과금, 데이터 위치, 하이퍼바이저 라이선스까지 합쳐서 어디에 둘까”로 바뀌는 중임. 특히 국내 기업도 VM웨어 비용과 AI 데이터 반출 이슈를 동시에 겪고 있어서 꽤 현실적인 이야기다.

댓글

댓글

댓글을 불러오는 중...

ai-ml

유튜브, AI 생성 영상에 자동 라벨 붙인다

유튜브가 사실적으로 보이거나 의미 있게 AI로 변경·생성된 콘텐츠에 더 눈에 띄는 라벨을 적용하고, 제작자가 AI 사용 여부를 밝히지 않아도 내부 신호로 감지되면 자동 라벨을 붙이겠다고 밝혔다. 다만 라벨만으로 추천 노출이나 수익화 자격이 바뀌지는 않으며, 제작자는 YouTube Studio에서 잘못된 판정을 수정할 수 있다.

ai-ml

테크 CEO들의 'AI 만능론', 숫자는 아직 그렇게 말하지 않는다

테크 업계에서 AI를 이유로 한 대규모 감원과 조직 재편이 이어지는 가운데, Box 창업자 애런 레비는 CEO들이 실제 업무의 마지막 1마일을 모른 채 AI 에이전트의 능력을 과대평가하고 있다고 지적했다. 2026년 첫 5개월 동안 이미 11만5430명이 해고됐고, 여러 연구는 AI 도입이 체감 생산성만큼 실제 생산성을 끌어올렸다는 근거가 아직 약하다고 말한다.

ai-ml

오픈AI와 앤트로픽, 코딩 에이전트로 드디어 돈 되는 시장을 찾은 듯

사이먼 윌리슨은 오픈AI와 앤트로픽이 코딩 에이전트와 기업용 과금으로 진짜 제품-시장 적합성을 찾았다고 봐. 개인 구독자에게는 월 100달러 플랜이 싸게 느껴지지만, 기업 고객은 이제 사용량 기준 토큰 가격을 그대로 내기 시작했고 이게 대형 고객 예산을 빠르게 흔들고 있다는 얘기야.

ai-ml

컴팔과 GMI 클라우드, 대규모 추론용 AI 인프라 구축 협력

컴팔이 실리콘밸리 기반 AI 인프라 기업 GMI 클라우드와 협력해 대규모 추론과 에이전틱 AI 워크로드에 맞춘 GPU 서버 인프라를 구축한다고 발표했어. COMPUTEX 2026에서는 NVIDIA HGX B300을 지원하는 Compal SGX30-2 같은 고성능 AI 서버 플랫폼도 선보일 예정이야.

ai-ml

AI 쓰면 편해진다더니, 직장인들은 ‘AI 과부하’에 지쳐가는 중

국내 직장인들이 AI 전환 압박, AI 답변 검증 부담, 대체 불안 때문에 피로감을 호소하고 있어. 중앙일보 설문에서는 5284명 중 31.6%가 ‘AI 답변 검증에 시간이 더 걸릴 때’를 가장 지치는 순간으로 꼽았고, 기업들은 무작정 AI 사용량을 밀어붙이는 방식에서 업무 방식 재설계로 넘어가야 한다는 지적이 나와.