---
title: "델이 말하는 AI 인프라의 다음 전장, 클라우드가 아니라 온프레미스"
published: 2026-05-24T08:09:01.584Z
canonical: https://jeff.news/article/3174
---
# 델이 말하는 AI 인프라의 다음 전장, 클라우드가 아니라 온프레미스

델 테크놀로지스가 DTW 2026에서 온프레미스 AI 전략을 강하게 밀고 나왔다. 챗GPT, 제미나이, 그록 같은 프론티어 모델을 기업 데이터센터 안에서 운영하고, 에이전틱 AI 시대의 토큰 비용과 데이터 통제 문제를 온프레미스 인프라로 풀겠다는 메시지다.

- 델 테크놀로지스가 DTW 2026에서 꺼낸 메시지는 꽤 선명함. AI는 클라우드에서 호출만 하는 게 아니라, 기업 데이터센터 안으로 들어온다는 것임
  - 델은 서버, 스토리지, 네트워크, 소프트웨어를 묶은 ‘델 AI 팩토리’ 전략으로 온프레미스 AI 시장을 잡겠다고 말함
  - 이미 5000개 이상의 델 AI 팩토리 고객 구축 경험을 확보했다고 밝힘

- 배경에는 에이전틱 AI 확산이 있음
  - 단순 질의응답이 아니라 AI가 업무를 수행하고 의사결정을 돕는 방향으로 가면, 데이터센터와 엣지, 데스크톱까지 인프라 전략이 바뀜
  - 델은 개발자가 데스크톱에서 AI 에이전트를 만들고 같은 프레임워크와 보안 정책으로 데이터센터 서버까지 확장하는 구상을 내놨음

- 가장 눈에 띄는 발표는 챗GPT, 제미나이, 그록 같은 프론티어 모델을 온프레미스에서 운영하도록 지원하겠다는 부분임
  - 예전에는 이런 모델을 주로 클라우드에서만 썼지만, 델은 파워엣지 서버 기반 기업 내부 환경에서도 돌릴 수 있게 하겠다고 설명함
  - 핵심은 고객 데이터가 외부 클라우드로 이동하지 않고 자체 데이터센터 안에 남는다는 점임

> [!IMPORTANT]
> 델의 논리는 단순함. 에이전틱 AI가 퍼지면 토큰 사용량이 폭증하고, 퍼블릭 클라우드의 토큰 과금이 기업 비용 압박으로 돌아온다는 것임.

- 델은 AI 인프라가 GPU만으로 완성되지 않는다고 강조함
  - 랙 설계, 냉각, 네트워킹, 케이블링, 구축 속도, 소프트웨어까지 같이 맞아야 한다는 주장임
  - 이번에 공개한 델 파워랙은 더 많은 GPU를 하나의 랙에 넣기 위해 냉각 효율과 전력 사용량을 최적화한 제품임

- 기존 데이터센터 현대화 숫자도 꽤 공격적임
  - 델은 18세대 파워엣지 서버 1대가 기존 14세대 서버 13대를 대체할 수 있을 정도로 효율이 높아졌다고 설명함
  - 신형 파워스토어는 최대 6대1 데이터 절감 효율을 지원한다고 밝힘

- 그렇다고 ‘클라우드 끝, 온프레미스 시작’ 같은 단순한 얘기는 아님
  - 델도 핵심 워크로드는 온프레미스에서 돌리고, 트래픽이 튀면 퍼블릭 클라우드나 서비스형 GPU(GPUaaS)를 쓰는 하이브리드 전략을 예상함
  - 기업 입장에서는 모델 선택보다 데이터 위치, 비용 구조, 보안 정책, 운영 역량을 같이 봐야 하는 국면으로 가는 중임

---

## 기술 맥락

- 델이 온프레미스 AI를 강조하는 이유는 모델 성능보다 운영 비용과 데이터 통제 문제가 커지고 있기 때문이에요. 에이전틱 AI는 한 번 답하고 끝나는 게 아니라 여러 번 계획하고 호출하고 실행하니까 토큰 사용량이 쉽게 커지거든요.

- 온프레미스의 장점은 데이터가 내부에 남는다는 점이에요. 금융, 제조, 공공처럼 민감한 데이터가 많은 조직은 모델 호출을 위해 데이터를 외부 클라우드로 보내는 것 자체가 리스크가 될 수 있어요.

- 대신 온프레미스는 공짜 점심이 아니에요. GPU만 사면 끝나는 게 아니라 전력, 냉각, 네트워크, 스토리지, 배포 자동화까지 한 세트로 굴러가야 해요. 델이 랙과 스토리지 숫자를 같이 말한 것도 이 이유예요.

- 현실적인 결론은 하이브리드에 가까워요. 예측 가능한 핵심 워크로드는 내부에서 돌리고, 갑자기 수요가 몰리는 구간은 클라우드나 GPUaaS를 붙이는 식으로 비용과 탄력성을 같이 잡으려는 흐름이에요.

## 핵심 포인트

- 델은 챗GPT, 제미나이, 그록을 파워엣지 서버 기반 온프레미스 환경에서 운영하는 전략을 공개
- 에이전틱 AI 확산으로 토큰 사용량이 커지면서 퍼블릭 클라우드 비용 부담이 커질 것으로 전망
- 18세대 파워엣지 서버는 기존 14세대 서버 13대를 1대로 통합할 수 있다고 설명

## 인사이트

AI 인프라 논의가 모델 성능에서 데이터 위치, 토큰 비용, 냉각, 랙 밀도, 운영 모델로 내려오고 있다. 기업 입장에서는 ‘어떤 모델을 쓰나’만큼이나 ‘어디서 돌리고 누가 비용을 통제하나’가 중요해지는 흐름이다.
