본문으로 건너뛰기
피드

델이 말하는 AI 인프라의 다음 전장, 클라우드가 아니라 온프레미스

devops 약 5분
vote
0
댓글
북마크

델 테크놀로지스가 DTW 2026에서 온프레미스 AI 전략을 강하게 밀고 나왔다. 챗GPT, 제미나이, 그록 같은 프론티어 모델을 기업 데이터센터 안에서 운영하고, 에이전틱 AI 시대의 토큰 비용과 데이터 통제 문제를 온프레미스 인프라로 풀겠다는 메시지다.

  • 1

    델은 챗GPT, 제미나이, 그록을 파워엣지 서버 기반 온프레미스 환경에서 운영하는 전략을 공개

  • 2

    에이전틱 AI 확산으로 토큰 사용량이 커지면서 퍼블릭 클라우드 비용 부담이 커질 것으로 전망

  • 3

    18세대 파워엣지 서버는 기존 14세대 서버 13대를 1대로 통합할 수 있다고 설명

  • 델 테크놀로지스가 DTW 2026에서 꺼낸 메시지는 꽤 선명함. AI는 클라우드에서 호출만 하는 게 아니라, 기업 데이터센터 안으로 들어온다는 것임

    • 델은 서버, 스토리지, 네트워크, 소프트웨어를 묶은 ‘델 AI 팩토리’ 전략으로 온프레미스 AI 시장을 잡겠다고 말함
    • 이미 5000개 이상의 델 AI 팩토리 고객 구축 경험을 확보했다고 밝힘
  • 배경에는 에이전틱 AI 확산이 있음

    • 단순 질의응답이 아니라 AI가 업무를 수행하고 의사결정을 돕는 방향으로 가면, 데이터센터와 엣지, 데스크톱까지 인프라 전략이 바뀜
    • 델은 개발자가 데스크톱에서 AI 에이전트를 만들고 같은 프레임워크와 보안 정책으로 데이터센터 서버까지 확장하는 구상을 내놨음
  • 가장 눈에 띄는 발표는 챗GPT, 제미나이, 그록 같은 프론티어 모델을 온프레미스에서 운영하도록 지원하겠다는 부분임

    • 예전에는 이런 모델을 주로 클라우드에서만 썼지만, 델은 파워엣지 서버 기반 기업 내부 환경에서도 돌릴 수 있게 하겠다고 설명함
    • 핵심은 고객 데이터가 외부 클라우드로 이동하지 않고 자체 데이터센터 안에 남는다는 점임

중요

> 델의 논리는 단순함. 에이전틱 AI가 퍼지면 토큰 사용량이 폭증하고, 퍼블릭 클라우드의 토큰 과금이 기업 비용 압박으로 돌아온다는 것임.

  • 델은 AI 인프라가 GPU만으로 완성되지 않는다고 강조함

    • 랙 설계, 냉각, 네트워킹, 케이블링, 구축 속도, 소프트웨어까지 같이 맞아야 한다는 주장임
    • 이번에 공개한 델 파워랙은 더 많은 GPU를 하나의 랙에 넣기 위해 냉각 효율과 전력 사용량을 최적화한 제품임
  • 기존 데이터센터 현대화 숫자도 꽤 공격적임

    • 델은 18세대 파워엣지 서버 1대가 기존 14세대 서버 13대를 대체할 수 있을 정도로 효율이 높아졌다고 설명함
    • 신형 파워스토어는 최대 6대1 데이터 절감 효율을 지원한다고 밝힘
  • 그렇다고 ‘클라우드 끝, 온프레미스 시작’ 같은 단순한 얘기는 아님

    • 델도 핵심 워크로드는 온프레미스에서 돌리고, 트래픽이 튀면 퍼블릭 클라우드나 서비스형 GPU(GPUaaS)를 쓰는 하이브리드 전략을 예상함
    • 기업 입장에서는 모델 선택보다 데이터 위치, 비용 구조, 보안 정책, 운영 역량을 같이 봐야 하는 국면으로 가는 중임

기술 맥락

  • 델이 온프레미스 AI를 강조하는 이유는 모델 성능보다 운영 비용과 데이터 통제 문제가 커지고 있기 때문이에요. 에이전틱 AI는 한 번 답하고 끝나는 게 아니라 여러 번 계획하고 호출하고 실행하니까 토큰 사용량이 쉽게 커지거든요.

  • 온프레미스의 장점은 데이터가 내부에 남는다는 점이에요. 금융, 제조, 공공처럼 민감한 데이터가 많은 조직은 모델 호출을 위해 데이터를 외부 클라우드로 보내는 것 자체가 리스크가 될 수 있어요.

  • 대신 온프레미스는 공짜 점심이 아니에요. GPU만 사면 끝나는 게 아니라 전력, 냉각, 네트워크, 스토리지, 배포 자동화까지 한 세트로 굴러가야 해요. 델이 랙과 스토리지 숫자를 같이 말한 것도 이 이유예요.

  • 현실적인 결론은 하이브리드에 가까워요. 예측 가능한 핵심 워크로드는 내부에서 돌리고, 갑자기 수요가 몰리는 구간은 클라우드나 GPUaaS를 붙이는 식으로 비용과 탄력성을 같이 잡으려는 흐름이에요.

AI 인프라 논의가 모델 성능에서 데이터 위치, 토큰 비용, 냉각, 랙 밀도, 운영 모델로 내려오고 있다. 기업 입장에서는 ‘어떤 모델을 쓰나’만큼이나 ‘어디서 돌리고 누가 비용을 통제하나’가 중요해지는 흐름이다.

댓글

댓글

댓글을 불러오는 중...

devops

포드가 AI 데이터센터 붐 수혜주로 뜬 이유는 자동차가 아니라 ESS였다

포드의 에너지 저장 사업이 AI 데이터센터 건설 붐을 타고 새 성장축으로 주목받고 있어. 전기차 수요 둔화로 남는 배터리 생산능력을 데이터센터·전력망용 ESS로 돌리는 전략이고, EDF 북미 사업체에 2028년부터 연간 4기가와트시 규모 공급 계약까지 체결했어.

devops

클라우드 빅3 차별화 논쟁, 정작 컴퓨트·스토리지는 거의 범용재가 됐다는 얘기

클라우드 업체들은 인공지능, 데이터베이스, 전용 서비스로 차별화를 강조하지만, 대부분의 기업 워크로드는 여전히 컴퓨트와 스토리지 위에서 돌아간다는 주장이다. AWS, 애저, 구글 클라우드의 핵심 인프라는 성숙도가 높아져 실질 역량 차이가 줄었고, 아키텍트는 브랜드보다 워크로드 적합성·비용·거버넌스·운영 정합성을 봐야 한다는 내용이다.

devops

DynIP, RFC 2136·IPv6·DNSSEC 지원하는 동적 DNS 서비스 공개

DynIP는 홈랩, 엣지 라우터, 인프라 팀을 겨냥한 동적 DNS(DDNS) 서비스다. 60초 안팎의 전파, RFC 2136 TSIG 기반 라우터 업데이트, 개인 도메인 연결, IPv6와 DNSSEC 지원을 핵심 기능으로 내세운다.

devops

깃허브 액션, 내부 데이터베이스 마이그레이션 여파로 4시간 지연

깃허브에서 2026년 5월 12일 13:41부터 17:43 협정세계시까지 일부 서비스 처리 지연이 발생했음. 내부 데이터베이스 마이그레이션으로 복제 지연이 생겼고, 작업 큐에 쌓이는 요청을 처리할 워커가 부족해진 게 원인이었음.

devops

AI 강국 경쟁, 결국 전기와 데이터센터 싸움으로 간다

AI 경쟁의 핵심이 모델과 반도체만이 아니라 안정적인 전력 확보로 이동하고 있다는 분석이야. 글로벌 데이터센터 전력 사용량은 2024년 400TWh에서 2030년 800TWh, 2050년 3500TWh 이상으로 커질 전망이고, 한국도 AI 데이터센터와 에너지 전략을 같이 설계해야 하는 상황이야.