---
title: "컴팔과 GMI 클라우드, 대규모 추론용 AI 인프라 구축 협력"
published: 2026-05-27T16:05:05.332Z
canonical: https://jeff.news/article/3313
---
# 컴팔과 GMI 클라우드, 대규모 추론용 AI 인프라 구축 협력

컴팔이 실리콘밸리 기반 AI 인프라 기업 GMI 클라우드와 협력해 대규모 추론과 에이전틱 AI 워크로드에 맞춘 GPU 서버 인프라를 구축한다고 발표했어. COMPUTEX 2026에서는 NVIDIA HGX B300을 지원하는 Compal SGX30-2 같은 고성능 AI 서버 플랫폼도 선보일 예정이야.

- 컴팔과 GMI 클라우드가 대규모 AI 추론 인프라 구축 협력을 발표함
  - 컴팔은 대만의 글로벌 서버·디바이스 제조사이고, GMI 클라우드는 실리콘밸리 기반 AI 인프라 기업임
  - 목표는 대규모 추론, 차세대 에이전틱 AI(agentic AI), 실시간 AI 애플리케이션을 지원하는 인프라임

- 이번 발표의 중심은 “AI가 실험 단계를 지나 실제 배포 단계로 가고 있다”는 메시지임
  - GMI 클라우드는 대규모 AI 학습과 추론 워크로드 증가에 대응하기 위해 고성능 GPU 서버 플랫폼을 도입할 예정임
  - 컴팔은 고집적 서버 설계, 열 관리 아키텍처, 시스템 통합 역량을 제공하는 역할을 맡음

- 양사 발언도 추론 인프라 쪽으로 초점이 맞춰져 있음
  - 컴팔 측은 AI 워크로드가 대규모 추론과 에이전틱 AI 애플리케이션 중심으로 진화하면서 집적도, 효율, 구축 주기가 중요해졌다고 설명함
  - GMI 클라우드 측은 모델 실험에서 실제 배포로 넘어가면서 확장 가능한 추론 인프라의 중요성이 커지고 있다고 봄

- COMPUTEX 2026에서 협업 결과도 공개할 계획임
  - 컴팔 부스에서는 GMI 클라우드의 에이전틱 AI와 추론 기반 애플리케이션 시나리오를 체험할 수 있다고 함
  - GMI 클라우드 부스에서는 컴팔의 고성능 AI 서버 플랫폼 Compal SGX30-2가 전시될 예정임

- Compal SGX30-2는 NVIDIA HGX B300 플랫폼 지원을 내세움
  - 대규모 AI 학습과 추론 워크로드에 필요한 성능과 확장성을 겨냥한 서버임
  - 고밀도 구축, 첨단 열 관리, 시스템 수준 통합 기능을 강조하고 있음
  - 결국 GPU를 얼마나 많이, 안정적으로, 빠르게 배치하느냐가 AI 클라우드 사업자의 경쟁력이 되는 흐름임

---

## 기술 맥락

- 이 발표에서 볼 포인트는 모델 자체가 아니라 추론 인프라예요. AI 서비스가 실제 사용자에게 배포되면 학습보다 매 요청을 처리하는 추론 비용, 지연 시간, 안정성이 더 크게 다가오거든요.

- 에이전틱 AI 워크로드가 언급되는 이유도 여기에 있어요. 에이전트는 한 번 답하고 끝나는 게 아니라 여러 단계로 도구를 호출하고 결과를 다시 해석해요. 같은 사용자 요청이라도 내부 추론 호출이 늘 수 있어서 인프라 요구가 더 빡세져요.

- 컴팔 같은 서버 제조사가 중요한 건 GPU만 꽂는다고 AI 클라우드가 되는 게 아니기 때문이에요. 고밀도 서버에서는 전력, 냉각, 랙 배치, 공급망, 장애 대응까지 같이 맞아야 실제 서비스 용량으로 전환돼요.

- HGX B300 지원 같은 문구는 그래서 단순 스펙 자랑에 가깝지만 의미는 있어요. GMI 클라우드 같은 인프라 사업자는 최신 GPU 플랫폼을 빠르게 도입해 추론 용량을 확보해야 하고, 컴팔은 그걸 서버 제품과 통합 역량으로 뒷받침하는 구도예요.

## 핵심 포인트

- 컴팔과 GMI 클라우드가 차세대 AI 인프라 구축 협력을 발표함
- 목표 워크로드는 대규모 추론, 에이전틱 AI, 실시간 AI 애플리케이션임
- GMI 클라우드는 고성능 GPU 서버 플랫폼을 도입할 예정임
- Compal SGX30-2는 NVIDIA HGX B300 플랫폼을 지원하도록 설계됨
- 양사는 COMPUTEX 2026에서 협업 성과와 애플리케이션 시나리오를 공개할 계획임

## 인사이트

보도자료 톤이 강하긴 하지만, AI 인프라 시장의 관심이 학습에서 추론과 에이전틱 워크로드로 이동하고 있다는 흐름은 분명해. 서버 제조사가 열 관리, 고밀도 구축, 공급망을 앞세우는 것도 결국 GPU 클라우드의 병목이 모델이 아니라 배포 인프라로 옮겨가고 있다는 얘기야.