---
title: "Zyphra, AMD GPU 기반 AI 클라우드 출시…오픈 가중치 모델 추론을 서버리스로 제공"
published: 2026-05-04T20:05:04.574Z
canonical: https://jeff.news/article/2230
---
# Zyphra, AMD GPU 기반 AI 클라우드 출시…오픈 가중치 모델 추론을 서버리스로 제공

Zyphra가 TensorWave 인프라와 AMD Instinct MI355X GPU를 기반으로 Zyphra 클라우드를 출시했어. DeepSeek V3.2, Kimi K2.6, GLM 5.1 같은 오픈 가중치 모델을 서버리스 추론으로 제공하고, 에이전트 코딩과 연구, 워크플로 자동화를 겨냥한다는 내용이야.

- Zyphra가 AMD GPU 기반 AI 플랫폼인 Zyphra 클라우드를 출시함
  - 인프라는 TensorWave가 제공함
  - 하드웨어는 AMD Instinct MI355X GPU 기반이라고 밝힘
  - 샌프란시스코에 본사를 둔 Zyphra는 자신들을 개방형 초지능 연구 및 제품 회사로 소개함

- 핵심 상품은 서버리스 추론 서비스인 Zyphra Inference임
  - DeepSeek V3.2, Kimi K2.6, GLM 5.1 같은 오픈 가중치 모델에 접근할 수 있게 함
  - 타깃 사용 사례는 에이전트 코딩, 연구, 워크플로 자동화임
  - 개발자 입장에서는 GPU 클러스터를 직접 잡고 서빙하지 않고도 모델 실행 환경을 쓰게 하겠다는 얘기임

> [!IMPORTANT]
> 이 뉴스의 포인트는 “또 하나의 AI 클라우드 출시”가 아니라 AMD GPU 기반으로 오픈 가중치 모델 추론 플랫폼을 상용화했다는 점임. 엔비디아 중심 인프라 시장에서 대안 스택을 만들려는 움직임으로 읽힘.

- Zyphra는 단순 모델 API가 아니라 모델 서빙, 에이전트 인프라, 컴퓨팅 리소스를 한 플랫폼에 묶는다고 설명함
  - 회사는 커스텀 커널을 사용한다고 밝혔음
  - 장문 컨텍스트 추론 알고리즘과 병렬 처리 방식도 활용한다고 함
  - 다만 구체적인 벤치마크 숫자나 가격 정보는 기사에 나오지 않음

- AMD와 TensorWave도 각자 포지션을 분명히 가져감
  - AMD는 개방형 플랫폼과 산업 협력을 통해 차세대 AI 인프라를 구동한다고 강조함
  - TensorWave는 Zyphra 같은 AI 기업에 전용 고성능 AMD 컴퓨팅을 제공하는 역할을 맡음
  - 기사에는 AMD 주가가 지난 1년간 265% 급등했고, 52주 최고치인 362.79달러 근처에서 거래된다는 투자 맥락도 포함됨

- Zyphra는 앞으로 플랫폼 기능을 더 확장할 계획임
  - 분산형 사후 훈련 서비스가 추가될 예정임
  - AMD EPYC CPU 기반 샌드박스형 에이전트 환경도 언급됨
  - 전용 GPU 클러스터 접근도 포함될 예정이지만, 구체적인 일정은 공개하지 않았음

---

## 기술 맥락

- Zyphra가 AMD GPU를 전면에 세운 이유는 AI 추론 인프라 비용과 공급망 문제가 커졌기 때문이에요. 엔비디아 GPU가 여전히 강하지만, 모든 회사가 같은 하드웨어에만 의존하면 가격과 물량에서 선택지가 좁아지거든요.

- 서버리스 추론을 붙인 것도 개발자 경험 때문이에요. 모델을 쓰려는 팀이 매번 GPU 클러스터, 서빙 서버, 스케일링 정책을 직접 운영하면 제품 개발보다 인프라 운영에 시간이 더 많이 들어가요.

- 오픈 가중치 모델을 제공하는 전략은 폐쇄형 API와 다른 장점이 있어요. 기업이나 개발자가 모델 선택권을 더 많이 가져갈 수 있고, 특정 워크로드에 맞춰 후처리나 최적화를 붙이기 쉬워요.

- 다만 기사에 성능 수치와 가격이 빠져 있어서 실전 판단은 아직 어려워요. 커스텀 커널과 장문 컨텍스트 추론 알고리즘을 쓴다고 해도, 결국 개발자는 지연시간, 처리량, 비용이 얼마나 나오는지를 보고 움직이게 되거든요.

## 핵심 포인트

- Zyphra 클라우드는 AMD Instinct MI355X GPU 기반으로 동작하고 TensorWave가 인프라를 제공해
- Zyphra Inference는 DeepSeek V3.2, Kimi K2.6, GLM 5.1 같은 오픈 가중치 모델 접근을 제공해
- 회사는 커스텀 커널, 장문 컨텍스트 추론 알고리즘, 병렬 처리 방식을 활용한다고 밝혔고 향후 사후 훈련 서비스와 전용 GPU 클러스터 접근까지 확장할 계획이야

## 인사이트

AI 인프라 시장이 엔비디아 일변도에서 조금씩 갈라지는 장면으로 볼 만해. 다만 기사 자체는 보도자료 성격이 강해서, 실제 성능 수치나 가격 경쟁력이 공개되지 않은 점은 감안해야 함.
