Zyphra, AMD GPU 기반 AI 클라우드 출시…오픈 가중치 모델 추론을 서버리스로 제공

ai-ml 2026-05-04 약 5분

 tags

#amd #gpu #inference #serverless #agent

vote

북마크

원문 보기

Zyphra가 TensorWave 인프라와 AMD Instinct MI355X GPU를 기반으로 Zyphra 클라우드를 출시했어. DeepSeek V3.2, Kimi K2.6, GLM 5.1 같은 오픈 가중치 모델을 서버리스 추론으로 제공하고, 에이전트 코딩과 연구, 워크플로 자동화를 겨냥한다는 내용이야.

1
Zyphra 클라우드는 AMD Instinct MI355X GPU 기반으로 동작하고 TensorWave가 인프라를 제공해
2
Zyphra Inference는 DeepSeek V3.2, Kimi K2.6, GLM 5.1 같은 오픈 가중치 모델 접근을 제공해
3
회사는 커스텀 커널, 장문 컨텍스트 추론 알고리즘, 병렬 처리 방식을 활용한다고 밝혔고 향후 사후 훈련 서비스와 전용 GPU 클러스터 접근까지 확장할 계획이야

Zyphra가 AMD GPU 기반 AI 플랫폼인 Zyphra 클라우드를 출시함
- 인프라는 TensorWave가 제공함
- 하드웨어는 AMD Instinct MI355X GPU 기반이라고 밝힘
- 샌프란시스코에 본사를 둔 Zyphra는 자신들을 개방형 초지능 연구 및 제품 회사로 소개함
핵심 상품은 서버리스 추론 서비스인 Zyphra Inference임
- DeepSeek V3.2, Kimi K2.6, GLM 5.1 같은 오픈 가중치 모델에 접근할 수 있게 함
- 타깃 사용 사례는 에이전트 코딩, 연구, 워크플로 자동화임
- 개발자 입장에서는 GPU 클러스터를 직접 잡고 서빙하지 않고도 모델 실행 환경을 쓰게 하겠다는 얘기임

❗중요

> 이 뉴스의 포인트는 “또 하나의 AI 클라우드 출시”가 아니라 AMD GPU 기반으로 오픈 가중치 모델 추론 플랫폼을 상용화했다는 점임. 엔비디아 중심 인프라 시장에서 대안 스택을 만들려는 움직임으로 읽힘.

Zyphra는 단순 모델 API가 아니라 모델 서빙, 에이전트 인프라, 컴퓨팅 리소스를 한 플랫폼에 묶는다고 설명함
- 회사는 커스텀 커널을 사용한다고 밝혔음
- 장문 컨텍스트 추론 알고리즘과 병렬 처리 방식도 활용한다고 함
- 다만 구체적인 벤치마크 숫자나 가격 정보는 기사에 나오지 않음
AMD와 TensorWave도 각자 포지션을 분명히 가져감
- AMD는 개방형 플랫폼과 산업 협력을 통해 차세대 AI 인프라를 구동한다고 강조함
- TensorWave는 Zyphra 같은 AI 기업에 전용 고성능 AMD 컴퓨팅을 제공하는 역할을 맡음
- 기사에는 AMD 주가가 지난 1년간 265% 급등했고, 52주 최고치인 362.79달러 근처에서 거래된다는 투자 맥락도 포함됨
Zyphra는 앞으로 플랫폼 기능을 더 확장할 계획임
- 분산형 사후 훈련 서비스가 추가될 예정임
- AMD EPYC CPU 기반 샌드박스형 에이전트 환경도 언급됨
- 전용 GPU 클러스터 접근도 포함될 예정이지만, 구체적인 일정은 공개하지 않았음

기술 맥락

Zyphra가 AMD GPU를 전면에 세운 이유는 AI 추론 인프라 비용과 공급망 문제가 커졌기 때문이에요. 엔비디아 GPU가 여전히 강하지만, 모든 회사가 같은 하드웨어에만 의존하면 가격과 물량에서 선택지가 좁아지거든요.
서버리스 추론을 붙인 것도 개발자 경험 때문이에요. 모델을 쓰려는 팀이 매번 GPU 클러스터, 서빙 서버, 스케일링 정책을 직접 운영하면 제품 개발보다 인프라 운영에 시간이 더 많이 들어가요.
오픈 가중치 모델을 제공하는 전략은 폐쇄형 API와 다른 장점이 있어요. 기업이나 개발자가 모델 선택권을 더 많이 가져갈 수 있고, 특정 워크로드에 맞춰 후처리나 최적화를 붙이기 쉬워요.
다만 기사에 성능 수치와 가격이 빠져 있어서 실전 판단은 아직 어려워요. 커스텀 커널과 장문 컨텍스트 추론 알고리즘을 쓴다고 해도, 결국 개발자는 지연시간, 처리량, 비용이 얼마나 나오는지를 보고 움직이게 되거든요.

AI 인프라 시장이 엔비디아 일변도에서 조금씩 갈라지는 장면으로 볼 만해. 다만 기사 자체는 보도자료 성격이 강해서, 실제 성능 수치나 가격 경쟁력이 공개되지 않은 점은 감안해야 함.

이전 기사 (P)

다음 기사 (N)

댓글을 불러오는 중...

ai-ml 2026-05-06

직장에서 AI로 ‘일하는 척’이 쉬워졌다는 불편한 얘기

이 글은 생성형 AI가 생산성을 올리는 도구인 동시에, 전문성 없는 사람이 전문적인 산출물을 흉내 내게 만드는 도구가 됐다고 비판해. 특히 문제는 초보자가 더 빨라지는 수준이 아니라, 아예 훈련받지 않은 분야의 결과물을 그럴듯하게 만들어 조직 안에서 검증 없이 굴러가게 만드는 데 있다고 짚어.

ai-ml 2026-05-06

AI 상담에 마음을 맡기는 사람들, 편하긴 한데 진짜 괜찮을까

AI 챗봇을 상담사처럼 쓰는 사람들이 늘고 있지만, 전문가들은 정서적 의존과 판단 외주화가 보이지 않는 위험을 만든다고 본다. 실제 실험에서는 AI가 즉각적인 위로와 명확한 답을 주는 데 강했지만, 인간 상담사는 질문을 통해 내담자가 자기 맥락을 더 깊게 보게 만들었다.

ai-ml 2026-05-06

국내 의료 AI, 학회장에서 ‘실제 임상 데이터’로 존재감 키웠다

국내 의료 AI 기업들이 학회 시즌을 맞아 중환자 예측, 심전도 분석, 치매 치료제 부작용 모니터링 등 실제 임상 적용 사례를 공개했다. 핵심은 기술 데모가 아니라 병원 EMR 데이터와 임상 근거를 바탕으로 의료진 업무 부담과 환자 안전 문제를 해결한다는 점이다.

ai-ml 2026-05-06

미국 기술업계 해고 40% 증가, AI가 화이트칼라 조직을 다시 짜고 있다

월스트리트저널은 AI 확산이 미국 기술업계의 구조조정을 가속하고 있다고 보도했다. 미국 전체 해고는 전년 대비 줄었지만, 기술 분야 해고는 1분기에 40% 늘었고 기업들은 중간관리와 반복 업무를 줄이는 방향으로 움직이고 있다.

ai-ml 2026-05-06

광주AI사관학교 7기 시작, 8개월짜리 실전형 고급 과정으로 갈아엎었다

광주인공지능사관학교가 7기 교육생 220명과 함께 8개월 교육에 들어갔다. 올해는 교육 체계와 지원 구조를 바꿔 AI 모델 기획, 개발, 검증, 사업화까지 한 번에 경험하는 실전형 고급 과정으로 운영된다.

Zyphra, AMD GPU 기반 AI 클라우드 출시…오픈 가중치 모델 추론을 서버리스로 제공

요약

핵심 포인트

핵심 개념

분석

기술 맥락

인사이트

댓글

댓글

Zyphra, AMD GPU 기반 AI 클라우드 출시…오픈 가중치 모델 추론을 서버리스로 제공

요약

핵심 포인트

핵심 개념

분석

기술 맥락

인사이트

댓글

댓글

관련 기사