본문으로 건너뛰기
피드

Zyphra, AMD GPU 기반 AI 클라우드 출시…오픈 가중치 모델 추론을 서버리스로 제공

ai-ml 약 5분
vote
0
댓글
북마크

Zyphra가 TensorWave 인프라와 AMD Instinct MI355X GPU를 기반으로 Zyphra 클라우드를 출시했어. DeepSeek V3.2, Kimi K2.6, GLM 5.1 같은 오픈 가중치 모델을 서버리스 추론으로 제공하고, 에이전트 코딩과 연구, 워크플로 자동화를 겨냥한다는 내용이야.

  • 1

    Zyphra 클라우드는 AMD Instinct MI355X GPU 기반으로 동작하고 TensorWave가 인프라를 제공해

  • 2

    Zyphra Inference는 DeepSeek V3.2, Kimi K2.6, GLM 5.1 같은 오픈 가중치 모델 접근을 제공해

  • 3

    회사는 커스텀 커널, 장문 컨텍스트 추론 알고리즘, 병렬 처리 방식을 활용한다고 밝혔고 향후 사후 훈련 서비스와 전용 GPU 클러스터 접근까지 확장할 계획이야

  • Zyphra가 AMD GPU 기반 AI 플랫폼인 Zyphra 클라우드를 출시함

    • 인프라는 TensorWave가 제공함
    • 하드웨어는 AMD Instinct MI355X GPU 기반이라고 밝힘
    • 샌프란시스코에 본사를 둔 Zyphra는 자신들을 개방형 초지능 연구 및 제품 회사로 소개함
  • 핵심 상품은 서버리스 추론 서비스인 Zyphra Inference임

    • DeepSeek V3.2, Kimi K2.6, GLM 5.1 같은 오픈 가중치 모델에 접근할 수 있게 함
    • 타깃 사용 사례는 에이전트 코딩, 연구, 워크플로 자동화임
    • 개발자 입장에서는 GPU 클러스터를 직접 잡고 서빙하지 않고도 모델 실행 환경을 쓰게 하겠다는 얘기임

중요

> 이 뉴스의 포인트는 “또 하나의 AI 클라우드 출시”가 아니라 AMD GPU 기반으로 오픈 가중치 모델 추론 플랫폼을 상용화했다는 점임. 엔비디아 중심 인프라 시장에서 대안 스택을 만들려는 움직임으로 읽힘.

  • Zyphra는 단순 모델 API가 아니라 모델 서빙, 에이전트 인프라, 컴퓨팅 리소스를 한 플랫폼에 묶는다고 설명함

    • 회사는 커스텀 커널을 사용한다고 밝혔음
    • 장문 컨텍스트 추론 알고리즘과 병렬 처리 방식도 활용한다고 함
    • 다만 구체적인 벤치마크 숫자나 가격 정보는 기사에 나오지 않음
  • AMD와 TensorWave도 각자 포지션을 분명히 가져감

    • AMD는 개방형 플랫폼과 산업 협력을 통해 차세대 AI 인프라를 구동한다고 강조함
    • TensorWave는 Zyphra 같은 AI 기업에 전용 고성능 AMD 컴퓨팅을 제공하는 역할을 맡음
    • 기사에는 AMD 주가가 지난 1년간 265% 급등했고, 52주 최고치인 362.79달러 근처에서 거래된다는 투자 맥락도 포함됨
  • Zyphra는 앞으로 플랫폼 기능을 더 확장할 계획임

    • 분산형 사후 훈련 서비스가 추가될 예정임
    • AMD EPYC CPU 기반 샌드박스형 에이전트 환경도 언급됨
    • 전용 GPU 클러스터 접근도 포함될 예정이지만, 구체적인 일정은 공개하지 않았음

기술 맥락

  • Zyphra가 AMD GPU를 전면에 세운 이유는 AI 추론 인프라 비용과 공급망 문제가 커졌기 때문이에요. 엔비디아 GPU가 여전히 강하지만, 모든 회사가 같은 하드웨어에만 의존하면 가격과 물량에서 선택지가 좁아지거든요.

  • 서버리스 추론을 붙인 것도 개발자 경험 때문이에요. 모델을 쓰려는 팀이 매번 GPU 클러스터, 서빙 서버, 스케일링 정책을 직접 운영하면 제품 개발보다 인프라 운영에 시간이 더 많이 들어가요.

  • 오픈 가중치 모델을 제공하는 전략은 폐쇄형 API와 다른 장점이 있어요. 기업이나 개발자가 모델 선택권을 더 많이 가져갈 수 있고, 특정 워크로드에 맞춰 후처리나 최적화를 붙이기 쉬워요.

  • 다만 기사에 성능 수치와 가격이 빠져 있어서 실전 판단은 아직 어려워요. 커스텀 커널과 장문 컨텍스트 추론 알고리즘을 쓴다고 해도, 결국 개발자는 지연시간, 처리량, 비용이 얼마나 나오는지를 보고 움직이게 되거든요.

AI 인프라 시장이 엔비디아 일변도에서 조금씩 갈라지는 장면으로 볼 만해. 다만 기사 자체는 보도자료 성격이 강해서, 실제 성능 수치나 가격 경쟁력이 공개되지 않은 점은 감안해야 함.

댓글

댓글

댓글을 불러오는 중...

ai-ml

서울 AI 허브, 커서 해커톤으로 공공데이터 기반 도시문제 해결 실험

서울 AI 허브가 Cursor 국내 공식 빌더 커뮤니티 Team Human과 함께 6월 27일 ‘Cursor Hackathon Seoul vol.3’를 연다. 참가자들은 생성형 AI와 서울시 공공데이터를 활용해 교통, 환경, 복지, 안전 같은 도시문제를 해결하는 서비스를 약 8시간 안에 구현하게 된다.

ai-ml

소버린 AI, 이제 ‘국산’보다 ‘통제권’ 기준을 따질 때

한국의 독자 AI 파운데이션 모델 프로젝트를 둘러싼 논쟁이 ‘외산 기술을 썼느냐’에 갇히면서 정작 중요한 기준 논의가 밀렸다는 지적이 나왔다. 전문가들은 소버린 AI의 핵심을 원산지 증명이 아니라 모델 가중치, 학습 과정, 데이터, 라이선스, 배포·운영 통제권을 국내 주체가 실제로 갖고 있는지로 봐야 한다고 말한다.

ai-ml

중국, AI를 가정과 상점에 밀어 넣는 ‘AI 플러스 소비’ 프로젝트 가동

중국 정부가 내수 침체를 돌파하기 위해 ‘AI 플러스 소비’ 활성화 계획을 내놨다. 휴머노이드, 실버 케어 로봇, 드론 배송, 스마트 홈, AI 체험 센터, 이자 보조금까지 묶어 AI 제품을 일상 소비재로 밀어붙이겠다는 전략이다.

ai-ml

AI 데이터센터 짓느라 빚내는 빅테크, 이제 금리도 신경 써야 함

아마존, 알파벳, 마이크로소프트, 메타 같은 하이퍼스케일러들이 AI 인프라에 올해 약 7천500억 달러를 쏟아부을 전망이다. 투자 규모가 너무 커지면서 잉여현금흐름만으로는 부족해졌고, 빅테크도 채권 발행과 금리 변화에 민감한 기업이 되고 있다.

ai-ml

알파폴드 노벨상 주역 존 점퍼, 구글 딥마인드 떠나 앤트로픽 합류

알파폴드 개발로 2024년 노벨 화학상을 받은 존 점퍼 구글 딥마인드 부사장이 앤트로픽으로 이직한다. 제미나이 공동 개발자 노엄 샤지어의 오픈AI 이직에 이어 구글 핵심 AI 인재 유출이 이어지는 모양새다.