본문으로 건너뛰기
피드

SKT, Arm·리벨리온과 손잡고 CPU+NPU 결합 AI 추론 서버 개발

ai-ml 약 3분
vote
0
댓글
북마크

SK텔레콤이 Arm, 리벨리온과 CPU+NPU 결합 AI 서버 솔루션을 공동 개발하기로 함. GPU 대비 전력 효율이 높은 이종 컴퓨팅 방식으로, AI 추론 시대의 데이터센터 경쟁력 확보를 노림.

  • 1

    Arm AGI CPU + 리벨리온 리벨카드(NPU) 결합 서버 솔루션

  • 2

    AI 학습→추론 전환기, 전력 효율이 핵심 경쟁력으로 부상

  • 3

    SKT 자체 AI 데이터센터에 우선 적용 후 A.X K1 모델 운영에 활용 검토

  • SKT가 Arm, 리벨리온과 차세대 AI 인프라 구축을 위한 MOU를 체결함

    • 핵심은 CPU(Arm AGI CPU) + NPU(리벨리온 리벨카드)를 결합한 서버 솔루션 공동 개발
    • 리벨카드는 올해 3분기 출시 예정인 AI 추론 전용 칩임
  • AI 산업이 '학습'에서 '추론' 단계로 무게중심이 이동하고 있음

    • 추론은 24시간 상시 운영되는 만큼 전력 효율과 비용이 곧 경쟁력임
    • 기존 GPU 기반 구조는 추론에도 쓸 수 있지만 전력 소모와 비용 부담이 큼

중요

> GPU가 AI 학습의 왕이었다면, 추론 시대에는 NPU가 대안으로 급부상 중. 추론은 한 번 하고 끝나는 게 아니라 서비스가 살아있는 동안 쉬지 않고 돌아가기 때문에, 전력 효율이 곧 경쟁력임.

  • CPU+NPU 이종 컴퓨팅 구조로 역할을 분담함

    • CPU가 시스템 관제탑 역할(데이터 처리, 시스템 운영 총괄)
    • NPU가 AI 추론 연산 전담 — 각자 잘하는 걸 맡는 구조임
  • SKT는 이 솔루션을 자체 AI 데이터센터에 먼저 적용해 검증할 계획임

    • 자체 파운데이션 모델 A.X K1 운영에 활용하는 방안도 검토 중
    • 최종 목표는 저전력·고효율 AI 추론 인프라 확보와 데이터센터 경쟁력 강화

기술 맥락

  • AI 추론이 왜 별도 칩이 필요한지 궁금할 수 있는데요. 학습은 한 번 하면 끝이지만 추론은 서비스가 살아있는 동안 계속 돌아가거든요. 매일 수백만 건의 요청을 처리하려면 전력 효율이 핵심이에요
  • GPU는 원래 병렬 연산에 특화된 칩인데, AI 학습의 대규모 행렬 연산에 딱 맞아서 표준이 됐어요. 근데 추론은 학습보다 연산 규모가 작고 대신 지연시간(latency)과 전력 효율이 중요하거든요. 그래서 추론에 특화된 NPU가 주목받는 거예요
  • Arm 기반 CPU를 서버에 쓰는 것도 같은 맥락이에요. 전통적으로 서버 CPU는 x86(인텔/AMD) 독무대였는데, AWS Graviton이 Arm 기반으로 전력 효율을 입증하면서 판도가 바뀌고 있거든요
  • 리벨리온은 한국 AI 반도체 스타트업 중에서 가장 주목받는 곳 중 하나예요. 이번에 Arm이라는 글로벌 반도체 설계 기업과 직접 협력한다는 건 기술력을 인정받았다는 신호로 읽을 수 있어요

GPU 중심 AI 인프라에서 추론 특화 NPU로의 전환이 본격화되고 있음. 한국 AI 칩 스타트업 리벨리온이 Arm이라는 글로벌 빅네임과 직접 협력한다는 점이 의미 있음.

댓글

댓글

댓글을 불러오는 중...

ai-ml

유튜브, AI 생성 영상에 자동 라벨 붙인다

유튜브가 사실적으로 보이거나 의미 있게 AI로 변경·생성된 콘텐츠에 더 눈에 띄는 라벨을 적용하고, 제작자가 AI 사용 여부를 밝히지 않아도 내부 신호로 감지되면 자동 라벨을 붙이겠다고 밝혔다. 다만 라벨만으로 추천 노출이나 수익화 자격이 바뀌지는 않으며, 제작자는 YouTube Studio에서 잘못된 판정을 수정할 수 있다.

ai-ml

테크 CEO들의 'AI 만능론', 숫자는 아직 그렇게 말하지 않는다

테크 업계에서 AI를 이유로 한 대규모 감원과 조직 재편이 이어지는 가운데, Box 창업자 애런 레비는 CEO들이 실제 업무의 마지막 1마일을 모른 채 AI 에이전트의 능력을 과대평가하고 있다고 지적했다. 2026년 첫 5개월 동안 이미 11만5430명이 해고됐고, 여러 연구는 AI 도입이 체감 생산성만큼 실제 생산성을 끌어올렸다는 근거가 아직 약하다고 말한다.

ai-ml

오픈AI와 앤트로픽, 코딩 에이전트로 드디어 돈 되는 시장을 찾은 듯

사이먼 윌리슨은 오픈AI와 앤트로픽이 코딩 에이전트와 기업용 과금으로 진짜 제품-시장 적합성을 찾았다고 봐. 개인 구독자에게는 월 100달러 플랜이 싸게 느껴지지만, 기업 고객은 이제 사용량 기준 토큰 가격을 그대로 내기 시작했고 이게 대형 고객 예산을 빠르게 흔들고 있다는 얘기야.

ai-ml

컴팔과 GMI 클라우드, 대규모 추론용 AI 인프라 구축 협력

컴팔이 실리콘밸리 기반 AI 인프라 기업 GMI 클라우드와 협력해 대규모 추론과 에이전틱 AI 워크로드에 맞춘 GPU 서버 인프라를 구축한다고 발표했어. COMPUTEX 2026에서는 NVIDIA HGX B300을 지원하는 Compal SGX30-2 같은 고성능 AI 서버 플랫폼도 선보일 예정이야.

ai-ml

AI 쓰면 편해진다더니, 직장인들은 ‘AI 과부하’에 지쳐가는 중

국내 직장인들이 AI 전환 압박, AI 답변 검증 부담, 대체 불안 때문에 피로감을 호소하고 있어. 중앙일보 설문에서는 5284명 중 31.6%가 ‘AI 답변 검증에 시간이 더 걸릴 때’를 가장 지치는 순간으로 꼽았고, 기업들은 무작정 AI 사용량을 밀어붙이는 방식에서 업무 방식 재설계로 넘어가야 한다는 지적이 나와.