리벨리온 '리벨100', gpt-oss·미니맥스에서 H200 대비 전성비 3배 기록
리벨리온이 2세대 AI 반도체 리벨 100으로 gpt-oss-120b와 MiniMax 등 최신 오픈소스 추론 모델을 구동해 엔비디아 H200 대비 3배 높은 전성비를 기록했다고 공개했다. UCIe 기반 칩렛 구조에 HBM3E 144GB를 탑재했으며, TPOT 3.2ms로 체감 응답 속도에서도 경쟁력을 입증했다.
- 1
gpt-oss-120b에서 효율 모드 TPOT 4.0ms, 성능 모드 3.2ms 기록
- 2
엔비디아 H200 대비 전성비(전력 대비 성능) 3배 달성 주장
- 3
AI 반도체 스타트업 최초로 UCIe 기반 칩렛 아키텍처 도입
- 4
HBM3E 144GB 탑재 — 120B급 모델을 단일 카드로 구동 가능
- 5
MiniMax 모델 구동은 국내 AI 반도체 업계 최초 사례
학습 시장은 엔비디아가 독점하지만 추론 시장은 구조적 여지가 있다. 리벨 100이 처음부터 추론에 올인하고 메모리 대역폭과 TPOT에 집중한 건 데이터센터 TCO 경쟁으로 틈을 만들려는 전략으로 읽힌다.
관련 기사
컴퓨텍스 2026, AI 경쟁 무대가 클라우드 밖 현실 세계로 옮겨간다
컴퓨텍스 2026은 'AI 투게더'를 내세우며 AI가 모델·연산 경쟁을 넘어 로봇, 제조 자동화, 돌봄, 엣지 디바이스 같은 현실 세계 적용 단계로 이동하고 있다는 메시지를 던졌다. 33개 국가·지역에서 1,500개 기업이 참가하고 6,000개 부스를 운영하는 역대 최대 규모 행사로, 퀄컴·마벨·인텔·NXP 등 주요 기업 CEO들이 기조연설에 나선다. 특히 로봇용 대규모 언어 모델 시장이 2028년 1,000억 달러를 넘고 연평균 48.2% 성장할 것이라는 전망이 핵심 숫자로 제시됐다.
엔비디아, 전 세계 AI 클라우드 생태계 넓히며 AI 팩토리 판 키운다
엔비디아가 지티시 타이베이에서 전 세계 AI 클라우드 파트너 생태계를 6개 대륙으로 확장하고 있다고 밝혔다. 핵심은 단순 GPU 공급이 아니라, 토큰 비용과 전력 효율까지 최적화한 풀스택 AI 팩토리 인프라를 지역별로 깔겠다는 전략이다.
MS, 클라우드 없이 도는 윈도 온디바이스 AI와 개발자용 RTX 데브박스 공개
마이크로소프트가 빌드 2026에서 클라우드를 거치지 않고 기기 안에서 AI 에이전트를 돌리는 온디바이스 AI 전략을 공개했어. 소형언어모델 아이언 1.0 두 종, 엔비디아 RTX 스파크 기반 서피스 하드웨어, WSL·터미널·파일 탐색기 개선까지 묶어 윈도를 AI 개발 플랫폼으로 다시 밀어붙이는 그림이야.
MS, 오픈AI·앤스로픽 겨냥한 자체 추론 모델 7종 공개
마이크로소프트가 빌드 행사에서 자체 학습한 추론 모델 MAI-싱킹-1과 코딩 모델 MAI-코드-1 등 7종을 공개했어. 오픈AI와 앤스로픽의 투자자이자 파트너였던 MS가 이제는 자체 모델, 에이전트, 개발자용 AI 하드웨어까지 묶어 직접 경쟁하는 쪽으로 방향을 튼 셈이야.
알파벳 120조원 증자, 악재가 아니라 AI 수요 신호라는 해석
미래에셋증권은 알파벳의 800억달러 규모 유상증자를 AI 인프라 투자 확대 신호로 해석했다. 단기 주가 하락은 부담이 아니라 매수 기회이며, 알파벳을 글로벌 AI 최선호주로 유지한다는 내용이다.
댓글
댓글
댓글을 불러오는 중...