본문으로 건너뛰기
피드

리벨리온 '리벨100' 성능 공개 — H200급 연산, 전력은 3분의 1

ai-ml 약 4분
vote
0
댓글
북마크

한국 AI 반도체 스타트업 리벨리온이 차세대 NPU 리벨100의 성능을 공개했다. FP16 1페타플롭스로 엔비디아 H200과 사실상 동급이면서 전력은 1/3 수준. 삼성 144GB HBM3E와 UCIe 칩렛 구조를 채택했고 하반기 양산에 들어간다.

  • 1

    리벨100은 FP16 1페타플롭스, H200(0.99 페타플롭스)과 동급 성능

  • 2

    GPT-oss-120b 추론 시 전력소비량이 H200 대비 1/3

  • 3

    삼성 144GB HBM3E 탑재, 스타트업 최초 UCIe 기반 칩렛 아키텍처

  • 4

    삼성 파운드리 4나노 공정 생산, 2026년 하반기 양산 시작

  • 5

    미니맥스 등 오픈소스 모델 최적화로 추론 인프라 시장 본격 공략

  • 리벨리온이 차세대 NPU '리벨100'의 성능을 공개함 — 엔비디아 H200급 연산, 전력은 3분의 1
    • FP16 기준 1페타플롭스(1초 1000조 번 연산), H200의 0.99 페타플롭스와 사실상 동급
    • 오픈AI의 GPT-oss-120b 구동 시 전력소비량이 H200 대비 1/3 수준. 전성비가 핵심 차별화 포인트
  • 하드웨어 구성도 엔비디아 최신 스펙을 거의 따라감
    • 삼성전자 144GB HBM3E 탑재 (리벨리온 최초 HBM). H200은 141GB HBM3E
    • 반도체 스타트업 최초로 UCIe 기반 칩렛 아키텍처 채택
    • 삼성전자 파운드리 4나노 공정에서 생산

중요

> H200급 연산을 전력 1/3로 돌린다는 게 사실이라면, 데이터센터 TCO 계산이 뒤집힌다. 하반기 양산 시점이 관전 포인트.

  • 타겟은 기업 서버가 아니라 데이터센터 본진
    • 1세대 '아톰'은 기업용 서버용. 리벨100은 처음부터 하이퍼스케일러 겨냥
    • 판매 단위는 NPU 8장이 통합된 서버 단위. 랙 단위에서도 엔비디아와 경쟁 가능하도록 준비 중
  • 소프트웨어 생태계 대응도 빠름
    • 글로벌 사용자 Top5 코딩용 오픈소스 AI 모델 '미니맥스' 최적화 완료
    • 엔비디아 외에 미니맥스 최적화에 성공한 반도체가 거의 없는 상황
    • SK텔레콤, LG AI연구원, 업스테이지, 구글, 알리바바 오픈소스 모델까지 지원 확대 계획
  • 양산은 2026년 하반기 시작

기술 맥락

리벨100이 강조하는 건 단순 '엔비디아 대체'가 아니라 추론(inference) 전력효율이에요. 학습(training)은 여전히 엔비디아의 CUDA 생태계가 사실상 독점이지만, 추론은 전력단가와 TCO가 직접적으로 매출에 꽂히는 영역이라 NPU 스타트업들이 여길 공략하는 거거든요. 오픈소스 모델(GPT-oss, 미니맥스) 벤치마크를 앞세우는 것도 추론 시장을 타겟팅한다는 신호예요.

UCIe 기반 칩렛 아키텍처를 택한 것도 의미가 큰데, 칩 하나에 모든 걸 집적하는 대신 여러 다이를 인터커넥트로 묶는 구조라 수율과 확장성에서 유리해요. 엔비디아도 B200부터 칩렛으로 가고 있고요. 스타트업이 이걸 양산 제품에 넣는 건 흔치 않은 선택이에요.

HBM3E를 삼성에서 가져온 점도 관전 포인트예요. SK하이닉스가 엔비디아향 HBM을 거의 독점하고 있는 상황에서, 삼성 HBM을 공급망으로 묶어낸 한국 팹리스 스타트업이라는 포지션이 생긴 셈이거든요. 파운드리도 삼성 4나노라 한국 반도체 생태계 내 수직계열화 구도가 만들어졌어요.

관건은 추론 인프라 시장에서 얼마나 빠르게 레퍼런스를 깔 수 있느냐예요. 성능 숫자가 아무리 좋아도 CUDA 대안 SW 스택이 안정적으로 돌아가고, 주요 오픈소스 모델이 하루라도 빨리 포팅돼야 데이터센터 사업자들이 움직이거든요. 미니맥스 최적화 속도를 강조한 건 이 부분을 의식한 메시지로 보여요.

추론 시장의 핵심 지표는 '와트당 토큰'이다. H200급 성능을 전력 1/3으로 돌린다면 TCO 계산이 뒤집힐 수 있고, 하반기 양산과 데이터센터 레퍼런스 확보 속도가 향후 12개월 관전 포인트다.

댓글

댓글

댓글을 불러오는 중...

ai-ml

미국의 AI 우위가 흔들린다, 중국은 GPU 봉쇄를 우회하며 격차를 좁히는 중

미국이 GPU 수출 통제로 중국의 AI 추격을 늦추려 했지만, 중국은 오픈웨이트 모델, 자체 AI칩, 산업 현장 적용 속도를 앞세워 격차를 줄이고 있다. 앤트로픽은 중국이 프런티어 AI 우위를 잡으면 감시·검열·군사·사이버 역량이 강화될 수 있다고 경고했다. 동시에 전문가들은 이제 AI 경쟁의 핵심이 컴퓨트만이 아니라 인재, 데이터, 도메인 적용 능력으로 옮겨가고 있다고 본다.

ai-ml

구글, 노트북에서 돌리는 멀티모달 모델 Gemma 4 12B 공개

구글이 Gemma 4 12B를 공개했음. 이미지와 오디오용 별도 인코더를 줄이거나 없애고, 16GB 메모리급 노트북에서도 로컬 멀티모달 에이전트를 돌리는 쪽에 초점을 맞춘 모델임.

ai-ml

씨샵으로 로컬 대규모 언어 모델을 돌리는 추론 엔진, 텐서샤프 공개

텐서샤프는 GGUF 모델 파일을 로컬에서 실행하는 씨샵 기반 대규모 언어 모델 추론 엔진이다. 콘솔, 웹 챗봇, 올라마 호환 API, 오픈에이아이 호환 API를 제공하고, 젬마 4·큐웬 3 계열·지피티 오에스에스·네모트론-H·미스트랄 3 같은 모델을 지원한다.

ai-ml

제작비 2천 달러짜리 인공지능 실사 영화, 메이저 영화제에 들어갔다

이란 시위 탄압을 다룬 75분짜리 드라마 '드림스 오브 바이올렛'이 트라이베카 영화제에서 공개된다. 모든 이미지와 캐릭터가 인공지능으로 생성된 실사 장편이며, 감독 애시 쿠샤는 제작비가 2천 달러 미만이었다고 말한다.

ai-ml

오픈소스로 고객지원 AI 에이전트를 직접 호스팅하는 콘버시오

콘버시오는 고객지원 챗봇, 답변 초안, 대화 요약, 이슈 라우팅을 한 번에 처리하는 오픈소스 AI 지원 계층을 내세운다. 핵심 메시지는 기능보다 통제권이다. 고객 대화, 프롬프트, 임베딩, 모델 트래픽을 팀이 소유한 인프라 안에 두자는 쪽이다.