본문으로 건너뛰기
피드

국산 AI 반도체 레니게이드·리벨100, 정부 성능 검증 통과

ai-ml 약 4분
vote
0
댓글
북마크

과기정통부가 국산 AI 반도체 성능 지표인 K-퍼프를 써서 퓨리오사AI의 레니게이드와 리벨리온의 리벨100을 검증했다. 챗봇, 문서 검색, 보고서 생성, 대용량 문서 분석 같은 실제 서비스 조건에서 둘 다 기준을 만족했다는 게 핵심이다.

  • 1

    K-퍼프는 국산 AI 반도체 성능을 실제 서비스 환경 기준으로 재는 공식 지표임

  • 2

    레니게이드와 리벨100이 챗봇·검색·보고서 생성·문서 분석 서비스 기준을 만족함

  • 3

    정부는 서버형뿐 아니라 온디바이스형 AI 반도체까지 성능 측정 기준을 넓힐 계획임

  • 과기정통부가 국산 AI 반도체 성능을 공식 지표로 검증했다는 소식임

    • 4일 서울 롯데호텔에서 열린 ‘K-AI 반도체 성장 포럼’에서 결과를 공유함
    • 대상은 퓨리오사AI의 레니게이드와 리벨리온의 리벨100
  • 이번 검증에 쓰인 기준은 K-퍼프(Perf)임

    • 국산 AI 반도체 성능을 객관적으로 보여주기 위한 공식 측정 지표
    • 지난해 12월 수요 기관과 공급 기관이 같이 참여해서 실제 사용 환경 중심으로 측정 모델, 조건, 지표를 정함
    • 그냥 “우리 칩 빨라요”가 아니라, 수요 기업이 구매 판단에 쓸 수 있는 데이터로 만들겠다는 쪽에 가까움

중요

> 검증 포인트는 단순 벤치마크 점수가 아니라 실제 AI 서비스 유형별 기준을 만족했는지임. 챗봇, 문서 검색, 보고서 생성, 대용량 문서 분석처럼 기업이 바로 떠올리는 워크로드가 들어감.

  • 레니게이드와 리벨100은 대표 AI 서비스 4종에서 성능 검증을 받음

    • AI 챗봇 서비스
    • 문서 검색 서비스
    • 보고서 생성 서비스
    • 대용량 문서 분석 서비스
  • 결과적으로 두 칩 모두 서비스별 성능 기준을 만족한 것으로 나옴

    • 모델 크기, 입출력 크기, 동시 사용 규모인 배치(Batch) 같은 조건을 바꿔가며 반복 실험함
    • 기사 표현상으로는 서비스 유형별 시험 조건에 따른 성능 측정 결과를 즉각 도출할 수 있음을 확인했다는 설명임
    • 즉, 특정 데모 하나가 잘 돈다는 얘기보다 “조건을 바꿔도 성능 데이터를 뽑을 수 있는 검증 체계가 생겼다”는 쪽이 더 중요함
  • 정부는 앞으로 측정 범위를 서버형에서 온디바이스형 AI 반도체까지 넓힐 계획임

    • 온디바이스 AI는 스마트폰, 노트북, 엣지 장비에서 직접 추론하는 쪽이라 서버형과 성능 조건이 다름
    • 테스트베드 같은 실증 인프라도 제공하겠다고 밝힘
    • 국내 AI 반도체 생태계가 커지려면 칩 자체보다 검증·실증·레퍼런스 고객이 같이 붙어야 하는데, 이번 포럼은 그 흐름의 일부로 보면 됨

기술 맥락

  • 이번 선택의 핵심은 “칩 스펙표”가 아니라 “서비스별 실사용 성능”을 기준으로 삼았다는 점이에요. AI 반도체는 TOPS 같은 숫자만 봐서는 실제 챗봇이나 문서 분석 서비스에서 얼마나 버티는지 알기 어렵거든요.

  • K-Perf가 모델 크기, 입출력 크기, 배치 조건을 같이 보는 이유도 여기에 있어요. 같은 칩이라도 입력 토큰이 길어지거나 동시 요청이 늘어나면 지연 시간과 처리량이 확 바뀌기 때문에, 수요 기업은 자기 서비스 조건에 맞는 데이터를 봐야 해요.

  • 정부가 온디바이스형까지 기준을 넓히려는 것도 자연스러운 흐름이에요. 서버형 AI 반도체는 데이터센터 추론이 중심이지만, 온디바이스는 전력, 발열, 메모리 제약이 훨씬 빡빡해서 별도 검증 기준이 필요하거든요.

  • 개발자 입장에서는 앞으로 공개될 세부 데이터가 중요해요. 어떤 모델에서, 어떤 배치 크기로, 어느 정도 입력 길이를 처리했고, 지연 시간과 처리량이 얼마였는지가 나와야 실제 도입 판단으로 이어질 수 있어요.

국산 AI 반도체 얘기가 늘 ‘가능성’에 머물렀다면, 이번 포인트는 수요 기업이 볼 수 있는 객관 성능 데이터로 넘어가려는 시도라는 점임. 개발자 입장에선 모델 이름보다 실제 배치 크기, 입출력 크기, 서비스별 지연·처리량 데이터가 얼마나 공개되느냐가 진짜 관전 포인트임.

댓글

댓글

댓글을 불러오는 중...

ai-ml

동아대와 메가존클라우드, 양자컴퓨팅·양자 머신러닝 단기 특강 연다

동아대 G-LAMP 연구소가 메가존클라우드와 함께 6월 29일부터 30일까지 양자컴퓨팅 단기 특강을 연다. 큐비트와 게이트 기초부터 AWS 브래킷 실습, 그로버·쇼어 알고리즘, 양자 머신러닝까지 이틀 안에 다루는 집중 과정이다.

ai-ml

기업 AI 에이전트가 너무 많아질 때, 답은 ‘오케스트레이션 레이어’라는 주장

엠클라우드브리지는 기업 내 AI 도구가 부서별로 따로 도입되며 생기는 ‘AI 사일로’를 문제로 짚고, 이를 묶는 중간 오케스트레이션 레이어를 제안한다. Ai 365는 MS 365·애저·패브릭 위에서 지식·데이터·업무·보안 에이전트를 통합 운영하는 엔터프라이즈 AI 플랫폼이다.

ai-ml

요기요, 제미나이 엔터프라이즈로 사내 AI 해커톤 열고 실제 서비스 적용 추진

메가존소프트와 구글클라우드가 요기요의 첫 사내 AI 해커톤을 기술 지원했다. 43개 팀이 57개 아이디어를 냈고, 대상은 메뉴 개선과 이미지 최적화를 제안한 ‘AI 메뉴 비서’가 받았다.

ai-ml

구글, 노트북에서 돌리는 멀티모달 오픈 모델 ‘젬마 4 12B’ 공개

구글이 개인 노트북과 온디바이스 환경에서 멀티모달 AI 에이전트를 돌릴 수 있는 오픈 모델 ‘젬마 4 12B’를 공개했다. 별도 이미지·오디오 인코더를 덜어낸 구조, 16GB급 메모리 환경 지원, 아파치 2.0 라이선스 배포가 핵심이다.

ai-ml

엔비디아와 델 무대에 오른 네이버클라우드, 무기는 풀스택 AI

네이버클라우드가 엔비디아와 델 행사에서 동시에 주요 AI 파트너로 언급됐어. 자체 대규모 언어 모델, 클라우드 인프라, 데이터센터, 서비스 운영까지 가진 풀스택 구조를 앞세워 추론 수요와 소버린 AI 시장을 노리고 있어.