본문으로 건너뛰기
피드

LG ‘K-엑사원’, 벤치마크 10개 1위 찍고 실전형 AI 모델로 고도화

ai-ml 약 5분
vote
0
댓글
북마크

LG AI연구원이 독파모 프로젝트용 모델 ‘K-엑사원’을 고도화하며 2단계 프로젝트에 들어간다. 1차 평가 13개 벤치마크 중 10개에서 1위를 차지했고, 하이브리드 어텐션으로 메모리 요구량과 연산량을 기존 엑사원 4.0 대비 70% 줄였다. 추론 속도 150% 향상, 긴 문서 처리 1.3배 개선 같은 수치도 공개됐다.

  • 1

    K-엑사원은 1차 평가 13개 벤치마크 중 10개 영역에서 1위를 차지함

  • 2

    하이브리드 어텐션으로 메모리 요구량과 연산량을 엑사원 4.0 대비 70% 줄임

  • 3

    멀티 토큰 예측 자체 설계로 추론 속도를 150% 높임

  • 4

    LG 컨소시엄은 공공, 금융, 제조 실증을 통해 실전 도구형 AI를 지향함

  • LG AI연구원이 ‘K-엑사원’ 고도화로 독파모 2단계 프로젝트에 들어감

    • K-엑사원은 LG AI연구원이 5년간 엑사원을 개발하며 쌓은 기술을 집약한 모델임
    • 목표는 단순 연구용 모델이 아니라 산업 현장 문제를 푸는 실전 도구형 전문가 AI임
  • 1차 평가 성적은 꽤 공격적으로 내세울 만함

    • 13개 벤치마크 지표 중 10개 영역에서 1위를 차지함
    • 글로벌 AI 성능 평가 기관 아티피셜 어낼리시스의 인텔리전스 지수에서도 오픈 웨이트 모델 기준 당시 세계 7위, 국내 1위에 올랐다고 함
    • 국내 독자 파운데이션 모델로서 기본 체력을 검증했다는 게 LG 쪽 메시지임

중요

> 숫자로 제일 눈에 띄는 건 벤치마크 1위보다 비용 절감임. 하이브리드 어텐션으로 메모리 요구량과 연산량을 엑사원 4.0 대비 70% 줄였다고 밝힘.

  • K-엑사원의 핵심 개선은 성능과 비용을 같이 잡는 쪽임

    • 전체 문맥을 파악하는 글로벌 어텐션과 필요한 구간에만 집중하는 방식을 결합한 하이브리드 어텐션을 적용함
    • 이 구조로 메모리 요구량과 연산량을 엑사원 4.0 대비 70% 줄였다고 함
    • 파운데이션 모델은 성능만 좋아도 운영비가 터지면 현장 도입이 어렵기 때문에, 이 수치가 꽤 중요함
  • 추론 속도와 긴 문서 처리도 개선됨

    • 자체 설계한 멀티 토큰 예측 영역으로 추론 속도를 150% 높임
    • 학습 어휘를 15만개로 확장해 긴 문서 처리 능력을 1.3배 향상시킴
    • 긴 문서 처리는 공공, 금융, 제조 문서 자동화에서 체감이 큰 영역임
  • 답변 품질을 끌어올리기 위한 학습 알고리즘도 들어감

    • 오답에서 학습 신호를 찾는 강화학습 알고리즘 AGAPO를 적용함
    • 선호학습 알고리즘 GrouPER도 적용해 답변의 자연스러움과 정확도를 개선했다고 함
    • 결국 모델 구조, 추론 최적화, 학습 후처리를 한꺼번에 손본 셈임
  • LG 컨소시엄 구성도 꽤 풀스택 지향임

    • LG AI연구원이 주관하고, LG유플러스·LG CNS·슈퍼브AI가 고성능 파운데이션 모델 개발에 참여함
    • 퓨리오사AI, 프렌들리AI, 엘리스그룹은 풀스택 AI 산업 생태계 쪽을 맡음
    • 이스트소프트, 이스트에이드, 한글과컴퓨터, 뤼튼테크놀로지스는 서비스 선도 사례 창출 쪽에 붙음
  • 실증 사업은 공공과 산업 쪽이 강점으로 제시됨

    • LG CNS를 중심으로 외교부 지능형 외교안보 데이터 플랫폼을 추진함
    • 경찰청 AI 수사 지원 서비스, 행정안전부 AI 안전신문고 연구 개발도 언급됨
    • 금융·제조 전반의 생태계 경험도 강점으로 내세움
  • LG AI연구원은 엑사원을 ‘전문가 AI’로 키우겠다는 방향을 밝힘

    • 단순 기술 확보가 아니라 산업 현장의 실제 문제를 해결하는 실전 도구가 목표라고 설명함
    • 향후 피지컬 인텔리전스 구현까지 이어가겠다는 계획도 내놓음

기술 맥락

  • K-엑사원에서 제일 중요한 선택은 모델 성능만 키우는 게 아니라 운영 비용을 줄이는 구조를 넣었다는 점이에요. 파운데이션 모델은 실제 서비스에 붙이면 추론 비용과 메모리 요구량이 바로 병목이 되거든요.

  • 하이브리드 어텐션은 긴 문맥을 무작정 전부 무겁게 처리하지 않기 위한 선택으로 볼 수 있어요. 전체 흐름은 유지하면서 필요한 구간에 더 집중하면, 긴 문서를 다루는 산업 업무에서 비용과 속도를 같이 개선할 여지가 생겨요.

  • 멀티 토큰 예측으로 추론 속도를 150% 높였다는 부분도 실전 배포 관점에서 중요해요. 사용자가 기다리는 시간이 줄어야 공공 문서, 금융 상담, 제조 업무 자동화 같은 곳에서 실제 도구로 받아들여지거든요.

  • 컨소시엄이 모델, 인프라, 서비스 기업을 같이 묶은 이유는 파운데이션 모델 하나만으로는 산업 생태계가 안 만들어지기 때문이에요. 모델을 돌릴 하드웨어, 배포 플랫폼, 현장 서비스가 같이 있어야 “국산 모델”이 제품으로 이어져요.

국내 파운데이션 모델 경쟁에서 중요한 건 ‘우리도 모델 있음’이 아니라 비용과 속도, 실제 도입 사례임. K-엑사원 발표는 벤치마크 성능보다 메모리 70% 절감과 공공·산업 실증 조합이 더 눈에 띔.

댓글

댓글

댓글을 불러오는 중...

ai-ml

정부, 2조800억 원 들여 GPU 9704장 확보한다

과기정통부가 2조800억 원 규모 첨단 GPU 확보·구축·운용 지원 사업자로 네이버클라우드, 삼성SDS, 엘리스그룹을 선정했다. 총 9704장의 최신 GPU를 확보해 독자 AI 파운데이션 모델, 국가 AI 프로젝트, 산학연 연구개발, 클라우드 GPU 서비스에 투입할 계획이다.

ai-ml

딥시크발 가격 전쟁, 중국 AI 클라우드 마진을 갈아버리는 중

딥시크 V4의 초저가 정책 이후 중국 AI 시장에서 API 가격 인하가 연쇄적으로 터지고 있다. 샤오미는 최대 99%, 텐센트 클라우드는 최대 97.5%까지 가격을 낮췄고, 오픈 웨이트 모델 확산이 추론 서비스의 차별점을 가격 경쟁으로 몰아가고 있다.

ai-ml

AI 전력난 때문에 빅테크가 핵융합까지 당기는 중, 헬리온 4억6500만 달러 유치

샘 알트만이 투자한 헬리온이 4억6500만 달러를 새로 유치하며 기업가치 155억 달러를 기록했다. 마이크로소프트에 전력을 공급할 ‘오리온’ 원자로 건설은 AI 데이터센터 전력 수요를 빅테크가 직접 해결하려는 흐름으로 해석된다. 핵심은 AI 경쟁이 모델과 GPU를 넘어 청정 전력 확보 경쟁으로 번지고 있다는 점이다.

ai-ml

엔비디아가 한국에 그리려는 ‘AI 팩토리’, 핵심은 원전급 전력 먹는 GPU 인프라

젠슨 황은 한국 기업들과 함께 기가와트급 AI 팩토리를 구축하겠다는 구상을 밝혔다. 기존 데이터센터가 CPU 중심으로 데이터를 저장·조회했다면, AI 팩토리는 수십만 개 GPU와 초고속 네트워크, 전력·냉각 설비를 결합해 대규모 추론을 계속 수행하는 인프라다. 네이버는 초대형 AI 팩토리를 짓고, SK는 AI 팩토리로 반도체 생산을 자동화한 뒤 그 반도체를 다시 AI 팩토리에 공급하는 선순환을 노린다.

ai-ml

젠슨 황 방한 막판까지 AI 동맹 총정리, SK·LG·현대차·네이버를 하루에 훑었다

젠슨 황 엔비디아 최고경영자가 방한 마지막 일정까지 국내 대기업과 정부, 스타트업을 잇달아 만나며 한국을 AI 생태계의 핵심 파트너로 띄웠다. SK와는 AI 인프라와 반도체, LG와는 로보틱스, 현대차와는 피지컬 AI, 네이버와는 대규모 AI 인프라 협력 논의가 이어졌다. 서울대 강연에서는 AI와 로봇이 산업 전반을 바꾸는 지금이 학생들에게 큰 기회라고 강조했다.