구글, 텍스트를 4배 빠르게 생성하는 확산형 젬마 모델 공개
구글이 텍스트 확산 방식을 실험하는 오픈 모델 디퓨전젬마를 공개했다. 기존 대규모 언어 모델처럼 토큰을 왼쪽부터 하나씩 찍는 대신 256개 토큰 블록을 병렬로 다듬어, 단일 GPU 로컬 추론에서 최대 4배 빠른 생성을 노린다.
- 1
디퓨전젬마는 아파치 2.0 라이선스로 공개된 260억 총 파라미터 규모의 혼합 전문가 모델
- 2
추론 시 활성화되는 파라미터는 38억 개라 양자화하면 18GB 비디오 메모리 안에 들어감
- 3
단일 엔비디아 H100에서 초당 1000개 이상, 지포스 RTX 5090에서 초당 700개 이상 토큰 생성을 제시함
- 4
품질은 표준 젬마 4보다 낮아 고품질 운영 환경보다는 로컬·대화형·저동시성 워크플로에 맞춰짐
로컬 인공지능 앱에서 병목이 되는 지연 시간을 정면으로 겨냥한 모델이다. 품질보다 반응성이 중요한 코드 인필링, 실시간 편집, 구조화 텍스트 생성 쪽에서는 자동회귀 모델만 고집할 이유가 줄어들 수 있다.
관련 기사
KT, 경기권 스타트업에 AI·클라우드 전환 전략 공유
KT가 경기권 스타트업을 대상으로 AI와 클라우드를 활용한 AX 전환 전략을 공유했다. AWS, 데이터브릭스, KT클라우드와 함께 AI 에이전트, 데이터 기반 의사결정, 클라우드 전환 사례를 소개하며 스타트업이 실제 업무에 적용할 수 있는 방향을 제시했다.
네이버클라우드, 국방 AI에 ‘옴니모달·엣지 데이터센터’ 카드 꺼냈다
네이버클라우드가 국방 AI를 실제 작전 환경에 적용하기 위한 전략을 공개했다. 핵심은 텍스트·음성·영상·지도 데이터를 한 작전 상황으로 묶는 옴니모달 AI, 중앙·엣지 데이터센터, 온톨로지 기반 지식체계, 현장 엔지니어 전진 배치다. 해외의 합동 지휘통제 사례까지 끌어오며 국방 AI가 단순 자동화가 아니라 미래 지휘통제 경쟁력이라는 메시지를 던졌다.
네이버클라우드, 국방 AI 시장에 풀스택으로 들어가려는 그림
네이버클라우드가 국방 인공지능 전환 시장을 겨냥해 옴니모달 AI, 국방 전용 AI 데이터센터, 전장 엣지, 현장 파견 엔지니어 체계를 묶은 전략을 공개했다. 단순 모델 납품이 아니라 폐쇄망 클라우드와 작전 체계 연동까지 포함한 국방 AI 인프라 포지셔닝에 가깝다.
네이버클라우드, 국방 AI 전담팀 꾸리고 ‘소버린 AI’로 합참 AX 겨냥
네이버클라우드가 국방 AX 전담 조직을 만들고 소버린 AI 기반 국방 인프라 전략을 공개했다. 하이퍼클로바X 옴니모달, 구축형 클라우드, 온톨로지 기반 지식체계, 현장 배치형 개발자를 묶어 군사 데이터를 통합 분석하는 풀스택 전략을 내세웠다. 합참의 K-JADC2 추진 흐름과 맞물려 국내 클라우드·AI 기업들의 국방 시장 경쟁이 본격화되는 분위기다.
AI 학습데이터도 성분표가 필요해졌다, LG AI연구원이 말한 ‘AI-BOM’
LG AI연구원은 생성형 AI 저작권·데이터 공급망 리스크에 대응하려면 AI 모델이 어떤 데이터, 모델, 소프트웨어, 라이선스, 보안 요소로 만들어졌는지 추적하는 AI-BOM이 필요하다고 설명했다. 자체 분석에서는 상업적으로 이용 가능해 보이는 2852개 데이터셋 중 종속 데이터 리스크까지 고려하면 실제 사용 가능한 데이터셋이 605개, 약 21.21%에 그쳤다. 오픈소스 코드 기준의 라이선스 판단을 AI 학습데이터에 그대로 적용하면 큰 오판이 날 수 있다는 얘기다.
댓글
댓글
댓글을 불러오는 중...