구글, 토큰을 한 글자씩 찍지 않는 오픈소스 모델 ‘디퓨전젬마’ 공개
구글이 자기회귀 방식 대신 확산 기반으로 텍스트를 생성하는 오픈소스 모델 ‘디퓨전젬마’를 공개했다. 한 번에 256개 토큰 블록을 만들고 반복 정제하는 방식이라 H100에서 초당 1000토큰 이상, RTX 5090에서도 초당 700토큰 이상을 낸다는 점이 핵심이다. 다만 품질은 아직 젬마4보다 낮아 연구용·실험용 성격이 강하다.
- 1
디퓨전젬마는 기존 대규모 언어 모델처럼 토큰을 순차 생성하지 않고 256개 토큰 블록을 동시에 생성함
- 2
260억 파라미터 규모의 전문가혼합 구조지만 추론 시 약 38억 파라미터만 활성화됨
- 3
H100에서 초당 1000토큰 이상, RTX 5090에서 초당 700토큰 이상 생성 가능하다고 공개됨
- 4
양자화 적용 시 약 18GB 브이램으로 구동 가능해 고성능 소비자용 그래픽카드도 겨냥함
- 5
출력 품질은 아직 젬마4가 우위라 상용 고품질 응답보다는 로컬 AI·실시간 편집·연구 실험에 적합함
모델 크기 경쟁만 보던 흐름에서 ‘생성 방식을 바꾸면 뭐가 달라지나’로 초점이 옮겨가는 신호다. 로컬 AI나 코딩 도구처럼 지연 시간이 체감 품질을 좌우하는 영역에서는 꽤 볼 만한 실험임.
관련 기사
KT, 경기권 스타트업에 AI·클라우드 전환 전략 공유
KT가 경기권 스타트업을 대상으로 AI와 클라우드를 활용한 AX 전환 전략을 공유했다. AWS, 데이터브릭스, KT클라우드와 함께 AI 에이전트, 데이터 기반 의사결정, 클라우드 전환 사례를 소개하며 스타트업이 실제 업무에 적용할 수 있는 방향을 제시했다.
네이버클라우드, 국방 AI에 ‘옴니모달·엣지 데이터센터’ 카드 꺼냈다
네이버클라우드가 국방 AI를 실제 작전 환경에 적용하기 위한 전략을 공개했다. 핵심은 텍스트·음성·영상·지도 데이터를 한 작전 상황으로 묶는 옴니모달 AI, 중앙·엣지 데이터센터, 온톨로지 기반 지식체계, 현장 엔지니어 전진 배치다. 해외의 합동 지휘통제 사례까지 끌어오며 국방 AI가 단순 자동화가 아니라 미래 지휘통제 경쟁력이라는 메시지를 던졌다.
네이버클라우드, 국방 AI 시장에 풀스택으로 들어가려는 그림
네이버클라우드가 국방 인공지능 전환 시장을 겨냥해 옴니모달 AI, 국방 전용 AI 데이터센터, 전장 엣지, 현장 파견 엔지니어 체계를 묶은 전략을 공개했다. 단순 모델 납품이 아니라 폐쇄망 클라우드와 작전 체계 연동까지 포함한 국방 AI 인프라 포지셔닝에 가깝다.
네이버클라우드, 국방 AI 전담팀 꾸리고 ‘소버린 AI’로 합참 AX 겨냥
네이버클라우드가 국방 AX 전담 조직을 만들고 소버린 AI 기반 국방 인프라 전략을 공개했다. 하이퍼클로바X 옴니모달, 구축형 클라우드, 온톨로지 기반 지식체계, 현장 배치형 개발자를 묶어 군사 데이터를 통합 분석하는 풀스택 전략을 내세웠다. 합참의 K-JADC2 추진 흐름과 맞물려 국내 클라우드·AI 기업들의 국방 시장 경쟁이 본격화되는 분위기다.
AI 학습데이터도 성분표가 필요해졌다, LG AI연구원이 말한 ‘AI-BOM’
LG AI연구원은 생성형 AI 저작권·데이터 공급망 리스크에 대응하려면 AI 모델이 어떤 데이터, 모델, 소프트웨어, 라이선스, 보안 요소로 만들어졌는지 추적하는 AI-BOM이 필요하다고 설명했다. 자체 분석에서는 상업적으로 이용 가능해 보이는 2852개 데이터셋 중 종속 데이터 리스크까지 고려하면 실제 사용 가능한 데이터셋이 605개, 약 21.21%에 그쳤다. 오픈소스 코드 기준의 라이선스 판단을 AI 학습데이터에 그대로 적용하면 큰 오판이 날 수 있다는 얘기다.
댓글
댓글
댓글을 불러오는 중...