구글, 텍스트를 한 토큰씩 안 쓰는 오픈소스 모델 디퓨전젬마 공개
구글이 자동회귀 방식 대신 확산 방식으로 텍스트를 생성하는 오픈소스 모델 디퓨전젬마를 공개했다. 256토큰 블록을 동시에 디노이징해 같은 크기의 젬마 자동회귀 모델보다 최대 4배 빠른 추론 속도를 냈다는 설명이다. 아직 20억 파라미터 규모의 실험적 공개지만, 추론 비용과 지연시간을 줄이려는 흐름에서 꽤 중요한 실험이다.
- 1
디퓨전젬마는 다음 토큰을 하나씩 예측하는 자동회귀 방식이 아니라 256토큰 블록을 병렬로 생성하는 확산 방식을 쓴다
- 2
구글 딥마인드에 따르면 같은 크기의 젬마 자동회귀 모델보다 최대 4배 빠른 처리 속도를 기록했다
- 3
현재 공개된 모델은 20억 파라미터 규모이며 텍스트 전용 실험 모델로 분류된다
- 4
아파치 2.0 라이선스로 공개돼 상업적 활용도 가능하고, 가중치와 코드는 허깅페이스에서 제공된다
- 5
확산 방식은 장문 일관성 가능성이 있지만 지시 이행이나 정확한 수식 처리에서는 아직 자동회귀 모델 대비 약점이 있다는 평가도 있다
언어 모델 성능 경쟁이 ‘더 큰 모델’만이 아니라 ‘생성 방식 자체를 바꾸는 싸움’으로 가고 있다. 당장 운영 서비스에 꽂을 모델이라기보다는, 추론 지연과 비용을 줄이려는 팀이 다음 세대 아키텍처를 살펴볼 만한 신호다.
관련 기사
네이버클라우드, 전장에 바로 쓰는 국방 AI 전략 공개
네이버클라우드가 국방 분야 AX 전략으로 소버린 AI 기반 전력화 모델을 공개했다. 핵심은 텍스트·이미지·음성·영상을 하나의 모델에서 학습하는 옴니모달 AI와, 개발 이후 실제 작전 현장 적용까지 이어지는 FDE 중심 운영 체계다.
NHN, 5년 만에 CTO 부활…AI 클라우드 투자 회수전 시작
NHN이 2021년 이후 비어 있던 그룹 CTO 자리를 다시 만들고 양철웅 신임 CTO를 선임했다. 클라우드·보안·AI 인프라 투자를 그룹 AX와 외부 클라우드 매출로 연결해야 하는 게 핵심 과제다. 특히 B200 GPU 7656장, 연구개발비 비중 6.77%, 1분기 현금성 자산 감소 같은 숫자가 이번 인사의 무게를 보여준다.
GMI 클라우드와 마그나 AI, 소버린 AI 팩토리 글로벌 확장 추진
GMI 클라우드와 마그나 AI가 글로벌 소버린 AI 팩토리 네트워크를 공동 설계·배포·확장하는 전략적 파트너십을 맺었다. 초기 프로젝트는 말레이시아, 벨기에, 루마니아에 집중하고, 중동과 아프리카 배포도 개발 중이다.
대구·울산·경북 5개 SW중심대, 구글 클라우드 AI 에이전트 챌린지 마무리
경북대, 대구대, 영남대, 울산대, 한동대가 공동으로 구글 클라우드 AI 에이전트 챌린지를 진행하고 본선과 시상식을 마쳤다. 학생들은 5주간 교육을 받고 산업 현장 문제를 해결하는 AI 에이전트 프로젝트를 기획·개발했다.
정부는 GPU 9,704장, 엔비디아는 국내 대기업과 AI 팩토리 판 키운다
과기정통부가 네이버클라우드, 삼성SDS, 엘리스그룹과 2조 800억 원 규모로 엔비디아 베라루빈 2,016장과 B300 7,688장을 확보한다. 동시에 엔비디아는 삼성, SK, 네이버, LG와 제조·로봇·데이터센터까지 묶는 AI 팩토리 연합을 만들고 있고, 아마존의 물 사용량 공개는 AI 인프라 경쟁이 전력과 냉각 효율 싸움으로 넘어갔다는 신호다.
댓글
댓글
댓글을 불러오는 중...