구글, 토큰을 한 글자씩 뱉지 않는 실험적 모델 ‘디퓨전젬마’ 공개
구글이 기존 자기회귀 방식과 다른 텍스트 생성 구조를 쓰는 실험적 오픈소스 모델 ‘디퓨전젬마’를 공개했다. 한 번에 256개 토큰 블록을 만들고 반복 정제하는 확산 방식으로, 엔비디아 H100에서 초당 1000개 이상 토큰 생성 성능을 낸다고 설명한다.
- 1
디퓨전젬마는 텍스트를 한 토큰씩 순차 생성하지 않고 256개 토큰 블록 단위로 동시에 생성함
- 2
엔비디아 H100에서 초당 1000개 이상, 지포스 RTX 5090에서 초당 700개 이상 토큰 생성을 제시함
- 3
260억 전체 매개변수 중 추론 시 38억 매개변수만 활성화하는 전문가 혼합 구조를 사용함
- 4
문서 중간 수정, 코드 인필링, 마크다운 생성처럼 앞뒤 문맥을 동시에 봐야 하는 작업에 강점을 내세움
로컬 AI에서 체감 성능은 모델 크기만큼이나 지연시간이 중요함. 디퓨전젬마가 흥미로운 건 ‘더 큰 모델’ 경쟁이 아니라, 텍스트 생성의 순차 병목을 다른 방식으로 깨보려는 시도라는 점임.
관련 기사
클로드가 애저 안으로 들어옴…앤트로픽·엔비디아·마이크로소프트 동맹 본격 가동
앤트로픽의 클로드 모델군이 엔비디아 블랙웰 울트라 기반 마이크로소프트 애저 클라우드에 정식 배포됐다. 이제 애저 고객은 외부 호출이 아니라 애저 내부에서 클로드를 직접 구동할 수 있어, 데이터 역외 이전 규제가 있는 기업에게 꽤 큰 변화다.
백악관 AI 규제 강화, 오픈소스 모델엔 오히려 기회 될까
미국 백악관의 AI 규제 강화 흐름 속에서 오픈소스 AI 모델이 상대적으로 주목받을 수 있다는 분석이 나왔다. 폐쇄형 모델에 대한 공급 안정성, 규제 리스크, 특정 업체 의존 문제가 커지면서 개발자와 기업이 오픈소스 대안을 더 진지하게 보고 있다는 내용이다.
한국은행, AI 데이터센터 투자가 미국 경제 성장축 됐다고 분석
한국은행 뉴욕 사무소가 AI 확산에 따른 컴퓨팅 수요와 데이터센터 투자를 미국 경제의 핵심 성장 동력으로 봤다. 미국에는 현재 데이터센터 4,378개가 가동 중이고, 약 2,700개가 건설 중이거나 계획 중이며, AI 반도체와 서버의 경제적 수명은 2∼3년에 불과해 투자 사이클이 계속 이어질 수 있다는 분석이다.
국제결제은행, AI 투자 열풍이 금융시장 흔들 수 있다고 경고
국제결제은행(BIS)이 AI 부문으로 몰리는 투자 열풍이 장기 침체와 금융시장 불안을 부를 수 있다고 경고했다. 하이퍼스케일러들은 내년까지 AI 인프라에 1조 달러 이상을 쏟아부을 예정이지만, 이제는 막대한 지출이 실제 현금 흐름과 이익으로 이어지는지 검증해야 한다는 메시지다.
GS, 산업 현장 안전관리 AI를 중소기업에 무상 제공
GS그룹이 안전관리 AI 에이전트 ‘에어(AIR)’를 중소기업에 무상 제공하고 있다. 작업명과 설명만 넣으면 생성형 AI가 공정, 위험요인, 위험등급, 예방 대책을 자동으로 만들고, 실제 현장에서는 위험성 평가 시간이 기존의 10분의 1로 줄었다.
댓글
댓글
댓글을 불러오는 중...