이번 주 허깅페이스는 ‘가리키고, 듣고, 그리듯 쓰는’ 오픈웨이트 모델 전쟁이었다
이번 주 허깅페이스 트렌드는 엔비디아의 비주얼 그라운딩 모델, 구글의 인코더 프리 멀티모달 젬마 4 12B, 디퓨전 방식 언어 모델 디퓨전젬마가 이끌었다. 공통점은 빅테크가 오픈웨이트로 성능뿐 아니라 배포 효율, 속도, 라이선스 전략까지 밀어붙이고 있다는 점이다. 한국 개발자 입장에서는 모델 성능보다 라이선스, 온디바이스 가능성, 추론 비용 구조를 같이 봐야 한다.
- 1
엔비디아 LocateAnything-3B는 자연어 지시를 이미지 속 좌표와 바운딩 박스로 바꾸는 비주얼 그라운딩 모델이며 출시 보름 만에 월 다운로드 11만 회를 넘겼다
- 2
구글 젬마 4 12B는 별도 비전·오디오 인코더 없이 텍스트·이미지·오디오·비디오를 단일 트랜스포머로 처리하고 16GB 노트북 구동을 목표로 한다
- 3
디퓨전젬마는 256토큰 블록을 디퓨전 방식으로 생성해 H100 기준 초당 1100토큰 이상을 기록했다고 소개됐다
- 4
오픈웨이트 모델이라도 아파치 2.0, MIT, 비상업 라이선스, 게이트 다운로드처럼 조건이 제각각이라 기업 도입 전 라이선스 확인이 필수다
- 5
비전 AI는 단순 묘사에서 좌표 기반 그라운딩으로, 언어 모델은 순차 생성에서 병렬 생성으로 아키텍처 상식이 흔들리는 중이다
이 글의 핵심은 ‘오픈소스 모델이 많아졌다’가 아니라 빅테크가 폐쇄형 API의 장점을 오픈웨이트로 빠르게 흘려보내고 있다는 점이다. 국내 팀은 모델 랭킹만 볼 게 아니라 라이선스, 로컬 구동, 데이터 반출 리스크, 추론 비용까지 같이 평가해야 한다.
관련 기사
네이버클라우드, 전장에 바로 쓰는 국방 AI 전략 공개
네이버클라우드가 국방 분야 AX 전략으로 소버린 AI 기반 전력화 모델을 공개했다. 핵심은 텍스트·이미지·음성·영상을 하나의 모델에서 학습하는 옴니모달 AI와, 개발 이후 실제 작전 현장 적용까지 이어지는 FDE 중심 운영 체계다.
NHN, 5년 만에 CTO 부활…AI 클라우드 투자 회수전 시작
NHN이 2021년 이후 비어 있던 그룹 CTO 자리를 다시 만들고 양철웅 신임 CTO를 선임했다. 클라우드·보안·AI 인프라 투자를 그룹 AX와 외부 클라우드 매출로 연결해야 하는 게 핵심 과제다. 특히 B200 GPU 7656장, 연구개발비 비중 6.77%, 1분기 현금성 자산 감소 같은 숫자가 이번 인사의 무게를 보여준다.
GMI 클라우드와 마그나 AI, 소버린 AI 팩토리 글로벌 확장 추진
GMI 클라우드와 마그나 AI가 글로벌 소버린 AI 팩토리 네트워크를 공동 설계·배포·확장하는 전략적 파트너십을 맺었다. 초기 프로젝트는 말레이시아, 벨기에, 루마니아에 집중하고, 중동과 아프리카 배포도 개발 중이다.
대구·울산·경북 5개 SW중심대, 구글 클라우드 AI 에이전트 챌린지 마무리
경북대, 대구대, 영남대, 울산대, 한동대가 공동으로 구글 클라우드 AI 에이전트 챌린지를 진행하고 본선과 시상식을 마쳤다. 학생들은 5주간 교육을 받고 산업 현장 문제를 해결하는 AI 에이전트 프로젝트를 기획·개발했다.
정부는 GPU 9,704장, 엔비디아는 국내 대기업과 AI 팩토리 판 키운다
과기정통부가 네이버클라우드, 삼성SDS, 엘리스그룹과 2조 800억 원 규모로 엔비디아 베라루빈 2,016장과 B300 7,688장을 확보한다. 동시에 엔비디아는 삼성, SK, 네이버, LG와 제조·로봇·데이터센터까지 묶는 AI 팩토리 연합을 만들고 있고, 아마존의 물 사용량 공개는 AI 인프라 경쟁이 전력과 냉각 효율 싸움으로 넘어갔다는 신호다.
댓글
댓글
댓글을 불러오는 중...