아이폰에서 도는 4B 이미지 생성 모델, Bonsai Image 4B 공개
PrismML이 로컬 기기용 이미지 생성 모델 Bonsai Image 4B를 공개했다. 1비트와 삼진 양자화 버전으로 나뉘며, 전체 정밀도 FLUX.2 Klein 4B 대비 메모리 사용량을 크게 줄여 아이폰에서도 512×512 이미지를 생성할 수 있게 만든 게 핵심이다.
- 1
1비트 모델은 확산 트랜스포머를 0.93GB까지 줄여 전체 정밀도 대비 8.3배 작아졌다
- 2
삼진 모델은 1.21GB로 조금 더 크지만 FLUX.2 Klein 4B 품질의 95%를 유지한다고 주장한다
- 3
아이폰 17 프로 맥스에서 512×512 이미지를 9.4초에 생성했고, 맥 M4 프로에서는 약 6초가 걸렸다
- 4
오픈 가중치와 코드는 Apache 2.0 라이선스로 공개될 예정이다
이미지 생성 모델 경쟁이 단순히 더 예쁜 결과물 싸움에서 ‘어디서 돌릴 수 있느냐’ 싸움으로 넘어가는 느낌이다. 서버 비용, 지연 시간, 프롬프트 프라이버시까지 생각하면 온디바이스 생성은 제품 설계 관점에서 꽤 큰 카드다.
관련 기사
젠슨 황 키노트에 네이버클라우드 등장, 엔비디아 AI 인프라 파트너로 부각
젠슨 황 엔비디아 최고경영자가 GTC 타이페이 2026 기조연설에서 네이버클라우드를 AI 네이티브 클라우드 주요 파트너로 소개했다. 하이퍼클로바X, 네이버 월드모델, AI 팩토리, 데이터센터 각까지 함께 언급되며 네이버의 AI 인프라 협력이 다시 주목받고 있다.
중국 AI, 한국 시장에 초저가로 진입…데이터 안보 리스크도 같이 커진다
미국 AI 기업이 선점한 한국 생성형 AI 시장에 미니맥스, 지푸AI 같은 중국 기업들이 가격과 콘텐츠 특화 기능을 앞세워 들어오고 있어. 토큰 비용은 미국 주요 모델 대비 최대 20분의 1 수준까지 내려가지만, 데이터 안보와 AI 공급망 종속 리스크도 같이 커진다는 게 핵심이야.
인텔, OpenVINO로 로봇용 피지컬 AI 배포 난이도 낮춘다
인텔이 컴퓨텍스 2026에 맞춰 OpenVINO 피지컬 AI 프레임워크와 로보틱스 AI 스위트 전략을 공개했어. 핵심은 로봇마다 따로 맞추던 센서, 추론, 제어 스택을 인텔 칩과 오픈소스 프레임워크 기반으로 단순화해 현장 배포를 쉽게 만들겠다는 거야.
엔비디아, 로봇·자율주행·공장 AI용 오픈소스 에이전트 스킬 공개
엔비디아가 컴퓨텍스 2026과 GTC 타이베이에서 피지컬 인공지능 개발용 오픈소스 에이전트 스킬과 도구 모음을 공개했다. 코스모스, 옴니버스, 아이작, 메트로폴리스, 젯슨 같은 엔비디아 스택을 코딩 에이전트가 직접 호출해 데이터 생성, 시뮬레이션, 학습, 평가, 배포를 자동화하게 만드는 구상이다.
국가AI전략위, AI 3대 강국 로드맵에 99개 과제와 9.9조 예산 공개
국가AI전략위원회가 출범 이후 성과로 대한민국 인공지능행동계획, 정부 AI 예산 통합 공개, 재해복구 체계 강화, 한-UAE 협력 확대를 제시했다. 99개 실행과제와 326개 정책권고, 41개 부처 741개 사업 9조9000억원 규모 예산이 핵심 숫자다.
댓글
댓글
댓글을 불러오는 중...