Sweep Next-Edit: 1.5B 파라미터로 다음 코드 편집을 예측하는 오픈 모델
로컬에서 500ms 이내로 실행되는 1.5B 오픈웨이트 코드 편집 예측 모델. 4배 큰 모델을 벤치마크에서 능가하며, Qwen2.5-Coder 기반 GGUF 포맷으로 제공
- 1
1.5B 파라미터, Q8_0 GGUF 양자화, 컨텍스트 8192 토큰
- 2
speculative decoding으로 로컬 노트북에서 500ms 이내 추론
- 3
4배 큰 모델 대비 next-edit 벤치마크 우위 주장
- 4
Apache 2.0 라이선스, JetBrains 플러그인 제공
코드 자동완성의 경량화 경쟁이 본격화되고 있음. 로컬 실행 가능한 소형 모델이 실용성을 입증하는 중
댓글
댓글
댓글을 불러오는 중...