로컬 LLM 생태계에 Ollama는 필요 없다 — llama.cpp 래퍼의 민낯
Ollama가 llama.cpp의 성과를 가져다 쓰면서 크레딧을 주지 않고, 자체 포크로 성능을 악화시키며, VC 자금을 받아 클라우드로 전환하고 있다는 심층 비판글. 동일 하드웨어 기준 llama.cpp 대비 1.8배 느린 벤치마크, 모델 이름 왜곡, 보안 취약점 등 구체적 근거를 제시하며 llama.cpp 직접 사용과 LM Studio 등 대안을 권장함.
- 1
Ollama는 1년 넘게 llama.cpp 크레딧을 누락했고 MIT 라이선스 고지 의무도 미준수
- 2
자체 ggml 기반 백엔드 전환 후 llama.cpp가 해결한 버그를 재발시킴
- 3
동일 환경에서 llama.cpp가 Ollama 대비 1.8배 빠른 처리량 기록 (161 vs 89 tok/s)
- 4
DeepSeek R1 증류 모델을 원본 R1로 표기하여 사용자와 모델 제작사 모두에 혼란 유발
- 5
CVE-2025-51471 토큰 유출 취약점이 전 버전에 영향, 패치에 수개월 소요
Ollama의 '쉬운 설정'이라는 가치 제안이 성능 저하, 호환성 문제, 벤더 락인으로 상쇄되는 상황. llama.cpp 직접 사용의 진입 장벽이 크게 낮아진 지금, Ollama를 기본값으로 쓰는 관행을 재검토할 시점임.
관련 기사
AI 랠리의 다음 격전지, 데이터센터 밖으로 나오는 엣지 AI
지금까지 AI의 중심이 클라우드 데이터센터였다면, 다음 확산지는 공장·차량·로봇·드론·개인용 컴퓨터 같은 엣지 영역이라는 분석이 나와. 엔비디아가 말해온 생성형 AI, 에이전트 AI, 피지컬 AI 흐름과 맞물리면서 델과 퀄컴 같은 기업에 대한 기대도 커지고 있어.
네이버, 엔비디아와 국방 AI 인프라 협력 더 키우나
네이버가 국방 인공지능(AI) 시장을 노리면서 엔비디아와의 협력 관계가 더 중요해지고 있어. 국방 AI는 모델만 잘 만든다고 되는 게 아니라, 위성·드론·레이더·센서 데이터를 실시간으로 처리할 그래픽처리장치(GPU)와 데이터센터 인프라가 핵심이라는 분석이 나와.
AI 인프라 전쟁의 새 축, ‘네오클라우드’가 뜬다
AI 경쟁의 무게중심이 모델 개발에서 GPU 인프라 확보로 이동하면서, GPUaaS를 전문으로 하는 네오클라우드 사업자가 빠르게 부상하고 있다. 코어위브, 람다랩스, 네비우스 같은 글로벌 기업뿐 아니라 베슬AI, 몬드리안에이아이, 엘리스그룹 같은 국내 기업도 이 시장을 노리고 있다.
한국 AI, 성벽 쌓기보다 길 내는 하이브리드 전략이 필요하다는 주장
한국이 AI 3대 강국을 노린다면 한국어와 내수 중심의 방어형 소버린 AI에만 머물면 안 된다는 기고문이다. 기반 기술과 생태계는 열고, 핵심 데이터와 산업별 지식은 지키는 하이브리드 전략이 필요하다는 논지다.
델, AI 서버 수요 폭발로 1분기 매출 88% 급증
델테크놀로지스가 AI 서버 수요에 힘입어 1분기 매출 438억달러를 기록하며 전년 대비 88% 성장했다. 특히 AI 서버 매출은 161억달러로 757% 폭증했고, 올해 AI 서버 매출 전망도 600억달러로 상향됐다.
댓글
댓글
댓글을 불러오는 중...