---
title: "Caveman — Claude Code 토큰 75% 절약하는 '원시인 모드' 플러그인"
published: 2026-04-05T08:56:18.000Z
canonical: https://jeff.news/article/1549
---
# Caveman — Claude Code 토큰 75% 절약하는 '원시인 모드' 플러그인

Claude Code에서 불필요한 미사여구를 제거해 토큰 사용량을 평균 65% 줄여주는 스킬/플러그인. 기술적 정확도는 유지하면서 응답 속도를 ~3배 높이고, 2026년 연구에서 간결한 응답이 정확도를 26%p 높인다는 근거도 제시한다.

- Caveman은 Claude Code에서 토큰 사용량을 약 75% 줄여주는 스킬/플러그인 — 이름 그대로 "원시인 모드"
  - 불필요한 미사여구 다 빼고 핵심만 남김
  - 기술적 정확도는 100% 유지하면서 응답 속도 ~3배 향상

- Before/After 비교가 직관적임
  - 일반 Claude (69토큰): "React 컴포넌트가 리렌더링되는 이유는 매 렌더 사이클마다 새 객체 참조를 생성하기 때문일 가능성이..."
  - Caveman Claude (19토큰): "렌더마다 새 객체 ref. 인라인 객체 prop = 새 ref = 리렌더. `useMemo` 쓰셈."
  - 72% 절감이 체감됨

- 벤치마크 결과가 꽤 인상적
  - 10개 태스크 평균 **65% 토큰 절감** (범위: 22~87%)
  - React 리렌더 버그 설명: 87% 절감
  - PostgreSQL 레이스 컨디션 디버깅: 81% 절감
  - Docker 멀티스테이지 빌드: 72% 절감

- 설치는 `npx skills add JuliusBrussee/caveman` 한 줄이면 끝
  - Claude Code 플러그인 시스템이나 Codex 플러그인으로도 설치 가능

- 사용법도 간단 — `/caveman` 입력하거나 "caveman mode", "less tokens please" 같은 자연어로 활성화
  - "stop caveman"이나 "normal mode"로 해제
  - 코드 블록, 기술 용어, 에러 메시지는 정확히 유지하고 관사(a/an/the), 인사말, 헤징 표현만 제거

> [!TIP]
> 2026년 연구에 따르면 LLM을 간결한 응답으로 제약했을 때 특정 벤치마크에서 정확도가 26%p 향상됨 — 짧게 말하는 게 오히려 정확하다는 과학적 근거가 있는 셈

## 핵심 포인트

- 10개 태스크 평균 65% 토큰 절감, React 리렌더 설명은 87% 절감 달성
- 코드 블록·기술 용어·에러 메시지는 그대로 유지하고 관사·인사말·헤징만 제거
- npx skills add 한 줄로 설치, /caveman이나 자연어로 활성화 가능

## 인사이트

Claude Code나 Codex 비용이 신경 쓰이는 개발자한테 실용적인 도구. 토큰 줄이면서 오히려 정확도가 올라간다는 연구 결과가 인상적.