0
Claude Code에 가장 잘 맞는 프로그래밍 언어는? — 15개 언어 벤치마크 실험
ai-ml
요약
기사 전체 정리
Claude Code에 가장 잘 맞는 프로그래밍 언어는? — 15개 언어 벤치마크 실험
Ruby 커미터인 저자가 Claude Code(Opus 4.6, high effort)로 간이 Git 구현을 15개 언어로 시켜보고, 시간과 비용을 측정한 실험. 각 언어당 20회 반복, 총 600회 실행
작업은 두 단계로 나뉨:
- v1 (빈 프로젝트): init, add, commit, log 구현
- v2 (기능 확장): status, diff, checkout, reset 추가
결과: Ruby, Python, JavaScript가 압도적
- Top 3: Ruby(73초/$0.36), Python(78초/$0.37), JavaScript(81초/$0.39) — 빠르고 저렴하고 편차도 작음
- 4위부터(Go, Rust, Java) 편차가 급격히 증가. Go는 평균 102초인데 ±37초 흔들림
- 정적 타입 언어는 동적 타입 대비 1.4~2.6배 느리고 비쌈
- 600회 중 실패(테스트 미통과)는 딱 3건: Rust 2건, Haskell 1건. Rust 실패 로그 중 하나에서 에이전트가 "테스트가 틀렸다"고 주장한 건 환각(hallucination)으로 보임
흥미로운 세부 발견
코드 길이: OCaml(216줄), Ruby(219줄), Haskell(224줄)이 가장 짧고, C가 517줄로 가장 길었음. 그런데 짧은 코드 ≠ 빠른 생성. OCaml과 Haskell은 compact하지만 thinking 토큰을 많이 써서 느림
타입체커 오버헤드: Python/mypy는 순수 Python 대비 1.6
1.7배, Ruby/Steep는 순수 Ruby 대비 **2.03.2배** 느림. Steep의 AI 친숙도가 mypy보다 낮은 게 원인으로 추정v1 vs v2 차이: v1(빈 프로젝트)에서 언어 간 격차가 가장 큼. Python(32.9초) vs Lua(96.4초)가 3배 차이. v2(기능 확장)에서는 격차가 줄어들어 OCaml이 47.1초로 JavaScript(45.1초)에 근접
중요
> 30초 vs 60초 대기 차이가 별거 아닌 것 같지만, 프롬프트 → 대기 → 다음 작업 생각 → 다시 프롬프트하는 반복 개발에서는 집중력과 흐름에 직접적으로 영향을 준다는 저자의 지적이 핵심.
저자의 해석 (Ruby 커미터 바이어스 감안)
- 동적 언어가 빠른 이유 추정: 타입 시스템 부재 + 간결한 코드 + 프로젝트 설정 파일 불필요(Python/Ruby/JS는 파일 하나만 생성하면 됨) + AI 학습 데이터 양
- "타입 없으면 버그 더 많지 않냐?"에 대해: 타입 에러는 가장 발견하기 쉬운 버그이고, 유일하게 실패한 3건이 Rust와 Haskell(정적 타입)이었다는 점을 지적
- 전략적 시사점: 동적 언어로 시작해서 프로젝트가 성숙하면 정적 언어로 마이그레이션하는 고전적 전략이 AI 코딩 에이전트 시대에도 여전히 유효할 수 있음. 코딩 에이전트가 언어 간 마이그레이션을 잘한다면 더더욱
댓글
댓글
댓글을 불러오는 중...