---
title: "Ghost Pepper — Control 키만 누르면 끝나는 macOS 로컬 음성인식 앱"
published: 2026-04-06T19:50:16.000Z
canonical: https://jeff.news/article/1606
---
# Ghost Pepper — Control 키만 누르면 끝나는 macOS 로컬 음성인식 앱

macOS에서 Control 키를 누른 채 말하면 로컬 Whisper 모델로 음성 인식 후, Qwen LLM이 텍스트까지 정리해주는 오픈소스 유틸리티. 서버 전송 없이 Apple Silicon에서 전부 처리되므로 프라이버시 걱정이 없음.

- macOS에서 Control 키 꾹 누르고 말하면 텍스트로 변환해주는 오픈소스 앱 **Ghost Pepper**가 나왔음 — 핵심은 **완전 로컬 처리**라 서버로 음성 데이터가 나가지 않음
  - 메뉴바에 상주하면서 독(Dock)에는 안 보임. 딱 유틸리티 앱다운 설계
  - Control 키 놓으면 바로 트랜스크립션 + 텍스트 붙여넣기까지 자동으로 처리됨

- 음성 인식은 **WhisperKit** 기반으로 모델을 골라 쓸 수 있음
  - `whisper tiny.en` (~75MB) — 제일 빠름, 영어 전용
  - `whisper small.en` (~466MB) — 기본값, 영어 정확도 최고
  - `whisper small multilingual` (~466MB) — 다국어 지원
  - `Parakeet v3` (~1.4GB) — 25개 언어 지원. 용량 좀 먹지만 다국어 필요하면 이걸로

- 단순 받아쓰기가 아니라 **로컬 LLM으로 텍스트 정리**까지 해줌 — 어.. 음.. 같은 필러 단어 제거하고 문장도 다듬어줌
  - Qwen 3.5 0.8B (~535MB) — 가장 빠름
  - Qwen 3.5 2B (~1.3GB) — 속도/품질 밸런스
  - Qwen 3.5 4B (~2.8GB) — 최고 품질
  - **LLM.swift**로 구동하고 모델은 Hugging Face에서 받아옴

- Apple Silicon (M1 이상) + macOS 14.0 이상 필수
  - 마이크 권한, 접근성(Accessibility) 권한 두 가지 필요 — 글로벌 키보드 단축키 감지랑 자동 텍스트 입력 때문

- MIT 라이선스로 공개. Swift 99.1%로 작성됨
  - WhisperKit, LLM.swift, Hugging Face, Sparkle 프레임워크 활용

## 핵심 포인트

- Control 키 hold-to-talk 방식으로 음성을 녹음하고 자동 트랜스크립션 + 붙여넣기
- WhisperKit 기반 음성 인식 — tiny부터 multilingual까지 모델 선택 가능
- Qwen 3.5 로컬 LLM으로 필러 단어 제거 등 텍스트 후처리
- 완전 로컬 처리로 음성 데이터가 외부 서버로 나가지 않음
- MIT 라이선스, Apple Silicon + macOS 14.0 이상 필요

## 인사이트

로컬 LLM과 Whisper를 조합해서 프라이버시를 지키면서도 실용적인 음성 입력 도구를 만든 좋은 사례. 온디바이스 AI가 점점 실용 앱 단계로 진입하고 있다는 걸 보여줌.
