본문으로 건너뛰기
피드

Ghost Pepper — Control 키만 누르면 끝나는 macOS 로컬 음성인식 앱

open-source 약 3분
vote
0
댓글
북마크

macOS에서 Control 키를 누른 채 말하면 로컬 Whisper 모델로 음성 인식 후, Qwen LLM이 텍스트까지 정리해주는 오픈소스 유틸리티. 서버 전송 없이 Apple Silicon에서 전부 처리되므로 프라이버시 걱정이 없음.

  • 1

    Control 키 hold-to-talk 방식으로 음성을 녹음하고 자동 트랜스크립션 + 붙여넣기

  • 2

    WhisperKit 기반 음성 인식 — tiny부터 multilingual까지 모델 선택 가능

  • 3

    Qwen 3.5 로컬 LLM으로 필러 단어 제거 등 텍스트 후처리

  • 4

    완전 로컬 처리로 음성 데이터가 외부 서버로 나가지 않음

  • 5

    MIT 라이선스, Apple Silicon + macOS 14.0 이상 필요

  • macOS에서 Control 키 꾹 누르고 말하면 텍스트로 변환해주는 오픈소스 앱 Ghost Pepper가 나왔음 — 핵심은 완전 로컬 처리라 서버로 음성 데이터가 나가지 않음

    • 메뉴바에 상주하면서 독(Dock)에는 안 보임. 딱 유틸리티 앱다운 설계
    • Control 키 놓으면 바로 트랜스크립션 + 텍스트 붙여넣기까지 자동으로 처리됨
  • 음성 인식은 WhisperKit 기반으로 모델을 골라 쓸 수 있음

    • whisper tiny.en (~75MB) — 제일 빠름, 영어 전용
    • whisper small.en (~466MB) — 기본값, 영어 정확도 최고
    • whisper small multilingual (~466MB) — 다국어 지원
    • Parakeet v3 (~1.4GB) — 25개 언어 지원. 용량 좀 먹지만 다국어 필요하면 이걸로
  • 단순 받아쓰기가 아니라 로컬 LLM으로 텍스트 정리까지 해줌 — 어.. 음.. 같은 필러 단어 제거하고 문장도 다듬어줌

    • Qwen 3.5 0.8B (~535MB) — 가장 빠름
    • Qwen 3.5 2B (~1.3GB) — 속도/품질 밸런스
    • Qwen 3.5 4B (~2.8GB) — 최고 품질
    • LLM.swift로 구동하고 모델은 Hugging Face에서 받아옴
  • Apple Silicon (M1 이상) + macOS 14.0 이상 필수

    • 마이크 권한, 접근성(Accessibility) 권한 두 가지 필요 — 글로벌 키보드 단축키 감지랑 자동 텍스트 입력 때문
  • MIT 라이선스로 공개. Swift 99.1%로 작성됨

    • WhisperKit, LLM.swift, Hugging Face, Sparkle 프레임워크 활용

로컬 LLM과 Whisper를 조합해서 프라이버시를 지키면서도 실용적인 음성 입력 도구를 만든 좋은 사례. 온디바이스 AI가 점점 실용 앱 단계로 진입하고 있다는 걸 보여줌.

댓글

댓글

댓글을 불러오는 중...

open-source

위키피디아에도 빅테크식 반노조 플레이북이 들어왔다

위키미디어 재단이 5월 열흘 사이 MediaWiki 장기 핵심 개발자를 해고하고, 자원봉사 편집자 요청을 처리하던 Community Tech 팀을 해산했다는 비판 글이다. 해고된 인력 상당수가 노조 조직 활동과 연결돼 있었고, 위키피디아 편집자들은 연대 파업까지 거론하고 있다. 재단은 2억9660만 달러의 준비금과 빠르게 성장하는 AI 대상 API 매출을 갖고 있어, 이 사안이 단순 비용 절감으로 보기 어렵다는 게 글의 핵심이다.

open-source

캘리포니아, 연령 확인법에서 리눅스 빼려는 수정안 추진

캘리포니아가 운영체제에 사용자 나이 확인을 요구하는 법안에서 대부분의 오픈소스 운영체제를 제외하는 수정안을 추진 중이다. 데비안, 페도라, 우분투, 아치, 리눅스 민트 같은 배포판은 빠질 가능성이 커졌지만, 스팀OS처럼 독점 앱 생태계와 연결된 플랫폼은 여전히 애매한 상태다.

open-source

마이크로소프트, 45년 전 86-DOS 소스코드를 오픈소스로 공개

마이크로소프트가 86-DOS 1.00 출시 45주년에 맞춰 지금까지 발견된 것 중 가장 오래된 DOS 소스코드를 공개했어. 팀 패터슨의 차고에 있던 도트 매트릭스 출력물을 스캔하고 옮겨 적어, 원본 바이너리와 바이트 단위로 동일하게 다시 컴파일되는 수준까지 복원한 게 포인트야.

open-source

밤부 랩, AGPLv3 위반 논란으로 오픈소스 커뮤니티와 충돌

3D 프린터 제조사 밤부 랩이 AGPLv3 라이선스 위반 논란에 휘말렸고, Software Freedom Conservancy가 두 건의 위반 사례를 확인했다는 내용이야. Louis Rossmann과 Gamers Nexus는 관련 개발자의 법적 방어를 위해 2만달러를 기부했고, 갈등의 핵심은 오픈소스 기반 생태계를 클라우드와 DRM으로 점점 닫아가려는 움직임이야.

open-source

플리퍼, 리눅스 기반 확장형 기기 '플리퍼 원' 공개

플리퍼가 기존 플리퍼 제로를 대체하는 후속작이 아니라, 리눅스 기반 네트워킹·확장형 기기인 플리퍼 원을 공개했어. RK3576 8코어 ARM 칩, 와이파이 6E, 듀얼 이더넷, NVMe, HDMI 4K 120Hz까지 넣으면서 장난감 같은 해킹 도구에서 훨씬 범용적인 리눅스 장비 쪽으로 방향을 넓히는 그림이야.