본문으로 건너뛰기
피드

파일명 몰라도 찾는 로컬 우선 데스크톱 검색 도구, 미라 공개

open-source 약 5분
vote
0
댓글
북마크

미라는 폴더를 색인해 파일명, 메타데이터, 본문, 의미 기반 검색을 한 번에 제공하는 로컬 우선 데스크톱 앱임. 기본 처리는 기기 안에서 이뤄지고, 원하면 제미나이 API로 임베딩 생성을 넘길 수 있음.

  • 1

    파일명을 정확히 몰라도 자연어로 로컬 파일을 찾는 데 초점을 둔 데스크톱 앱임

  • 2

    파일 메타데이터, 문서 본문 추출, 로컬 임베딩 기반 의미 검색을 함께 사용해 결과를 랭킹함

  • 3

    현재 맥용 빌드를 제공하지만 애플 공증은 아직 없어 첫 실행 때 격리 플래그를 지워야 함

  • 미라는 로컬 폴더를 ‘의미 검색 가능한 작업 공간’으로 바꿔주는 데스크톱 앱임

    • 파일명을 정확히 기억하지 못해도 평문 영어로 검색할 수 있음
    • 이름은 라틴어 ‘보다, 바라보다’라는 뜻의 미라레에서 가져왔다고 함
    • 현재는 깃허브 릴리스에서 최신 맥용 빌드를 내려받는 방식임
  • 검색 방식은 단순 파일명 검색 하나가 아니라 세 가지를 섞는 구조임

    • 메타데이터 검색으로 파일 이름, 형식, 크기, 날짜를 빠르게 조회함
    • 본문 추출로 피디에프, 문서, 텍스트 파일 안의 내용까지 검색함
    • 의미 검색으로 정확한 단어가 없어도 뜻이 가까운 파일을 찾음
  • 색인 흐름은 꽤 직관적임

    • 사용자가 원본 폴더를 추가하면 미라가 백그라운드에서 바로 색인을 시작함
    • 디렉터리 트리를 돌면서 파일 메타데이터를 기록하고, 지원 형식에서는 텍스트를 뽑아냄
    • 이후 의미 검색용 임베딩(Embeddings)을 생성하고, 검색 시 메타데이터·본문·의미 유사도를 함께 반영해 랭킹함

💡

> 파일 검색이 자주 막히는 사람이라면 키워드 검색과 의미 검색을 같이 쓰는 방식이 꽤 실용적임. 특히 ‘그 문서에 뭐라고 적었는지는 기억나는데 파일명은 모르는’ 상황에 맞춰져 있음.

  • 기본값은 로컬 우선(Local-first)이라 개인정보 측면에서 신경 쓴 흔적이 있음

    • 기본 처리에서는 파일이 기기 밖으로 나가지 않는다고 설명함
    • 설정에서 선택적으로 제미나이 API 제공자를 켜면, 임베딩 생성에 필요한 콘텐츠가 사용자가 넣은 키로 구글 API에 전송됨
    • 즉, 완전 로컬 검색으로 쓸 수도 있고 품질이나 편의를 위해 외부 API를 붙일 수도 있는 구조임
  • 앱 안에서는 검색 결과를 바로 열거나 파인더에서 위치를 볼 수 있음

    • 결과 미리보기 기능을 통해 파일을 앱에서 바로 확인할 수 있음
    • 검색 도구가 따로 놀지 않고 실제 파일 작업으로 이어지게 만든 점이 중요함
    • ‘찾기’에서 끝나는 게 아니라 ‘열기·드러내기’까지 이어지는 데스크톱 검색 경험을 노린 셈임
  • 아직 초기 프로젝트 느낌도 분명함

    • 맥 앱이 애플 공증을 받지 않아 첫 실행 때 ‘손상되어 열 수 없다’는 메시지가 나올 수 있음
    • 이 경우 터미널에서 xattr -cr /Applications/Mira.app 명령으로 격리 플래그를 제거해야 한다고 안내함
    • 개발 전제 조건으로 러스트(Rust), 번(Bun), 타우리 v2(Tauri v2) 시스템 의존성이 필요함

⚠️주의

> 공증되지 않은 데스크톱 앱은 설치 전에 소스와 릴리스 신뢰도를 직접 확인하는 게 좋음. 로컬 파일 전체를 색인하는 앱이라 권한 범위가 꽤 넓기 때문임.


기술 맥락

  • 미라의 선택은 로컬 파일 검색에 의미 검색을 붙이는 거예요. 기존 파일 검색은 파일명이나 정확한 키워드에 강하지만, 사람이 실제로 기억하는 건 ‘그 문서가 무슨 내용이었는지’인 경우가 많거든요.

  • 그래서 메타데이터, 본문 추출, 임베딩 검색을 같이 씁니다. 파일명만 보면 놓치는 문서를 본문 검색이 잡고, 정확한 단어가 달라도 의미가 비슷하면 임베딩 검색이 한 번 더 잡아주는 구조예요.

  • 로컬 우선 설계가 중요한 이유는 검색 대상이 개인 파일이기 때문이에요. 회사 문서, 계약서, 노트, 코드 조각이 섞여 있을 수 있어서 기본값으로 외부 서버에 보내지 않는다는 점이 신뢰의 출발점이 됩니다.

  • 다만 선택적으로 제미나이 API를 붙일 수 있게 한 건 품질과 비용 사이의 타협이에요. 로컬 임베딩은 개인정보에 유리하지만 모델 성능이나 속도에서 한계가 있을 수 있고, 외부 API는 품질을 얻는 대신 데이터 전송이라는 부담이 생겨요.

개발자 입장에서는 ‘내 파일을 클라우드 검색 서비스에 올리지 않고 의미 검색을 붙인다’는 점이 꽤 실용적임. 다만 아직 공증되지 않은 맥 앱이고, 선택적으로 제미나이 API를 쓰면 파일 내용 일부가 외부로 나갈 수 있다는 점은 사용자가 직접 판단해야 함.

댓글

댓글

댓글을 불러오는 중...

open-source

Paint.NET, 22년 만에 드디어 paint.net 도메인을 손에 넣다

무료 이미지 편집 도구 Paint.NET이 2004년 출시 이후 22년 만에 paint.net 도메인을 확보했다. 기존 도메인 소유자가 Paint.NET 공식 사이트처럼 보이는 콘텐츠와 광고 링크를 올리면서 상표권 침해와 도메인 점유 문제가 명확해졌고, 제작자 릭 브루스터가 법적 대응 끝에 도메인을 가져왔다.

open-source

KORE, Parquet보다 더 작고 빠르다는 새 컬럼형 바이너리 포맷 공개

KORE는 분석 워크로드를 겨냥한 오픈소스 바이너리 파일 포맷으로, Parquet 대비 더 높은 압축률과 빠른 쿼리 성능을 주장한다. 다만 현재 공개된 내용에는 일부 구현이 스텁 처리됐다는 언급도 있어, 벤치마크 숫자는 흥미롭지만 실제 도입 전 검증이 필수다.

open-source

소설 쓰기에 맞춘 오프라인 텍스트 에디터, 치즈 페이퍼

치즈 페이퍼는 소설과 장문 글쓰기에 특화된 오픈소스 텍스트 에디터다. 장면별 본문은 마크다운으로, 노트와 요약은 TOML 헤더로 저장하고, 파일 동기화 도구와 함께 쓰는 오프라인 우선 구조를 택했다.

open-source

진짜 신용카드 두께에 컴퓨터를 넣어버린 DIY 하드웨어 프로젝트

Muxcard는 ESP32-C3, 전자종이 디스플레이, NFC를 실제 신용카드에 가까운 두께로 집어넣은 초박형 컴퓨터 프로토타입이다. 제작자는 약 1밀리미터 두께를 목표로 직접 플렉스 피시비를 만들고, 배터리·디스플레이 연결·기계적 피로 같은 현실적인 문제를 하나씩 검증했다.

open-source

브라 사이즈 계산기를 Emacs 안에 만든 사람의 진짜 Emacs식 생활 자동화

필자가 브라 사이즈를 다시 재야 하는 상황에서 Emacs Lisp로 EU, UK, US 브라 사이즈 계산기를 만든 이야기다. Emacs Calc의 단위 변환과 Org 테이블 수식을 엮어서, 측정값만 적으면 여러 지역 기준 사이즈가 자동으로 채워지는 작은 도구로 확장했다.