본문으로 건너뛰기
피드

Librario: 여러 도서 메타데이터 소스를 하나로 합치는 오픈소스 API

backend 약 3분
vote
0
댓글
북마크

개인 서재 1,800권 관리를 위해 만든 도서 메타데이터 통합 API. Google Books, ISBNDB, Hardcover 등에서 데이터를 가져와 필드별 전략으로 병합함. Go로 작성, PostgreSQL 백엔드, AGPL 라이선스. 프리알파 단계.

  • 1

    Google Books, ISBNDB, Hardcover 등 여러 소스의 도서 메타데이터를 하나로 병합

  • 2

    제목 스코어링(괄호/80자 이상 감점), 표지 품질 스코어링 등 필드별 병합 전략 적용

  • 3

    AI가 작성한 DB 스키마를 신뢰할 수 없어 SourceHut 개발자에게 재작성 의뢰

  • 4

    AGPL 라이선스, Go 작성, PostgreSQL 백엔드, 프리알파 단계

개인 서재 1,800권을 관리하려다 만든 도서 메타데이터 통합 API인 Librario가 Show HN에 공개됨. Go로 작성되었고 AGPL 라이선스로 SourceHut에서 호스팅됨.


  • 기존 도서 API들은 하나만으로 완전한 정보를 얻을 수 없는 게 문제였음. 어떤 소스는 시리즈 정보만, 다른 소스는 장르만, 또 다른 소스는 표지만 제대로 제공하는 식임
  • 현재 Google Books, ISBNDB, Hardcover를 지원하며, Goodreads와 Anna's Archive도 추가 예정임
  • 핵심은 서로 충돌하는 데이터를 병합하는 머저(merger) 로직임. 필드별로 다른 전략을 사용함:
    • 제목: 괄호가 포함되거나 80자 이상인 제목은 감점하는 스코어링 시스템 적용 (부제나 에디션 정보가 제목에 섞이는 걸 방지)
    • 표지: 모든 후보 URL을 수집한 뒤 이미지를 다운로드해서 해상도와 품질 기준으로 점수를 매겨 최적 표지를 선택
    • 기타 필드(출판사, 언어, 페이지 수 등): 소스 우선순위 기반으로 첫 번째 비어있지 않은 값을 채택
  • PostgreSQL 백엔드를 사용하며, 쿼리가 늘어날수록 데이터베이스가 강화되는 구조임
  • 데이터베이스 스키마는 원래 AI로 작성했으나 신뢰하기 어려워서 SourceHut 개발자에게 의뢰해 v1.0 전에 전면 재작성 중임
  • net/http에서 Fiber로 마이그레이션을 검토했지만, 표준 라이브러리를 벗어나는 게 적절하지 않다고 판단해 취소했음
  • 현재 프리알파(pre-alpha) 단계이며, 개발자가 생후 5개월 아기를 돌보는 중이라 개발 속도는 느린 편임

도서 메타데이터의 파편화 문제를 해결하려는 실용적 접근이며, AI 생성 코드를 신뢰하지 못해 전문가에게 재작성을 맡긴 판단이 흥미로운 사례임.

댓글

댓글

댓글을 불러오는 중...

backend

Go에서 Rust로 옮길 때 진짜로 바뀌는 것들

이 글은 Go 백엔드 서비스를 Rust로 옮길 때 속도보다 컴파일 타임 보장, 런타임 트레이드오프, 개발자 경험이 더 중요하다고 설명한다. nil 패닉, 데이터 레이스, 에러 처리, 제네릭, 비동기 모델, 마이그레이션 전략까지 실무 관점에서 Go와 Rust를 길게 비교한다.

backend

Python 3.15에서 헤드라인은 못 탔지만 꽤 쓸만한 기능들

Python 3.15에는 lazy imports나 Tachyon profiler 같은 큰 기능 말고도 실무에서 바로 체감될 만한 작은 개선들이 들어가. TaskGroup 취소, 컨텍스트 매니저 데코레이터 개선, 스레드 안전 이터레이터처럼 평소 애매하게 불편했던 지점들이 꽤 깔끔해졌어.

backend

심평원, DUR부터 의료영상 심사까지 클라우드로 갈아엎는다

심평원이 정보시스템 클라우드 전환과 함께 병·의원 업무에 직접 닿는 DUR, 의료영상 AI 심사, 요양급여내역 조회 시스템을 고도화한다. 핵심은 설치형 프로그램 중심이던 연계를 웹과 API 기반으로 넓히고, 진료·청구 과정에서 실시간 확인과 자동 판독을 강화하는 쪽이다.

backend

윈도우 에러 코드 7번 ‘ERROR_ARENA_TRASHED’는 어디서 왔을까

ERROR_ARENA_TRASHED는 Win32에서 실제로 쓰이는 현대적 에러라기보다 MS-DOS 시절 메모리 관리 구조에서 넘어온 잔재야. MS-DOS가 메모리 블록 앞의 arena 시그니처를 훑다가 예상한 값이 아니면 ‘arena가 망가졌다’고 보고 이 에러를 냈다는 이야기야.

backend

C/C++ 컴파일러의 느슨한 메모리 동시성 버그를 자동으로 잡는 박사논문

C와 C++ 컴파일러에서 relaxed memory 동시성 버그를 찾는 자동 테스트 프레임워크를 다룬 박사논문이 공개됐어. Téléchat, Atomic-mixer 같은 도구로 소스 수준 동작과 컴파일된 프로그램 동작을 비교하고, LLVM과 GCC 툴체인에서 실제 버그를 찾아낸 내용이 핵심이야.