본문으로 건너뛰기
피드

한컴, PDF 접근성 태그 자동 삽입 기능 오픈소스로 공개

open-source 약 7분
vote
0
댓글
북마크

한글과컴퓨터가 PDF 문서의 접근성 태그를 AI로 자동 생성해 원본 PDF에 삽입하는 기능을 오픈소스로 공개했다. 미국 ADA 타이틀 II, 유럽 접근성법, 국내 장애인차별금지법 대응 수요가 커지는 가운데, 문서 수량 제한 없는 사내 처리형 도구를 내세웠다. 이후 PDF/UA 국제 표준 준수 수준의 상용 솔루션으로 이어가는 오픈 코어 전략도 밝혔다.

  • 1

    오픈데이터로더 PDF는 AI가 제목, 표, 목록, 이미지 등을 분석해 접근성 태그를 PDF 내부에 직접 기록한다.

  • 2

    한컴은 이 기능을 4월 30일 오픈소스로 배포했고, 문서 수량 제한 없이 사용할 수 있다고 밝혔다.

  • 3

    기존 시장은 무료 범위가 월 수십 페이지 수준이거나 연간 수만 달러 라이선스 비용이 드는 경우가 많았다.

  • 4

    한컴은 2026년 2분기 안에 PDF/UA 국제 표준 준수 수준의 상용 솔루션도 출시할 계획이다.

한컴이 PDF 접근성 태그 자동 삽입 기능을 오픈소스로 풀었음

  • 한글과컴퓨터가 AI 기반 PDF 접근성 기능을 오픈데이터로더 PDF에 탑재해 4월 30일 배포함

    • 핵심은 PDF 문서의 접근성 태그를 자동으로 생성하고 삽입하는 기능임
    • 기업과 공공기관이 추가 비용이나 건당 과금 없이 대량 PDF를 접근성 문서로 바꿀 수 있다는 게 한컴의 주장임
  • 이 기능은 단순히 PDF에서 텍스트를 뽑는 수준이 아님

    • AI가 문서 구조를 분석함
    • 제목, 표, 목록, 이미지 같은 구성 요소를 구분함
    • 분석 결과를 원본 PDF 파일 안에 접근성 태그 형태로 직접 기록함
  • 한컴은 “무료 오픈소스 도구 중 여기까지 해주는 건 오픈데이터로더 PDF가 유일하다”고 강조함

    • 문서 내용 추출 도구는 많음
    • 하지만 추출 결과를 실제 PDF 내부의 접근성 구조로 완결해 삽입하는 단계까지 무료로 제공하는 경우는 드물다는 설명임

중요

> 관건은 “PDF를 읽어주는 도구”가 아니라 “PDF 자체를 접근성 구조가 있는 문서로 바꾸는 도구”라는 점임. 규제 대응에서는 이 차이가 꽤 큼.

왜 지금 PDF 접근성이 이슈가 됐나

  • PDF는 전 세계에서 가장 많이 쓰이는 문서 형식 중 하나지만, 접근성 태그 없이 돌아다니는 문서가 많음

    • 태그가 없으면 스크린 리더가 문서 구조를 제대로 이해하기 어려움
    • 시각장애인 등 정보 접근 취약 계층은 제목, 표, 목록, 이미지 맥락을 파악하기 힘들어짐
  • 규제 일정도 기업들을 밀어붙이는 중임

    • 미국 ADA 타이틀 II 주요 의무 적용 시점이 2026년 4월부터 도래함
    • 유럽 EAA도 맞물려 있음
    • 국내 장애인차별금지법까지 고려하면 글로벌 문서를 많이 다루는 조직은 미룰 수 없는 일이 됨
  • 결국 문제는 “수많은 기존 PDF를 어떻게 싸고 빠르게 바꾸느냐”임

    • 기업과 공공기관은 이미 쌓아둔 PDF가 많음
    • 사람이 일일이 태그를 붙이면 비용과 시간이 감당 안 됨
    • 그래서 AI 기반 자동 태깅과 대량 처리 수요가 커지는 구조임

기존 시장의 비용 구조를 정면으로 건드림

  • 한컴은 기존 PDF 접근성 도구들이 비용 장벽이 높았다고 봄

    • 클라우드 API 방식은 무료 제공 범위가 월 수십 페이지 수준인 경우가 있음
    • 본격 도입하면 연간 수만 달러의 기업용 라이선스 비용이 발생한다고 설명함
    • 일부 데스크톱 제품은 무료 체험에서도 워터마크가 붙거나 핵심 기능이 유료였다고 함
  • 오픈데이터로더 PDF는 이 지점을 “무제한 무료 활용”으로 치고 들어감

    • 문서 수량 제한 없이 사용할 수 있다고 밝힘
    • 사내 환경에서 처리되기 때문에 민감한 문서가 외부 서버로 전송되지 않음
    • 파이썬, Node.js, Java 라이브러리와 명령줄 도구도 제공함
  • 개발자 입장에서는 기존 업무 흐름에 붙일 수 있다는 점이 중요함

    • 배치 처리 파이프라인에 명령줄 도구를 붙일 수 있음
    • 백엔드 서비스에서는 언어별 라이브러리로 연동할 수 있음
    • 문서 관리 시스템이나 규제 대응 워크플로우에 넣기 쉬운 형태를 노린 듯함

💡

> 민감한 계약서, 공공 문서, 내부 보고서를 다루는 조직이라면 클라우드 변환 API보다 사내 처리형 도구가 검토 우선순위에 올라갈 수 있음.

오픈소스 배포 뒤에는 오픈 코어 전략이 있음

  • 한컴은 이번 공개를 단순 기능 배포로 보지 않음

    • 문서 처리 도구를 넘어 접근성 대응과 규제 준수까지 아우르는 문서 AI 플랫폼 전략의 일부라고 설명함
    • 무료 핵심 엔진으로 개발자와 기업을 한컴 생태계로 끌어들이려는 그림임
  • 기술적으로는 PDF협회 사양과 PDF/UA 국제 표준을 기준으로 태그 구조를 생성한다고 함

    • PDF/UA는 PDF 범용 접근성 표준임
    • 접근성 검증 도구 veraPDF 개발팀인 듀얼랩과도 협업해 품질 검증 체계를 고도화하고 있음
  • 상용 솔루션 계획도 이미 나와 있음

    • 한컴은 2026년 2분기 안에 PDF/UA 국제 표준 준수 수준의 결과물을 출력하는 상용 솔루션을 출시할 예정임
    • 핵심 기능은 오픈소스로 제공하고, 감사 대응과 규제 준수가 필요한 기업 고객에게 전문 솔루션을 공급하는 오픈 코어 전략임
  • 정지환 한컴 CTO의 메시지도 명확함

    • PDF 접근성 시장은 오랫동안 높은 비용과 복잡한 도입 구조로 운영돼 왔다고 봄
    • 한컴은 누구나 비용 부담 없이 접근성 전환을 시작하게 만들고, 규제가 본격화되는 흐름에 맞춰 무료 도구와 상용 솔루션을 함께 제공하겠다는 입장임

기술 맥락

  • 이 기사에서 핵심 선택은 “PDF 내용을 추출할 것인가, PDF 내부 구조를 실제로 고칠 것인가”예요. 접근성 규제 대응에서는 화면에 텍스트가 보이는지만으로는 부족하고, 스크린 리더가 문서의 제목, 표, 목록 구조를 이해할 수 있어야 하거든요.

  • 한컴이 AI를 쓰는 이유는 기존 PDF가 너무 많기 때문이에요. 기업이나 공공기관은 수년간 쌓인 문서를 한꺼번에 바꿔야 하는데, 사람이 직접 태그를 붙이면 비용이 터지고 일정도 안 맞아요.

  • 온프레미스 처리를 강조하는 것도 실무적으로 중요해요. 규제 대응이 필요한 문서일수록 계약서, 행정 문서, 내부 자료처럼 외부 서버에 올리기 애매한 경우가 많아서, 사내 배치 처리로 끝낼 수 있는지가 도입 판단에 큰 영향을 줘요.

  • 오픈 코어 전략은 개발자 생태계를 먼저 잡는 방식이에요. 핵심 기능을 무료로 풀어 사용량과 신뢰를 만들고, PDF/UA 준수 검증이나 감사 대응처럼 기업이 돈을 낼 만한 영역을 상용 제품으로 가져가는 구조예요.

PDF 접근성은 그동안 ‘중요하지만 돈과 시간이 너무 드는 일’에 가까웠다. 한컴은 규제가 본격화되는 타이밍에 무료 엔진을 먼저 풀고, 검증·감사·표준 준수가 필요한 기업 고객을 상용 솔루션으로 받겠다는 꽤 정석적인 오픈 코어 그림을 잡았다.

댓글

댓글

댓글을 불러오는 중...

open-source

오픈소스 AI가 이겨야 한다는 짧고 강한 선언

이 글은 AI가 소수 폐쇄형 기관에서 빌려 쓰는 자원이 되면 소프트웨어 자유뿐 아니라 운영의 자유까지 잃는다고 주장함. AI를 일, 교육, 과학, 소프트웨어, 공공서비스의 문명 인프라로 보고, 로컬 실행·감사·수정·보존 가능한 오픈소스 AI가 필요하다는 선언에 가까움.

open-source

수파베이스, 5억 달러 투자 받고 100억 달러 데카콘 됐다

오픈소스 데이터베이스 플랫폼 수파베이스가 5억 달러 시리즈F 투자를 유치하며 기업가치 100억 달러를 넘겼다. AI 코딩 도구 확산으로 수파베이스 기반 데이터베이스 생성이 1년간 600% 이상 늘었고, 이 중 60% 이상이 AI 도구를 통해 만들어졌다. 포스트그레스 기반 백엔드 플랫폼이 바이브 코딩 시대의 기본 인프라로 자리 잡는 흐름이다.

open-source

오픈소스 AI, 좋긴 한데 통제 없으면 진짜 위험하다는 경고

국제 공동 연구팀이 오픈소스 AI의 잠재력과 위험을 함께 짚으며 4가지 거버넌스 조치를 제안했다. 기후변화, 식량 안보 같은 문제 해결에 기여할 수 있지만, 환경 비용·기술 격차·가짜뉴스 확산을 방치하면 사회적 부담이 커질 수 있다는 주장이다.

open-source

프롬프트에 돈을 모으면 AI가 공개적으로 구현해주는 ‘페이블풀’

페이블풀은 사람들이 하나의 큰 프롬프트에 돈을 보태면 AI 에이전트가 공개 장부와 마일스톤을 따라 구현을 시도하는 서비스다. 최소 프로젝트 규모는 100달러 이상이고, 후원자는 0.25달러부터 참여할 수 있다.

open-source

홈브루 6.0.0 공개, 이제 서드파티 탭은 먼저 믿어야 실행된다

홈브루 6.0.0은 탭 신뢰 모델, 기본 내부 JSON API, 리눅스 샌드박스, brew bundle 개선, macOS 27 초기 지원을 한꺼번에 넣은 대형 릴리스다. 특히 서드파티 탭의 임의 Ruby 코드 실행 위험을 줄이고, 공급망 보안과 성능을 동시에 밀어붙인 게 핵심이다.