본문으로 건너뛰기
피드

한컴, PDF 접근성 태그 자동 삽입 기능 오픈소스로 공개

open-source 약 7분

한글과컴퓨터가 PDF 문서의 접근성 태그를 AI로 자동 생성해 원본 PDF에 삽입하는 기능을 오픈소스로 공개했다. 미국 ADA 타이틀 II, 유럽 접근성법, 국내 장애인차별금지법 대응 수요가 커지는 가운데, 문서 수량 제한 없는 사내 처리형 도구를 내세웠다. 이후 PDF/UA 국제 표준 준수 수준의 상용 솔루션으로 이어가는 오픈 코어 전략도 밝혔다.

  • 1

    오픈데이터로더 PDF는 AI가 제목, 표, 목록, 이미지 등을 분석해 접근성 태그를 PDF 내부에 직접 기록한다.

  • 2

    한컴은 이 기능을 4월 30일 오픈소스로 배포했고, 문서 수량 제한 없이 사용할 수 있다고 밝혔다.

  • 3

    기존 시장은 무료 범위가 월 수십 페이지 수준이거나 연간 수만 달러 라이선스 비용이 드는 경우가 많았다.

  • 4

    한컴은 2026년 2분기 안에 PDF/UA 국제 표준 준수 수준의 상용 솔루션도 출시할 계획이다.

한컴이 PDF 접근성 태그 자동 삽입 기능을 오픈소스로 풀었음

  • 한글과컴퓨터가 AI 기반 PDF 접근성 기능을 오픈데이터로더 PDF에 탑재해 4월 30일 배포함

    • 핵심은 PDF 문서의 접근성 태그를 자동으로 생성하고 삽입하는 기능임
    • 기업과 공공기관이 추가 비용이나 건당 과금 없이 대량 PDF를 접근성 문서로 바꿀 수 있다는 게 한컴의 주장임
  • 이 기능은 단순히 PDF에서 텍스트를 뽑는 수준이 아님

    • AI가 문서 구조를 분석함
    • 제목, 표, 목록, 이미지 같은 구성 요소를 구분함
    • 분석 결과를 원본 PDF 파일 안에 접근성 태그 형태로 직접 기록함
  • 한컴은 “무료 오픈소스 도구 중 여기까지 해주는 건 오픈데이터로더 PDF가 유일하다”고 강조함

    • 문서 내용 추출 도구는 많음
    • 하지만 추출 결과를 실제 PDF 내부의 접근성 구조로 완결해 삽입하는 단계까지 무료로 제공하는 경우는 드물다는 설명임

중요

> 관건은 “PDF를 읽어주는 도구”가 아니라 “PDF 자체를 접근성 구조가 있는 문서로 바꾸는 도구”라는 점임. 규제 대응에서는 이 차이가 꽤 큼.

왜 지금 PDF 접근성이 이슈가 됐나

  • PDF는 전 세계에서 가장 많이 쓰이는 문서 형식 중 하나지만, 접근성 태그 없이 돌아다니는 문서가 많음

    • 태그가 없으면 스크린 리더가 문서 구조를 제대로 이해하기 어려움
    • 시각장애인 등 정보 접근 취약 계층은 제목, 표, 목록, 이미지 맥락을 파악하기 힘들어짐
  • 규제 일정도 기업들을 밀어붙이는 중임

    • 미국 ADA 타이틀 II 주요 의무 적용 시점이 2026년 4월부터 도래함
    • 유럽 EAA도 맞물려 있음
    • 국내 장애인차별금지법까지 고려하면 글로벌 문서를 많이 다루는 조직은 미룰 수 없는 일이 됨
  • 결국 문제는 “수많은 기존 PDF를 어떻게 싸고 빠르게 바꾸느냐”임

    • 기업과 공공기관은 이미 쌓아둔 PDF가 많음
    • 사람이 일일이 태그를 붙이면 비용과 시간이 감당 안 됨
    • 그래서 AI 기반 자동 태깅과 대량 처리 수요가 커지는 구조임

기존 시장의 비용 구조를 정면으로 건드림

  • 한컴은 기존 PDF 접근성 도구들이 비용 장벽이 높았다고 봄

    • 클라우드 API 방식은 무료 제공 범위가 월 수십 페이지 수준인 경우가 있음
    • 본격 도입하면 연간 수만 달러의 기업용 라이선스 비용이 발생한다고 설명함
    • 일부 데스크톱 제품은 무료 체험에서도 워터마크가 붙거나 핵심 기능이 유료였다고 함
  • 오픈데이터로더 PDF는 이 지점을 “무제한 무료 활용”으로 치고 들어감

    • 문서 수량 제한 없이 사용할 수 있다고 밝힘
    • 사내 환경에서 처리되기 때문에 민감한 문서가 외부 서버로 전송되지 않음
    • 파이썬, Node.js, Java 라이브러리와 명령줄 도구도 제공함
  • 개발자 입장에서는 기존 업무 흐름에 붙일 수 있다는 점이 중요함

    • 배치 처리 파이프라인에 명령줄 도구를 붙일 수 있음
    • 백엔드 서비스에서는 언어별 라이브러리로 연동할 수 있음
    • 문서 관리 시스템이나 규제 대응 워크플로우에 넣기 쉬운 형태를 노린 듯함

💡

> 민감한 계약서, 공공 문서, 내부 보고서를 다루는 조직이라면 클라우드 변환 API보다 사내 처리형 도구가 검토 우선순위에 올라갈 수 있음.

오픈소스 배포 뒤에는 오픈 코어 전략이 있음

  • 한컴은 이번 공개를 단순 기능 배포로 보지 않음

    • 문서 처리 도구를 넘어 접근성 대응과 규제 준수까지 아우르는 문서 AI 플랫폼 전략의 일부라고 설명함
    • 무료 핵심 엔진으로 개발자와 기업을 한컴 생태계로 끌어들이려는 그림임
  • 기술적으로는 PDF협회 사양과 PDF/UA 국제 표준을 기준으로 태그 구조를 생성한다고 함

    • PDF/UA는 PDF 범용 접근성 표준임
    • 접근성 검증 도구 veraPDF 개발팀인 듀얼랩과도 협업해 품질 검증 체계를 고도화하고 있음
  • 상용 솔루션 계획도 이미 나와 있음

    • 한컴은 2026년 2분기 안에 PDF/UA 국제 표준 준수 수준의 결과물을 출력하는 상용 솔루션을 출시할 예정임
    • 핵심 기능은 오픈소스로 제공하고, 감사 대응과 규제 준수가 필요한 기업 고객에게 전문 솔루션을 공급하는 오픈 코어 전략임
  • 정지환 한컴 CTO의 메시지도 명확함

    • PDF 접근성 시장은 오랫동안 높은 비용과 복잡한 도입 구조로 운영돼 왔다고 봄
    • 한컴은 누구나 비용 부담 없이 접근성 전환을 시작하게 만들고, 규제가 본격화되는 흐름에 맞춰 무료 도구와 상용 솔루션을 함께 제공하겠다는 입장임

기술 맥락

  • 이 기사에서 핵심 선택은 “PDF 내용을 추출할 것인가, PDF 내부 구조를 실제로 고칠 것인가”예요. 접근성 규제 대응에서는 화면에 텍스트가 보이는지만으로는 부족하고, 스크린 리더가 문서의 제목, 표, 목록 구조를 이해할 수 있어야 하거든요.

  • 한컴이 AI를 쓰는 이유는 기존 PDF가 너무 많기 때문이에요. 기업이나 공공기관은 수년간 쌓인 문서를 한꺼번에 바꿔야 하는데, 사람이 직접 태그를 붙이면 비용이 터지고 일정도 안 맞아요.

  • 온프레미스 처리를 강조하는 것도 실무적으로 중요해요. 규제 대응이 필요한 문서일수록 계약서, 행정 문서, 내부 자료처럼 외부 서버에 올리기 애매한 경우가 많아서, 사내 배치 처리로 끝낼 수 있는지가 도입 판단에 큰 영향을 줘요.

  • 오픈 코어 전략은 개발자 생태계를 먼저 잡는 방식이에요. 핵심 기능을 무료로 풀어 사용량과 신뢰를 만들고, PDF/UA 준수 검증이나 감사 대응처럼 기업이 돈을 낼 만한 영역을 상용 제품으로 가져가는 구조예요.

PDF 접근성은 그동안 ‘중요하지만 돈과 시간이 너무 드는 일’에 가까웠다. 한컴은 규제가 본격화되는 타이밍에 무료 엔진을 먼저 풀고, 검증·감사·표준 준수가 필요한 기업 고객을 상용 솔루션으로 받겠다는 꽤 정석적인 오픈 코어 그림을 잡았다.

댓글

댓글

댓글을 불러오는 중...

open-source

모바일 신분증에 AI·블록체인 붙이는 해커톤, 최대 10억 창업 지원까지 걸림

한국디지털인증협회가 모바일 신분증 기반 AI·블록체인 서비스 아이디어를 찾는 ‘2026 블록체인 AI 해커톤’을 연다. 총상금은 3000만원이고, 입상팀에는 별도 심사를 거쳐 최대 10억원 규모 창업 지원 기회도 붙는다.

open-source

3D 보로노이 구조 만드는 오픈소스 도구 PyVoroGen 공개

토리노 폴리테크닉 대학교와 마스트리흐트 대학교 연구진이 3D 프린팅용 보로노이 구조 생성 도구 PyVoroGen을 공개했다. Python 기반 오픈소스라 점 밀도, 벽 두께, 기공 크기 같은 파라미터를 조절해 다공성·경량 구조를 만들 수 있다.

open-source

넷핵 5.0.0 공개, C99 전환과 크로스 컴파일 지원까지 들어갔다

오픈소스 던전 탐험 게임 넷핵(NetHack)이 5.0.0 버전을 공개했다. 게임 개선과 버그 수정뿐 아니라 C99 준수, 크로스 컴파일 장벽 제거, yacc·lex 기반 도구를 Lua 기반 처리로 바꾸는 등 빌드와 아키텍처 쪽 변화가 꽤 크다.

open-source

AMD, 리눅스 오픈소스 드라이버에 HDMI 2.1 핵심 지원 넣기 시작

AMD가 리눅스용 오픈소스 그래픽 드라이버에 HDMI 2.1의 고정 속도 링크 지원 패치를 공개했다. 아직 가변 주사율과 디스플레이 스트림 압축은 빠졌지만, HDMI 포럼의 제약 때문에 오픈소스 구현이 막혀 있던 영역에 공식 코드가 나온 점이 의미 있다.

open-source

한컴, AI로 PDF 접근성 태그 넣는 기술 오픈소스로 공개

한컴이 PDF 문서 구조를 AI로 분석해 접근성 태그를 자동 삽입하는 기능을 오픈소스로 공개했다. 미국 ADA 타이틀 II, 유럽 접근성법, 국내 장애인차별금지법 등 규제 대응 수요를 겨냥한 오픈 코어 전략이다.