본문으로 건너뛰기
피드

한컴, AI로 PDF 접근성 태그 넣는 기술 오픈소스로 공개

open-source 약 4분

한컴이 PDF 문서 구조를 AI로 분석해 접근성 태그를 자동 삽입하는 기능을 오픈소스로 공개했다. 미국 ADA 타이틀 II, 유럽 접근성법, 국내 장애인차별금지법 등 규제 대응 수요를 겨냥한 오픈 코어 전략이다.

  • 1

    PDF의 제목, 표, 이미지 구조를 AI가 분석하고 태그를 파일 내부에 직접 기록함

  • 2

    기업과 공공기관이 대량 PDF를 스크린 리더 친화적인 접근성 문서로 바꿀 수 있음

  • 3

    사내 설치형으로 동작해 민감 문서가 외부 클라우드로 나가지 않는 점을 강조함

  • 4

    2026년 2분기 PDF/UA 준수 상용 솔루션 출시를 계획 중임

  • 한컴이 AI 기반 PDF 접근성 태그 자동 생성·삽입 기능을 오픈소스로 공개함

    • 이 기능은 한컴의 문서 처리 도구인 오픈데이터로더(OpenDataLoader) PDF에 탑재돼 4월 30일 배포됨
    • 기업과 공공기관은 별도 비용 없이 대량 PDF를 스크린 리더가 읽을 수 있는 접근성 문서로 전환할 수 있음
  • 그냥 PDF 내용을 뽑아내는 도구가 아니라, 분석 결과를 다시 PDF 내부 구조에 써넣는 게 차별점임

    • AI가 PDF의 제목, 표, 이미지 같은 문서 구조를 분석함
    • 그 결과를 태그 형태로 파일 내부에 직접 기록해서 보조 기술이 문서 구조를 이해할 수 있게 만듦
    • 한컴은 이 단계까지 무료로 제공하는 관련 기술은 유일하다고 설명함

중요

> 핵심은 '추출'이 아니라 '삽입'임. 접근성 도구가 PDF를 읽으려면 텍스트만 있어서는 부족하고, 제목·표·이미지 같은 구조 정보가 파일 안에 제대로 들어가야 함.

  • 공개 배경에는 글로벌 접근성 규제가 있음

    • 2026년 4월부터 미국 장애인법(ADA) 타이틀 II의 주요 의무 적용이 시작됨
    • 유럽 접근성법(EAA), 국내 장애인차별금지법까지 맞물리면서 PDF 접근성 전환 수요가 커질 가능성이 큼
    • 공공기관이나 규제 산업 입장에서는 '나중에 고치자'가 점점 안 통하는 영역이 되는 중임
  • 한컴은 클라우드가 아니라 사내 설치형(On-premise) 실행을 강조함

    • 민감한 문서를 외부 클라우드로 올리지 않아도 된다는 게 포인트임
    • 파이썬, Node.js, Java 라이브러리를 지원해 기존 업무 시스템에 붙이기 쉽게 만들었다고 함
  • 사업 전략은 오픈 코어(Open Core)에 가까움

    • 핵심 기능은 무료로 열어 사용자를 확보함
    • 규제 준수가 엄격한 기업 고객에게는 전문 솔루션을 공급하는 방식임
    • PDF 접근성 검증 도구 veraPDF 개발팀인 듀얼랩(Dual Lab)과 협업 중이고, 2026년 2분기 안에 국제 표준 PDF/UA 준수 상용 솔루션을 내놓을 계획임

기술 맥락

  • 한컴이 고른 문제는 PDF '내용 추출'이 아니라 PDF '구조 복원'이에요. 왜냐하면 스크린 리더는 글자만 읽는 게 아니라 제목, 표, 이미지 대체 정보 같은 구조를 알아야 문서를 제대로 탐색할 수 있거든요.

  • 기존 오픈소스 도구가 주로 텍스트를 꺼내는 데 머물렀다면, 이번 기능은 분석한 구조를 PDF 내부 태그로 다시 넣는 쪽에 초점이 있어요. 그래서 접근성 규제 대응에서는 단순 파서보다 훨씬 직접적인 가치가 생겨요.

  • 온프레미스 지원도 그냥 배포 방식 문제가 아니에요. 공공기관이나 기업의 대량 PDF에는 민감한 정보가 많아서 외부 클라우드 업로드가 막히는 경우가 많거든요. 사내 시스템에서 파이썬, Node.js, Java로 붙일 수 있으면 기존 문서 워크플로에 넣기가 쉬워져요.

  • 오픈 코어 전략을 택한 이유도 명확해요. 무료 기능으로 접근성 전환을 시작하게 만들고, PDF/UA 검증이나 대량 처리 품질 보증이 필요한 조직에는 상용 솔루션을 제안할 수 있기 때문이에요.

PDF 접근성은 멋진 AI 데모보다 훨씬 덜 화려하지만, 공공·금융·교육 쪽에서는 실제 돈과 리스크가 걸린 문제임. 한컴이 무료 핵심 기능으로 진입 장벽을 낮추고, 규제 준수 시장에서 상용 솔루션을 파는 그림을 잡은 듯함.

댓글

댓글

댓글을 불러오는 중...

open-source

공무원이 퇴근 후 만든 AI 도구가 던진 질문: 정부 데이터는 왜 아직 AI가 못 읽나

광진구청 공무원이 HWP 문서 변환 도구와 법령 검색용 MCP 도구를 오픈소스로 공개하면서 공공기관의 AI 활용 문제가 다시 드러났다. 핵심은 개인의 미담이 아니라, 정부 데이터가 여전히 사람 눈으로 읽는 방식에 맞춰져 있고 AI가 호출하기 좋은 구조가 아니라는 점이다.

open-source

월러스, AI 에이전트용 메모리 SDK ‘멤월’ 공개

수이 기반 스토리지 프로토콜 월러스가 AI 에이전트용 메모리 레이어이자 SDK인 멤월을 출시했다. 핵심은 에이전트 메모리를 특정 모델이나 공급업체에 묶지 않고, 검증 가능하고 이동 가능한 데이터 레이어로 만들겠다는 것이다.

open-source

한컴, PDF 접근성 규제 대응용 오픈소스 솔루션 공개

한컴이 미국·유럽에서 강화되는 PDF 접근성 규제에 대응할 수 있는 오픈소스 솔루션을 공개했어. 접근성 태그가 없는 PDF 때문에 스크린 리더가 문서 구조를 못 읽는 문제를 겨냥했고, 올 2분기에는 PDF/UA 표준 수준의 상용 솔루션도 내놓을 예정이야.

open-source

Zig이 LLM 기여를 막는 이유: “PR이 아니라 사람에 베팅한다”

Zig 프로젝트는 이슈, PR, 버그 트래커 댓글까지 LLM 사용을 금지하는 강한 정책을 유지하고 있다. 핵심 논리는 코드 품질 문제가 아니라, 오픈소스 리뷰가 새 기여자를 키우는 투자라는 점이다. LLM이 만든 완성도 높은 PR은 당장 코드가 좋아 보여도 프로젝트가 신뢰할 사람을 얻는 과정과는 맞지 않는다는 주장이다.

open-source

한컴, PDF 접근성 태그를 자동 생성하는 AI 도구 오픈소스로 공개

한컴이 ‘오픈데이터로더 PDF’에 PDF 접근성 태그 자동 생성 기능을 넣고 오픈소스로 공개했어. AI가 제목, 표, 목록, 이미지 같은 문서 구조를 분석해 PDF 내부에 태그로 반영하는 방식이고, 온프레미스 실행과 파이썬·자바·명령줄 도구 연동을 지원해 기업 대량 문서 전환을 노린다는 내용이야.