본문으로 건너뛰기
피드

한컴, AI로 PDF 접근성 태그 넣는 기술 오픈소스로 공개

open-source 약 4분
vote
0
댓글
북마크

한컴이 PDF 문서 구조를 AI로 분석해 접근성 태그를 자동 삽입하는 기능을 오픈소스로 공개했다. 미국 ADA 타이틀 II, 유럽 접근성법, 국내 장애인차별금지법 등 규제 대응 수요를 겨냥한 오픈 코어 전략이다.

  • 1

    PDF의 제목, 표, 이미지 구조를 AI가 분석하고 태그를 파일 내부에 직접 기록함

  • 2

    기업과 공공기관이 대량 PDF를 스크린 리더 친화적인 접근성 문서로 바꿀 수 있음

  • 3

    사내 설치형으로 동작해 민감 문서가 외부 클라우드로 나가지 않는 점을 강조함

  • 4

    2026년 2분기 PDF/UA 준수 상용 솔루션 출시를 계획 중임

  • 한컴이 AI 기반 PDF 접근성 태그 자동 생성·삽입 기능을 오픈소스로 공개함

    • 이 기능은 한컴의 문서 처리 도구인 오픈데이터로더(OpenDataLoader) PDF에 탑재돼 4월 30일 배포됨
    • 기업과 공공기관은 별도 비용 없이 대량 PDF를 스크린 리더가 읽을 수 있는 접근성 문서로 전환할 수 있음
  • 그냥 PDF 내용을 뽑아내는 도구가 아니라, 분석 결과를 다시 PDF 내부 구조에 써넣는 게 차별점임

    • AI가 PDF의 제목, 표, 이미지 같은 문서 구조를 분석함
    • 그 결과를 태그 형태로 파일 내부에 직접 기록해서 보조 기술이 문서 구조를 이해할 수 있게 만듦
    • 한컴은 이 단계까지 무료로 제공하는 관련 기술은 유일하다고 설명함

중요

> 핵심은 '추출'이 아니라 '삽입'임. 접근성 도구가 PDF를 읽으려면 텍스트만 있어서는 부족하고, 제목·표·이미지 같은 구조 정보가 파일 안에 제대로 들어가야 함.

  • 공개 배경에는 글로벌 접근성 규제가 있음

    • 2026년 4월부터 미국 장애인법(ADA) 타이틀 II의 주요 의무 적용이 시작됨
    • 유럽 접근성법(EAA), 국내 장애인차별금지법까지 맞물리면서 PDF 접근성 전환 수요가 커질 가능성이 큼
    • 공공기관이나 규제 산업 입장에서는 '나중에 고치자'가 점점 안 통하는 영역이 되는 중임
  • 한컴은 클라우드가 아니라 사내 설치형(On-premise) 실행을 강조함

    • 민감한 문서를 외부 클라우드로 올리지 않아도 된다는 게 포인트임
    • 파이썬, Node.js, Java 라이브러리를 지원해 기존 업무 시스템에 붙이기 쉽게 만들었다고 함
  • 사업 전략은 오픈 코어(Open Core)에 가까움

    • 핵심 기능은 무료로 열어 사용자를 확보함
    • 규제 준수가 엄격한 기업 고객에게는 전문 솔루션을 공급하는 방식임
    • PDF 접근성 검증 도구 veraPDF 개발팀인 듀얼랩(Dual Lab)과 협업 중이고, 2026년 2분기 안에 국제 표준 PDF/UA 준수 상용 솔루션을 내놓을 계획임

기술 맥락

  • 한컴이 고른 문제는 PDF '내용 추출'이 아니라 PDF '구조 복원'이에요. 왜냐하면 스크린 리더는 글자만 읽는 게 아니라 제목, 표, 이미지 대체 정보 같은 구조를 알아야 문서를 제대로 탐색할 수 있거든요.

  • 기존 오픈소스 도구가 주로 텍스트를 꺼내는 데 머물렀다면, 이번 기능은 분석한 구조를 PDF 내부 태그로 다시 넣는 쪽에 초점이 있어요. 그래서 접근성 규제 대응에서는 단순 파서보다 훨씬 직접적인 가치가 생겨요.

  • 온프레미스 지원도 그냥 배포 방식 문제가 아니에요. 공공기관이나 기업의 대량 PDF에는 민감한 정보가 많아서 외부 클라우드 업로드가 막히는 경우가 많거든요. 사내 시스템에서 파이썬, Node.js, Java로 붙일 수 있으면 기존 문서 워크플로에 넣기가 쉬워져요.

  • 오픈 코어 전략을 택한 이유도 명확해요. 무료 기능으로 접근성 전환을 시작하게 만들고, PDF/UA 검증이나 대량 처리 품질 보증이 필요한 조직에는 상용 솔루션을 제안할 수 있기 때문이에요.

PDF 접근성은 멋진 AI 데모보다 훨씬 덜 화려하지만, 공공·금융·교육 쪽에서는 실제 돈과 리스크가 걸린 문제임. 한컴이 무료 핵심 기능으로 진입 장벽을 낮추고, 규제 준수 시장에서 상용 솔루션을 파는 그림을 잡은 듯함.

댓글

댓글

댓글을 불러오는 중...

open-source

오픈소스 AI가 이겨야 한다는 짧고 강한 선언

이 글은 AI가 소수 폐쇄형 기관에서 빌려 쓰는 자원이 되면 소프트웨어 자유뿐 아니라 운영의 자유까지 잃는다고 주장함. AI를 일, 교육, 과학, 소프트웨어, 공공서비스의 문명 인프라로 보고, 로컬 실행·감사·수정·보존 가능한 오픈소스 AI가 필요하다는 선언에 가까움.

open-source

수파베이스, 5억 달러 투자 받고 100억 달러 데카콘 됐다

오픈소스 데이터베이스 플랫폼 수파베이스가 5억 달러 시리즈F 투자를 유치하며 기업가치 100억 달러를 넘겼다. AI 코딩 도구 확산으로 수파베이스 기반 데이터베이스 생성이 1년간 600% 이상 늘었고, 이 중 60% 이상이 AI 도구를 통해 만들어졌다. 포스트그레스 기반 백엔드 플랫폼이 바이브 코딩 시대의 기본 인프라로 자리 잡는 흐름이다.

open-source

오픈소스 AI, 좋긴 한데 통제 없으면 진짜 위험하다는 경고

국제 공동 연구팀이 오픈소스 AI의 잠재력과 위험을 함께 짚으며 4가지 거버넌스 조치를 제안했다. 기후변화, 식량 안보 같은 문제 해결에 기여할 수 있지만, 환경 비용·기술 격차·가짜뉴스 확산을 방치하면 사회적 부담이 커질 수 있다는 주장이다.

open-source

프롬프트에 돈을 모으면 AI가 공개적으로 구현해주는 ‘페이블풀’

페이블풀은 사람들이 하나의 큰 프롬프트에 돈을 보태면 AI 에이전트가 공개 장부와 마일스톤을 따라 구현을 시도하는 서비스다. 최소 프로젝트 규모는 100달러 이상이고, 후원자는 0.25달러부터 참여할 수 있다.

open-source

홈브루 6.0.0 공개, 이제 서드파티 탭은 먼저 믿어야 실행된다

홈브루 6.0.0은 탭 신뢰 모델, 기본 내부 JSON API, 리눅스 샌드박스, brew bundle 개선, macOS 27 초기 지원을 한꺼번에 넣은 대형 릴리스다. 특히 서드파티 탭의 임의 Ruby 코드 실행 위험을 줄이고, 공급망 보안과 성능을 동시에 밀어붙인 게 핵심이다.