본문으로 건너뛰기
피드

공무원이 퇴근 후 만든 AI 도구가 던진 질문: 정부 데이터는 왜 아직 AI가 못 읽나

open-source 약 6분
vote
0
댓글
북마크

광진구청 공무원이 HWP 문서 변환 도구와 법령 검색용 MCP 도구를 오픈소스로 공개하면서 공공기관의 AI 활용 문제가 다시 드러났다. 핵심은 개인의 미담이 아니라, 정부 데이터가 여전히 사람 눈으로 읽는 방식에 맞춰져 있고 AI가 호출하기 좋은 구조가 아니라는 점이다.

  • 1

    공공 HWP 문서와 법령 데이터를 AI가 다루기 쉽게 만든 오픈소스 도구가 주목받음

  • 2

    법제처에는 1,600개 이상 법률과 1만 개 이상 행정규칙, 방대한 판례가 있지만 개발자 경험은 나쁘다는 지적이 나옴

  • 3

    정부 AI 예산은 9조 9,000억 원으로 전년 대비 3배 이상 늘었지만 현장 기본 데이터 접근성은 여전히 문제

  • 광진구청 소속 공무원이 만든 AI 도구 2개가 공공기관 실무자들 사이에서 꽤 큰 반응을 얻음

    • 하나는 코닥(kordoc)으로, 공공기관에 쌓여 있는 HWP 문서를 AI가 분석할 수 있는 형태로 바꿔주는 도구임
    • 다른 하나는 korean-law-mcp로, 법제처에 흩어진 법률·판례 정보를 AI가 검색하고 비교할 수 있게 연결해주는 도구임
    • 둘 다 오픈소스로 공개됐고, 실무자들 사이에서는 말 그대로 “가려운 곳 긁어줬다”는 반응이 나옴
  • 이 사례가 흥미로운 이유는 도구 자체보다 질문이 더 세기 때문임

    • 왜 이런 기본적인 불편함을 일선 공무원이 퇴근 후 시간을 쪼개 해결해야 했냐는 것
    • 개인의 헌신을 칭찬하는 미담으로 끝내기엔, 공공 행정 시스템이 너무 오래 방치한 문제처럼 보임
    • 기사도 이 지점을 짚음. 이건 한 사람의 능력담이 아니라 정부 데이터 접근성의 구조 문제라는 얘기임
  • 법제처에는 데이터가 없어서 문제가 생긴 게 아님. 오히려 데이터는 엄청 많음

    • 대한민국 현행 법률만 1,600개 이상임
    • 행정규칙은 1만 개 이상이고, 대법원부터 관세청까지 이어지는 판례도 방대하게 모여 있음
    • 그런데 개발자 관점에서는 이걸 자동화하거나 AI가 호출하기 좋은 방식으로 쓰기가 어렵다는 게 핵심임

중요

> 문제는 “데이터가 부족하다”가 아니라 “AI와 개발자가 다루기 좋은 구조가 아니다” 쪽에 가까움. 사람 눈으로 검색하는 사이트와 AI가 호출하는 데이터 인프라는 완전히 다른 설계가 필요함.

  • 업계 관계자의 표현이 꽤 직설적임

    • “공무원이 MCP를 만드는 것만으로도 천지개벽”이라는 반응이 나옴
    • 동시에 “애초에 법제처가 머신리더블하게 만들어 놨으면 됐다”는 지적도 따라붙음
    • 결국 AI 시대의 공공 데이터는 PDF, HWP, 웹 페이지로 ‘열람 가능’한 수준을 넘어 API나 구조화된 형태로 ‘처리 가능’해야 한다는 얘기임
  • 정부도 AI에 돈을 안 쓰는 건 아님. 오히려 예산은 크게 늘었음

    • 올해 정부 AI 예산은 9조 9,000억 원으로, 전년 대비 3배 이상 증가함
    • 행정안전부는 ‘AI 민주정부’를 내걸고 1조 원 넘는 예산을 투입함
    • 지난 3월부터는 공무원들이 행정 내부망에서 민간 AI를 쓸 수 있게 하는 ‘범정부 AI 공통기반’도 가동됨
  • 그런데 현장에서는 여전히 법령 검색 같은 기초 업무부터 답답함이 남아 있음

    • AI 예산과 플랫폼 도입은 커졌지만, 정작 AI가 읽어야 할 데이터의 품질과 접근성은 뒤처져 있다는 뜻임
    • 실무자는 문서를 찾고, 열고, 복사하고, 비교하는 반복 작업에 계속 시간을 쓰게 됨
    • AI 도입의 병목이 모델 성능이 아니라 데이터 구조에서 터지는 전형적인 케이스임
  • 이 공무원은 차관급 인사들 앞에서 “AI는 위에서부터 혁신이 이뤄져야 한다”는 취지로 말한 것으로 전해짐

    • 개인이 도구를 만드는 것도 중요하지만, 지속 가능한 변화는 제도와 인프라가 바뀌어야 가능하다는 의미로 읽힘
    • 공공기관마다 개인 개발자가 알아서 우회 도구를 만드는 방식은 확장성이 없음
    • 정부가 진짜 AI 행정을 원한다면, 현장의 데이터를 처음부터 AI가 쓸 수 있게 다시 설계해야 함

기술 맥락

  • 이번 사례의 핵심 선택은 법령·판례 데이터를 MCP로 감싸 AI가 호출할 수 있게 만든 거예요. 그냥 웹사이트 검색창을 사람이 누르는 방식으로는 대규모 언어 모델이 안정적으로 비교·검색하기 어렵거든요.

  • HWP 변환 도구가 같이 주목받은 이유도 비슷해요. 공공기관 문서는 사람이 읽기엔 익숙하지만, AI가 문단 구조와 표, 서식을 해석하려면 중간 변환 과정이 필요해요. 문서가 많을수록 이 차이가 실무 생산성 차이로 바로 튀어나와요.

  • 법제처에 1,600개 이상 법률과 1만 개 이상 행정규칙이 모여 있다는 건 데이터 규모 자체는 충분하다는 뜻이에요. 하지만 AI 시대에는 ‘어디엔가 있다’보다 ‘기계가 정확히 찾고 조합할 수 있다’가 더 중요해요.

  • 그래서 이 이슈는 모델을 어떤 걸 쓰느냐보다 데이터 접근 계층을 어떻게 설계하느냐에 가까워요. 정부가 AI 예산을 크게 늘려도, 원천 데이터가 구조화돼 있지 않으면 현장에서는 계속 수동 검색과 복붙이 남게 돼요.

이건 ‘능력 있는 공무원 한 명’ 이야기가 아니라 공공 데이터 인프라의 설계 실패에 가까워 보여. AI 예산을 크게 늘리는 것보다 먼저, 기계가 읽고 호출할 수 있는 행정 데이터 구조를 만드는 게 실무자 입장에선 훨씬 체감될 수 있음.

댓글

댓글

댓글을 불러오는 중...

open-source

오픈소스 AI가 이겨야 한다는 짧고 강한 선언

이 글은 AI가 소수 폐쇄형 기관에서 빌려 쓰는 자원이 되면 소프트웨어 자유뿐 아니라 운영의 자유까지 잃는다고 주장함. AI를 일, 교육, 과학, 소프트웨어, 공공서비스의 문명 인프라로 보고, 로컬 실행·감사·수정·보존 가능한 오픈소스 AI가 필요하다는 선언에 가까움.

open-source

수파베이스, 5억 달러 투자 받고 100억 달러 데카콘 됐다

오픈소스 데이터베이스 플랫폼 수파베이스가 5억 달러 시리즈F 투자를 유치하며 기업가치 100억 달러를 넘겼다. AI 코딩 도구 확산으로 수파베이스 기반 데이터베이스 생성이 1년간 600% 이상 늘었고, 이 중 60% 이상이 AI 도구를 통해 만들어졌다. 포스트그레스 기반 백엔드 플랫폼이 바이브 코딩 시대의 기본 인프라로 자리 잡는 흐름이다.

open-source

오픈소스 AI, 좋긴 한데 통제 없으면 진짜 위험하다는 경고

국제 공동 연구팀이 오픈소스 AI의 잠재력과 위험을 함께 짚으며 4가지 거버넌스 조치를 제안했다. 기후변화, 식량 안보 같은 문제 해결에 기여할 수 있지만, 환경 비용·기술 격차·가짜뉴스 확산을 방치하면 사회적 부담이 커질 수 있다는 주장이다.

open-source

프롬프트에 돈을 모으면 AI가 공개적으로 구현해주는 ‘페이블풀’

페이블풀은 사람들이 하나의 큰 프롬프트에 돈을 보태면 AI 에이전트가 공개 장부와 마일스톤을 따라 구현을 시도하는 서비스다. 최소 프로젝트 규모는 100달러 이상이고, 후원자는 0.25달러부터 참여할 수 있다.

open-source

홈브루 6.0.0 공개, 이제 서드파티 탭은 먼저 믿어야 실행된다

홈브루 6.0.0은 탭 신뢰 모델, 기본 내부 JSON API, 리눅스 샌드박스, brew bundle 개선, macOS 27 초기 지원을 한꺼번에 넣은 대형 릴리스다. 특히 서드파티 탭의 임의 Ruby 코드 실행 위험을 줄이고, 공급망 보안과 성능을 동시에 밀어붙인 게 핵심이다.