공무원이 퇴근 후 만든 AI 도구가 던진 질문: 정부 데이터는 왜 아직 AI가 못 읽나

open-source 2026-05-01 약 6분

 tags

#ai #mcp #hwp #public-data #government

vote

북마크

광진구청 공무원이 HWP 문서 변환 도구와 법령 검색용 MCP 도구를 오픈소스로 공개하면서 공공기관의 AI 활용 문제가 다시 드러났다. 핵심은 개인의 미담이 아니라, 정부 데이터가 여전히 사람 눈으로 읽는 방식에 맞춰져 있고 AI가 호출하기 좋은 구조가 아니라는 점이다.

1
공공 HWP 문서와 법령 데이터를 AI가 다루기 쉽게 만든 오픈소스 도구가 주목받음
2
법제처에는 1,600개 이상 법률과 1만 개 이상 행정규칙, 방대한 판례가 있지만 개발자 경험은 나쁘다는 지적이 나옴
3
정부 AI 예산은 9조 9,000억 원으로 전년 대비 3배 이상 늘었지만 현장 기본 데이터 접근성은 여전히 문제

광진구청 소속 공무원이 만든 AI 도구 2개가 공공기관 실무자들 사이에서 꽤 큰 반응을 얻음
- 하나는 코닥(kordoc)으로, 공공기관에 쌓여 있는 HWP 문서를 AI가 분석할 수 있는 형태로 바꿔주는 도구임
- 다른 하나는 korean-law-mcp로, 법제처에 흩어진 법률·판례 정보를 AI가 검색하고 비교할 수 있게 연결해주는 도구임
- 둘 다 오픈소스로 공개됐고, 실무자들 사이에서는 말 그대로 “가려운 곳 긁어줬다”는 반응이 나옴
이 사례가 흥미로운 이유는 도구 자체보다 질문이 더 세기 때문임
- 왜 이런 기본적인 불편함을 일선 공무원이 퇴근 후 시간을 쪼개 해결해야 했냐는 것
- 개인의 헌신을 칭찬하는 미담으로 끝내기엔, 공공 행정 시스템이 너무 오래 방치한 문제처럼 보임
- 기사도 이 지점을 짚음. 이건 한 사람의 능력담이 아니라 정부 데이터 접근성의 구조 문제라는 얘기임
법제처에는 데이터가 없어서 문제가 생긴 게 아님. 오히려 데이터는 엄청 많음
- 대한민국 현행 법률만 1,600개 이상임
- 행정규칙은 1만 개 이상이고, 대법원부터 관세청까지 이어지는 판례도 방대하게 모여 있음
- 그런데 개발자 관점에서는 이걸 자동화하거나 AI가 호출하기 좋은 방식으로 쓰기가 어렵다는 게 핵심임

❗중요

> 문제는 “데이터가 부족하다”가 아니라 “AI와 개발자가 다루기 좋은 구조가 아니다” 쪽에 가까움. 사람 눈으로 검색하는 사이트와 AI가 호출하는 데이터 인프라는 완전히 다른 설계가 필요함.

업계 관계자의 표현이 꽤 직설적임
- “공무원이 MCP를 만드는 것만으로도 천지개벽”이라는 반응이 나옴
- 동시에 “애초에 법제처가 머신리더블하게 만들어 놨으면 됐다”는 지적도 따라붙음
- 결국 AI 시대의 공공 데이터는 PDF, HWP, 웹 페이지로 ‘열람 가능’한 수준을 넘어 API나 구조화된 형태로 ‘처리 가능’해야 한다는 얘기임
정부도 AI에 돈을 안 쓰는 건 아님. 오히려 예산은 크게 늘었음
- 올해 정부 AI 예산은 9조 9,000억 원으로, 전년 대비 3배 이상 증가함
- 행정안전부는 ‘AI 민주정부’를 내걸고 1조 원 넘는 예산을 투입함
- 지난 3월부터는 공무원들이 행정 내부망에서 민간 AI를 쓸 수 있게 하는 ‘범정부 AI 공통기반’도 가동됨
그런데 현장에서는 여전히 법령 검색 같은 기초 업무부터 답답함이 남아 있음
- AI 예산과 플랫폼 도입은 커졌지만, 정작 AI가 읽어야 할 데이터의 품질과 접근성은 뒤처져 있다는 뜻임
- 실무자는 문서를 찾고, 열고, 복사하고, 비교하는 반복 작업에 계속 시간을 쓰게 됨
- AI 도입의 병목이 모델 성능이 아니라 데이터 구조에서 터지는 전형적인 케이스임
이 공무원은 차관급 인사들 앞에서 “AI는 위에서부터 혁신이 이뤄져야 한다”는 취지로 말한 것으로 전해짐
- 개인이 도구를 만드는 것도 중요하지만, 지속 가능한 변화는 제도와 인프라가 바뀌어야 가능하다는 의미로 읽힘
- 공공기관마다 개인 개발자가 알아서 우회 도구를 만드는 방식은 확장성이 없음
- 정부가 진짜 AI 행정을 원한다면, 현장의 데이터를 처음부터 AI가 쓸 수 있게 다시 설계해야 함

기술 맥락

이번 사례의 핵심 선택은 법령·판례 데이터를 MCP로 감싸 AI가 호출할 수 있게 만든 거예요. 그냥 웹사이트 검색창을 사람이 누르는 방식으로는 대규모 언어 모델이 안정적으로 비교·검색하기 어렵거든요.
HWP 변환 도구가 같이 주목받은 이유도 비슷해요. 공공기관 문서는 사람이 읽기엔 익숙하지만, AI가 문단 구조와 표, 서식을 해석하려면 중간 변환 과정이 필요해요. 문서가 많을수록 이 차이가 실무 생산성 차이로 바로 튀어나와요.
법제처에 1,600개 이상 법률과 1만 개 이상 행정규칙이 모여 있다는 건 데이터 규모 자체는 충분하다는 뜻이에요. 하지만 AI 시대에는 ‘어디엔가 있다’보다 ‘기계가 정확히 찾고 조합할 수 있다’가 더 중요해요.
그래서 이 이슈는 모델을 어떤 걸 쓰느냐보다 데이터 접근 계층을 어떻게 설계하느냐에 가까워요. 정부가 AI 예산을 크게 늘려도, 원천 데이터가 구조화돼 있지 않으면 현장에서는 계속 수동 검색과 복붙이 남게 돼요.

이건 ‘능력 있는 공무원 한 명’ 이야기가 아니라 공공 데이터 인프라의 설계 실패에 가까워 보여. AI 예산을 크게 늘리는 것보다 먼저, 기계가 읽고 호출할 수 있는 행정 데이터 구조를 만드는 게 실무자 입장에선 훨씬 체감될 수 있음.

이전 기사 (P)

다음 기사 (N)

댓글을 불러오는 중...

open-source 2026-07-30

엔아이피에이, 국내 오픈소스 인공지능·소프트웨어 커뮤니티 15곳 지원 시작

정보통신산업진흥원이 국내 오픈소스 인공지능·소프트웨어 커뮤니티 15곳을 선정해 개발 활동, 협업, 성과 확산을 지원하기 시작했음. 선정 커뮤니티에는 국내외 콘퍼런스 참여 기회, 그래픽처리장치와 서버 자원, 협업 공간 등이 제공됨.

open-source 2026-07-30

NIPA, 오픈소스 AI·SW 커뮤니티 15곳에 GPU·서버·콘퍼런스 지원 시작

정보통신산업진흥원이 국내 오픈소스 AI·SW 커뮤니티 15곳을 선정하고 본격 지원에 들어갔다. 선정 커뮤니티에는 국내외 콘퍼런스·세미나 참여 기회, 클라우드 기반 GPU·서버 자원, 협업 공간이 제공된다. AI, 머신러닝, 생성형 AI, 데이터 엔지니어링, 클라우드 인프라, 오픈소스 DB, Python, 보안까지 범위가 꽤 넓다.

open-source 2026-07-29

오픈 웨이트 인공지능이 폐쇄형 모델 사업자를 압박하는 이유

오픈 웨이트 모델은 학습된 가중치를 공개해 개발자가 직접 실행하고 개조할 수 있게 하는 방식이다. 성능 격차는 줄고 추론 비용은 급락하면서, 폐쇄형 API만 제공하는 모델 사업자의 가격·통제력 프리미엄이 흔들리고 있다.

open-source 2026-07-29

전자잉크 기기용 오픈소스 문서 뷰어, KOReader

KOReader는 킨들, 코보, 포켓북 같은 전자잉크 기기에서 여러 문서 포맷을 읽을 수 있게 해주는 문서 뷰어다. 전자책뿐 아니라 PDF, DjVu, MOBI, HTML, DOC, ZIP까지 폭넓게 지원하는 게 포인트다.

open-source 2026-07-28

하프라이프, 28년 만에 맥 OS 9용 파워PC 맥에 도착

밸브가 1999년에 취소했던 맥 OS 9용 하프라이프가 커뮤니티 포트로 다시 살아났음. Xash3D FWGS 기반 포트라 본편을 처음부터 끝까지 플레이할 수 있고, 멀티플레이와 확장팩 다운로드까지 포함돼 있음.

공무원이 퇴근 후 만든 AI 도구가 던진 질문: 정부 데이터는 왜 아직 AI가 못 읽나

요약

핵심 포인트

핵심 개념

분석

기술 맥락

인사이트

댓글

댓글

공무원이 퇴근 후 만든 AI 도구가 던진 질문: 정부 데이터는 왜 아직 AI가 못 읽나

요약

핵심 포인트

핵심 개념

분석

기술 맥락

인사이트

댓글

댓글

관련 기사