본문으로 건너뛰기
피드

인터넷 아카이브 차단으로는 AI를 막을 수 없음 — 웹의 역사만 지워질 뿐

general 약 3분

EFF 경고: NYT 등 주요 언론사가 인터넷 아카이브 크롤링을 차단하기 시작함. AI 학습 통제가 목적이지만, 비영리 아카이브까지 차단하면 웹의 역사 기록이 돌이킬 수 없이 사라질 위험.

  • 1

    NYT가 robots.txt 넘어서는 기술적 조치로 아카이브 크롤링 차단

  • 2

    Wayback Machine에 1조+ 웹페이지 보존, 위키피디아가 260만+ 기사 참조

  • 3

    검색·아카이빙 위한 복사는 확립된 공정 이용

  • 4

    AI 싸움 때문에 공공 기록을 희생시키면 돌이킬 수 없는 실수

신문사가 인터넷 아카이브를 차단하기 시작했음

  • EFF가 경고를 울리고 있음. 뉴욕타임스(NYT)가 인터넷 아카이브의 크롤링을 차단하기 시작했고, 가디언 등 다른 언론사도 뒤따르는 분위기임. robots.txt를 넘어서는 기술적 조치까지 동원 중

  • 인터넷 아카이브의 Wayback Machine에는 현재 1조 개 이상의 웹페이지가 보존되어 있고, 기자, 연구자, 법원이 매일 사용함. 위키피디아만 해도 249개 언어로 260만 개 이상의 뉴스 기사를 아카이브 링크로 참조하고 있음

  • 기사는 편집되고, 수정되고, 삭제됨 — 때로는 공개적으로, 때로는 조용히. 인터넷 아카이브가 원래 기사가 어떻게 출판되었는지 볼 수 있는 유일한 출처인 경우가 많음. 이걸 차단하면 역사 기록 자체가 사라지는 거임

왜 차단하나? AI 때문임

  • 언론사 측 논리: AI 회사들이 뉴스 콘텐츠를 스크래핑해서 모델 훈련에 쓰는 걸 통제하고 싶음. NYT를 비롯한 여러 언론사가 이미 AI 회사를 상대로 저작권 소송 중

  • 하지만 EFF의 반론: 인터넷 아카이브는 상업적 AI 시스템을 만들지 않음. 역사 보존이 미션임. AI 접근을 통제하겠다고 비영리 아카이브까지 차단하는 건 "아카이브가 시작하지도 않은 싸움" 때문에 수십 년의 역사 문서를 태우는 것과 같음

법적으로는 아카이빙이 보호받음

  • 검색 가능하게 만들기 위해 복사하는 행위는 이미 확립된 공정 이용(fair use)임. Google이 전체 도서를 복사해서 검색 가능한 데이터베이스를 만든 것도 법원이 공정 이용으로 인정했음

  • EFF 입장: AI 학습에 대한 법적 분쟁은 법원에서 해결해야 할 문제지만, 그 싸움의 과정에서 공공 기록을 희생시키는 것은 "심대하고 돌이킬 수 없는 실수"가 될 것

⚠️주의

> 주요 언론사가 인터넷 아카이브 크롤링을 차단하면, 미래 연구자들은 웹의 역사 기록 중 상당 부분이 그냥 사라져버린 걸 발견하게 될 수 있음

AI 저작권 분쟁의 부수적 피해가 비영리 아카이브에까지 미치고 있음. 기술 커뮤니티가 주시해야 할 사안.

댓글

댓글

댓글을 불러오는 중...

general

뉴욕타임스·디애틀랜틱·USA투데이에 Wayback Machine 보존 허용을 요구하는 청원

Save the Archive 청원은 주요 언론사가 Internet Archive의 Wayback Machine 보존을 막지 말고 협력해야 한다고 요구함. 특히 뉴욕타임스, 디애틀랜틱, USA투데이가 AI 우려를 이유로 보존을 제한하는 흐름을 비판하면서, 오히려 생성형 AI 시대일수록 독립적인 웹 아카이브가 더 중요하다고 주장함.

general

검색과 인공지능이 만드는 ‘감시형 웹의 벽정원’

이 글은 오픈 웹이 사라지는 이유를 출판의 문제가 아니라 발견 가능성의 문제로 봐. 구글 검색, 브라우저, 광고, 운영체제, 인공지능 어시스턴트, 신원 확인 인프라가 합쳐지면서 측정되고 수익화되는 웹만 더 잘 보이게 된다는 주장이다.

general

이 대통령, AI ‘초과세수 국민배당’ 논란에 직접 반박

이재명 대통령이 김용범 정책실장의 ‘AI 국민배당금’ 발언을 둘러싼 논란에 직접 나섰다. 핵심은 기업의 초과이윤을 걷겠다는 얘기가 아니라, AI 산업 호황으로 국가에 초과세수가 생기면 그 재원을 국민에게 어떻게 돌려줄지 검토하자는 취지였다는 설명이다.

general

AI 데이터센터 붐에 캐터필러·이튼까지 반도체주처럼 움직이는 중

AI 투자 열풍이 엔비디아 같은 반도체주를 넘어 전력, 냉각, 발전 장비를 파는 전통 산업재 기업 주가까지 끌어올리고 있다는 내용이다. 데이터센터 증설이 물리 인프라 수요를 키우면서 S&P500 산업재 지수와 필라델피아 반도체지수의 45일 상관계수가 0.75까지 올라갔다.

general

시니어 개발자가 자기 전문성을 제대로 설명하지 못하는 이유

이 글은 시니어 개발자가 비즈니스와 자주 어긋나는 이유를 ‘복잡성 관리’와 ‘불확실성 감소’의 충돌로 설명한다. 사업팀은 시장 반응을 빨리 확인하고 싶어 하고, 시니어 개발자는 안정성과 유지보수성을 지키려 하니 같은 요청도 서로 다른 문제로 보인다는 얘기다.