인터넷 아카이브 차단으로는 AI를 막을 수 없음 — 웹의 역사만 지워질 뿐

general 2026-03-20 약 3분

 tags

#internet-archive #copyright #ai-training #fair-use #wayback-machine

vote

북마크

EFF 경고: NYT 등 주요 언론사가 인터넷 아카이브 크롤링을 차단하기 시작함. AI 학습 통제가 목적이지만, 비영리 아카이브까지 차단하면 웹의 역사 기록이 돌이킬 수 없이 사라질 위험.

1
NYT가 robots.txt 넘어서는 기술적 조치로 아카이브 크롤링 차단
2
Wayback Machine에 1조+ 웹페이지 보존, 위키피디아가 260만+ 기사 참조
3
검색·아카이빙 위한 복사는 확립된 공정 이용
4
AI 싸움 때문에 공공 기록을 희생시키면 돌이킬 수 없는 실수

신문사가 인터넷 아카이브를 차단하기 시작했음

EFF가 경고를 울리고 있음. 뉴욕타임스(NYT)가 인터넷 아카이브의 크롤링을 차단하기 시작했고, 가디언 등 다른 언론사도 뒤따르는 분위기임. robots.txt를 넘어서는 기술적 조치까지 동원 중
인터넷 아카이브의 Wayback Machine에는 현재 1조 개 이상의 웹페이지가 보존되어 있고, 기자, 연구자, 법원이 매일 사용함. 위키피디아만 해도 249개 언어로 260만 개 이상의 뉴스 기사를 아카이브 링크로 참조하고 있음
기사는 편집되고, 수정되고, 삭제됨 — 때로는 공개적으로, 때로는 조용히. 인터넷 아카이브가 원래 기사가 어떻게 출판되었는지 볼 수 있는 유일한 출처인 경우가 많음. 이걸 차단하면 역사 기록 자체가 사라지는 거임

왜 차단하나? AI 때문임

언론사 측 논리: AI 회사들이 뉴스 콘텐츠를 스크래핑해서 모델 훈련에 쓰는 걸 통제하고 싶음. NYT를 비롯한 여러 언론사가 이미 AI 회사를 상대로 저작권 소송 중
하지만 EFF의 반론: 인터넷 아카이브는 상업적 AI 시스템을 만들지 않음. 역사 보존이 미션임. AI 접근을 통제하겠다고 비영리 아카이브까지 차단하는 건 "아카이브가 시작하지도 않은 싸움" 때문에 수십 년의 역사 문서를 태우는 것과 같음

법적으로는 아카이빙이 보호받음

검색 가능하게 만들기 위해 복사하는 행위는 이미 확립된 공정 이용(fair use)임. Google이 전체 도서를 복사해서 검색 가능한 데이터베이스를 만든 것도 법원이 공정 이용으로 인정했음
EFF 입장: AI 학습에 대한 법적 분쟁은 법원에서 해결해야 할 문제지만, 그 싸움의 과정에서 공공 기록을 희생시키는 것은 "심대하고 돌이킬 수 없는 실수"가 될 것

⚠️주의

> 주요 언론사가 인터넷 아카이브 크롤링을 차단하면, 미래 연구자들은 웹의 역사 기록 중 상당 부분이 그냥 사라져버린 걸 발견하게 될 수 있음

AI 저작권 분쟁의 부수적 피해가 비영리 아카이브에까지 미치고 있음. 기술 커뮤니티가 주시해야 할 사안.

이전 기사 (P)

다음 기사 (N)

댓글을 불러오는 중...

general 2026-06-24

존 카맥이 돌아본 초기 id 소프트웨어의 실수들

존 카맥이 퀘이크 개발 당시의 기술적 과욕, 팀 운영, 지분 구조 문제를 직접 돌아봤다. 퀘이크 자체는 엄청난 성취였지만, 그 과정에서 회사와 사람들에게 너무 큰 부담을 줬다는 반성에 가깝다.

general 2026-06-24

정부, 공공부문을 ‘AI 민주정부’로 바꾸겠다는 전략 공개

행정안전부가 전자정부의 날 행사에서 공공 인공지능 전환 전략인 ‘세계 최고의 AI 민주정부 실현 전략’을 발표했다. 핵심은 행정 효율화에 그치지 않고 국민 의견 수렴, 정책 참여, 행정 역량 강화를 AI로 밀어보겠다는 구상이다.

general 2026-06-23

워드 빨간 밑줄을 만든 토니 크루거를 기억하며

마이크로소프트 워드의 빨간 맞춤법 밑줄과 초록 문법 밑줄을 처음 만든 개발자 토니 크루거를 기리는 글이다. 예전에는 사용자가 직접 맞춤법 검사를 실행하고 기다려야 했지만, 토니는 이 기능을 백그라운드에서 덜 거슬리게 만들고 오류를 즉시 화면에 표시하는 방식으로 바꿨다. 지금은 거의 모든 문서 편집기와 개발 도구에 비슷한 표시가 들어갔다는 점에서, 조용하지만 엄청나게 널리 퍼진 사용자 경험 개선 사례다.

general 2026-06-24

삼성전자, AI 모듈러 홈 3년 안에 1만 채 팔겠다고 선언

삼성전자가 공장에서 80% 이상 제작되는 AI 모듈러 홈을 3년간 누적 1만 채 판매하겠다는 목표를 밝혔다. 스마트싱스 기반 보안, 화재·누수 알림, 에너지 절감, 방문자 맞이 자동화까지 주거 솔루션을 패키지로 묶는 전략이다.

general 2026-06-24

중기부, 딥테크 7개 팀에 예비연구 티켓 줬다

중기부가 생태계혁신형 딥테크 챌린지 프로젝트 예비연구팀 7곳을 출범시켰다. 206개 컨소시엄 중 7개가 뽑혀 41대 1 경쟁률을 통과했고, 최종 5개 과제에는 4년간 최대 200억 원의 연구개발 지원이 붙는다.

인터넷 아카이브 차단으로는 AI를 막을 수 없음 — 웹의 역사만 지워질 뿐

요약

핵심 포인트

분석

신문사가 인터넷 아카이브를 차단하기 시작했음

왜 차단하나? AI 때문임

법적으로는 아카이빙이 보호받음

인사이트

댓글

댓글

인터넷 아카이브 차단으로는 AI를 막을 수 없음 — 웹의 역사만 지워질 뿐

요약

핵심 포인트

분석

신문사가 인터넷 아카이브를 차단하기 시작했음

왜 차단하나? AI 때문임

법적으로는 아카이빙이 보호받음

인사이트

댓글

댓글

관련 기사