---
title: "안도르 제작자, 1,500쪽 대본 공개 접은 이유는 “AI 학습 데이터 되기 싫어서”"
published: 2026-05-30T22:22:20.000Z
canonical: https://jeff.news/article/3421
---
# 안도르 제작자, 1,500쪽 대본 공개 접은 이유는 “AI 학습 데이터 되기 싫어서”

스타워즈 드라마 안도르의 쇼러너 토니 길로이가 준비해둔 1,500쪽짜리 대본·콘셉트 아트 공개 계획을 접었다. 이유는 단순하다. 공개하는 순간 AI 모델 학습 데이터로 빨려 들어갈 수 있다는 우려 때문이다. 헐리우드 창작자와 스튜디오, AI 기업 사이의 저작권·학습 데이터 갈등이 다시 선명하게 드러난 사례다.

- 안도르 쇼러너 토니 길로이가 1,500쪽짜리 대본 공개 계획을 접었음. 이유는 꽤 직설적임. “AI 때문”임
  - 원래는 안도르의 모든 대본과 콘셉트 아트를 무료 웹사이트로 공개하려고 했음
  - 이미 자료 묶음도 준비돼 있었고, 길로이 본인도 결과물을 보고 마음에 들어 했다고 함
  - 그런데 공개하면 AI 시스템이 너무 쉽게 흡수할 수 있어서 결국 접었다는 얘기임

- 길로이의 표현은 꽤 거칠지만, 창작자들이 느끼는 감정은 정확히 드러남
  - 그는 자료 공개를 “자기만족”이나 “허영”에 가까운 일로 봤고, 반대로 AI 학습에 쓰일 리스크는 현실적이라고 봤음
  - 그래서 결론은 “왜 로봇을 더 도와줘야 하냐”는 쪽으로 갔음
  - 팬 입장에선 아쉬운 결정이지만, 창작자 입장에선 공개 웹이 더 이상 순수한 아카이브 공간이 아니게 된 셈임

> [!IMPORTANT]
> 여기서 포인트는 대본 1,500쪽이 사라졌다는 게 아니라, 창작자가 “공개하면 학습된다”는 전제를 기준으로 배포 여부를 결정하기 시작했다는 점임.

- 헐리우드 창작자들의 AI 반감은 갑자기 튀어나온 게 아님
  - 크리스토퍼 놀란은 AI의 책임 부재를 “무서운 가능성”이라고 말한 적이 있음
  - 블랙 미러 제작자 찰리 브루커는 챗지피티가 만든 대본을 보고 “쓰레기”라고 평가했음
  - 핵심 걱정은 단순히 품질이 낮다는 게 아니라, 자기 작품이 허락 없이 학습되고 결국 자기 일을 대체하는 도구로 돌아올 수 있다는 점임

- 반면 대형 스튜디오들은 AI를 완전히 피하는 분위기가 아님. 오히려 꽤 적극적임
  - 라이언스게이트는 2025년 9월 AI 스타트업 런웨이와 손잡고 자사 영화·TV 카탈로그 기반 머신러닝 모델을 만들기로 했음
  - 디즈니도 AI와 혼합현실 관련 업무를 조율하는 내부 팀을 만든 것으로 알려졌음
  - 밥 아이거 디즈니 최고경영자는 AI가 “우리를 더 낫게 만들고 더 좋은 이야기를 하게 할 수 있다”는 취지로 말한 적이 있음

- 그래서 갈등 구도가 꽤 선명함. 창작자는 방어하고, 스튜디오는 실험하고, AI 기업은 학습 데이터를 계속 원함
  - 창작자 개인에게는 AI가 생계와 저작권 리스크로 보임
  - 스튜디오에게는 제작비 절감, 후반 작업 자동화, 새 IP 활용 방식으로 보일 수 있음
  - AI 기업에게는 대본·책·기사 같은 고품질 텍스트가 모델 성능을 끌어올리는 핵심 재료임

- 이 문제가 2023년 헐리우드 파업의 핵심 쟁점 중 하나였다는 것도 중요함
  - 미국 작가 조합은 148일, 배우 조합은 118일 동안 파업했음
  - 요구사항에는 AI가 인간 작가를 대체하는 대본을 쓰지 못하게 하는 보호 장치가 포함됐음
  - 배우 쪽도 동의 없는 디지털 복제 생성을 막는 조항을 요구했음
  - 두 조합 모두 AI 관련 보호 조항이 들어간 계약을 비준했지만, 이 계약들은 대략 앞으로 1년 안에 다시 만료됨

- 법정 싸움도 이미 여러 갈래로 진행 중임
  - 뉴욕타임스는 오픈에이아이를 상대로 저작권 침해 소송을 제기했음
  - 왕좌의 게임 작가 조지 R. R. 마틴을 포함한 작가 그룹도 오픈에이아이를 상대로 별도 소송을 냈음
  - 또 다른 작가 그룹은 앤트로픽이 더 파일이라는 데이터셋으로 모델을 학습했다며 소송을 제기했는데, 이 데이터셋에는 수천 명 작가의 무단 복제물이 들어갔다는 주장이 있음
  - AI 기업들은 보통 이런 학습이 공정 이용이라고 주장하지만, 아직 결론은 안 났음

- 개발자 입장에서도 남 얘기가 아님. “인터넷에 공개된 데이터니까 써도 되겠지”라는 감각이 점점 위험해지고 있음
  - 모델 학습 데이터의 출처, 라이선스, 재배포 가능 여부를 제품 리스크로 봐야 하는 상황이 됨
  - 특히 기업용 AI 기능을 만들 때는 “이 모델이 뭘 먹고 컸는지”를 고객이 물어볼 가능성이 커지고 있음
  - 창작자들이 공개 자체를 줄이기 시작하면, 장기적으로는 오픈 웹의 고품질 자료도 줄어들 수 있음

---

## 기술 맥락

- 이 사건의 기술적 선택은 “자료를 공개할 것인가, 아니면 AI 학습 리스크 때문에 닫아둘 것인가”예요. 예전에는 팬 서비스나 교육적 가치가 크면 공개하는 쪽이 자연스러웠는데, 이제는 공개된 텍스트가 곧 학습 데이터가 될 수 있어서 판단 기준이 바뀌었어요.

- 대본이 특히 민감한 이유는 단순 텍스트가 아니라 구조화된 창작물이기 때문이에요. 장면 전환, 캐릭터 말투, 대사 리듬, 서사 구성까지 들어 있어서 생성형 모델 입장에선 꽤 고급 데이터거든요.

- 공정 이용 논쟁이 중요한 이유는 여기서 법적 결론이 나면 데이터 파이프라인 설계가 달라질 수 있기 때문이에요. 지금은 크롤링, 필터링, 학습, 보상 체계가 회사마다 제각각인데, 판례가 쌓이면 “어떤 데이터는 쓰면 안 된다”는 경계가 더 뚜렷해질 가능성이 커요.

- 개발팀이 볼 포인트는 모델 성능만이 아니에요. 학습 데이터의 출처를 설명할 수 있는지, 고객이 삭제 요청을 했을 때 대응 가능한지, 저작권 리스크를 제품 문서와 계약에서 어떻게 다룰지가 점점 실무 이슈가 되고 있어요.

## 핵심 포인트

- 토니 길로이는 안도르 대본 1,500쪽과 콘셉트 아트를 무료 웹사이트로 공개하려 했지만 AI 학습 우려로 중단했다
- 헐리우드 창작자들은 AI가 허락 없이 작품을 학습하고 결국 자신들을 대체할 수 있다는 점을 가장 크게 걱정하고 있다
- 라이언스게이트와 디즈니 같은 대형 스튜디오는 AI 협업과 내부 조직을 추진하며 창작자들과 다른 방향으로 움직이고 있다
- 2023년 작가·배우 조합 파업에서 AI 보호 조항이 핵심 쟁점이었고, 관련 계약은 약 1년 안에 다시 협상 대상이 된다
- 뉴욕타임스, 조지 R. R. 마틴 등 작가들, 앤트로픽 관련 소송까지 이어지며 AI 학습의 공정 이용 여부는 아직 결론이 나지 않았다

## 인사이트

AI 학습 데이터 논쟁은 이제 모델 개발자만의 문제가 아니라 공개 웹에 뭘 올릴지 결정하는 모든 창작자와 조직의 문제가 됐다. 개발자 입장에서도 데이터 수집, 라이선스, 모델 학습 출처를 대충 넘기기 어려워지는 흐름이다.