---
title: "AI로 통째 베껴 만든 가짜 ‘모호한 슬픔 사전’ 사이트가 원본을 밀어냈다"
published: 2026-06-20T18:05:31.000Z
canonical: https://jeff.news/article/4181
---
# AI로 통째 베껴 만든 가짜 ‘모호한 슬픔 사전’ 사이트가 원본을 밀어냈다

John Koenig의 책 『The Dictionary of Obscure Sorrows』를 무단으로 통째 게시한 사이트가 AI 이미지와 GPT-4 기반 단어 생성기를 붙이고 검색 결과에서 원본보다 위에 노출되고 있다. 제작자는 샌프란시스코의 웹 디자인·마케팅 에이전시 Qontour였고, 저자는 해당 사이트와 무관하다고 밝혔다.

## 무슨 일이 벌어졌나

- 누군가 『The Dictionary of Obscure Sorrows』의 새 공식 사이트처럼 보이는 웹사이트를 만들었음
  - 이 책은 John Koenig이 10년 넘게 만든 프로젝트로, “우리가 느끼지만 이름 붙이지 못한 감정”에 새 단어를 붙이는 작업임
  - 사이트에는 작가 소개, 언론 인용, 아마존 구매 링크까지 있어서 겉보기엔 출판사 홍보 사이트처럼 보임
  - 문제는 이게 공식 사이트가 아니었다는 것

- 더 심각한 건 책 내용이 거의 통째로 올라가 있었다는 점임
  - 800단어짜리 서문부터 311개 신조어 전체가 게시됨
  - 각 단어의 정의, 어원, 짧은 에세이도 포함됨
  - Koenig과 여러 아티스트가 만든 원래의 사진 콜라주 일러스트는 빠지고, DALL-E 2로 만든 이미지가 들어감

- 사이트는 AI 기능까지 붙여서 프로젝트의 결을 완전히 바꿔놨음
  - 상단 배너는 “AI로 당신만의 단어를 생성하라”는 식으로 방문자를 유도함
  - 사용자가 감정을 설명하면 GPT-4가 새 단어, 어원, 정의를 생성함
  - 그 결과물은 “사용자 생성 슬픔” 갤러리에 AI 이미지와 함께 올라감

> [!IMPORTANT]
> 원저자 John Koenig은 이 사이트와 아무 관련이 없다고 직접 확인함. “내가 한 게 아니다. 사이트가 꽤 잘 만들어져서 뭘 어떻게 해야 할지 모르겠다”는 취지로 답했다는 점이 이 사건의 핵심임.

## 원본과 가짜 사이트의 차이

- 원래 사이트와 무단 사이트는 도메인부터 미묘하게 다름
  - 원본은 dictionaryofobscuresorrows.com
  - 무단 사이트는 thedictionaryofobscuresorrows.com
  - 그냥 보면 공식 리뉴얼처럼 착각하기 딱 좋은 이름임

- 이 프로젝트에서 가장 유명한 단어는 “sonder”임
  - 뜻은 길거리의 낯선 사람도 자기만큼 생생하고 복잡한 삶을 살고 있다는 깨달음에 가까움
  - 이 단어는 Dictionary.com과 Merriam-Webster에도 실릴 정도로 퍼짐
  - 글쓴이는 “sonder”를 들어본 사람 상당수가 Tumblr에서 2012년에 한 사람이 만든 단어라는 사실을 모를 거라고 봄

- Koenig의 프로젝트는 꽤 큰 문화적 성공을 거둔 작업임
  - 2009년 Tumblr에서 시작했고, 2013년에는 인기 비디오 에세이 시리즈로 확장됨
  - 2021년 11월 Simon & Schuster를 통해 책으로 나왔고, 뉴욕타임스 베스트셀러가 됨
  - “anemoia”, “vellichor”, “monachopsis” 같은 단어도 프로젝트 밖에서 쓰이기 시작함

## 누가 만들었고, 왜 문제인가

- 무단 사이트를 만든 쪽은 Qontour라는 샌프란시스코 웹 디자인·마케팅 에이전시였음
  - 이전 이름은 Prompt Digital
  - 사이트 푸터의 크레딧에 스스로 이름을 올려놔서 찾기 어렵지 않았다고 함
  - 포트폴리오 페이지에서는 Webflow 디자인, AI 이미지 라이브러리, 사용자 참여형 단어 생성 기능을 만든 사례로 소개함

- Qontour는 스스로를 책의 “팬”이라고 설명했지만, 팬심이 권리를 만들어주진 않음
  - 책 전체를 웹에 게시할 권리는 별개임
  - 원작자의 동의 없이 이미지까지 AI로 바꾸고, 생성형 AI 기능을 붙인 건 단순 팬사이트 수준을 넘음
  - 특히 이 사이트를 자기 회사 포트폴리오와 Webflow 디렉터리에 올려 영업 자산처럼 활용함

- 저작권 표기도 이상하게 꼬여 있음
  - 푸터에는 “Dictionary Content © John Koenig – All rights reserved”라고 적어 원저작권자를 인정함
  - 동시에 사용자 생성 콘텐츠는 CC Zero로 공개한다고 적음
  - Webflow 쪽 “Copyright Info”에는 사이트를 Creative Commons Attribution-NonCommercial-NoDerivatives 4.0으로 라이선스한다고 써놨는데, 애초에 자기들이 소유하지 않은 콘텐츠를 다시 라이선스할 수는 없음

- 돈 냄새도 있음
  - Qontour는 아마존 구매 링크에 자기들의 예전 이름 Prompt Digital로 만든 제휴 코드를 넣음
  - 사이트가 책 제목, 개별 단어, John Koenig 이름 검색에서 원본보다 위에 뜨는 상황이라면, 몇 년간 수수료가 꽤 쌓였을 가능성도 있음

## 검색과 AI가 혼란을 키움

- 이 무단 사이트는 검색 결과에서 원본을 밀어내고 있음
  - 글쓴이가 시도한 여러 구글 검색에서 무단 사이트가 공식 사이트, 출판사 사이트, 위키피디아보다 위에 노출됨
  - 책 제목뿐 아니라 책에 실린 단어, 저자 이름 검색에서도 비슷한 현상이 나타났다고 함
  - 이 정도면 단순한 복제 사이트가 아니라 검색 생태계에서 권위까지 훔치는 상황임

- 대화형 AI 검색은 문제를 더 크게 만듦
  - ChatGPT와 Gemini 모두 무단 사이트를 공식 웹사이트로 링크함
  - 둘 다 John Koenig이 그 사이트를 만든 것처럼 답함
  - ChatGPT는 심지어 Koenig이 예전 Tumblr 기반 사이트에서 새 도메인으로 옮긴 것처럼 설명했다고 함

> [!WARNING]
> 검색과 AI 답변이 출처를 뭉개면, 원작자는 콘텐츠뿐 아니라 “무엇이 공식인가”라는 맥락까지 빼앗김. 이 사건에서 사람들은 책 자체가 AI로 쓰인 것 아니냐고 의심하기 시작했음.

- 출판사도 손을 놓고만 있진 않았지만 효과는 작았음
  - Simon & Schuster는 지난해 7월 구글에 DMCA 삭제 요청 2건을 냄
  - 대상은 무단 사이트의 페이지 2개였음
  - 글쓴이에 따르면 결과적으로 검색 노출에는 별 영향이 없었음

## AI와 동의의 문제

- 글쓴이는 이 사건을 “요즘 보기 드문 노골적인 표절”로 봄
  - 요즘 AI 표절은 보통 원문을 모델로 세탁해 법적으로 애매하게 다른 결과물로 만드는 식이 많음
  - 그런데 이 경우는 살아 있는 작가의 책을 통째로 올리고, AI 이미지를 붙이고, AI 기능을 더하고, 트래픽을 수익화함
  - 거기에 회사 포트폴리오까지 올렸으니 꽤 뻔뻔한 케이스임

- Qontour가 생성형 AI에 깊이 기대고 있다는 점도 맥락을 만듦
  - 회사는 자기 사이트의 모든 페이지가 Claude로 작성됐다고 설명함
  - “Q”라는 작가 페르소나를 사용한다고도 홍보함
  - 글쓴이는 여기서 빠진 핵심이 동의(consent)라고 봄

- 이 사건은 AI 시대 창작자들이 겪는 더 큰 흐름의 축소판임
  - 인간이 만든 작업물이 AI로 재포장되고 최적화되어 원본보다 더 잘 노출됨
  - 블로거, 작가, 기자, 아티스트, 음악가처럼 오래 쌓아 만든 사람들의 작업이 관심을 빨아들이는 사이트의 원료가 됨
  - 글쓴이는 이런 일을 거의 매일 새로 런칭한 AI 콘텐츠 사이트 메일로 본다고 함

- 결말은 씁쓸함
  - 원작자는 허락한 적 없고, 원작의 감성은 AI 기능과 이미지로 덮임
  - 검색과 챗봇은 가짜를 공식으로 착각함
  - 인간의 미묘한 감정을 설명하던 프로젝트가, 인간 창작물을 기계적으로 재활용하는 사례가 되어버린 셈임

---

## 기술 맥락

- 이 사건의 기술적 선택은 “원본 콘텐츠를 웹사이트와 생성형 AI 기능으로 재포장하는 것”이에요. Qontour는 Webflow로 사이트를 만들고, DALL-E 2 이미지와 GPT-4 단어 생성 기능을 붙여서 원래 책을 인터랙티브한 AI 경험처럼 바꿨어요.

- 문제는 구현 난이도보다 권한과 출처예요. 기술적으로는 책 내용을 넣고 이미지 생성 모델과 텍스트 생성 모델을 붙이면 그럴듯한 사이트가 빨리 나오지만, 원저작자의 동의 없이 하면 결과물이 아무리 매끈해도 표절과 혼동을 피하기 어려워요.

- 검색 레이어도 중요한 역할을 했어요. 무단 사이트가 책 제목, 저자 이름, 개별 단어 검색에서 원본보다 위에 뜨면서 사용자와 AI 챗봇이 그 사이트를 공식 출처로 받아들이게 됐거든요.

- ChatGPT와 Gemini가 잘못된 공식 사이트를 답한 건 단순 hallucination 문제가 아니에요. 웹에 이미 잘못 최적화된 정보가 쌓이고, 모델이나 검색형 답변이 그걸 압축해 보여주면 출처 혼란이 더 강하게 굳어지는 구조예요.

## 핵심 포인트

- 무단 사이트는 책의 800단어 서문과 311개 신조어, 정의, 어원, 에세이를 거의 전부 게시함
- 원작 일러스트 대신 DALL-E 2 이미지가 들어갔고 GPT-4로 새 단어를 만드는 기능도 붙음
- 저자 John Koenig은 해당 사이트 제작에 전혀 관여하지 않았다고 확인함
- Qontour는 사이트를 포트폴리오와 Webflow 디렉터리에 올려 자기 역량 홍보에 활용함
- 구글, ChatGPT, Gemini가 무단 사이트를 공식 사이트처럼 취급하면서 출처 혼란이 커짐

## 인사이트

이건 단순한 표절 사건이라기보다, AI와 검색 최적화가 결합되면 원본 창작자가 자기 작품의 ‘공식 맥락’까지 빼앗길 수 있다는 사례임. 개발자에게도 남 얘기가 아닌 게, 문서·블로그·오픈소스 지식이 비슷한 방식으로 재포장될 수 있음.