본문으로 건너뛰기
피드

AI로 통째 베껴 만든 가짜 ‘모호한 슬픔 사전’ 사이트가 원본을 밀어냈다

ai-ml 약 10분
vote
0
댓글
북마크

John Koenig의 책 『The Dictionary of Obscure Sorrows』를 무단으로 통째 게시한 사이트가 AI 이미지와 GPT-4 기반 단어 생성기를 붙이고 검색 결과에서 원본보다 위에 노출되고 있다. 제작자는 샌프란시스코의 웹 디자인·마케팅 에이전시 Qontour였고, 저자는 해당 사이트와 무관하다고 밝혔다.

  • 1

    무단 사이트는 책의 800단어 서문과 311개 신조어, 정의, 어원, 에세이를 거의 전부 게시함

  • 2

    원작 일러스트 대신 DALL-E 2 이미지가 들어갔고 GPT-4로 새 단어를 만드는 기능도 붙음

  • 3

    저자 John Koenig은 해당 사이트 제작에 전혀 관여하지 않았다고 확인함

  • 4

    Qontour는 사이트를 포트폴리오와 Webflow 디렉터리에 올려 자기 역량 홍보에 활용함

  • 5

    구글, ChatGPT, Gemini가 무단 사이트를 공식 사이트처럼 취급하면서 출처 혼란이 커짐

무슨 일이 벌어졌나

  • 누군가 『The Dictionary of Obscure Sorrows』의 새 공식 사이트처럼 보이는 웹사이트를 만들었음

    • 이 책은 John Koenig이 10년 넘게 만든 프로젝트로, “우리가 느끼지만 이름 붙이지 못한 감정”에 새 단어를 붙이는 작업임
    • 사이트에는 작가 소개, 언론 인용, 아마존 구매 링크까지 있어서 겉보기엔 출판사 홍보 사이트처럼 보임
    • 문제는 이게 공식 사이트가 아니었다는 것
  • 더 심각한 건 책 내용이 거의 통째로 올라가 있었다는 점임

    • 800단어짜리 서문부터 311개 신조어 전체가 게시됨
    • 각 단어의 정의, 어원, 짧은 에세이도 포함됨
    • Koenig과 여러 아티스트가 만든 원래의 사진 콜라주 일러스트는 빠지고, DALL-E 2로 만든 이미지가 들어감
  • 사이트는 AI 기능까지 붙여서 프로젝트의 결을 완전히 바꿔놨음

    • 상단 배너는 “AI로 당신만의 단어를 생성하라”는 식으로 방문자를 유도함
    • 사용자가 감정을 설명하면 GPT-4가 새 단어, 어원, 정의를 생성함
    • 그 결과물은 “사용자 생성 슬픔” 갤러리에 AI 이미지와 함께 올라감

중요

> 원저자 John Koenig은 이 사이트와 아무 관련이 없다고 직접 확인함. “내가 한 게 아니다. 사이트가 꽤 잘 만들어져서 뭘 어떻게 해야 할지 모르겠다”는 취지로 답했다는 점이 이 사건의 핵심임.

원본과 가짜 사이트의 차이

  • 원래 사이트와 무단 사이트는 도메인부터 미묘하게 다름

    • 원본은 dictionaryofobscuresorrows.com
    • 무단 사이트는 thedictionaryofobscuresorrows.com
    • 그냥 보면 공식 리뉴얼처럼 착각하기 딱 좋은 이름임
  • 이 프로젝트에서 가장 유명한 단어는 “sonder”임

    • 뜻은 길거리의 낯선 사람도 자기만큼 생생하고 복잡한 삶을 살고 있다는 깨달음에 가까움
    • 이 단어는 Dictionary.com과 Merriam-Webster에도 실릴 정도로 퍼짐
    • 글쓴이는 “sonder”를 들어본 사람 상당수가 Tumblr에서 2012년에 한 사람이 만든 단어라는 사실을 모를 거라고 봄
  • Koenig의 프로젝트는 꽤 큰 문화적 성공을 거둔 작업임

    • 2009년 Tumblr에서 시작했고, 2013년에는 인기 비디오 에세이 시리즈로 확장됨
    • 2021년 11월 Simon & Schuster를 통해 책으로 나왔고, 뉴욕타임스 베스트셀러가 됨
    • “anemoia”, “vellichor”, “monachopsis” 같은 단어도 프로젝트 밖에서 쓰이기 시작함

누가 만들었고, 왜 문제인가

  • 무단 사이트를 만든 쪽은 Qontour라는 샌프란시스코 웹 디자인·마케팅 에이전시였음

    • 이전 이름은 Prompt Digital
    • 사이트 푸터의 크레딧에 스스로 이름을 올려놔서 찾기 어렵지 않았다고 함
    • 포트폴리오 페이지에서는 Webflow 디자인, AI 이미지 라이브러리, 사용자 참여형 단어 생성 기능을 만든 사례로 소개함
  • Qontour는 스스로를 책의 “팬”이라고 설명했지만, 팬심이 권리를 만들어주진 않음

    • 책 전체를 웹에 게시할 권리는 별개임
    • 원작자의 동의 없이 이미지까지 AI로 바꾸고, 생성형 AI 기능을 붙인 건 단순 팬사이트 수준을 넘음
    • 특히 이 사이트를 자기 회사 포트폴리오와 Webflow 디렉터리에 올려 영업 자산처럼 활용함
  • 저작권 표기도 이상하게 꼬여 있음

    • 푸터에는 “Dictionary Content © John Koenig – All rights reserved”라고 적어 원저작권자를 인정함
    • 동시에 사용자 생성 콘텐츠는 CC Zero로 공개한다고 적음
    • Webflow 쪽 “Copyright Info”에는 사이트를 Creative Commons Attribution-NonCommercial-NoDerivatives 4.0으로 라이선스한다고 써놨는데, 애초에 자기들이 소유하지 않은 콘텐츠를 다시 라이선스할 수는 없음
  • 돈 냄새도 있음

    • Qontour는 아마존 구매 링크에 자기들의 예전 이름 Prompt Digital로 만든 제휴 코드를 넣음
    • 사이트가 책 제목, 개별 단어, John Koenig 이름 검색에서 원본보다 위에 뜨는 상황이라면, 몇 년간 수수료가 꽤 쌓였을 가능성도 있음

검색과 AI가 혼란을 키움

  • 이 무단 사이트는 검색 결과에서 원본을 밀어내고 있음

    • 글쓴이가 시도한 여러 구글 검색에서 무단 사이트가 공식 사이트, 출판사 사이트, 위키피디아보다 위에 노출됨
    • 책 제목뿐 아니라 책에 실린 단어, 저자 이름 검색에서도 비슷한 현상이 나타났다고 함
    • 이 정도면 단순한 복제 사이트가 아니라 검색 생태계에서 권위까지 훔치는 상황임
  • 대화형 AI 검색은 문제를 더 크게 만듦

    • ChatGPT와 Gemini 모두 무단 사이트를 공식 웹사이트로 링크함
    • 둘 다 John Koenig이 그 사이트를 만든 것처럼 답함
    • ChatGPT는 심지어 Koenig이 예전 Tumblr 기반 사이트에서 새 도메인으로 옮긴 것처럼 설명했다고 함

⚠️주의

> 검색과 AI 답변이 출처를 뭉개면, 원작자는 콘텐츠뿐 아니라 “무엇이 공식인가”라는 맥락까지 빼앗김. 이 사건에서 사람들은 책 자체가 AI로 쓰인 것 아니냐고 의심하기 시작했음.

  • 출판사도 손을 놓고만 있진 않았지만 효과는 작았음
    • Simon & Schuster는 지난해 7월 구글에 DMCA 삭제 요청 2건을 냄
    • 대상은 무단 사이트의 페이지 2개였음
    • 글쓴이에 따르면 결과적으로 검색 노출에는 별 영향이 없었음

AI와 동의의 문제

  • 글쓴이는 이 사건을 “요즘 보기 드문 노골적인 표절”로 봄

    • 요즘 AI 표절은 보통 원문을 모델로 세탁해 법적으로 애매하게 다른 결과물로 만드는 식이 많음
    • 그런데 이 경우는 살아 있는 작가의 책을 통째로 올리고, AI 이미지를 붙이고, AI 기능을 더하고, 트래픽을 수익화함
    • 거기에 회사 포트폴리오까지 올렸으니 꽤 뻔뻔한 케이스임
  • Qontour가 생성형 AI에 깊이 기대고 있다는 점도 맥락을 만듦

    • 회사는 자기 사이트의 모든 페이지가 Claude로 작성됐다고 설명함
    • “Q”라는 작가 페르소나를 사용한다고도 홍보함
    • 글쓴이는 여기서 빠진 핵심이 동의(consent)라고 봄
  • 이 사건은 AI 시대 창작자들이 겪는 더 큰 흐름의 축소판임

    • 인간이 만든 작업물이 AI로 재포장되고 최적화되어 원본보다 더 잘 노출됨
    • 블로거, 작가, 기자, 아티스트, 음악가처럼 오래 쌓아 만든 사람들의 작업이 관심을 빨아들이는 사이트의 원료가 됨
    • 글쓴이는 이런 일을 거의 매일 새로 런칭한 AI 콘텐츠 사이트 메일로 본다고 함
  • 결말은 씁쓸함

    • 원작자는 허락한 적 없고, 원작의 감성은 AI 기능과 이미지로 덮임
    • 검색과 챗봇은 가짜를 공식으로 착각함
    • 인간의 미묘한 감정을 설명하던 프로젝트가, 인간 창작물을 기계적으로 재활용하는 사례가 되어버린 셈임

기술 맥락

  • 이 사건의 기술적 선택은 “원본 콘텐츠를 웹사이트와 생성형 AI 기능으로 재포장하는 것”이에요. Qontour는 Webflow로 사이트를 만들고, DALL-E 2 이미지와 GPT-4 단어 생성 기능을 붙여서 원래 책을 인터랙티브한 AI 경험처럼 바꿨어요.

  • 문제는 구현 난이도보다 권한과 출처예요. 기술적으로는 책 내용을 넣고 이미지 생성 모델과 텍스트 생성 모델을 붙이면 그럴듯한 사이트가 빨리 나오지만, 원저작자의 동의 없이 하면 결과물이 아무리 매끈해도 표절과 혼동을 피하기 어려워요.

  • 검색 레이어도 중요한 역할을 했어요. 무단 사이트가 책 제목, 저자 이름, 개별 단어 검색에서 원본보다 위에 뜨면서 사용자와 AI 챗봇이 그 사이트를 공식 출처로 받아들이게 됐거든요.

  • ChatGPT와 Gemini가 잘못된 공식 사이트를 답한 건 단순 hallucination 문제가 아니에요. 웹에 이미 잘못 최적화된 정보가 쌓이고, 모델이나 검색형 답변이 그걸 압축해 보여주면 출처 혼란이 더 강하게 굳어지는 구조예요.

이건 단순한 표절 사건이라기보다, AI와 검색 최적화가 결합되면 원본 창작자가 자기 작품의 ‘공식 맥락’까지 빼앗길 수 있다는 사례임. 개발자에게도 남 얘기가 아닌 게, 문서·블로그·오픈소스 지식이 비슷한 방식으로 재포장될 수 있음.

댓글

댓글

댓글을 불러오는 중...

ai-ml

알파벳, AI 인프라에 1,850억 달러 베팅…구글 클라우드가 성장축으로 부상

모틀리풀은 알파벳이 AI 인프라에 대규모 설비투자를 이어가면서 향후 5년간 주가가 두 배 이상 오를 여지가 있다고 분석했다. 올해 설비투자는 1,800억~1,900억 달러로 예상되며, 구글 클라우드 매출은 1분기에 전년 대비 63% 증가했다.

ai-ml

넥슨은 AI 에이전트를 ‘소유’하려 했고, 크래프톤은 AI 도구를 ‘관리’하기로 했다

NDC 2026 대담에서 넥슨과 크래프톤이 사내 AI 전환 전략을 꽤 솔직하게 공개했다. 넥슨은 오픈소스 AI 에이전트 오픈클로의 전사 도입을 시도했다가 보안·운영·비용 문제로 보류했고, 크래프톤은 상용 AI 도구를 대시보드로 관리하는 방식을 택했다.

ai-ml

일본 병원, 재활 요약지 작성에 생성형 인공지능 써보니 시간은 57% 줄고 오류는 81.8%에서 나왔다

일본의 290병상 종합병원 연구진이 재활 요약지 작성에 생성형 인공지능과 엑셀 매크로를 결합한 워크플로를 도입해 실제 임상 현장에서 평가했음. 작성 시간 중앙값은 23분에서 10분으로 줄었지만, 무작위 검토한 문서 11건 중 9건에서 오류가 발견돼 사람의 최종 검토가 필수라는 결론이 나왔음.

ai-ml

야타브, 규제 산업용 인공지능 신뢰·검증 플랫폼을 비바테크에서 공개

야타브가 비바테크 2026에서 규제 산업을 겨냥한 인공지능 신뢰·검증 플랫폼을 공개했음. 입력 위협 방어, 답변 진위 검증, 기업 내부 지식 기반 검색·추론, 업무 자동화, 산업별 전용 모델 구축까지 한 플랫폼으로 묶는 전략임.

ai-ml

안양시가 피지컬 인공지능 산업 키우겠다고 두 번째 전략 회의 열었다

안양시가 제조업, 로봇, 인공지능을 결합한 피지컬 인공지능 산업 생태계 조성을 논의했음. 아직 구체적인 기술 구현이나 예산이 나온 단계는 아니지만, 지역 제조 기반을 인공지능 산업 전략으로 연결하려는 정책 초기 움직임으로 볼 수 있음.