본문으로 건너뛰기
피드

arXiv, AI가 지어낸 참고문헌 넣은 연구자 1년 차단한다

ai-ml 약 4분
vote
0
댓글
북마크

arXiv가 대규모 언어 모델(LLM)이 만들어낸 가짜 참고문헌이나 명백한 AI 생성 흔적을 검증 없이 넣은 원고에 대해 1년投稿 금지 제재를 적용하기로 했다. 제재가 끝난 뒤에도 해당 연구자는 신뢰할 만한 동료심사 저널이나 학회에 이미 승인된 논문만 arXiv에 올릴 수 있다. AI 활용 자체를 막겠다는 게 아니라, 검증 안 된 AI 산출물이 학술 인프라를 오염시키는 걸 막겠다는 쪽에 가깝다.

  • 1

    가짜 참고문헌이 발견되면 arXiv投稿 1년 금지

  • 2

    제재 이후에도 동료심사를 통과한 논문만投稿 가능

  • 3

    LLM 산출물을 검증하지 않은 명백한 흔적도 제재 대상

  • 4

    연구 커뮤니티에서는 찬반이 갈리지만 AI 슬롭 대응 필요성은 커지는 중

  • arXiv가 AI가 지어낸 참고문헌을 넣은 원고에 대해 꽤 센 제재를 꺼냈음

    • 원고에서 대규모 언어 모델(LLM)이 만든 가짜 레퍼런스가 발견되면, 해당 연구자는 arXiv에 1년 동안 논문을 올릴 수 없음
    • 단순 오탈자나 형식 문제 수준이 아니라, AI 결과물을 제대로 확인하지 않았다는 ‘반박하기 어려운’ 흔적이 있을 때 적용됨
  • 제재는 1년으로 끝나지 않음

    • Thomas Dietterich arXiv 컴퓨터과학 섹션 의장에 따르면, 1년이 지난 뒤에도 바로 정상 복귀가 아님
    • 그 이후에는 ‘신뢰할 만한 동료심사 venue’에서 이미 승인된 논문만 arXiv에 올릴 수 있음
    • 사실상 “한 번 걸리면 한동안 선공개 플랫폼으로서의 arXiv 접근권을 잃는다”는 얘기임
  • arXiv가 문제 삼는 건 AI 사용 자체가 아니라, 검증 안 한 AI 산출물임

    • LLM은 문헌 조사나 초안 작성 같은 합법적인 연구 보조 도구로 이미 많이 쓰이고 있음
    • 하지만 가짜 인용, 존재하지 않는 논문, “여기 200단어 요약이 있습니다. 수정할까요?” 같은 챗봇 흔적이 원고에 남아 있으면 얘기가 달라짐
    • Dietterich는 이런 원고에 대해 “저자들이 LLM 결과를 확인하지 않았다는 강한 증거가 있으면, arXiv는 제출물의 어떤 것도 신뢰할 수 없다”고 봄
  • 연구자들 반응은 갈림

    • 일부는 “좋은 조치다, 왜 AI 환각만 보냐, 슬롭 전체와 싸워야 한다”는 식으로 환영함
    • 반대로 Reviewer3 창업자 Natalie Khalil은 “arXiv에서 막아도 연구자는 다른 곳에서 계속 연구할 것”이라며 증상이 아니라 원인을 봐야 한다고 지적함
    • Dietterich 쪽 입장은 단호함. 무책임한 연구자가 다른 곳에 올릴 수 있다는 게 arXiv에서 허용해야 할 이유는 아니라는 것
  • 이 이슈가 커지는 배경에는 ‘AI 슬롭’이 있음

    • AI 슬롭은 생성형 AI로 만든 저품질·무의미 콘텐츠를 말함
    • preprint 서버들은 빠르게 논문을 공유한다는 장점 때문에, 검증이 약해지면 이런 콘텐츠에 더 취약해짐
    • 일부 플랫폼은 가이드라인 위반 저자를 차단하고, 다른 플랫폼은 AI 사용 우려가 큰 제출 유형 자체를 배제하는 식으로 대응 중
  • 흥미로운 포인트는 가짜 참고문헌이 단순 실수가 아니라 신뢰 붕괴의 신호로 취급된다는 점임

    • Dietterich는 “이런 단순한 것도 확인하지 않았다면, 대체 다른 건 뭘 확인하지 않은 거냐”는 질문을 던짐
    • 논문 공장(paper mill)처럼 저자 자리나 인용을 판매하는 업체에서 AI 생성 콘텐츠가 흘러들어오는 사례도 언급됨
    • 결국 레퍼런스 하나가 틀린 문제가 아니라, 연구 생산 과정 전체가 검증 없이 자동화되는 문제로 번지는 중임

개발자 입장에서도 남 얘기가 아님. LLM이 만든 코드, 문서, 레퍼런스를 검증 없이 붙이는 습관이 누적되면 결국 플랫폼과 조직이 ‘신뢰 비용’을 제재로 바꾸기 시작한다는 신호다.

댓글

댓글

댓글을 불러오는 중...

ai-ml

유튜브, AI 생성 영상에 자동 라벨 붙인다

유튜브가 사실적으로 보이거나 의미 있게 AI로 변경·생성된 콘텐츠에 더 눈에 띄는 라벨을 적용하고, 제작자가 AI 사용 여부를 밝히지 않아도 내부 신호로 감지되면 자동 라벨을 붙이겠다고 밝혔다. 다만 라벨만으로 추천 노출이나 수익화 자격이 바뀌지는 않으며, 제작자는 YouTube Studio에서 잘못된 판정을 수정할 수 있다.

ai-ml

테크 CEO들의 'AI 만능론', 숫자는 아직 그렇게 말하지 않는다

테크 업계에서 AI를 이유로 한 대규모 감원과 조직 재편이 이어지는 가운데, Box 창업자 애런 레비는 CEO들이 실제 업무의 마지막 1마일을 모른 채 AI 에이전트의 능력을 과대평가하고 있다고 지적했다. 2026년 첫 5개월 동안 이미 11만5430명이 해고됐고, 여러 연구는 AI 도입이 체감 생산성만큼 실제 생산성을 끌어올렸다는 근거가 아직 약하다고 말한다.

ai-ml

오픈AI와 앤트로픽, 코딩 에이전트로 드디어 돈 되는 시장을 찾은 듯

사이먼 윌리슨은 오픈AI와 앤트로픽이 코딩 에이전트와 기업용 과금으로 진짜 제품-시장 적합성을 찾았다고 봐. 개인 구독자에게는 월 100달러 플랜이 싸게 느껴지지만, 기업 고객은 이제 사용량 기준 토큰 가격을 그대로 내기 시작했고 이게 대형 고객 예산을 빠르게 흔들고 있다는 얘기야.

ai-ml

컴팔과 GMI 클라우드, 대규모 추론용 AI 인프라 구축 협력

컴팔이 실리콘밸리 기반 AI 인프라 기업 GMI 클라우드와 협력해 대규모 추론과 에이전틱 AI 워크로드에 맞춘 GPU 서버 인프라를 구축한다고 발표했어. COMPUTEX 2026에서는 NVIDIA HGX B300을 지원하는 Compal SGX30-2 같은 고성능 AI 서버 플랫폼도 선보일 예정이야.

ai-ml

AI 쓰면 편해진다더니, 직장인들은 ‘AI 과부하’에 지쳐가는 중

국내 직장인들이 AI 전환 압박, AI 답변 검증 부담, 대체 불안 때문에 피로감을 호소하고 있어. 중앙일보 설문에서는 5284명 중 31.6%가 ‘AI 답변 검증에 시간이 더 걸릴 때’를 가장 지치는 순간으로 꼽았고, 기업들은 무작정 AI 사용량을 밀어붙이는 방식에서 업무 방식 재설계로 넘어가야 한다는 지적이 나와.