arXiv, AI가 지어낸 참고문헌 넣은 연구자 1년 차단한다

ai-ml 2026-05-19 약 4분

 tags

#llm #arxiv #preprint #research #hallucination

vote

북마크

arXiv가 대규모 언어 모델(LLM)이 만들어낸 가짜 참고문헌이나 명백한 AI 생성 흔적을 검증 없이 넣은 원고에 대해 1년投稿 금지 제재를 적용하기로 했다. 제재가 끝난 뒤에도 해당 연구자는 신뢰할 만한 동료심사 저널이나 학회에 이미 승인된 논문만 arXiv에 올릴 수 있다. AI 활용 자체를 막겠다는 게 아니라, 검증 안 된 AI 산출물이 학술 인프라를 오염시키는 걸 막겠다는 쪽에 가깝다.

1
가짜 참고문헌이 발견되면 arXiv投稿 1년 금지
2
제재 이후에도 동료심사를 통과한 논문만投稿 가능
3
LLM 산출물을 검증하지 않은 명백한 흔적도 제재 대상
4
연구 커뮤니티에서는 찬반이 갈리지만 AI 슬롭 대응 필요성은 커지는 중

arXiv가 AI가 지어낸 참고문헌을 넣은 원고에 대해 꽤 센 제재를 꺼냈음
- 원고에서 대규모 언어 모델(LLM)이 만든 가짜 레퍼런스가 발견되면, 해당 연구자는 arXiv에 1년 동안 논문을 올릴 수 없음
- 단순 오탈자나 형식 문제 수준이 아니라, AI 결과물을 제대로 확인하지 않았다는 ‘반박하기 어려운’ 흔적이 있을 때 적용됨
제재는 1년으로 끝나지 않음
- Thomas Dietterich arXiv 컴퓨터과학 섹션 의장에 따르면, 1년이 지난 뒤에도 바로 정상 복귀가 아님
- 그 이후에는 ‘신뢰할 만한 동료심사 venue’에서 이미 승인된 논문만 arXiv에 올릴 수 있음
- 사실상 “한 번 걸리면 한동안 선공개 플랫폼으로서의 arXiv 접근권을 잃는다”는 얘기임
arXiv가 문제 삼는 건 AI 사용 자체가 아니라, 검증 안 한 AI 산출물임
- LLM은 문헌 조사나 초안 작성 같은 합법적인 연구 보조 도구로 이미 많이 쓰이고 있음
- 하지만 가짜 인용, 존재하지 않는 논문, “여기 200단어 요약이 있습니다. 수정할까요?” 같은 챗봇 흔적이 원고에 남아 있으면 얘기가 달라짐
- Dietterich는 이런 원고에 대해 “저자들이 LLM 결과를 확인하지 않았다는 강한 증거가 있으면, arXiv는 제출물의 어떤 것도 신뢰할 수 없다”고 봄
연구자들 반응은 갈림
- 일부는 “좋은 조치다, 왜 AI 환각만 보냐, 슬롭 전체와 싸워야 한다”는 식으로 환영함
- 반대로 Reviewer3 창업자 Natalie Khalil은 “arXiv에서 막아도 연구자는 다른 곳에서 계속 연구할 것”이라며 증상이 아니라 원인을 봐야 한다고 지적함
- Dietterich 쪽 입장은 단호함. 무책임한 연구자가 다른 곳에 올릴 수 있다는 게 arXiv에서 허용해야 할 이유는 아니라는 것
이 이슈가 커지는 배경에는 ‘AI 슬롭’이 있음
- AI 슬롭은 생성형 AI로 만든 저품질·무의미 콘텐츠를 말함
- preprint 서버들은 빠르게 논문을 공유한다는 장점 때문에, 검증이 약해지면 이런 콘텐츠에 더 취약해짐
- 일부 플랫폼은 가이드라인 위반 저자를 차단하고, 다른 플랫폼은 AI 사용 우려가 큰 제출 유형 자체를 배제하는 식으로 대응 중
흥미로운 포인트는 가짜 참고문헌이 단순 실수가 아니라 신뢰 붕괴의 신호로 취급된다는 점임
- Dietterich는 “이런 단순한 것도 확인하지 않았다면, 대체 다른 건 뭘 확인하지 않은 거냐”는 질문을 던짐
- 논문 공장(paper mill)처럼 저자 자리나 인용을 판매하는 업체에서 AI 생성 콘텐츠가 흘러들어오는 사례도 언급됨
- 결국 레퍼런스 하나가 틀린 문제가 아니라, 연구 생산 과정 전체가 검증 없이 자동화되는 문제로 번지는 중임

개발자 입장에서도 남 얘기가 아님. LLM이 만든 코드, 문서, 레퍼런스를 검증 없이 붙이는 습관이 누적되면 결국 플랫폼과 조직이 ‘신뢰 비용’을 제재로 바꾸기 시작한다는 신호다.

이전 기사 (P)

다음 기사 (N)

댓글을 불러오는 중...

ai-ml 2026-07-13

애플 새 음성 인식 API, 온디바이스 영어 전사에서 위스퍼 스몰까지 이겼다

애플의 새 음성 인식 API인 스피치애널라이저가 리브리스피치 벤치마크에서 기존 SFSpeechRecognizer는 물론 위스퍼 스몰보다도 낮은 단어 오류율을 기록했어. 깨끗한 음성에서는 2.12%, noisy 음성에서는 4.56%로, 기존 애플 API 대비 오류율을 3.5~4배 줄였고 위스퍼 스몰보다 약 3배 빠르게 돌았어. 다만 영어·애플 플랫폼·OS 26 조건의 결과라, 다국어와 크로스플랫폼에서는 여전히 위스퍼의 장점이 남아 있어.

ai-ml 2026-07-13

AI를 진짜 잘 쓰는 기업, 미국 증시에서 연 30% 프리미엄 받는다는 연구

예일대와 로체스터대 연구진이 기업의 실제 대형 언어 모델 사용 데이터를 분석했더니, AI 활용도가 높은 상위 20% 기업이 하위 20%보다 주당 평균 0.64% 높은 초과수익률을 냈다. 단순히 AI 기업이냐가 아니라, 업무에 AI를 얼마나 깊게 쓰는지가 시장 가치에 반영되고 있다는 얘기다.

ai-ml 2026-07-13

ZTE, AI 에이전트폰으로 스마트폰 재도전…진짜 승부처는 앱 생태계

ZTE가 바이트댄스의 더우바오를 탑재한 AI 에이전트 스마트폰으로 시장 재진입을 노린다. 핵심은 사용자가 명령하면 AI가 여러 앱을 직접 열고 조작하는 방식인데, 위챗·타오바오·알리페이 같은 플랫폼과 충돌하면서 생태계 문제가 가장 큰 변수로 떠올랐다.

ai-ml 2026-07-13

노벨상 학자들까지 “AI 경제 충격, 지금 제도 안 만들면 늦다”

노벨 경제학상 수상자 15명을 포함한 학자와 기술 업계 인사 약 200명이 AI가 향후 10년 안에 경제를 급격히 바꿀 수 있다며 정책 대응을 촉구했다. 이들은 산업혁명보다 큰 변화가 훨씬 짧은 시간에 올 수 있고, 대규모 일자리 대체와 생활 수준 향상이라는 양면성이 동시에 존재한다고 봤다.

ai-ml 2026-07-13

NHN, AI 데이터센터 매출 기대감에 목표주가 5만6000원으로 상향

한국투자증권이 NHN의 목표주가를 4만5000원에서 5만6000원으로 올리고 투자의견 매수를 유지했다. 핵심 근거는 양평 AI 데이터센터 가동, 공공·민간 GPU 클러스터 수주 확대, 클라우드 사업부 신규 매출 반영이다.

arXiv, AI가 지어낸 참고문헌 넣은 연구자 1년 차단한다

요약

핵심 포인트

핵심 개념

분석

인사이트

댓글

댓글

arXiv, AI가 지어낸 참고문헌 넣은 연구자 1년 차단한다

요약

핵심 포인트

핵심 개념

분석

인사이트

댓글

댓글

관련 기사