Открытый научный репозиторий arXiv вводит новую политику в отношении работ с использованием генеративного ИИ.[1] Если модераторы находят очевидные следы того, что авторы просто скопировали текст из нейросети, не проверяя его, всех таких авторов статей ждёт годовой бан на 1 год на новые загрузки.

Политику публично сформулировал Томас Диттерих [2], председатель секции компьютерных наук arXiv. В серии сообщений он написал, что если в рукописи есть неопровержимые доказательства того, что авторы не проверяли результаты генерации LLM, «мы не можем доверять вообще ничему в этой статье».
К таким доказательствам он относит:
- галлюцинированные ссылки: несуществующие статьи, журналы, DOI;
- мета-комментарии от самой модели в стиле: «Вот краткое резюме на 200 слов, хотите, что-нибудь изменить?» или «Таблица ниже иллюстративна, заполните её настоящими данными из экспериментов»;
- другие типичные «случайные утечки» системных/служебных фраз LLM, которые автор даже не попытался удалить.
Какие санкции вводит arXiv
Если модераторы находят такие признаки, arXiv применяет двухступенчатое наказание:
- Годовой бан для всех указанных в статье авторов: они не могут подавать новые работы в arXiv в течение 12 месяцев.
- После истечения бана авторы смогут снова размещать препринты только если статья уже принята в «уважаемое рецензируемое издание». То есть арбитром качества становится не только arXiv, но и внешние научные журналы или конференции.
Важно: речь не о полном запрете ИИ. Диттерих и комментаторы подчёркивают, что:
- arXiv не запрещает использовать ChatGPT* и другие модели для черновиков, редактуры или перевода;
- ответственность лежит на авторах: они обязаны проверять факты, ссылки и формулировки;
- наказание нацелено именно на случаи, когда видно, что текст выложили «как есть», без человеческого контроля.
Почему арxiv пошёл на такие меры
В обсуждении новой политики цитируют аудит журнала The Lancet [3]: доля публикаций с поддельными ссылками, попавших в PubMed, выросла с примерно одной такой статьи на 2800 работ в 2023 году до одной на 300 в начале 2026-го. То есть таких случаев стало примерно в 10—12 раз больше всего за пару лет, а перелом пришёлся на середину 2024 года. Главным источником этой проблемы называют, как раз генеративные модели, которые легко придумывают правдоподобные, но несуществующие ссылки. Сами редакторы и исследователи называют происходящее — «ИИ-каша»: тексты, которые внешне похожи на научную статью, но изнутри набиты ошибками, бессмысленными перефразами и фейковыми референсами.

arXiv уже раньше пытался бороться с этим мягкими мерами (обновлённые гайды по использованию ИИ, требования к описанию инструментов), но теперь впервые вводит жёсткое персональное наказание: бан конкретных авторов, а не только отказ по одной рукописи.
Что это значит для исследователей и науки в целом
По сути, arXiv закрепляет простое правило: ИИ, это инструмент, а не автор.
- Можно использовать LLM для черновика, перевода, структурирования текста.
- Нельзя перекладывать на неё ответственность за факты, ссылки и корректность выводов.
Если авторы этого не понимают, arXiv теперь не просто отклоняет одну работу, а выводит их из игры на год и заставляет вернуться только через фильтр классического перевоспитания.
Для научного сообщества это важный сигнал: эпоха «давайте зальём в arXiv статью, которую нагенерил ChatGPT* за вечер» официально закончилась. Теперь цена за такую «экономию времени» — репутационный удар и временное исключение из ключевого источника научной видимости.
*Сервис ChatGPT от компании OpenAI — официально недоступен на территории РФ.
Источники:
- 404media.co
- theverge.com
- linkedin.com
+7 (966) 666-81-26