Нейросеть «ИИ‑исследователь» — автор или рецензент?

11
Иллюстрация к новости

В журнал Nature опубликована статья Chris Lu и коллег «На пути к сквозной автоматизации исследований в области искусственного интеллекта» («Towards end-to-end automation of AI research»), в которой описан прецедент того, как полностью автоматизированная ИИ-система преодолела порог научного рецензирования – система AI Scientist («ИИ‑исследователь»), разработанная компании Sakana AI. Авторы статьи показывают, как эта система автоматизирует почти весь исследовательский цикл — от появления идеи до подготовки полноценной научной статьи.

Рабочий процесс AI Scientist устроен так, чтобы напоминать деятельность человека‑исследователя. Система генерирует направления исследований в заданной под области машинного обучения, проверяет новизну предложений по базам научной литературы, отсекая слишком близкие к уже существующим работам, и формирует детализированные экспериментальные планы. Далее AI Scientist пишет и модифицирует код, автоматически отлавливает и исправляет ошибки исполнения, запускает серию экспериментов, анализирует полученные данные, строит графики и оформляет результаты в LaTeX‑шаблоне стандартной конференционной статьи, включая методологию, результаты, обсуждение и список цитирований.

Авторы выделяют два основных режима работы системы. В template‑based режиме The AI Scientist получает кодовый шаблон и по шагам расширяет его, планируя последовательность экспериментов и фиксируя ход работы в «журнале экспериментов». В более автономном template‑free режиме система сама генерирует исходный код, организует эксперименты в виде агентного дерева поиска с несколькими стадиями — от предварительной проверки идей до основной серии исследований — и на каждом этапе выбирает наиболее перспективные ветви для продолжения. На основании журнала экспериментов и автоматически собранного обзора литературы AI Scientist формирует связный текст статьи.

Отдельный компонент работы — автоматизированный «рецензент», еще одна нейросетевая система, обученная оценивать статьи по критериям ведущих конференций, таких как Конференция по нейронным информационным системам (Conference on Neural Information Processing Systems, NeurIPS). Авторы показывают, что автоматический рецензент способен предсказывать решения программных комитетов с точностью, сопоставимой с человеческими рецензентами, и используют его для сравнения разных конфигураций AI Scientist, в том числе в зависимости от мощности базовых моделей и объема вычислений на этапе тестирования.

Чтобы оценить, как сгенерированные системой статьи выглядят в реальной экспертной процедуре, команда Sakana AI отправила три полностью подготовленные AI Scientist тестовые статьи в области науки о машинном обучении на семинар в рамках Международной конференции по изучению представлений (International Conference on Learning Representations, ICLR) 2025 года. Рецензентам сообщили, что среди материалов могут быть статьи, созданные ИИ, но не указали, какие именно, так что оценка проходила в стандартном «слепом» формате. Одна из этих статей получила оценки 6, 7 и 6 баллов от независимых рецензентов и была принята на воркшоп; позже её отозвали по договорённости с организаторами, поскольку подача изначально рассматривалась как эксперимент. 

При этом авторы подчеркивают, что у AI Scientist есть серьёзные ограничения. Среди ключевых проблем они называют склонность к «галлюцинациям», в том числе к генерации и цитированию несуществующих научных работ, а также этические и организационные риски. Потенциальный рост числа статей, подготовленных подобными системами, может перегрузить инфраструктуру рецензирования, осложнить экспертную оценку и увеличить долю «шума» в научной литературе.

Оригинальная публикация (для цитирования):

Lu, C., Lu, C., Lange, R. T., Yamada, Y., Hu, S., Foerster, J., Ha, D., & Clune, J. (2026). Towards end‑to‑end automation of AI research. Nature, 651(8024), 914–930. https://doi.org/10.1038/s41586-026-10265-5