Нейросеть SciRus-tiny анализирует научные тексты и ищет близкие по тематике публикаций: запуск на eLIBRARY.RU

253
Иллюстрация к новости

Научная электронная библиотека открыла для пользователей портала eLIBRARY.RU поиск близких по тематике публикаций с применением нейросети SciRus-tiny, разработанной в МГУ для анализа научных текстов. Традиционно поиск в базах данных научной информации производится путем указания ключевых слов. Количество найденных документов и их состав сильно зависят от того, насколько точно подобраны ключевые слова. Нейросетевой поиск позволяет задать в качестве условия запроса аннотацию или полный текст научной статьи, или даже подборки статей по интересующей тематике. Система автоматически подберет документы, максимально близкие по своей тематической направленности.

На портале eLIBRARY.RU такой поиск реализован на странице с описанием публикации (пункт "Найти близкие по тематике публикации" в панели "Инструменты"). Кроме поиска с помощью нейросети, на выбор пользователя предоставляется несколько вариантов поиска — на основе совместного цитирования, просмотра публикаций пользователями и включения в подборки, соавторства и совпадения ключевых слов. Также есть возможность ограничить поиск путем указания периода выпуска научной статьи, типа публикации, ее вхождения в РИНЦ или ядро РИНЦ, или по дате размещения на портале eLIBRARY.RU. Последнее условие удобно использовать для поиска среди свежих поступлений в Научную электронную библиотеку.

Напомним, что в декабре 2023 года сотрудники лаборатории Машинного обучения и семантического анализа Института ИИ МГУ при поддержке портала eLIBRARY.RU обучили и опубликовали в открытом доступе нейронную сеть для получения семантических векторных представлений (эмбеддингов) научных текстов на русском языке SciRus-tiny. С ее помощью можно решать множество прикладных задач, начиная с поиска и классификации, и заканчивая извлечением научных терминов.

Подробнее на сайте eLIBRARY.RU.