Доклады Российской академии наук. Математика, информатика, процессы управления
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив
Импакт-фактор

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Докл. РАН. Матем., информ., проц. упр.:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Доклады Российской академии наук. Математика, информатика, процессы управления, 2022, том 508, страницы 104–105
DOI: https://doi.org/10.31857/S2686954322070074
(Mi danma345)
 

Эта публикация цитируется в 5 научных статьях (всего в 5 статьях)

ПЕРЕДОВЫЕ ИССЛЕДОВАНИЯ В ОБЛАСТИ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА И МАШИННОГО ОБУЧЕНИЯ

ruSciBERT:: языковая модель на базе архитектуры трансформер для получения семантических векторных представлений научных текстов на русском языке

Н. А. Герасименко, А. С. Чернявский, М. А. Никифорова

ПАО "Сбербанк", г. Москва
Список литературы:
Аннотация: Значительный рост числа научных публикаций и количества научных отчетов делает задачу их обработки и анализа сложной и трудозатратной. Языковые модели, основанные на архитектуре Трансформер и предобученные на больших текстовых коллекциях, позволяют качественно решать множество задач анализа текстовых данных. Для работы с научными текстами на английском языке существуют модели SciBERT [1] и ее модификация SPECTER [2], однако они не поддерживают русский язык в связи с малым количеством текстов в обучающей выборке. Кроме того, способ оценки качества языковых моделей для научных текстов, бенчмарк SciDocs, также поддерживает только английский язык. Предлагаемая модель ruSciBERT позволит решать широкий спектр задач, связанных с анализом научных текстов на русском языке, а прилагаемый к ней бенчмарк ruSciDocs позволит оценивать качество языковых моделей применительно к этим задачам.
Ключевые слова: языковая модель, семантические представления, SciBERT, SciDocs.
Статья представлена к публикации: А. Л. Семёнов
Поступило: 28.10.2022
После доработки: 28.10.2022
Принято к публикации: 01.11.2022
Англоязычная версия:
Doklady Mathematics, 2022, Volume 508, Issue suppl. 1, Pages S95–S96
DOI: https://doi.org/10.1134/S1064562422060072
Реферативные базы данных:
Тип публикации: Статья
УДК: 004.8
Образец цитирования: Н. А. Герасименко, А. С. Чернявский, М. А. Никифорова, “ruSciBERT:: языковая модель на базе архитектуры трансформер для получения семантических векторных представлений научных текстов на русском языке”, Докл. РАН. Матем., информ., проц. упр., 508 (2022), 104–105; Dokl. Math., 508:suppl. 1 (2022), S95–S96
Цитирование в формате AMSBIB
\RBibitem{GerCheNik22}
\by Н.~А.~Герасименко, А.~С.~Чернявский, М.~А.~Никифорова
\paper ruSciBERT:: языковая модель на базе архитектуры трансформер для получения семантических векторных представлений научных текстов на русском языке
\jour Докл. РАН. Матем., информ., проц. упр.
\yr 2022
\vol 508
\pages 104--105
\mathnet{http://mi.mathnet.ru/danma345}
\crossref{https://doi.org/10.31857/S2686954322070074}
\elib{https://elibrary.ru/item.asp?id=49991318}
\transl
\jour Dokl. Math.
\yr 2022
\vol 508
\issue suppl. 1
\pages S95--S96
\crossref{https://doi.org/10.1134/S1064562422060072}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/danma345
  • https://www.mathnet.ru/rus/danma/v508/p104
  • Эта публикация цитируется в следующих 5 статьяx:
    Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Доклады Российской академии наук. Математика, информатика, процессы управления Доклады Российской академии наук. Математика, информатика, процессы управления
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024