Записки научных семинаров ПОМИ
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив
Импакт-фактор

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Зап. научн. сем. ПОМИ:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Записки научных семинаров ПОМИ, 2021, том 499, страницы 206–221 (Mi znsl7060)  

II. Информатика

Word-based russian text augmentation for character-level models
[Пословная аугментация для обучения посимвольных моделей на русскоязычных текстах]

R. B. Galinskya, A. M. Alekseevba, S. I. Nikolenkoab

a St. Petersburg Department of Steklov Mathematical Institute of Russian Academy of Sciences
b Saint Petersburg State University
Список литературы:
Аннотация: Большие модели глубокого обучения, в том числе модели для обработки естественных языков, требуют больших наборов данных для обучения. Такие наборы могут оказаться недоступны для относительно редких языков или для отдельных предметных областей. Мы рассматриваем подход к решению проблемы низкой вариативности и малого размера доступных для обучения NLP моделей наборов данных на основе аугментации данных при помощи синонимов. Мы представляем новую схему аугментации, которая включает замену слов на синонимы и изменение порядка слов, применяем её к русскому языку и получаем улучшенные результаты для задачи анализа тональности. Библ. – 46 назв.
Ключевые слова: глубокое обучение, обработка естественных языков, аугментация данных, анализ тональности.
Финансовая поддержка Номер гранта
Санкт-Петербургский государственный университет
This research was supported by the St. Petersburg State University, research project “Artificial Intelligence and Data Science: Theory, Technology, Industrial and Interdisciplinary Research and Applications”.
Поступило: 02.10.2020
Тип публикации: Статья
Язык публикации: английский
Образец цитирования: R. B. Galinsky, A. M. Alekseev, S. I. Nikolenko, “Word-based russian text augmentation for character-level models”, Исследования по прикладной математике и информатике. I, Зап. научн. сем. ПОМИ, 499, ПОМИ, СПб., 2021, 206–221
Цитирование в формате AMSBIB
\RBibitem{GalAleNik21}
\by R.~B.~Galinsky, A.~M.~Alekseev, S.~I.~Nikolenko
\paper Word-based russian text augmentation for character-level models
\inbook Исследования по прикладной математике и информатике.~I
\serial Зап. научн. сем. ПОМИ
\yr 2021
\vol 499
\pages 206--221
\publ ПОМИ
\publaddr СПб.
\mathnet{http://mi.mathnet.ru/znsl7060}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/znsl7060
  • https://www.mathnet.ru/rus/znsl/v499/p206
  • Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Записки научных семинаров ПОМИ
    Статистика просмотров:
    Страница аннотации:153
    PDF полного текста:59
    Список литературы:18
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024