Записки научных семинаров ПОМИ
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив
Импакт-фактор

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Зап. научн. сем. ПОМИ:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Записки научных семинаров ПОМИ, 2021, том 499, страницы 248–266 (Mi znsl7052)  

II. Информатика

Robust word vectors: context-informed embeddings for noisy texts
[Робастные векторы слов: распределённые представления для зашумленных текстов с учётом контекста]

T. Khakhulina, V. Logachevab, V. Malykhcbd

a Skolkovo Institute of Science and Technology, Nobelya Ulitsa, 3, 121205, Moscow, Russia
b Moscow Institute of Physics and Technology, 9 Institutskiy per., Dolgoprudny, Moscow Region
c Steklov Institute of Mathematics at St. Petersburg, nab. r. Fontanki, 27, 191023, St. Petersburg
d Institute for Systems Analysis, Federal Research Center “Computer Science and Control” of Russian Academy of Sciences, pr. 60-letiya Oktyabrya, 9, 117312, Moscow
Список литературы:
Аннотация: Мы представляем новую языконезависимую архитектуру робастных векторов слов (robust word vectors, RoVe). Её задача – решить проблему опечаток и орфографических ошибок, которыми изобилует практически любой порождённый пользователями контент и которые при этом осложняют автоматическую обработку текстов. Наша модель мотивирована морфологически, что позволяет ей обрабатывать ранее не виденные формы слов в морфологически богатых языках. Мы представляем результаты для нескольких задач обработки естественных языков на нескольких языках для нескольких родственных нейросетевых архитектур, показывая, что предлагаемая архитектура устойчива к опечаткам. Библ. – 38 назв.
Ключевые слова: векторы слов, распределённые представления, обработка естественных языков.
Финансовая поддержка Номер гранта
PAO Sberbank 0000000007417F630002
Национальная технологическая инициатива
This work was supported by the National Technology Initiative and PAO Sberbank project ID 0000000007417F630002.
Поступило: 14.01.2019
Тип публикации: Статья
УДК: 004.85
Язык публикации: английский
Образец цитирования: T. Khakhulin, V. Logacheva, V. Malykh, “Robust word vectors: context-informed embeddings for noisy texts”, Исследования по прикладной математике и информатике. I, Зап. научн. сем. ПОМИ, 499, ПОМИ, СПб., 2021, 248–266
Цитирование в формате AMSBIB
\RBibitem{KhaLogMal21}
\by T.~Khakhulin, V.~Logacheva, V.~Malykh
\paper Robust word vectors: context-informed embeddings for noisy texts
\inbook Исследования по прикладной математике и информатике.~I
\serial Зап. научн. сем. ПОМИ
\yr 2021
\vol 499
\pages 248--266
\publ ПОМИ
\publaddr СПб.
\mathnet{http://mi.mathnet.ru/znsl7052}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/znsl7052
  • https://www.mathnet.ru/rus/znsl/v499/p248
  • Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Записки научных семинаров ПОМИ
    Статистика просмотров:
    Страница аннотации:87
    PDF полного текста:44
    Список литературы:20
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024