Записки научных семинаров ПОМИ
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив
Импакт-фактор

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Зап. научн. сем. ПОМИ:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Записки научных семинаров ПОМИ, 2021, том 499, страницы 222–235 (Mi znsl7050)  

II. Информатика

Named entity recognition in Russian using multi-task LSTM-CRF
[Распознавание именованных сущностей для русского языка при помощи мультизадачной модели LSTM-CRF]

D. Mazitova, I. Alimovaa, E. Tutubalinab

a Kazan Federal University, Kazan, Russia, 420008
b Lomonosov Moscow State University, Kolmogorova str., 1, Moscow 119991, Russia
Список литературы:
Аннотация: Цель распознавания именованных сущностей (named entity recognition, NER) – получить важную информацию из неструктурированных данных, представленных в виде текста на естественном языке. В настоящей работе мы исследуем эффективность современного мультизадачного подхода к NER на русскоязычных корпусах с использованием нескольких различных наборов данных для NER и набора данных частеречной разметки (part-of-speech tagging, POS). Мы применяем современную нейросетевую архитектуру, основанную на двунаправленных LSTM и условных случайных полях (CRF). Свёрточные нейронные сети использовались для обучения признаков на уровне отдельных букв. Мы представляем обширное экспериментальное исследование на трёх стандартных русскоязычных новостных наборах данных. Предлагаемая мультизадачная модель улучшает известные ранее результаты, достигая F1-меры 88.04% на датасете Гареева и F1-меры 99.49% на датасете Person-1000. Библ. – 37 назв.
Ключевые слова: распознавание именованных сущностей, обработка естественных языков, рекуррентные нейронные сети.
Финансовая поддержка Номер гранта
Российский научный фонд 20-11-20166
This work was supported by the Russian Science Foundation grant no. 20-11-20166.
Поступило: 14.01.2019
Тип публикации: Статья
УДК: 004.85
Язык публикации: английский
Образец цитирования: D. Mazitov, I. Alimova, E. Tutubalina, “Named entity recognition in Russian using multi-task LSTM-CRF”, Исследования по прикладной математике и информатике. I, Зап. научн. сем. ПОМИ, 499, ПОМИ, СПб., 2021, 222–235
Цитирование в формате AMSBIB
\RBibitem{MazAliTut21}
\by D.~Mazitov, I.~Alimova, E.~Tutubalina
\paper Named entity recognition in Russian using multi-task LSTM-CRF
\inbook Исследования по прикладной математике и информатике.~I
\serial Зап. научн. сем. ПОМИ
\yr 2021
\vol 499
\pages 222--235
\publ ПОМИ
\publaddr СПб.
\mathnet{http://mi.mathnet.ru/znsl7050}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/znsl7050
  • https://www.mathnet.ru/rus/znsl/v499/p222
  • Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Записки научных семинаров ПОМИ
    Статистика просмотров:
    Страница аннотации:134
    PDF полного текста:78
    Список литературы:15
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024