Системы и средства информатики
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив
Импакт-фактор

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Системы и средства информ.:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Системы и средства информатики, 2018, том 28, выпуск 2, страницы 145–153
DOI: https://doi.org/10.14357/08696527180211
(Mi ssi578)
 

Эта публикация цитируется в 1 научной статье (всего в 1 статье)

Интеллектуальный анализ данных на базе Stanford CoreNLP для определения частей речи в русском языке

О. В. Андреева, М. Б. Багиров, А. А. Данькина, Т. О. Федорова, М. М. Шевелёва

Нижегородский государственный технический университет им. Р. Е. Алексеева
Список литературы:
Аннотация: Рассматриваются основные принципы функционирования библиотеки Stanford CoreNLP для обработки текстовых фрагментов, а также ее реализации на различных естественных языках, таких как английский, испанский и французский. Особенностью модели является взаимодействие отдельных блоков каждого языка благодаря организации взаимосвязанной структуры специализированных пакетов. Более подробно рассмотрены пакеты, которые непосредственно учитывают синтаксические и грамматические особенности внедренных языков. Также были разработаны способы взаимодействия Stanford CoreNLP с текстовыми данными на русском языке. Создана модель, позволяющая определять части речи у текстов на русском языке, повышена эффективность работы модели с текстами технической литературы на русском языке. В качестве результатов приведены тесты, позволяющие судить об эффективности внедренных изменений.
Ключевые слова: обработка информации; интеллектуальный анализ данных; Stanford CoreNLP; анализ естественного языка; POS tagger; определение частей речи; морфологический анализ русского языка.
Поступила в редакцию: 23.10.2017
Реферативные базы данных:
Тип публикации: Статья
Образец цитирования: О. В. Андреева, М. Б. Багиров, А. А. Данькина, Т. О. Федорова, М. М. Шевелёва, “Интеллектуальный анализ данных на базе Stanford CoreNLP для определения частей речи в русском языке”, Системы и средства информ., 28:2 (2018), 145–153
Цитирование в формате AMSBIB
\RBibitem{AndBagDan18}
\by О.~В.~Андреева, М.~Б.~Багиров, А.~А.~Данькина, Т.~О.~Федорова, М.~М.~Шевелёва
\paper Интеллектуальный анализ данных на базе Stanford CoreNLP для определения частей речи в русском языке
\jour Системы и средства информ.
\yr 2018
\vol 28
\issue 2
\pages 145--153
\mathnet{http://mi.mathnet.ru/ssi578}
\crossref{https://doi.org/10.14357/08696527180211}
\elib{https://elibrary.ru/item.asp?id=34954060}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/ssi578
  • https://www.mathnet.ru/rus/ssi/v28/i2/p145
  • Эта публикация цитируется в следующих 1 статьяx:
    Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Системы и средства информатики
    Статистика просмотров:
    Страница аннотации:609
    PDF полного текста:496
    Список литературы:41
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024