|
Эта публикация цитируется в 1 научной статье (всего в 1 статье)
Интеллектуальный анализ данных на базе Stanford CoreNLP для определения частей речи в русском языке
О. В. Андреева, М. Б. Багиров, А. А. Данькина, Т. О. Федорова, М. М. Шевелёва Нижегородский государственный технический университет им. Р. Е. Алексеева
Аннотация:
Рассматриваются основные принципы функционирования библиотеки Stanford CoreNLP для обработки текстовых фрагментов, а также ее реализации на различных естественных языках, таких как английский, испанский и французский. Особенностью модели является взаимодействие отдельных блоков каждого языка благодаря организации взаимосвязанной структуры специализированных пакетов. Более подробно рассмотрены пакеты, которые непосредственно учитывают синтаксические и грамматические особенности внедренных языков. Также были разработаны способы взаимодействия Stanford CoreNLP с текстовыми данными на русском языке. Создана модель, позволяющая определять части речи у текстов на русском языке, повышена эффективность работы модели с текстами технической литературы на русском языке. В качестве результатов приведены тесты, позволяющие судить об эффективности внедренных изменений.
Ключевые слова:
обработка информации; интеллектуальный анализ данных; Stanford CoreNLP; анализ естественного языка; POS tagger; определение частей речи; морфологический анализ русского языка.
Поступила в редакцию: 23.10.2017
Образец цитирования:
О. В. Андреева, М. Б. Багиров, А. А. Данькина, Т. О. Федорова, М. М. Шевелёва, “Интеллектуальный анализ данных на базе Stanford CoreNLP для определения частей речи в русском языке”, Системы и средства информ., 28:2 (2018), 145–153
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/ssi578 https://www.mathnet.ru/rus/ssi/v28/i2/p145
|
Статистика просмотров: |
Страница аннотации: | 604 | PDF полного текста: | 493 | Список литературы: | 41 |
|