О. В. Андреева, М. Б. Багиров, А. А. Данькина, Т. О. Федорова, М. М. Шевелёва, “Интеллектуальный анализ данных на базе Stanford CoreNLP для определения частей речи в русском языке”, Системы и средства информ., 28:2 (2018), 145

Системы и средства информатики

RUS ENG

ЖУРНАЛЫ ПЕРСОНАЛИИ ОРГАНИЗАЦИИ КОНФЕРЕНЦИИ СЕМИНАРЫ ВИДЕОТЕКА ПАКЕТ AMSBIB

JavaScript is disabled in your browser. Please switch it on to enable full functionality of the website

	Общая информация
	Последний выпуск
	Архив
	Импакт-фактор

	Поиск публикаций
	Поиск ссылок

	RSS
	Последний выпуск
	Текущие выпуски
	Архивные выпуски
	Что такое RSS

Системы и средства информ.:
Год:
Том:
Выпуск:
Страница:
	Найти

Персональный вход:
Логин:
Пароль:
	Запомнить пароль
	Войти
	Забыли пароль?
	Регистрация

Системы и средства информатики, 2018, том 28, выпуск 2, страницы 145–153
DOI: https://doi.org/10.14357/08696527180211 (Mi ssi578)

Эта публикация цитируется в 1 научной статье (всего в 1 статье)

Интеллектуальный анализ данных на базе Stanford CoreNLP для определения частей речи в русском языке

О. В. Андреева, М. Б. Багиров, А. А. Данькина, Т. О. Федорова, М. М. Шевелёва

Нижегородский государственный технический университет им. Р. Е. Алексеева

PDF полного текста (1477 kB) Список цитирования (1)

Список литературы:

PDF

HTML

DOI: https://doi.org/10.14357/08696527180211

Аннотация: Рассматриваются основные принципы функционирования библиотеки Stanford CoreNLP для обработки текстовых фрагментов, а также ее реализации на различных естественных языках, таких как английский, испанский и французский. Особенностью модели является взаимодействие отдельных блоков каждого языка благодаря организации взаимосвязанной структуры специализированных пакетов. Более подробно рассмотрены пакеты, которые непосредственно учитывают синтаксические и грамматические особенности внедренных языков. Также были разработаны способы взаимодействия Stanford CoreNLP с текстовыми данными на русском языке. Создана модель, позволяющая определять части речи у текстов на русском языке, повышена эффективность работы модели с текстами технической литературы на русском языке. В качестве результатов приведены тесты, позволяющие судить об эффективности внедренных изменений.

Ключевые слова: обработка информации; интеллектуальный анализ данных; Stanford CoreNLP; анализ естественного языка; POS tagger; определение частей речи; морфологический анализ русского языка.

Поступила в редакцию: 23.10.2017

Реферативные базы данных:

Тип публикации: Статья

Образец цитирования: О. В. Андреева, М. Б. Багиров, А. А. Данькина, Т. О. Федорова, М. М. Шевелёва, “Интеллектуальный анализ данных на базе Stanford CoreNLP для определения частей речи в русском языке”, Системы и средства информ., 28:2 (2018), 145–153

Цитирование в формате AMSBIB

\RBibitem{AndBagDan18}

\by О.~В.~Андреева, М.~Б.~Багиров, А.~А.~Данькина, Т.~О.~Федорова, М.~М.~Шевелёва

\paper Интеллектуальный анализ данных на базе Stanford CoreNLP для определения частей речи в русском языке

\jour Системы и средства информ.

\yr 2018

\vol 28

\issue 2

\pages 145--153

\mathnet{http://mi.mathnet.ru/ssi578}

\crossref{https://doi.org/10.14357/08696527180211}

\elib{https://elibrary.ru/item.asp?id=34954060}

Образцы ссылок на эту страницу:

https://www.mathnet.ru/rus/ssi578

https://www.mathnet.ru/rus/ssi/v28/i2/p145

Эта публикация цитируется в следующих 1 статьяx:

Citing articles in Google Scholar: Russian citations, English citations
Related articles in Google Scholar: Russian articles, English articles

Статистика просмотров:
Страница аннотации:	609
PDF полного текста:	496
Список литературы:	41

Что такое QR-код?

Обратная связь:

Пользовательское соглашение

Регистрация посетителей портала

Логотипы