|
Автоматика и телемеханика, 2013, выпуск 10, страницы 154–165
(Mi at6155)
|
|
|
|
Эта публикация цитируется в 2 научных статьях (всего в 2 статьях)
Тематический выпуск
Статистический теггер для морфологической разметки русскоязычных текстов
В. В. Петроченковa, А. О. Казенниковb a Институт проблем передачи информации им. А. А. Харкевича РАН
b Московский государственный институт радиотехники, электроники и автоматики
Аннотация:
Рассматривается метод построения статистического теггера для автоматической морфологической разметки русскоязычных текстов. При такой разметке каждому слову приписывается тег, содержащий в себе информацию о части речи и полном наборе морфологических характеристик слова. Используется набор морфологических характеристик, принятый в корпусе СинТагРус, материал которого использовался для обучения теггера. В основе работы теггера лежит метод опорных векторов SVM (Support Vector Machine). Разработанный теггер показал высокую скорость и хорошее качество разметки.
Образец цитирования:
В. В. Петроченков, А. О. Казенников, “Статистический теггер для морфологической разметки русскоязычных текстов”, Автомат. и телемех., 2013, № 10, 154–165; Autom. Remote Control, 74:10 (2013), 1724–1732
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/at6155 https://www.mathnet.ru/rus/at/y2013/i10/p154
|
Статистика просмотров: |
Страница аннотации: | 288 | PDF полного текста: | 103 | Список литературы: | 38 | Первая страница: | 19 |
|