|
Ученые записки Казанского государственного университета. Серия Физико-математические науки, 2009, том 151, книга 3, страницы 214–228
(Mi uzku800)
|
|
|
|
Эта публикация цитируется в 1 научной статье (всего в 1 статье)
Эвристики для улучшения работы частичного синтаксического анализатора
В. А. Буштедтa, В. Н. Поляковabc a Московский институт стали и сплавов
b Институт языкознания РАН
c Московский государственный лингвистический университет
Аннотация:
В статье описана работа частичного синтаксического анализатора с использованием эвристик, которые позволяют сократить количество ложно выявленных при первоначальном анализе синтаксических конструкций (чанков). В предыдущих работах авторов было выявлено, что в русском языке на обнаружение чанков очень большое воздействие оказывают явления омонимии и полисемии. Под ложно выявленными чанками понимаются такие, которые были обнаружены частичным синтаксическим анализатором, но не являются на самом деле верными. Метод поиска чанков с применением этих эвристик получил название “Right-Chunk 4”. Приведена формальная постановка задачи. Выполнена компьютерная реализация метода поиска чанков, результатом которой является программный комплекс “Chunk-Creator 4”. Проведена оценка эффективности предложенного метода поиска чанков.
Ключевые слова:
искусственный интеллект, компьютерная лингвистика, парсинг, синтаксический анализ, чанкинг.
Поступила в редакцию: 26.02.2009
Образец цитирования:
В. А. Буштедт, В. Н. Поляков, “Эвристики для улучшения работы частичного синтаксического анализатора”, Учён. зап. Казан. гос. ун-та. Сер. Физ.-матем. науки, 151, № 3, Изд-во Казанского ун-та, Казань, 2009, 214–228
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/uzku800 https://www.mathnet.ru/rus/uzku/v151/i3/p214
|
Статистика просмотров: |
Страница аннотации: | 320 | PDF полного текста: | 124 | Список литературы: | 41 |
|