|
Исследование грамматической неоднозначности наиболее частотных слов русского языка
Э. С. Клышинский, В. А. Бунтякова, О. В. Карпик
Аннотация:
В своих предыдущих исследованиях мы обнаружили, что в европейских языках грамматическая неоднозначность наиболее частотных слов ведет себя несколько иначе, чем в более редких словах. В данном исследовании мы более подробно анализируем причины этого явления, уделяя особое внимание первой тысяче наиболее частотных токенов. Исследование современных систем снятия омонимии и синтаксического анализа показало, что всплеск разнообразия частей речи, который наблюдается в наиболее частотных слова, приводит к увеличению числа ошибок на выходе этих систем.
Ключевые слова:
грамматическая неоднозначность, квантитативный
анализ, статистика распределения, русский язык.
Образец цитирования:
Э. С. Клышинский, В. А. Бунтякова, О. В. Карпик, “Исследование грамматической неоднозначности наиболее частотных слов русского языка”, Препринты ИПМ им. М. В. Келдыша, 2021, 058, 22 с.
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/ipmp2975 https://www.mathnet.ru/rus/ipmp/y2021/p58
|
Статистика просмотров: |
Страница аннотации: | 73 | PDF полного текста: | 64 | Список литературы: | 12 |
|