Труды СПИИРАН
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Информатика и автоматизация:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Труды СПИИРАН, 2013, выпуск 24, страницы 332–348 (Mi trspy571)  

Программно-алгоритмическое обеспечение создания синтаксическо-статистической модели русского языка по текстовому корпусу

И. С. Кипяткова

Санкт-Петербургский институт информатики и автоматизации РАН
Список литературы:
Аннотация: Создание модели языка является одним из этапов обучения системы распознавания слитной речи. В статье описаны алгоритм и разработанные программные средства для создания синтаксическо-статистической модели русского языка по текстовому корпусу. Основными этапами в работе алгоритма являются предварительная обработка текстового материала, создание статистической n-граммной модели языка, дополнение статистической модели n-граммами, полученными в результате синтаксического анализа. Синтаксический анализ позволяет увеличить количество создаваемых в результате обработки текста различных биграмм и тем самым повысить качество модели языка за счет выявления грамматически связанных пар слов. Приводятся результаты тестирования созданных с помощью программного модуля моделей языка по показателям информационной энтропии, коэффициента неопределенности, относительного количества внесловарных слов и совпадений n-грамм.
Ключевые слова: автоматическое распознавание речи, статистическая модель языка, синтаксический анализ.
Поступила в редакцию: 01.02.2013
Тип публикации: Статья
УДК: 004.522
PACS: 43.71.Sy
MSC: 68T50
Образец цитирования: И. С. Кипяткова, “Программно-алгоритмическое обеспечение создания синтаксическо-статистической модели русского языка по текстовому корпусу”, Тр. СПИИРАН, 24 (2013), 332–348
Цитирование в формате AMSBIB
\RBibitem{Kip13}
\by И.~С.~Кипяткова
\paper Программно-алгоритмическое обеспечение создания синтаксическо-статистической модели русского языка по текстовому корпусу
\jour Тр. СПИИРАН
\yr 2013
\vol 24
\pages 332--348
\mathnet{http://mi.mathnet.ru/trspy571}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/trspy571
  • https://www.mathnet.ru/rus/trspy/v24/p332
  • Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Информатика и автоматизация
    Статистика просмотров:
    Страница аннотации:224
    PDF полного текста:110
    Список литературы:31
    Первая страница:1
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024