Вестник Южно-Уральского государственного университета. Серия «Математическое моделирование и программирование»
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив
Правила для авторов
Загрузить рукопись

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Вестн. ЮУрГУ. Сер. Матем. моделирование и программирование:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Вестник Южно-Уральского государственного университета. Серия «Математическое моделирование и программирование», 2012, выпуск 13, страницы 119–127 (Mi vyuru74)  

Программирование

Распределенная инструментальная среда словарного морфологического анализа для обработки русского языка

Д. А. Усталов, М. Л. Гольдштейн

Институт математики и механики УрО РАН (г. Екатеринбург, Российская Федерация)
Список литературы:
Аннотация: В статье рассмотрен подход к масштабированию сервиса морфологического разбора слов естественного языка при обработке различных коллекций документов на русском языке. Выполнен обзор и критический анализ существующих решений. Сформированы требования к инструментальной среде словарного морфологического анализатора. Распределенная архитектура Web-сервиса морфологического анализа, предназначенного для обработки крупных коллекций документов на русском языке, представлена в виде структурной модели. Данная архитектура реализована в виде прототипа системы на языке программирования Ruby. Приведена структура используемого морфологического словаря в виде реляционной схемы. Испытания данного метода в распределенной вычислительной среде показали линейную масштабируемость предлагаемого решения. Конфигурация эксперимента включает систему генерации нагрузки в виде HTTP-запросов, систему балансировки нагрузки на рабочие узлы распределенной системы, серверы приложений с функционирующим анализатором и базу данных морфологического словаря, а также кэширующий узел для снижения издержек при выполнении запросов к словарю. Применение данного подхода позволяет получить линейный рост производительности в распределенных системах автоматической обработки больших объемов текста.
Ключевые слова: распределенные вычисления, обработка естественного языка, корпусная лингвистика, обработка больших объемов данных, морфологический анализ.
Поступила в редакцию: 08.06.2012
Тип публикации: Статья
УДК: 004.912
MSC: 68T50
Образец цитирования: Д. А. Усталов, М. Л. Гольдштейн, “Распределенная инструментальная среда словарного морфологического анализа для обработки русского языка”, Вестн. ЮУрГУ. Сер. Матем. моделирование и программирование, 2012, № 13, 119–127
Цитирование в формате AMSBIB
\RBibitem{UstGol12}
\by Д.~А.~Усталов, М.~Л.~Гольдштейн
\paper Распределенная инструментальная среда словарного морфологического анализа для обработки русского языка
\jour Вестн. ЮУрГУ. Сер. Матем. моделирование и программирование
\yr 2012
\issue 13
\pages 119--127
\mathnet{http://mi.mathnet.ru/vyuru74}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/vyuru74
  • https://www.mathnet.ru/rus/vyuru/y2012/i13/p119
  • Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Статистика просмотров:
    Страница аннотации:186
    PDF полного текста:86
    Список литературы:71
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024