Моделирование и анализ информационных систем
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив
Импакт-фактор

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Модел. и анализ информ. систем:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Моделирование и анализ информационных систем, 2018, том 25, номер 4, страницы 435–458
DOI: https://doi.org/10.18255/1818-1015-2018-4-435-458
(Mi mais640)
 

Эта публикация цитируется в 1 научной статье (всего в 1 статье)

Тезаурусы

Русскоязычные тезаурусы: автоматизированное построение и применение в задачах обработки текстов на естественном языке

Н. С. Лагутина, К. В. Лагутина, А. С. Адрианов, И. В. Парамонов

Ярославский государственный университет им. П.Г. Демидова, ул. Советская, 14, г. Ярославль, 150003 Россия
Список литературы:
Аннотация: В работе выполнен обзор существующих электронных русскоязычных тезаурусов и методов их автоматического построения и применения. Авторы провели анализ основных характеристик тезаурусов, находящихся в открытом доступе, для научных исследований, оценили динамику их развития и эффективность в решении задач по обработке естественного языка. Были исследованы статистические и лингвистические методы построения тезаурусов, которые позволяют автоматизировать разработку и уменьшить затраты на труд экспертов-лингвистов. В частности, рассматривались алгоритмы выделения ключевых терминов из текстов и семантических тезаурусных связей всех типов, а также качество применения получившихся в результате их работы тезаурусов. Для наглядной иллюстрации особенностей различных методов построения тезаурусных связей был разработан комбинированный метод, генерирующий специализированный тезаурус полностью автоматически на основе корпуса текстов предметной области и нескольких существующих лингвистических ресурсов. С использованием предложенного метода были проведены эксперименты с русскоязычными корпусами текстов из двух предметных областей: статьи о мигрантах и твиты. Для анализа полученных тезаурусов использовалась комплексная оценка, разработанная авторами в предыдущем исследовании, которая позволяет определить различные аспекты тезауруса и качество методов его генерации. Проведённый анализ выявил основные достоинства и недостатки различных подходов к построению тезаурусов и выделению семантических связей различных типов, а также позволил определить потенциальные направления будущих исследований.
Ключевые слова: тезаурус, семантические отношения, автоматическое построение тезауруса, автоматическое выделение связей, выделение ключевых слов.
Поступила в редакцию: 01.08.2018
Реферативные базы данных:
Тип публикации: Статья
УДК: 004.912
Образец цитирования: Н. С. Лагутина, К. В. Лагутина, А. С. Адрианов, И. В. Парамонов, “Русскоязычные тезаурусы: автоматизированное построение и применение в задачах обработки текстов на естественном языке”, Модел. и анализ информ. систем, 25:4 (2018), 435–458
Цитирование в формате AMSBIB
\RBibitem{LagLagAdr18}
\by Н.~С.~Лагутина, К.~В.~Лагутина, А.~С.~Адрианов, И.~В.~Парамонов
\paper Русскоязычные тезаурусы: автоматизированное построение и применение в задачах обработки текстов на естественном языке
\jour Модел. и анализ информ. систем
\yr 2018
\vol 25
\issue 4
\pages 435--458
\mathnet{http://mi.mathnet.ru/mais640}
\crossref{https://doi.org/10.18255/1818-1015-2018-4-435-458}
\elib{https://elibrary.ru/item.asp?id=35452930}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/mais640
  • https://www.mathnet.ru/rus/mais/v25/i4/p435
  • Эта публикация цитируется в следующих 1 статьяx:
    Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Моделирование и анализ информационных систем
    Статистика просмотров:
    Страница аннотации:612
    PDF полного текста:1128
    Список литературы:32
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024