Труды института системного программирования РАН
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Труды ИСП РАН:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Труды института системного программирования РАН, 2022, том 34, выпуск 1, страницы 73–86
DOI: https://doi.org/10.15514/ISPRAS-2022-34(1)-6
(Mi tisp666)
 

Обобщенная контекстно-зависимая теоретико-графовая модель фольклорных и литературных текстов

Н. Д. Москин, А. А. Рогов, Р. В. Воронов

Петрозаводский государственный университет
Аннотация: Одной из проблем при автоматической обработке текстов является их атрибуция. Под этим термином понимают установление атрибутов текстового произведения (определение авторства, времени создания, места записи и др.). В статье представлена обобщенная контекстно-зависимая теоретико-графовая модель, предназначенная для анализа фольклорных и литературных текстов. Минимальной структурной единицей модели (примитивом) является слово. Множества слов объединяются в вершины, причем одно и то же слово может иметь отношение к разным вершинам. Ребра и графовые подструктуры отражают лексические, синтаксические и семантические связи текста. Характеристиками модели являются ее нечеткость, иерархичность и темпоральность. В качестве примеров приводятся иерархическая теоретико-графовая модель составляющих (на примере литературных произведений А. С. Пушкина), темпоральная теоретико-графовая модель сказочного сюжета (на примере русских волшебных сказок А. М. Афанасьева) и нечеткая теоретико-графовая модель «сильных» связей грамматических классов (на примере анонимных статей из дореволюционных журналов «Время», «Эпоха» и еженедельника «Гражданин», которые редактировал Ф. М. Достоевский). Модель строится таким образом, чтобы в дальнейшем ее можно было исследовать с помощью методов искусственного интеллекта (например, деревьев решений или нейронных сетей). Для этой цели в информационной системе «Фольклор» был разработан формат для хранения подобных данных, а также реализованы процедуры для ввода, редактирования и анализа текстов и их теоретико-графовых моделей.
Ключевые слова: теоретико-графовая модель, атрибуция текстов, лексика, синтаксис, семантика, нечеткий граф, иерархический граф, темпоральный граф, информационная система «Фольклор».
Тип публикации: Статья
Образец цитирования: Н. Д. Москин, А. А. Рогов, Р. В. Воронов, “Обобщенная контекстно-зависимая теоретико-графовая модель фольклорных и литературных текстов”, Труды ИСП РАН, 34:1 (2022), 73–86
Цитирование в формате AMSBIB
\RBibitem{MosRogVor22}
\by Н.~Д.~Москин, А.~А.~Рогов, Р.~В.~Воронов
\paper Обобщенная контекстно-зависимая теоретико-графовая модель фольклорных и литературных текстов
\jour Труды ИСП РАН
\yr 2022
\vol 34
\issue 1
\pages 73--86
\mathnet{http://mi.mathnet.ru/tisp666}
\crossref{https://doi.org/10.15514/ISPRAS-2022-34(1)-6}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/tisp666
  • https://www.mathnet.ru/rus/tisp/v34/i1/p73
  • Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Труды института системного программирования РАН
    Статистика просмотров:
    Страница аннотации:9
    PDF полного текста:21
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024