Моделирование и анализ информационных систем
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив
Импакт-фактор

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Модел. и анализ информ. систем:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Моделирование и анализ информационных систем, 2020, том 27, номер 3, страницы 330–343
DOI: https://doi.org/10.18255/1818-1015-2020-3-330-343
(Mi mais719)
 

Theory of data

Автоматизированный поиск и анализ стилометрических характеристик, описывающих стиль прозы 19–21 веков

К. В. Лагутина, А. М. Манахова

Ярославский государственный университет им. П. Г. Демидова, ул. Советская, 14, г. Ярославль, 150003 Россия
Список литературы:
Аннотация: Статья посвящена сравнению стилометрических характеристик нескольких уровней, являющихся маркерами стиля прозаического текста, и анализу стилистических изменений русской и британской прозы 19–21 веков. Стилометрические характеристики включают в себя низкоуровневые характеристики, основанные на словах и символах, и высокоуровневые — ритмические. Подобные характеристики моделируют стиль текста и являются индикаторами времени его создания.
Вычисление всех характеристик происходит полностью автоматически, что позволяет проводить крупные эксперименты с художественными произведениями большого объёма и ускоряет работу эксперта-лингвиста. Для подсчёта стилометрических характеристик, в том числе основанных на результатах поиска ритмических средств, используется программа ProseRhythmDetector. В результате её работы каждый текст представляется в виде набора одних и тех же характеристик трёх уровней: символов, слов, ритма. Тексты объединяются по десятилетиям, для каждого десятилетия находятся средние значения стилометрических характеристик. Полученные модели десятилетий сравниваются при помощи стандартных метрик близости, результаты сравнения визуализируются в виде тепловых карт и дендрограмм. Эксперименты с двумя корпусами русских и британских текстов показывают, что в течение 19–21 веков появляются как общие тенденции изменения стиля для обоих корпусов, например, уменьшение количества ритмических средств в расчёте на одно предложение, так и собственные для каждого языка, например, динамика изменения длин слов и предложений. Стилометрические характеристики всех уровней выявляют схожесть стиля текстов, опубликованных в одном веке. Также характеристики трёх уровней в комплексе лучше демонстрируют уникальность каждого десятилетия, чем характеристики конкретного уровня. Это исследование показывает значимость стилометрических характеристик как маркеров стиля различных эпох и позволяет выявить тенденции изменения стиля на протяжении нескольких веков.
Ключевые слова: ритм текста, анализ ритма, обработка естественного языка, стилометрия, ритмические средства, автоматизация.
Финансовая поддержка Номер гранта
Российский фонд фундаментальных исследований 19-07-00243
Исследование выполнено при финансовой поддержке РФФИ в рамках научного проекта №19-07-00243.
Поступила в редакцию: 14.05.2020
Исправленный вариант: 08.06.2020
Принята в печать: 10.06.2020
Тип публикации: Статья
УДК: 004.912
MSC: 68T50
Образец цитирования: К. В. Лагутина, А. М. Манахова, “Автоматизированный поиск и анализ стилометрических характеристик, описывающих стиль прозы 19–21 веков”, Модел. и анализ информ. систем, 27:3 (2020), 330–343
Цитирование в формате AMSBIB
\RBibitem{LagMan20}
\by К.~В.~Лагутина, А.~М.~Манахова
\paper Автоматизированный поиск и анализ стилометрических характеристик, описывающих стиль прозы 19--21 веков
\jour Модел. и анализ информ. систем
\yr 2020
\vol 27
\issue 3
\pages 330--343
\mathnet{http://mi.mathnet.ru/mais719}
\crossref{https://doi.org/10.18255/1818-1015-2020-3-330-343}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/mais719
  • https://www.mathnet.ru/rus/mais/v27/i3/p330
  • Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Моделирование и анализ информационных систем
    Статистика просмотров:
    Страница аннотации:76
    PDF полного текста:78
    Список литературы:21
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024