Вестник Санкт-Петербургского университета. Серия 10. Прикладная математика. Информатика. Процессы управления
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Вестн. С.-Петербург. ун-та. Сер. 10. Прикл. матем. Информ. Проц. упр.:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Вестник Санкт-Петербургского университета. Серия 10. Прикладная математика. Информатика. Процессы управления, 2021, том 17, выпуск 4, страницы 389–396
DOI: https://doi.org/10.21638/11701/spbu10.2021.407
(Mi vspui505)
 

Информатика

Research of features of Dostoevsky's publicistic style by using $n$-grams based on the materials of the “Time” and “Epoch” magazines
[Исследование особенностей публицистического стиля Ф. М. Достоевского с помощью $n$-грамм по материалам журналов «Время» и «Эпоха»]

R. V. Abramov, K. A. Kulakov, A. A. Lebedev, N. D. Moskin, A. A. Rogov

Petrozavodsk State University, 33, pr. Lenina, Petrozavodsk, 185910, Russian Federation
Список литературы:
Аннотация: Работа посвящена изучению публицистического стиля Ф. М. Достоевского на материалах статей в журналах «Время» и «Эпоха» (1861–1865 гг.). Для этого были выбраны фрагменты текстов (в том числе М. М. Достоевского, Н. Н. Страхова, А. А. Головачева и др.) размером 500, 700 и 1000 слов, на которых выполнялся подсчет встречаемости би- и триграмм, представляющих собой закодированные последовательности частей речи. Далее на их основе были построены деревья решения и выполнен анализ точности распознавания текстов. Если рассмотреть классификацию на первом уровне дерева (размер фрагмента 1000), то точность в среднем была равна 87 %. Этим признаком выступает процент наличия биграммы «прилагательное — существительное». При анализе триграмм наиболее значимым признаком на первом уровне была последовательность «существительное — прилагательное — существительное». Также в статье рассмотрена задача сравнения полученных деревьев решений.
Ключевые слова: публицистический стиль, атрибуция текстов, дерево решений, $n$-грамма, Ф. М. Достоевский, сравнение деревьев, информационная система «Статистические методы для анализа литературных текстов».
Финансовая поддержка Номер гранта
Российский фонд фундаментальных исследований 18-012-90026
Работа выполнена при финансовой поддержке Российского фонда фундаментальных исследований (проект № 18-012-90026).
Поступила: 25 декабря 2020 г.
Принята к печати: 13 октября 2021 г.
Тип публикации: Статья
УДК: 004.8
MSC: 68T50
Язык публикации: английский
Образец цитирования: R. V. Abramov, K. A. Kulakov, A. A. Lebedev, N. D. Moskin, A. A. Rogov, “Research of features of Dostoevsky's publicistic style by using $n$-grams based on the materials of the “Time” and “Epoch” magazines”, Вестн. С.-Петербург. ун-та. Сер. 10. Прикл. матем. Информ. Проц. упр., 17:4 (2021), 389–396
Цитирование в формате AMSBIB
\RBibitem{AbrKulLeb21}
\by R.~V.~Abramov, K.~A.~Kulakov, A.~A.~Lebedev, N.~D.~Moskin, A.~A.~Rogov
\paper Research of features of Dostoevsky's publicistic style by using $n$-grams based on the materials of the ``Time'' and ``Epoch'' magazines
\jour Вестн. С.-Петербург. ун-та. Сер. 10. Прикл. матем. Информ. Проц. упр.
\yr 2021
\vol 17
\issue 4
\pages 389--396
\mathnet{http://mi.mathnet.ru/vspui505}
\crossref{https://doi.org/10.21638/11701/spbu10.2021.407}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/vspui505
  • https://www.mathnet.ru/rus/vspui/v17/i4/p389
  • Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Вестник Санкт-Петербургского университета. Серия 10. Прикладная математика. Информатика. Процессы управления
    Статистика просмотров:
    Страница аннотации:56
    PDF полного текста:4
    Список литературы:8
    Первая страница:4
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024