Вестник Санкт-Петербургского университета. Серия 10. Прикладная математика. Информатика. Процессы управления
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Вестн. С.-Петербург. ун-та. Сер. 10. Прикл. матем. Информ. Проц. упр.:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Вестник Санкт-Петербургского университета. Серия 10. Прикладная математика. Информатика. Процессы управления, 2023, том 19, выпуск 1, страницы 43–50
DOI: https://doi.org/10.21638/11701/spbu10.2023.104
(Mi vspui565)
 

Прикладная математика

Нахождение наличия заимствований в научных работах на основе марковских цепей

Р. Р. Саакянa, И. А. Шпехтb, Г. А. Петросянa

a Ванадзорский государственный университет им. О. Туманяна, Республика Армения, 2001, Ванадзор, ул. Тигран Мец, 36
b Академия маркетинга и социально-информационных технологий — ИМСИТ, Российская Федерация, 350010, Краснодар, ул. Зиповская, 5
Список литературы:
Аннотация: Цель исследования заключается в выработке оптимальных подходов для поиска заимствований в научных работах. Рассматриваются этапы нахождения наличия заимствований: предобработка, грубое фильтрование текстов, нахождение схожих текстов, нахождение заимствований. Основное внимание уделяется описанию подходов и техник, которые можно эффективно реализовать на каждом из этапов, например перевод символов текста из заглавных в строчные, удаление знаков препинаний, удаление стоп-слов для этапа предобработки; фильтры по темам и частоте слов для этапа грубого фильтрования текста; подсчет важности слов в контексте текста и представление слова в виде вектора в многомерном пространстве для определения меры близости для этапа нахождения схожих текстов; поиск точного совпадения, перефразов и меры близости выражений для этапа нахождения заимствований. Научная новизна заключается в предлагаемом в статье использовании марковских цепей для нахождения схожести текстов для второго и третьего этапов процесса поиска заимствований. На примере показана методика применения марковских цепей для представления текста, поиска наиболее часто встречающихся слов, построения графа марковской цепи слов и перспективы использования марковских цепей текстов для грубого фильтрования и поиска схожих текстов.
Ключевые слова: поиск заимствований, алгоритмы нахождения заимствований, марковские цепи, программное обеспечение проверки на оригинальность.
Поступила: 13 ноября 2022 г.
Принята к печати: 19 января 2023 г.
Тип публикации: Статья
УДК: 004.021
MSC: 68W05
Образец цитирования: Р. Р. Саакян, И. А. Шпехт, Г. А. Петросян, “Нахождение наличия заимствований в научных работах на основе марковских цепей”, Вестн. С.-Петербург. ун-та. Сер. 10. Прикл. матем. Информ. Проц. упр., 19:1 (2023), 43–50
Цитирование в формате AMSBIB
\RBibitem{SaaShpPet23}
\by Р.~Р.~Саакян, И.~А.~Шпехт, Г.~А.~Петросян
\paper Нахождение наличия заимствований в~научных работах на основе марковских цепей
\jour Вестн. С.-Петербург. ун-та. Сер. 10. Прикл. матем. Информ. Проц. упр.
\yr 2023
\vol 19
\issue 1
\pages 43--50
\mathnet{http://mi.mathnet.ru/vspui565}
\crossref{https://doi.org/10.21638/11701/spbu10.2023.104}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/vspui565
  • https://www.mathnet.ru/rus/vspui/v19/i1/p43
  • Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Вестник Санкт-Петербургского университета. Серия 10. Прикладная математика. Информатика. Процессы управления
    Статистика просмотров:
    Страница аннотации:24
    PDF полного текста:8
    Список литературы:9
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024