Труды института системного программирования РАН
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Труды ИСП РАН:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Труды института системного программирования РАН, 2022, том 34, выпуск 1, страницы 151–160
DOI: https://doi.org/10.15514/ISPRAS-2022-34(1)-11
(Mi tisp671)
 

Эта публикация цитируется в 1 научной статье (всего в 1 статье)

О комбинированном алгоритме обнаружения заимствований в текстовых документах

К. Ф. Сафинa, Ю. В. Чеховичbc

a Московский физико-технический институт
b Федеральный исследовательский центр «Информатика и управление» РАН
c Компания Антиплагиат
Аннотация: Поиск заимствований в текстовом документе по отношению к обширной коллекции потенциальных источников является вычислительно тяжелой задачей. При этом существуют так называемые внутренние методы поиска заимствований, которые не используют внешний корпус, а анализируют исключительно проверяемый документ. Эти методы не отличаются точностью, но обеспечивают довольно высокую производительность. В работе предложен комбинированный подход к обнаружению текстовых заимствований, основанный на использовании внутренних методов для выявления высокооригинальных документов, проверка которых по внешней коллекции не требуется. Предлагаемый алгоритм призван разгрузить систему поиска заимствований по внешней коллекции, отфильтровывая документы с высокой степенью оригинальности. В работе предлагается алгоритм поиска внутренних заимствований, описываются результаты вычислительных экспериментов.
Ключевые слова: обработка естественного языка, обнаружение заимствований, внутренние заимствования, поиск выбросов в статистике, антиплагиат.
Тип публикации: Статья
Образец цитирования: К. Ф. Сафин, Ю. В. Чехович, “О комбинированном алгоритме обнаружения заимствований в текстовых документах”, Труды ИСП РАН, 34:1 (2022), 151–160
Цитирование в формате AMSBIB
\RBibitem{SafChe22}
\by К.~Ф.~Сафин, Ю.~В.~Чехович
\paper О комбинированном алгоритме обнаружения заимствований в текстовых документах
\jour Труды ИСП РАН
\yr 2022
\vol 34
\issue 1
\pages 151--160
\mathnet{http://mi.mathnet.ru/tisp671}
\crossref{https://doi.org/10.15514/ISPRAS-2022-34(1)-11}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/tisp671
  • https://www.mathnet.ru/rus/tisp/v34/i1/p151
  • Эта публикация цитируется в следующих 1 статьяx:
    Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Труды института системного программирования РАН
    Статистика просмотров:
    Страница аннотации:23
    PDF полного текста:10
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024