Труды института системного программирования РАН
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Труды ИСП РАН:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Труды института системного программирования РАН, 2021, том 33, выпуск 4, страницы 131–146
DOI: https://doi.org/10.15514/ISPRAS-2021-33(4)-10
(Mi tisp618)
 

Алгоритм маркирования текстовых документов на основе изменения интервалов между словами, обеспечивающий устойчивость к преобразованию формата

А. В. Козачокa, С. А. Копыловa, П. Н. Горбачевa, А. Е. Гайновb, Б. В. Кондратьевb

a Академия Федеральной службы охраны Российской Федерации
b Министерство обороны Российской Федерации
Аннотация: В статье представлен алгоритм маркирования электронных текстовых документов, основанный на внедрении идентификационной информации за счет изменения величин интервалов между словами. Разработка алгоритма направлена на повышение защищенности документов, содержащих текстовую информацию, от утечки по каналу, обусловленному передачей напечатанных на бумаге документов, а также соответствующих электронных копий бумажных документов. В процессе разработки алгоритма маркирования проведен анализ существующих средств защиты бумажных документов от утечки, рассмотрены практические решения в области защиты текстовых документов, определены их достоинства и недостатки. В качестве подхода к внедрению информации выступает алгоритм изменения величин интервалов между словами. Изменение величин интервалов между словами основано на встраивании удлиненного пробела в выделенные области строк текста и корректировке остальных значений величин интервалов между словами на рассчитанные значения. Для обеспечения инвариантности встроенного маркера к печати и последующему сканированию или фотографированию разработаны алгоритмы формирования областей встраивания и матрицы встраивания. В процессе формирования областей встраивания из строк текста исходного документа формируются массивы пробелов, состоящие из пар: по четыре и два пробела или по два пробела. Посредством встраиваемой информации в сформированных областях определятся места встраивания удлиненного пробела. В процессе встраивания маркера формируется матрица встраивания, содержащая значения смещения слов, и осуществляется ее встраивание в исходный документ при печати. Применение разработанного алгоритма маркирования позволяет внедрять в структуру текста электронного документа маркер, инвариантный к преобразованию формата электронного документа в бумажный посредством печати и обратно через сканирование или фотографирование. Представлены особенности и ограничения разработанного алгоритма маркирования. Определены направления дальнейших исследований.
Ключевые слова: защита от утечки информации, маркирование, распознавание образов, обработка изображений, текстовые документы.
Тип публикации: Статья
Образец цитирования: А. В. Козачок, С. А. Копылов, П. Н. Горбачев, А. Е. Гайнов, Б. В. Кондратьев, “Алгоритм маркирования текстовых документов на основе изменения интервалов между словами, обеспечивающий устойчивость к преобразованию формата”, Труды ИСП РАН, 33:4 (2021), 131–146
Цитирование в формате AMSBIB
\RBibitem{KozKopGor21}
\by А.~В.~Козачок, С.~А.~Копылов, П.~Н.~Горбачев, А.~Е.~Гайнов, Б.~В.~Кондратьев
\paper Алгоритм маркирования текстовых документов на основе изменения интервалов между словами, обеспечивающий устойчивость к преобразованию формата
\jour Труды ИСП РАН
\yr 2021
\vol 33
\issue 4
\pages 131--146
\mathnet{http://mi.mathnet.ru/tisp618}
\crossref{https://doi.org/10.15514/ISPRAS-2021-33(4)-10}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/tisp618
  • https://www.mathnet.ru/rus/tisp/v33/i4/p131
  • Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Труды института системного программирования РАН
    Статистика просмотров:
    Страница аннотации:17
    PDF полного текста:9
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024