К. В. Чувилин, “Эффективный алгоритм сравнения документов в формате LATEX”, Компьютерные исследования и моделирование, 7:2 (2015), 329

Компьютерные исследования и моделирование

RUS ENG

ЖУРНАЛЫ ПЕРСОНАЛИИ ОРГАНИЗАЦИИ КОНФЕРЕНЦИИ СЕМИНАРЫ ВИДЕОТЕКА ПАКЕТ AMSBIB

JavaScript is disabled in your browser. Please switch it on to enable full functionality of the website

	Общая информация
	Последний выпуск
	Архив

	Поиск публикаций
	Поиск ссылок

	RSS
	Последний выпуск
	Текущие выпуски
	Архивные выпуски
	Что такое RSS

Компьютерные исследования и моделирование:
Год:
Том:
Выпуск:
Страница:
	Найти

Персональный вход:
Логин:
Пароль:
	Запомнить пароль
	Войти
	Забыли пароль?
	Регистрация

Компьютерные исследования и моделирование, 2015, том 7, выпуск 2, страницы 329–345
DOI: https://doi.org/10.20537/2076-7633-2015-7-2-329-345 (Mi crm191)

Эта публикация цитируется в 2 научных статьях (всего в 2 статьях)

МОДЕЛИ В ФИЗИКЕ И ТЕХНОЛОГИИ

Эффективный алгоритм сравнения документов в формате LATEX

К. В. Чувилин

Московский физико-технический институт (ГУ), Россия, 141700, Московская область, г. Долгопрудный, Институтский переулок, д. 9

PDF полного текста (337 kB) Список цитирования (2)

Список литературы:

PDF

HTML

DOI: https://doi.org/10.20537/2076-7633-2015-7-2-329-345

Аннотация: Рассматривается задача построения различий, возникающих при редактировании документов в формате LATEX. Каждый документ представляется в виде синтаксического дерева, узлы которого называются токенами. Строится минимально возможное текстовое представление документа, не меняющее синтаксическое дерево. Весь текст разбивается на фрагменты, границы которых соответствуют токенам. С помощью алгоритма Хиршберга строится отображение последовательности текстовых фрагментов изначального документа в аналогичную последовательность отредактированного документа, соответствующее минимальному редактирующему расстоянию. Строится отображение символов текстов, соответствующее отображению последовательностей текстовых фрагментов. В синтаксических деревьях выделяются токены такие, что символы соответствующих фрагментов текста при отображении либо все не меняются, либо все удаляются, либо все добавляются. Для деревьев, образованных остальными токенами, строится отображение с помощью алгоритма Zhang-Shasha.

Ключевые слова: автоматизация, анализ текста, лексема, машинное обучение, метрика, редактирующее расстояние, синтаксическое дерево, токен, LATEX.

Поступила в редакцию: 16.07.2013
Исправленный вариант: 04.02.2015

Тип публикации: Статья

УДК: 519.226

Образец цитирования: К. В. Чувилин, “Эффективный алгоритм сравнения документов в формате LATEX”, Компьютерные исследования и моделирование, 7:2 (2015), 329–345

Цитирование в формате AMSBIB

\RBibitem{Chu15}

\by К.~В.~Чувилин

\paper Эффективный алгоритм сравнения документов в формате LATEX

\jour Компьютерные исследования и моделирование

\yr 2015

\vol 7

\issue 2

\pages 329--345

\mathnet{http://mi.mathnet.ru/crm191}

\crossref{https://doi.org/10.20537/2076-7633-2015-7-2-329-345}

Образцы ссылок на эту страницу:

https://www.mathnet.ru/rus/crm191

https://www.mathnet.ru/rus/crm/v7/i2/p329

Эта публикация цитируется в следующих 2 статьяx:

Citing articles in Google Scholar: Russian citations, English citations
Related articles in Google Scholar: Russian articles, English articles

Компьютерные исследования и моделирование

Статистика просмотров:
Страница аннотации:	182
PDF полного текста:	220
Список литературы:	35

Что такое QR-код?

Обратная связь:

Пользовательское соглашение

Регистрация посетителей портала

Логотипы