|
Эта публикация цитируется в 2 научных статьях (всего в 2 статьях)
МОДЕЛИ В ФИЗИКЕ И ТЕХНОЛОГИИ
Использование синтаксических деревьев для автоматизации коррекции документов в формате LATEX
К. В. Чувилин Московский физико-технический институт (ГУ), 141700, Московская область, г. Долгопрудный, Институтский переулок, 9.
Аннотация:
Рассматривается задача автоматизации коррекции документов в формате LATEX. Каждый документ представляется в виде синтаксического дерева. С помощью модифицированного алгоритма Zhang-Shasha строится отображение вершин дерева изначального документа в вершины дерева отредактированного документа, соответствующее минимальному редактирующему расстоянию. Отображения вершины в вершину составляют обучающую выборку, по которой генерируются правила замены для автоматической коррекции. Для каждого правила собирается статистика его применимости к отредактированным документам. На ее основе производится оценка качества правил и их улучшение.
Ключевые слова:
автоматизация, анализ текста, лексема, машинное обучение, метрика, обучение с подкреплением, регулярное выражение, редактирующее расстояние, синтаксическое дерево, токен, LATEX.
Поступила в редакцию: 20.07.2012
Образец цитирования:
К. В. Чувилин, “Использование синтаксических деревьев для автоматизации коррекции документов в формате LATEX”, Компьютерные исследования и моделирование, 4:4 (2012), 871–883
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/crm536 https://www.mathnet.ru/rus/crm/v4/i4/p871
|
|