Труды института системного программирования РАН
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Труды ИСП РАН:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Труды института системного программирования РАН, 2018, том 30, выпуск 4, страницы 7–28
DOI: https://doi.org/10.15514/ISPRAS-2018-30(4)-1
(Mi tisp344)
 

Эта публикация цитируется в 4 научных статьях (всего в 4 статьях)

Tolerant parsing with a special kind of «Any» symbol: the algorithm and practical application
[Толерантный синтаксический анализ с использованием специального символа «Any»: алгоритм и практическое применение]

A. V. Goloveshkin, S. S. Mikhalkovich

I.I. Vorovich Institute for Mathematics, Mechanics and Computer Science, Southern Federal University
Список литературы:
Аннотация: Толерантный синтаксический анализ позволяет найти области программы, представляющие интерес в контексте конкретной задачи, и извлечь информацию об их структуре. В то время как эти области должны быть подробно описаны в грамматике языка, другие части программы могут быть не описаны совсем или описаны менее детально, при этом генерируемый парсер должен признавать корректными все возможные вариации программы в нерелевантных областях, то есть, должен быть толерантным по отношению к ним. Островные грамматики — один из основных способов реализации толерантного парсинга. Термином «остров» обозначаются релевантные области кода, термином «вода» - нерелевантный код. В настоящей работе описывается модифицированный LL(1) алгоритм со встроенной обработкой специального символа «Any», позволяющего сопоставлять последовательности токенов, не описанные разработчиком грамматики в явном виде. Применение данного алгоритма к островным грамматикам ведёт к сокращению описания воды и упрощению описания островов. Наша реализация «Any» является более безопасной для использования и менее ограничительной по сравнению с ближайшими аналогами в генераторах Coco/R и LightParse. Также она более предсказуема и требует меньших накладных расходов в сравнении с концепцией «ограниченных морей», внедрённой в PetitParser. На базе алгоритма реализован генератор компиляторов со встроенным языком описания островных грамматик. Как показано в разделе экспериментов, сгенерированный по островной грамматике языка C# толерантный парсер может быть успешно применён для анализа крупных промышленных проектов.
Ключевые слова: толерантный парсинг, устойчивый парсинг, легковесный парсинг, частичный парсинг, островная грамматика, генерация парсеров.
Реферативные базы данных:
Тип публикации: Статья
Язык публикации: английский
Образец цитирования: A. V. Goloveshkin, S. S. Mikhalkovich, “Tolerant parsing with a special kind of «Any» symbol: the algorithm and practical application”, Труды ИСП РАН, 30:4 (2018), 7–28
Цитирование в формате AMSBIB
\RBibitem{GolMik18}
\by A.~V.~Goloveshkin, S.~S.~Mikhalkovich
\paper Tolerant parsing with a special kind of «Any» symbol: the algorithm and practical application
\jour Труды ИСП РАН
\yr 2018
\vol 30
\issue 4
\pages 7--28
\mathnet{http://mi.mathnet.ru/tisp344}
\crossref{https://doi.org/10.15514/ISPRAS-2018-30(4)-1}
\elib{https://elibrary.ru/item.asp?id=32663687}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/tisp344
  • https://www.mathnet.ru/rus/tisp/v30/i4/p7
  • Эта публикация цитируется в следующих 4 статьяx:
    Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Труды института системного программирования РАН
    Статистика просмотров:
    Страница аннотации:194
    PDF полного текста:124
    Список литературы:34
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024