|
HTTP-request classification in automatic web application crawling
[Классификация HTTP-запросов к серверу в задаче автоматического обхода современных веб-приложений]
A. V. Lapkina, A. A. Petukhov Lomonosov Moscow State University
Аннотация:
Задача автоматической классификации запросов приложения, а также задача определения правил маршрутизации запросов на сервере напрямую связана с анализом пользовательского интерфейса динамических веб-страниц и может быть решена на уровне браузера, поскольку он содержит полную информацию о возможных запросах, возникающих при взаимодействии пользователя с каждой из страниц веб-приложения. В данной работе для решения поставленной задачи предлагается использовать данные из контекста выполнения запроса в веб-клиенте с целью выделения дополнительных признаков для классификации запросов. При этом в качестве контекста возникновения или трассы запроса рассматривается совокупность дополнительных идентификационных данных, которые можно получить, наблюдая за выполнением JavaScript-кода на веб-странице или за изменением элементов пользовательского интерфейса в результате активации интерфейсных элементов. К таким данным, например, можно отнести положение и стиль элемента, вызвавшего клиентский запрос, стек вызовов функций JavaScript и изменение в DOM-дереве страницы после запроса. В рамках данной работы для автоматизации выделения трасс запросов и их последующей классификации используется реализация протокола Chrome DevTools.
Ключевые слова:
классификация запросов, динамические веб-приложения, автоматический обход приложений, протокол Chrome DevTools.
Образец цитирования:
A. V. Lapkina, A. A. Petukhov, “HTTP-request classification in automatic web application crawling”, Труды ИСП РАН, 33:3 (2021), 77–86
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/tisp600 https://www.mathnet.ru/rus/tisp/v33/i3/p77
|
Статистика просмотров: |
Страница аннотации: | 468 | PDF полного текста: | 76 | Список литературы: | 24 |
|