|
Эта публикация цитируется в 1 научной статье (всего в 1 статье)
Способ оценки похожести программ методами машинного обучения
П. Д. Борисовa, Ю. В. Косолаповb a Научно-исследовательский институт “Специализированные вычислительные устройства защиты и автоматика”, г. Ростов-на-Дону
b Южный федеральный университет
Аннотация:
В работе рассматривается задача построения алгоритма сравнения двух исполнимых файлов. В основе алгоритма лежит построение по заданной паре программ вектора показателей похожести и принятие на основе этого вектора решения о похожести или непохожести программ с помощью методов машинного обучения. Показатели похожести строятся с помощью алгоритмов двух типов: с помощью алгоритмов, не учитывающих формат входных данных (значения нечетких хеш-функций, значения коэффициентов сжатия), и с помощью алгоритмов, выполняющих анализ машинного кода (с помощью дизассемблеров). Всего построено 15 показателей: 9 показателей первого типа и 6 второго. На основе построенного обучающего множества пар похожих и непохожих программ (на основе набора программ coreutils) обучены и протестированы 7 разных бинарных классификаторов. Результаты экспериментов показали высокую точность моделей на основе случайного леса и k ближайших соседей. Также выявлено, что совместное применение показателей обоих типов может увеличить точность классификации.
Ключевые слова:
обфускация, похожесть программ, машинное обучение
Образец цитирования:
П. Д. Борисов, Ю. В. Косолапов, “Способ оценки похожести программ методами машинного обучения”, Труды ИСП РАН, 34:5 (2022), 63–76
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/tisp721 https://www.mathnet.ru/rus/tisp/v34/i5/p63
|
Статистика просмотров: |
Страница аннотации: | 17 | PDF полного текста: | 8 |
|