|
Detecting malicious activity in open-source projects using machine learning methods
[Обнаружение вредоносной активности в проектах с открытым исходным кодом с помощью методов машинного обучения]
S. A. Rakovsky MIREA — Russian Technological University, Moscow
Аннотация:
Python Package Index (PyPI) является основным хранилищем проектов для языка программирования Python и используется пакетным менеджером pip по умолчанию. PyPI является бесплатной и свободной платформой с открытым исходным кодом: каждый может зарегистрировать пользователя в PyPI и опубликовать свой проект, а также в случае надобности изучить исходный код. Платформа не проверяет проекты, опубликованные пользователями, оставляя возможность пожаловаться на вредоносный проект посредством e-mail. При этом не пройдет и месяца, как аналитики вновь и вновь обнаруживают вредоносные пакеты на PyPI. Организации, работающие в сфере обеспечения безопасности открытых репозитория, тщательно следят за появляющимися проектами. К сожалению, этого недостаточно: некоторые вредоносные проекты обнаруживают и удаляют лишь спустя несколько месяцев после публикации. В рамках данной работы предложен алгоритм автоматического выбора признаков, опирающийся на биграммы и свойства кода, и обучен ET-классификатор, позволяющий с высокой достоверностью определять некоторые виды вредоносной логики в коде. В качестве обучающей выборки были взяты репозитории вредоносного кода MalRegistry и DataDog. После обучения модель была протестирована на трёх последних релизах всех существующих на данный момент проектов на PyPI, и ей удалось найти 28 ранее не обнаруженных вредоносных проекта, старший из которых существовал почти полтора года. Подход, примененный в работе, позволяет также сканировать публикуемые проекты в режиме реального времени, что может быть использовано для оперативного обнаружения вредоносной активности. В рамках работы дополнительное внимание акцентируется на методах, которые не требуют эксперта для отбора признаков и контроля отобранных признаков, что уменьшает нагрузку на людей.
Ключевые слова:
pypi, обнаружение вредоносного программного обеспечения, безопасность открытого программного обеспечения, открытое программное обеспечение
Образец цитирования:
S. A. Rakovsky, “Detecting malicious activity in open-source projects using machine learning methods”, Труды ИСП РАН, 36:3 (2024), 161–166
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/tisp894 https://www.mathnet.ru/rus/tisp/v36/i3/p161
|
Статистика просмотров: |
Страница аннотации: | 5 | PDF полного текста: | 2 |
|