Труды института системного программирования РАН
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Труды ИСП РАН:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Труды института системного программирования РАН, 2020, том 32, выпуск 5, страницы 81–94
DOI: https://doi.org/10.15514/ISPRAS-2020-32(5)-6
(Mi tisp545)
 

Эта публикация цитируется в 15 научных статьях (всего в 15 статьях)

Синтез модели машинного обучения для обнаружения компьютерных атак на основе набора данных CICIDS2017

М. Н. Горюнов, А. Г. Мацкевич, Д. А. Рыболовлев

Академия ФСО России
Список литературы:
Аннотация: В работе рассмотрены вопросы построения и практической реализации модели обнаружения компьютерных атак на основе методов машинного обучения. Среди доступных публичных наборов данных выбран один из наиболее актуальных – CICIDS2017. Для рассматриваемого набора данных подробно разработаны процедуры предварительной обработки данных и сэмплирования. При проведении экспериментов для сокращения времени вычислений в обучающей выборке оставлен единственный класс компьютерных атак – веб-атаки (brute force, XSS, SQL injection). Последовательно описана процедура формирования признакового пространства, позволившая существенно снизить его размерность – с 85 до 10 наиболее значимых признаков. Произведена оценка качества десяти наиболее распространенных моделей машинного обучения на полученной предобработанной подвыборке данных. Среди моделей (алгоритмов), которые продемонстрировали наилучшие результаты (k-nearest neighbors, decision tree, random forest, AdaBoost, logistic regression), с учетом минимального времени выполнения обоснован выбор модели «случайный лес». На этапе настройки и обучения выбранной модели осуществлен квазиоптимальный подбор гиперпараметров, что позволило добиться повышения качества модели в сравнении с ранее опубликованными результатами исследований. Произведена апробация синтезированной модели обнаружения атак на реальном сетевом трафике, показавшая ее состоятельность только при условии обучения на данных, собираемых в конкретной защищаемой сети, в виду зависимости ряда значимых признаков от физической структуры сети и настроек используемого оборудования. Сделан вывод о возможности применения методов машинного обучения для обнаружения компьютерных атак с учетом указанных ограничений.
Ключевые слова: информационная безопасность, система обнаружения атак, машинное обучение, дерево решений, случайный лес, сетевой трафик, компьютерная атака.
Тип публикации: Статья
Образец цитирования: М. Н. Горюнов, А. Г. Мацкевич, Д. А. Рыболовлев, “Синтез модели машинного обучения для обнаружения компьютерных атак на основе набора данных CICIDS2017”, Труды ИСП РАН, 32:5 (2020), 81–94
Цитирование в формате AMSBIB
\RBibitem{GorMatRyb20}
\by М.~Н.~Горюнов, А.~Г.~Мацкевич, Д.~А.~Рыболовлев
\paper Синтез модели машинного обучения для обнаружения компьютерных атак на основе набора данных CICIDS2017
\jour Труды ИСП РАН
\yr 2020
\vol 32
\issue 5
\pages 81--94
\mathnet{http://mi.mathnet.ru/tisp545}
\crossref{https://doi.org/10.15514/ISPRAS-2020-32(5)-6}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/tisp545
  • https://www.mathnet.ru/rus/tisp/v32/i5/p81
  • Эта публикация цитируется в следующих 15 статьяx:
    Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Труды института системного программирования РАН
    Статистика просмотров:
    Страница аннотации:447
    PDF полного текста:219
    Список литературы:87
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024