|
Эта публикация цитируется в 4 научных статьях (всего в 4 статьях)
Статистика и кластеры в поисках аномальных вкраплений в условиях больших данных
А. А. Грушоa, Н. А. Грушоa, М. И. Забежайлоa, Д. В. Смирновb, Е. Е. Тимонинаa, С. Я. Шоргинa a Федеральный исследовательский центр «Информатика и управление» Российской академии наук
b ПАО Сбербанк России
Аннотация:
Построены алгоритмы снижения уровня «ложных тревог» (ЛТ) при поиске аномалий в сложных гетерогенных последовательностях объектов (Big Data). Традиционно в математической статистике такое снижение достигается за счет минимизации ошибки ЛТ. Однако в задачах выявления аномалий (редкие вкрапления аномальных данных) такой подход ведет к повышению вероятности потери искомых аномалий. Чтобы не потерять искомые аномалии, в данной работе предлагается, наоборот, в критериях, рассчитанных на наименьшую сложность вычислений, допустить большую ошибку появления ЛТ, но использовать тот факт, что выделенных такими критериями объектов значительно меньше, чем исходных объектов в Big Data. Тогда выделенные объекты можно объединить в один кластер и использовать дополнительную информацию, связанную с объектами этого кластера, для выявления искомых аномалий. Смысл этих действий состоит в том, что более сложно вычислимые характеристики объектов для отсева ЛТ не потребуют больших вычислительных ресурсов на меньшем относительно исходных данных кластере объектов. Показано, что при выполнении некоторых условий порядок использования дополнительной информации не влияет на результат ее использования при фильтрации ЛТ. Результаты применения алгоритма фильтрации в последовательности объектов обобщены на фильтрацию ЛТ в форме причинно-следственных схем в исходных данных. При известных схемах показано, как можно фильтровать ЛТ, выявляя только фрагменты схем.
Ключевые слова:
информационная безопасность, поиск аномалий, алгоритмы фильтрации «ложных тревог».
Поступила в редакцию: 17.09.2021
Образец цитирования:
А. А. Грушо, Н. А. Грушо, М. И. Забежайло, Д. В. Смирнов, Е. Е. Тимонина, С. Я. Шоргин, “Статистика и кластеры в поисках аномальных вкраплений в условиях больших данных”, Информ. и её примен., 15:4 (2021), 79–86
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/ia760 https://www.mathnet.ru/rus/ia/v15/i4/p79
|
Статистика просмотров: |
Страница аннотации: | 144 | PDF полного текста: | 43 | Список литературы: | 24 |
|