Информатика и её применения
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив
Импакт-фактор

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Информ. и её примен.:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Информатика и её применения, 2021, том 15, выпуск 4, страницы 79–86
DOI: https://doi.org/10.14357/19922264210411
(Mi ia760)
 

Эта публикация цитируется в 4 научных статьях (всего в 4 статьях)

Статистика и кластеры в поисках аномальных вкраплений в условиях больших данных

А. А. Грушоa, Н. А. Грушоa, М. И. Забежайлоa, Д. В. Смирновb, Е. Е. Тимонинаa, С. Я. Шоргинa

a Федеральный исследовательский центр «Информатика и управление» Российской академии наук
b ПАО Сбербанк России
Список литературы:
Аннотация: Построены алгоритмы снижения уровня «ложных тревог» (ЛТ) при поиске аномалий в сложных гетерогенных последовательностях объектов (Big Data). Традиционно в математической статистике такое снижение достигается за счет минимизации ошибки ЛТ. Однако в задачах выявления аномалий (редкие вкрапления аномальных данных) такой подход ведет к повышению вероятности потери искомых аномалий. Чтобы не потерять искомые аномалии, в данной работе предлагается, наоборот, в критериях, рассчитанных на наименьшую сложность вычислений, допустить большую ошибку появления ЛТ, но использовать тот факт, что выделенных такими критериями объектов значительно меньше, чем исходных объектов в Big Data. Тогда выделенные объекты можно объединить в один кластер и использовать дополнительную информацию, связанную с объектами этого кластера, для выявления искомых аномалий. Смысл этих действий состоит в том, что более сложно вычислимые характеристики объектов для отсева ЛТ не потребуют больших вычислительных ресурсов на меньшем относительно исходных данных кластере объектов. Показано, что при выполнении некоторых условий порядок использования дополнительной информации не влияет на результат ее использования при фильтрации ЛТ. Результаты применения алгоритма фильтрации в последовательности объектов обобщены на фильтрацию ЛТ в форме причинно-следственных схем в исходных данных. При известных схемах показано, как можно фильтровать ЛТ, выявляя только фрагменты схем.
Ключевые слова: информационная безопасность, поиск аномалий, алгоритмы фильтрации «ложных тревог».
Финансовая поддержка Номер гранта
Российский фонд фундаментальных исследований 18-29-03081_мк
Работа частично поддержана РФФИ (проект 18-29-03081).
Поступила в редакцию: 17.09.2021
Тип публикации: Статья
Образец цитирования: А. А. Грушо, Н. А. Грушо, М. И. Забежайло, Д. В. Смирнов, Е. Е. Тимонина, С. Я. Шоргин, “Статистика и кластеры в поисках аномальных вкраплений в условиях больших данных”, Информ. и её примен., 15:4 (2021), 79–86
Цитирование в формате AMSBIB
\RBibitem{GruGruZab21}
\by А.~А.~Грушо, Н.~А.~Грушо, М.~И.~Забежайло, Д.~В.~Смирнов, Е.~Е.~Тимонина, С.~Я.~Шоргин
\paper Статистика и~кластеры в~поисках аномальных вкраплений в~условиях больших данных
\jour Информ. и её примен.
\yr 2021
\vol 15
\issue 4
\pages 79--86
\mathnet{http://mi.mathnet.ru/ia760}
\crossref{https://doi.org/10.14357/19922264210411}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/ia760
  • https://www.mathnet.ru/rus/ia/v15/i4/p79
  • Эта публикация цитируется в следующих 4 статьяx:
    Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Информатика и её применения
    Статистика просмотров:
    Страница аннотации:157
    PDF полного текста:44
    Список литературы:27
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024