Труды института системного программирования РАН
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Труды ИСП РАН:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Труды института системного программирования РАН, 2015, том 27, выпуск 1, страницы 151–172
DOI: https://doi.org/10.15514/ISPRAS-2015-27(1)-8
(Mi tisp117)
 

Эта публикация цитируется в 1 научной статье (всего в 1 статье)

Применение временных рядов в задаче фоновой идентификации пользователей на основе анализа их работы с текстовыми данными

В. Ю. Королев, А. Ю. Корчагин, И. В. Машечкин, М. И. Петровский, Д. В. Царёв

Факультет вычислительной математики и кибернетики, Московский государственный университет имени М.В. Ломоносова
Список литературы:
Аннотация: В статье представлен новый подход идентификации пользователя на основе анализа его поведения при работе с текстовой информацией. Для описания поведения пользователя предлагается использовать содержимое текстовых документов, к которым он обращался. Структурированное представление рассматриваемой поведенческой информации осуществляется на основе отображения содержимого электронных документов в тематическое пространство пользователя, формируемое с использованием неотрицательной матричной факторизации. Веса выделенных тематик в документе характеризуют тематическую направленность пользователя во время работы с данным документом. Изменение значений весов тематик во времени формирует многомерный временной ряд, описывающий историю поведения пользователя при работе с текстовыми данными. Построение прогноза такого временного ряда позволит осуществлять идентификацию данного пользователя на основе оценки отклонений наблюдаемой тематической направленности пользователя от спрогнозированных значений. В рамках предложенного подхода был разработан собственный оригинальный метод прогнозирования временных рядов, основанный на ортонормированной неотрицательной матричной факторизации (ОНМФ). Важно отметить, что ранее методы неотрицательной матричной факторизации не использовался для решения задачи прогнозирования временных рядов. Проведённое экспериментальное исследование на примере реальной корпоративной переписки пользователей, сформированной из набора данных Enron, показало применимость предложенного подхода идентификации пользователя. Кроме того, эксперименты с применением других популярных на сегодняшний день методами прогнозирования показали превосходство разработанного метода на основе ОНМФ по качеству классификации тематических характеристик пользователя. Также в работе исследовались два различных подхода оценки отклонений: абсолютная оценка и оценка p-значения. Эксперименты показали, что оба рассмотренные подхода расчёта оценки отклонения временной точки от прогноза применимы в предложенном подходе идентификации пользователя.
Ключевые слова: компьютерная безопасность, идентификация пользователя, тематическое моделирование, ортонормированная неотрицательная матричная факторизация, прогнозирование временных рядов.
Финансовая поддержка Номер гранта
Министерство образования и науки Российской Федерации RFMEFI60414X0056
Работы выполнены при финансовой поддержке Минобрнауки России (Соглашение № 14.604.21.0056 о предоставлении субсидии, Уникальный идентификатор прикладных научных исследований RFMEFI60414X0056).
Реферативные базы данных:
Тип публикации: Статья
Образец цитирования: В. Ю. Королев, А. Ю. Корчагин, И. В. Машечкин, М. И. Петровский, Д. В. Царёв, “Применение временных рядов в задаче фоновой идентификации пользователей на основе анализа их работы с текстовыми данными”, Труды ИСП РАН, 27:1 (2015), 151–172
Цитирование в формате AMSBIB
\RBibitem{KorKorMas15}
\by В.~Ю.~Королев, А.~Ю.~Корчагин, И.~В.~Машечкин, М.~И.~Петровский, Д.~В.~Царёв
\paper Применение временных рядов в задаче фоновой идентификации пользователей на основе анализа их работы с текстовыми данными
\jour Труды ИСП РАН
\yr 2015
\vol 27
\issue 1
\pages 151--172
\mathnet{http://mi.mathnet.ru/tisp117}
\crossref{https://doi.org/10.15514/ISPRAS-2015-27(1)-8}
\elib{https://elibrary.ru/item.asp?id=23420345}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/tisp117
  • https://www.mathnet.ru/rus/tisp/v27/i1/p151
  • Эта публикация цитируется в следующих 1 статьяx:
    Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Труды института системного программирования РАН
    Статистика просмотров:
    Страница аннотации:270
    PDF полного текста:142
    Список литературы:41
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024