Труды института системного программирования РАН
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Труды ИСП РАН:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Труды института системного программирования РАН, 2015, том 27, выпуск 3, страницы 291–302
DOI: https://doi.org/10.15514/ISPRAS-2015-27(3)-20
(Mi tisp152)
 

Combined classifier for website messages filtration
[Совмещенный классификатор для фильтрации сообщений на веб сайтах]

Veniamin Tarasov, Еkaterina Mezenceva, Danila Karbaev

Volga Region State University of Telecommunications and Informatics
Список литературы:
Аннотация: работе рассмотрен новый подход к фильтрации сообщений на сайтах с использованием совмещенного классификатора. Уровень защиты пользовательских данных определен стандартами информационной безопасности для Интернет-ресурсов, кроме того постоянно растет число спам-сообщений в интерактивных разделах сайтов. Предлагаемый подход, в отличие от распространенных решений для электронной почты, основан на совместном использовании методов Байеса и Фишера, что позволило разработать эффективное программное решение фильтрации спама. Основная идея классификации сообщений заключается в выделении всех признаков, вычисления вероятностей для отдельных признаков, и затем объединения всех вычисленных вероятностей в значение для всего сообщения. Рассмотрены критерии оптимальности при классификации сообщений на основе статистических моделей. В качестве примера были установлены пороговые значения, обеспечивающие минимум пропуска в спам нужных сообщений, т.е. минимум ложных срабатываний. Для получения более достоверных результатов выявления спама необходимо проводить анализ множеств результатов работы отдельных фильтров и подмножества их пересечений. В работе рассмотрен подход к построению совмещенного классификатора, удовлетворяющего критериям оптимальности и обеспечивающего принятие решений при классификации сообщений на основе статистических методов. Нами предлагается именно такой подход к организации классификатора, который заключается в совместном использовании методов Байеса и Фишера для повышения качества фильтрации на основе анализа подмножеств пересечения множеств, распознанных обоими методами (спам/не спам, ложные срабатывания и пропуск спама). Благодаря реализации совмещенного фильтра можно обоснованно сравнивать качество обученности совмещенного фильтра.
Ключевые слова: совмещенный классификатор, спам фильтр, критерий оптимизации.
Реферативные базы данных:
Тип публикации: Статья
Язык публикации: английский
Образец цитирования: Veniamin Tarasov, Еkaterina Mezenceva, Danila Karbaev, “Combined classifier for website messages filtration”, Труды ИСП РАН, 27:3 (2015), 291–302
Цитирование в формате AMSBIB
\RBibitem{TarMezKar15}
\by Veniamin~Tarasov, Еkaterina~Mezenceva, Danila~Karbaev
\paper Combined classifier for website messages filtration
\jour Труды ИСП РАН
\yr 2015
\vol 27
\issue 3
\pages 291--302
\mathnet{http://mi.mathnet.ru/tisp152}
\crossref{https://doi.org/10.15514/ISPRAS-2015-27(3)-20}
\elib{https://elibrary.ru/item.asp?id=23832949}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/tisp152
  • https://www.mathnet.ru/rus/tisp/v27/i3/p291
  • Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Труды института системного программирования РАН
    Статистика просмотров:
    Страница аннотации:106
    PDF полного текста:50
    Список литературы:25
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024