|
Combined classifier for website messages filtration
[Совмещенный классификатор для фильтрации сообщений на веб сайтах]
Veniamin Tarasov, Еkaterina Mezenceva, Danila Karbaev Volga Region State University of Telecommunications and Informatics
Аннотация:
работе рассмотрен новый подход к фильтрации сообщений на сайтах с использованием совмещенного классификатора. Уровень защиты пользовательских данных определен стандартами информационной безопасности для Интернет-ресурсов, кроме того постоянно растет число спам-сообщений в интерактивных разделах сайтов. Предлагаемый подход, в отличие от распространенных решений для электронной почты, основан на совместном использовании методов Байеса и Фишера, что позволило разработать эффективное программное решение фильтрации спама. Основная идея классификации сообщений заключается в выделении всех признаков, вычисления вероятностей для отдельных признаков, и затем объединения всех вычисленных вероятностей в значение для всего сообщения. Рассмотрены критерии оптимальности при классификации сообщений на основе статистических моделей. В качестве примера были установлены пороговые значения, обеспечивающие минимум пропуска в спам нужных сообщений, т.е. минимум ложных срабатываний. Для получения более достоверных результатов выявления спама необходимо проводить анализ множеств результатов работы отдельных фильтров и подмножества их пересечений. В работе рассмотрен подход к построению совмещенного классификатора, удовлетворяющего критериям оптимальности и обеспечивающего принятие решений при классификации сообщений на основе статистических методов. Нами предлагается именно такой подход к организации классификатора, который заключается в совместном использовании методов Байеса и Фишера для повышения качества фильтрации на основе анализа подмножеств пересечения множеств, распознанных обоими методами (спам/не спам, ложные срабатывания и пропуск спама). Благодаря реализации совмещенного фильтра можно обоснованно сравнивать качество обученности совмещенного фильтра.
Ключевые слова:
совмещенный классификатор, спам фильтр, критерий оптимизации.
Образец цитирования:
Veniamin Tarasov, Еkaterina Mezenceva, Danila Karbaev, “Combined classifier for website messages filtration”, Труды ИСП РАН, 27:3 (2015), 291–302
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/tisp152 https://www.mathnet.ru/rus/tisp/v27/i3/p291
|
Статистика просмотров: |
Страница аннотации: | 113 | PDF полного текста: | 56 | Список литературы: | 35 |
|