Аннотация:
В работе представлен метод, направленный на повышение надежности
байесовского классификатора. Метод заключается в добавлении
к обучающей выборке из смеси распределений двух исходных классов
искусственно сгенерированных наблюдений из третьего, “фонового” класса,
равномерно распределенного на компакте, содержащем неизвестный
носитель исходной смеси. Такая модификация позволяет приблизить
к заданному (в нашем случае к нулевому) уровню значение
дискриминантной функции вне носителя распределения обучающих данных.
Добавление варианта решения “Отказ от классификации”, принимаемого
классификатором при достаточно малых значениях дискриминантной
функции, приводит к локальному повышению его надежности. В частности,
такой подход позволяет решить несколько проблем:
отказаться от обработки данных, сильно отличающихся от обучающих;
выявлять аномальные значения во входных данных; отказаться от
принятия решений в “пограничных” областях при разделении на классы.
В статье приводится теоретическое обоснование оптимальности
предлагаемого классификатора. Практическая ценность метода
демонстрируется на задачах классификации изображений
и временных рядов.
Также предложена методика выделения доверенных областей,
которую можно использовать для выявления аномальных данных,
случаев смещения параметров распределения классов, выделения областей
пересечения распределений исходных классов. На основе доверенных
областей введены количественные показатели надежности и
эффективности классификатора.
Библиография: 23 названия.
Работа выполнена при поддержке гранта
для исследовательских центров в области искусственного интеллекта,
предоставленного Аналитическим центром при Правительстве Российской Федерации в соответствии с соглашением
о предоставлении субсидии (идентификатор соглашения 000000D730321P5Q0002)
и соглашением с Институтом системного программирования им. В. П. Иванникова
от 02 ноября 2021 г. № 70-2021-00142.
Поступила в редакцию: 05.09.2024
Тип публикации:
Статья
УДК:
004.8+519.6
Образец цитирования:
К. С. Лукьянов, П. А. Яськов, А. И. Перминов, А. П. Коваленко, Д. Ю. Турдаков, “Экстраполяция байесовского классификатора при неизвестном носителе распределения смеси двух классов”, УМН, 79:6(480) (2024), 57–82