Информатика и её применения
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив
Импакт-фактор

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Информ. и её примен.:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Информатика и её применения, 2020, том 14, выпуск 1, страницы 63–70
DOI: https://doi.org/10.14357/19922264200109
(Mi ia646)
 

Эта публикация цитируется в 6 научных статьях (всего в 6 статьях)

О методах повышения точности многоклассовой классификации на несбалансированных данных

Л. А. Севастьяновa, Е. Ю. Щетининb

a Российский университет дружбы народов
b Финансовый университет при Правительстве РФ
Список литературы:
Аннотация: Проведены исследования методов преодоления разбалансированности классов в данных с целью повышения качества классификации с точностью, более высокой, чем при непосредственном использовании алгоритмов классификации к несбалансированным данным. Для повышения точности классификации в работе предложена схема, состоящая в использовании комбинации алгоритмов классификации и методов отбора признаков RFE (Recursive Feature Elimination), Random Forest и Boruta с предварительным использованием балансирования классов методами случайного семплирования, SMOTE (Synthetic Minority Oversamplimg TEchnique) и ADASYN (ADAptive SYNthetic sampling). На примере данных о заболеваниях кожи проведены компьютерные эксперименты, показавшие, что применение алгоритмов семплирования для устранения дисбаланса классов, а также отбора наиболее информативных признаков значительно повышает точность результатов классификации. Наиболее эффективным по точности классификации оказался алгоритм случайного леса при семплировании данных с использованием алгоритма ADASYN.
Ключевые слова: классификация, несбалансированные данные, семплирование, случайный лес, ADASYN, SMOTE.
Финансовая поддержка Номер гранта
Российский фонд фундаментальных исследований 18-07-00567_а
Работа выполнена при поддержке РФФИ (проект 18-07-00567).
Поступила в редакцию: 29.11.2019
Тип публикации: Статья
Образец цитирования: Л. А. Севастьянов, Е. Ю. Щетинин, “О методах повышения точности многоклассовой классификации на несбалансированных данных”, Информ. и её примен., 14:1 (2020), 63–70
Цитирование в формате AMSBIB
\RBibitem{SevShc20}
\by Л.~А.~Севастьянов, Е.~Ю.~Щетинин
\paper О методах повышения точности многоклассовой классификации на~несбалансированных данных
\jour Информ. и её примен.
\yr 2020
\vol 14
\issue 1
\pages 63--70
\mathnet{http://mi.mathnet.ru/ia646}
\crossref{https://doi.org/10.14357/19922264200109}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/ia646
  • https://www.mathnet.ru/rus/ia/v14/i1/p63
  • Эта публикация цитируется в следующих 6 статьяx:
    Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Информатика и её применения
    Статистика просмотров:
    Страница аннотации:513
    PDF полного текста:707
    Список литературы:39
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024