Труды СПИИРАН
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Информатика и автоматизация:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Труды СПИИРАН, 2020, выпуск 19, том 6, страницы 1198–1221
DOI: https://doi.org/10.15622/ia.2020.19.6.3
(Mi trspy1130)
 

Эта публикация цитируется в 1 научной статье (всего в 1 статье)

Математическое моделирование и прикладная математика

New method for optimal feature set reduction
[Новый метод оптимального сокращения множества признаков]

O. German, S. Nasr

Belarusian State University of Informatics and Radioelectronics (BSUIR)
Аннотация: Рассматривается задача нахождения минимального по размеру множества атрибутов, используемых для распределения многомерных объектов по классам, например на основе деревьев решений. Задача имеет важное значение при разработке высокопроизводительных и точных классифицирующих систем. Приведен краткий сравнительный обзор известных методов. Задача сформулирована как отыскание минимального (взвешенного) покрытия на различающей 0,1-матрице, которая служит для описания возможности атрибутов разделять пары объектов из разных классов. Приведено описание способа построения различающей матрицы. Сформулированы и решены на основе общего разрешающего принципа групповых резолюций следующие варианты задачи: отыскание минимального по размеру множества атрибутов на заданном входном наборе данных; отыскание минимального по размеру множества атрибутов с минимальным суммарным весом атрибутов (в качестве весов атрибутов можно использовать величины, определяемые на основе известных алгоритмов, например на основе метода RELIEF); нахождение оптимального взвешенного нечеткого покрытия для случая, когда элементы различающей матрицы принимают значения в диапазоне [0,1]; определение статистически оптимального покрытия различающей матрицы (например, для входных наборов данных больших размеров). Статистически оптимальный алгоритм позволяет ограничить время решения полиномом от размеров задачи и плотности единичных элементов в различающей матрице и при этом обеспечить близкую к единице вероятность отыскания точного решения.
Таким образом, предлагается общий подход к определению минимального по размеру множества атрибутов, учитывающий различные особенности в постановке задачи, что отличает данный подход от известных. Изложение содержит многочисленные иллюстрации с целью придать ему максимальную ясность. Ряд теоретических положений, приводимых в статье, основывается на ранее опубликованных результатах. В заключительной части представлены результаты экспериментов, а также сведения о сокращении размерности задачи о покрытии для больших массивов данных. Отмечаются некоторые перспективные направления изложенного подхода, включая работу с неполными и качественными данными, интегрировании управляющей модели в систему классификации данных.
Ключевые слова: многомерные данные, классификация, минимизация размера множества атрибутов, задача о минимальном покрытии, принцип групповых резолюций.
Поступила в редакцию: 29.07.2020
Тип публикации: Статья
УДК: 519.7
Язык публикации: английский
Образец цитирования: O. German, S. Nasr, “New method for optimal feature set reduction”, Тр. СПИИРАН, 19:6 (2020), 1198–1221
Цитирование в формате AMSBIB
\RBibitem{GerNas20}
\by O.~German, S.~Nasr
\paper New method for optimal feature set reduction
\jour Тр. СПИИРАН
\yr 2020
\vol 19
\issue 6
\pages 1198--1221
\mathnet{http://mi.mathnet.ru/trspy1130}
\crossref{https://doi.org/10.15622/ia.2020.19.6.3}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/trspy1130
  • https://www.mathnet.ru/rus/trspy/v19/i6/p1198
  • Эта публикация цитируется в следующих 1 статьяx:
    Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Информатика и автоматизация
    Статистика просмотров:
    Страница аннотации:98
    PDF полного текста:39
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024