|
Интеллектуальные системы управления, aнализ данных
Метод энтропийно-рандомизированного восстановления пропущенных данных
Ю. А. Дубновabc, В. Ю. Полищукde, Ю. С. Попковafg, Ю. М. Полищукh, А. В. Мельниковh, Е. С. Соколh a Институт системного анализа Федерального исследовательского центра “Информатика и управление” РАН, Москва
b Национальный исследовательский университет “Высшая школа экономики”, Москва
c Московский физико-технический институт
d Национальный исследовательский Томский политехнический университет
e Институт мониторинга климатических и экологических систем СО РАН
f Брауде Колледж университета Хайфы, Кармиель, Израиль
g Институт проблем управления им. В.А. Трапезникова РАН, Москва
h Югорский НИИ информационных технологий, Ханты-Мансийск
Аннотация:
Статья посвящена проблеме восстановления про́пусков в коллекциях данных для задач машинного обучения. Предложен новый рандомизированный метод восстановления пропущенных данных, основанный на технологии энтропийно-робастного оценивания и генерации ансамблей случайных величин. Предложенный метод схож с использованием вспомогательной регрессии для восстановления пропущенных значений, но в отличие от последней в случае энтропийного оценивания не накладываются дополнительные ограничения на функцию правдоподобия ошибок в выборке и допустимы малые объемы данных, что становится крайне актуальным в задачах, когда объем данных для обучения ограничен, а пропуски встречаются не систематически. Предложенный метод применяется для восстановления пропущенных данных о площадях термокарстовых озер арктической зоны РФ, измеряемых по спутниковым снимкам.
Ключевые слова:
восстановление пропусков, энтропийное оценивание, рандомизированное машинное обучение, термокарстовые озера, Арктика.
Образец цитирования:
Ю. А. Дубнов, Ю. А. Дубнов, В. Ю. Полищук, Ю. С. Попков, Ю. М. Полищук, А. В. Мельников, Е. С. Сокол, “Метод энтропийно-рандомизированного восстановления пропущенных данных”, Автомат. и телемех., 2021, № 4, 140–160; Autom. Remote Control, 82:4 (2021), 670–686
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/at15527 https://www.mathnet.ru/rus/at/y2021/i4/p140
|
Статистика просмотров: |
Страница аннотации: | 239 | PDF полного текста: | 19 | Список литературы: | 45 | Первая страница: | 26 |
|