Информатика и её применения
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив
Импакт-фактор

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Информ. и её примен.:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Информатика и её применения, 2024, том 18, выпуск 2, страницы 47–53
DOI: https://doi.org/10.14357/19922264240207
(Mi ia899)
 

О порождении синтетических признаков на основе опорных цепей и произвольных метрик в рамках топологического подхода к анализу данных. Часть 2. Экспериментальная апробация на задачах фармакоинформатики

И. Ю. Торшин

Федеральный исследовательский центр «Информатика и управление» Российской академии наук
Список литературы:
Аннотация: Рассмотрение прецедентных отношений между признаками и таргетной переменной в виде наборов элементов булевой решетки указывает на возможность порождения синтетических признаков с использованием метрических функций расстояния. Сформулированы подходы к (1) оценке релевантности («информативности») метрик по отношению к решаемым задачам, (2) порождению и (3) отбору синтетических признаков, более информативных, чем исходные признаковые описания. Представленные результаты топологического анализа 2400 выборок данных «молекула–свойство» из ProteomicsDB позволили получить достаточно эффективные алгоритмы прогнозирования свойств молекул (ранговая корреляция в кросс-валидации — 90$\pm$0,23). На данной выборке задач установлены метрики, которые наиболее часто порождают информативные синтетические признаки: максимальное уклонение Колмогорова, «косое» расстояние, метрики Lp, Реньи, фон Мизеса. Для решения изученного комплекса задач показано преимущество полиномных корректоров по сравнению с нейросетевыми и с корректорами типа «случайный лес».
Ключевые слова: топологический анализ данных, теория решеток, алгебраический подход Ю. И. Журавлёва, фармакоинформатика.
Финансовая поддержка Номер гранта
Российский научный фонд 23-21-00154
Работа выполнена при поддержке гранта РНФ (проект № 23-21-00154) с использованием инфраструктуры Центра коллективного пользования «Высокопроизводительные вычисления и большие данные» (ЦКП «Информатика») ФИЦ ИУ РАН (г. Москва).
Поступила в редакцию: 09.04.2024
Реферативные базы данных:
Тип публикации: Статья
Образец цитирования: И. Ю. Торшин, “О порождении синтетических признаков на основе опорных цепей и произвольных метрик в рамках топологического подхода к анализу данных. Часть 2. Экспериментальная апробация на задачах фармакоинформатики”, Информ. и её примен., 18:2 (2024), 47–53
Цитирование в формате AMSBIB
\RBibitem{Tor24}
\by И.~Ю.~Торшин
\paper О порождении синтетических признаков на основе опорных цепей и произвольных метрик в рамках топологического подхода к анализу данных. Часть~2. Экспериментальная апробация на задачах фармакоинформатики
\jour Информ. и её примен.
\yr 2024
\vol 18
\issue 2
\pages 47--53
\mathnet{http://mi.mathnet.ru/ia899}
\crossref{https://doi.org/10.14357/19922264240207}
\edn{https://elibrary.ru/OTXCUD}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/ia899
  • https://www.mathnet.ru/rus/ia/v18/i2/p47
  • Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Информатика и её применения
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024