И. Ю. Торшин, “О порождении синтетических признаков на основе опорных цепей и произвольных метрик в рамках топологического подхода к анализу данных. Часть 2. Экспериментальная апробация на задачах фармакоинформатики”, Информ. и её примен., 18:2 (2024), 47

Информатика и её применения

RUS ENG

ЖУРНАЛЫ ПЕРСОНАЛИИ ОРГАНИЗАЦИИ КОНФЕРЕНЦИИ СЕМИНАРЫ ВИДЕОТЕКА ПАКЕТ AMSBIB

JavaScript is disabled in your browser. Please switch it on to enable full functionality of the website

	Общая информация
	Последний выпуск
	Архив
	Импакт-фактор

	Поиск публикаций
	Поиск ссылок

	RSS
	Последний выпуск
	Текущие выпуски
	Архивные выпуски
	Что такое RSS

Информ. и её примен.:
Год:
Том:
Выпуск:
Страница:
	Найти

Персональный вход:
Логин:
Пароль:
	Запомнить пароль
	Войти
	Забыли пароль?
	Регистрация

Информатика и её применения, 2024, том 18, выпуск 2, страницы 47–53
DOI: https://doi.org/10.14357/19922264240207 (Mi ia899)

О порождении синтетических признаков на основе опорных цепей и произвольных метрик в рамках топологического подхода к анализу данных. Часть 2. Экспериментальная апробация на задачах фармакоинформатики

И. Ю. Торшин

Федеральный исследовательский центр «Информатика и управление» Российской академии наук

PDF полного текста (211 kB)

Список литературы:

PDF

HTML

DOI: https://doi.org/10.14357/19922264240207

Аннотация: Рассмотрение прецедентных отношений между признаками и таргетной переменной в виде наборов элементов булевой решетки указывает на возможность порождения синтетических признаков с использованием метрических функций расстояния. Сформулированы подходы к (1) оценке релевантности («информативности») метрик по отношению к решаемым задачам, (2) порождению и (3) отбору синтетических признаков, более информативных, чем исходные признаковые описания. Представленные результаты топологического анализа 2400 выборок данных «молекула–свойство» из ProteomicsDB позволили получить достаточно эффективные алгоритмы прогнозирования свойств молекул (ранговая корреляция в кросс-валидации — 90$\pm$0,23). На данной выборке задач установлены метрики, которые наиболее часто порождают информативные синтетические признаки: максимальное уклонение Колмогорова, «косое» расстояние, метрики Lp, Реньи, фон Мизеса. Для решения изученного комплекса задач показано преимущество полиномных корректоров по сравнению с нейросетевыми и с корректорами типа «случайный лес».

Ключевые слова: топологический анализ данных, теория решеток, алгебраический подход Ю. И. Журавлёва, фармакоинформатика.

Финансовая поддержка	Номер гранта
Российский научный фонд	23-21-00154
Работа выполнена при поддержке гранта РНФ (проект № 23-21-00154) с использованием инфраструктуры Центра коллективного пользования «Высокопроизводительные вычисления и большие данные» (ЦКП «Информатика») ФИЦ ИУ РАН (г. Москва).

Поступила в редакцию: 09.04.2024

Реферативные базы данных:

Тип публикации: Статья

Образец цитирования: И. Ю. Торшин, “О порождении синтетических признаков на основе опорных цепей и произвольных метрик в рамках топологического подхода к анализу данных. Часть 2. Экспериментальная апробация на задачах фармакоинформатики”, Информ. и её примен., 18:2 (2024), 47–53

Цитирование в формате AMSBIB

\RBibitem{Tor24}

\by И.~Ю.~Торшин

\paper О порождении синтетических признаков на основе опорных цепей и произвольных метрик в рамках топологического подхода к анализу данных. Часть~2. Экспериментальная апробация на задачах фармакоинформатики

\jour Информ. и её примен.

\yr 2024

\vol 18

\issue 2

\pages 47--53

\mathnet{http://mi.mathnet.ru/ia899}

\crossref{https://doi.org/10.14357/19922264240207}

\edn{https://elibrary.ru/OTXCUD}

Образцы ссылок на эту страницу:

https://www.mathnet.ru/rus/ia899

https://www.mathnet.ru/rus/ia/v18/i2/p47

Цикл статей

О порождении синтетических признаков на основе опорных цепей и произвольных метрик в рамках топологического подхода к анализу данных. Часть 1. Включение в формализм эмпирических функций расстояния
И. Ю. Торшин
Информ. и её примен., 2024, 18:1, 71–77
О порождении синтетических признаков на основе опорных цепей и произвольных метрик в рамках топологического подхода к анализу данных. Часть 2. Экспериментальная апробация на задачах фармакоинформатики
И. Ю. Торшин
Информ. и её примен., 2024, 18:2, 47–53

Citing articles in Google Scholar: Russian citations, English citations
Related articles in Google Scholar: Russian articles, English articles

Что такое QR-код?

Обратная связь:

Пользовательское соглашение

Регистрация посетителей портала

Логотипы