Аннотация:
В настоящее время в качестве аналитической системы в различных медико-биологических исследованиях применяются биологические микрочипы, содержащие нуклеотиды, белки, пептиды, гликаны и другие биологические молекулы. Современные микрочипы активно модифицируются, увеличивается количество и плотность иммобилизированных молекул. Обработка больших массивов данных, полученных с помощью микрочипов, требует оптимизации алгоритмов их анализа. Данные получение на пептидных микрочипах имеют некоторые особенности и требует применения нестандартных методов статистического анализа. В настоящей работе представлены результаты анализа репертуара антител в сыворотках пациентов с диагнозом раком молочной железы, полученных с помощью микрочипов, содержащих 330 тысяч пептидов. Исследование методов уменьшения размерности, в частности, проекционных методов и методов отбора информативных признаков показало, что метод проекции на латентные структуры позволяет выявить эффективную размерность данных, уменьшить эффект переобучения модели и улучшить качество распознавания объектов. Точность результатов эксперимента оценена при помощи ROC-кривой, и наилучшее качество достигнуто с использованием трёх латентных структур без предварительной нормализации и с использованием всех пептидов.
Ключевые слова:
микрочипы, пептиды, нормализация, латентные переменные, кластеризация, ROC-кривая, метод проекции на латентные структуры.
Исследование выполнено при финансовой поддержке РФФИ в рамках научного проекта № 17-04-00321 и в рамках выполнения государственного задания Минобрнауки России №6.3892.2017/4.6.
Материал поступил в редакцию 04.07.2017, опубликован 29.11.2017
Тип публикации:
Статья
УДК:
57.087
Образец цитирования:
Д. С. Анисимов, С. В. Подлесных, Е. А. Колосова, Д. Н. Щербаков, В. Д. Петрова, С. А. Джонстон, А. Ф. Лазарев, Н. М. Оскорбин, А. И. Шаповал, М. А. Рязанов, “Анализ многомерных данных пептидных микрочипов с использованием метода проекции на латентные структуры”, Матем. биология и биоинформ., 12:2 (2017), 435–445
\RBibitem{AniPodKol17}
\by Д.~С.~Анисимов, С.~В.~Подлесных, Е.~А.~Колосова, Д.~Н.~Щербаков, В.~Д.~Петрова, С.~А.~Джонстон, А.~Ф.~Лазарев, Н.~М.~Оскорбин, А.~И.~Шаповал, М.~А.~Рязанов
\paper Анализ многомерных данных пептидных микрочипов с~использованием метода проекции на латентные структуры
\jour Матем. биология и биоинформ.
\yr 2017
\vol 12
\issue 2
\pages 435--445
\mathnet{http://mi.mathnet.ru/mbb304}
\crossref{https://doi.org/10.17537/2017.12.435}
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/mbb304
https://www.mathnet.ru/rus/mbb/v12/i2/p435
Эта публикация цитируется в следующих 2 статьяx:
Koshechkin A.A., Romanovich V O., Stamate D., Johnston S.A., Zamyatin V A., “Technology of Informative Feature Selection For Immunosignature Analysis”, Sovrem. Tehnol. Med., 12:5 (2020), 19–25
И. Ю. Бойко, Д. С. Анисимов, Л. Л. Смолякова, М. А. Рязанов, “Подход к отбору значимых признаков при решении биомедицинских задач бинарной классификации данных с микрочипов”, Матем. биология и биоинформ., 15:1 (2020), 4–19