Труды СПИИРАН
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Информатика и автоматизация:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Труды СПИИРАН, 2018, выпуск 58, страницы 5–26
DOI: https://doi.org/10.15622/sp.58.1
(Mi trspy1004)
 

Искусственный интеллект, инженерия данных и знаний

A high-performance genome-wide association study algorithm based on analysis of pairs of individuals
[Быстродействующий алгоритм полногеномного поиска ассоциаций на основе анализа пар объектов]

L. V. Utkina, I. L. Utkinaba

a Peter the Great Saint-Petersburg Polytechnic University
b Skolkovo Institute of Science and Technology
Аннотация: Предложен простой быстродействующий алгоритм полногеномного поиска ассоциаций для оценки основного и эпистатического эффекта влияния маркеров или единичных нуклеотидных полиморфизмов (SNP). Основная идея, лежащая в основе алгоритма, заключается в сравнении генотипов пар объектов популяции и сравнении соответствующих значений фенотипа. В алгоритме используется интуитивное предположение, что изменения аллелей, соответствующих важным SNP у пары объектов, приводят к большому различию значений фенотипа этих индивидуумов. Алгоритм основан на рассмотрении пар индивидуумов вместо SNP или пар SNP. Основным преимуществом алгоритма является то, что он слабо зависит от количества SNP в матрице генотипов. В основном он зависит от количества объектов, которое, как правило, очень мало по сравнению с количеством SNP. Другое важное преимущество алгоритма заключается в том, что он позволяет без дополнительных вычислений обнаруживать эпистатический эффект, рассматриваемый как взаимодействие генов. Алгоритм также может использоваться в случае, когда фенотип принимает только два значения (схема случай–контроль). Кроме того, алгоритм может быть достаточно просто расширен с анализа двоичной матрицы генотипов на случай количественного анализа экспрессии генов. Численные эксперименты с реальными наборами данных, состоящими из популяций удвоенных гаплоидных линий ячменя, иллюстрируют преимущество предлагаемого алгоритма по сравнению со стандартными алгоритмами полногеномного поиска ассоциаций с вычислительной точки зрения, особенно для обнаружения эпистатического эффекта. Пути для повышения эффективности предлагаемого алгоритма также обсуждаются в статье.
Ключевые слова: полногеномный поиск ассоциаций, ANOVA, машинное обучение, эпистаз, SNP, метрика расстояния.
Поступила в редакцию: 30.09.2017
Реферативные базы данных:
Тип публикации: Статья
УДК: 006.72
Язык публикации: английский
Образец цитирования: L. V. Utkin, I. L. Utkina, “A high-performance genome-wide association study algorithm based on analysis of pairs of individuals”, Тр. СПИИРАН, 58 (2018), 5–26
Цитирование в формате AMSBIB
\RBibitem{UtkUtk18}
\by L.~V.~Utkin, I.~L.~Utkina
\paper A high-performance genome-wide association study algorithm based on analysis of pairs of individuals
\jour Тр. СПИИРАН
\yr 2018
\vol 58
\pages 5--26
\mathnet{http://mi.mathnet.ru/trspy1004}
\crossref{https://doi.org/10.15622/sp.58.1}
\elib{https://elibrary.ru/item.asp?id=35630301}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/trspy1004
  • https://www.mathnet.ru/rus/trspy/v58/p5
  • Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Информатика и автоматизация
    Статистика просмотров:
    Страница аннотации:150
    PDF полного текста:50
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024