Аннотация:
Секвенирование человеческого генома началось в 1994 году. Понадобилось 10 лет работы многих научных коллективов для того, чтобы получить черновую последовательность ДНК человека. Современные технологии секвенирования позволяют получать геном конкретного человека за несколько дней. Обсуждаются успехи современной биоинформатики, связанные с появлением высокопроизводительных платформ секвенирования, которые не только способствовали расширению возможностей различных направлений биологии и других смежных наук, но и породили феномен больших данных. Обосновывается необходимость разработки новых технологий и методов для организации хранения, управления, анализа и визуализации больших данных. Современная биоинформатика столкнулась не только с проблемой больших данных, но и с огромным разнообразием методов обработки и представления, одновременным существованием различных программных средств и форматов данных. Обсуждаются пути решения возникших проблем, в частности путем использования наработок работы с большими данными из других областей современной жизни, таких как сетевой анализ и анализ деловых данных. Новые системы управления базами данных, отличные от реляционных, помогут решить проблему хранения больших данных и обеспечения приемлемого времени выполнения поисковых запросов. Новые технологии программирования, такие, как обобщенное программирование и визуальное программирование призваны решить проблему разнообразия форматов геномных данных и обеспечить возможность оперативного создания собственных скриптов для обработки данных.
Ключевые слова:
большие данные, Big Data, NGS, секвенирование генома, IT-технологии, биоинформатика, обобщенное программирование, визуальное программирование, нереляционные системы управления базами данных, NoSQL системы, Hadoop, MapReduce.
The study was partially supported by RFBR grants 15-07-05783 (N.N.N), 16-07-00937 and 16-07-01000 (U.M.N) and the Program of Fundamental Scientific Research of the Presidium of the Russian Academy of Sciences I.33P. (U.M.N).
Материал поступил в редакцию 16.03.2018, опубликован 03.04.2018
Тип публикации:
Статья
УДК:
004.9:004.9:004.8:577.21
Язык публикации: английский
Образец цитирования:
N. N. Nazipova, E. A. Isaev, V. V. Kornilov, D. V. Pervukhin, A. A. Morozova, A. A. Gorbunov, M. N. Ustinin, “Big Data in bioinformatics”, Матем. биология и биоинформ., 13, Suppl. (2018), t1–t16
\RBibitem{NazIsaKor18}
\by N.~N.~Nazipova, E.~A.~Isaev, V.~V.~Kornilov, D.~V.~Pervukhin, A.~A.~Morozova, A.~A.~Gorbunov, M.~N.~Ustinin
\paper Big Data in bioinformatics
\jour Матем. биология и биоинформ.
\yr 2018
\vol 13
\pages t1--t16
\issueinfo Suppl.
\mathnet{http://mi.mathnet.ru/mbb359}
\crossref{https://doi.org/10.17537/2018.13.t1}
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/mbb359
https://www.mathnet.ru/rus/mbb/v13/i3/p1
Перевод статьи
Большие данные в биоинформатике Н. Н. Назипова, Е. А. Исаев, В. В. Корнилов, Д. В. Первухин, А. А. Морозова, А. А. Горбунов, М. Н. Устинин Матем. биология и биоинформ., 2017, 12:1, 102–119
Эта публикация цитируется в следующих 10 статьяx:
Ankush Joshi, Gesu Thakur, Vikash Kumar, Yashvir Singh, Deepika Joshi, Studies in Big Data, 154, Cyber-Physical Systems Security, 2025, 259
Orkid Coskuner-Weber, Semih Alpsoy, Ozgur Yolcu, Egehan Teber, Ario de Marco, Spase Shumka, “Metagenomics studies in aquaculture systems: Big data analysis, bioinformatics, machine learning and quantum computing”, Computational Biology and Chemistry, 118 (2025), 108444
Ayoub Yahiaoui, Abderrazak Khediri, Hama Soltani, Hakim Bendjenna, Mohamed Ridda Laouar, Mounir Achouri, Lecture Notes in Networks and Systems, 982, 13th International Conference on Information Systems and Advanced Technologies “ICISAT 2023”, 2024, 144
Ajay Sharma, Tarun Pal, Utkarsha Naithani, Gaurav Gupta, Varun Jaiswal, Intelligent Data Analytics for Bioinformatics and Biomedical Systems, 2024, 265
N.N. Nazipova, Proceedings of the International Conference “Mathematical Biology and Bioinformatics”, 9, Proceedings of the International Conference “Mathematical Biology and Bioinformatics”, 2022
Mahi Sharma, Shuvhra Mondal, Sudeshna Bhattacharjee, Neetu Jabalia, Health Information Science, Computational Intelligence in Healthcare, 2021, 343
Н. Н. Назипова, “Разнообразие некодирующих РНК в геномах эукариот”, Матем. биология и биоинформ., 16:2 (2021), 256–298
Razika Driouche, Advances in Intelligent Systems and Computing, 1103, Advanced Intelligent Systems for Sustainable Development (AI2SD'2019), 2020, 385
F. Celesti, A. Celesti, A. Galletta, M. Fazio, M. Villari, “Optimizing the research of dna sequences in a nosql document database: a preliminary study”, 2019 IEEE Symposium on Computers and Communications (Iscc), IEEE Symposium on Computers and Communications Iscc, IEEE, 2019, 1153–1158
Fabrizio Celesti, Antonio Celesti, Antonino Galletta, Maria Fazio, Massimo Villari, 2019 IEEE Symposium on Computers and Communications (ISCC), 2019, 1153