Математическая биология и биоинформатика
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив
Импакт-фактор

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Матем. биология и биоинформ.:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Математическая биология и биоинформатика, 2020, том 15, выпуск 2, страницы 313–337
DOI: https://doi.org/10.17537/2020.15.313
(Mi mbb435)
 

Эта публикация цитируется в 1 научной статье (всего в 1 статье)

Обзоры

Сложность ДНК-последовательностей. Различные подходы и определения

В. Д. Гусев, Л. А. Мирошниченко

Институт математики им. С.Л. Соболева Сибирского отделения Российской академии наук, Новосибирск, Россия
Список литературы:
Аннотация: Важной количественной характеристикой символьных последовательностей (текстов, строк) является сложность, отражающая на интуитивном уровне степень их “неслучайности”. Достаточно общий подход к оцениванию сложности сформулировал А.Н. Колмогоров. Он предложил измерять её длиной кратчайшего описания, по которому последовательность восстанавливается однозначно. Поскольку программы, гарантированно осуществляющей поиск кратчайшего описания, не существует, на практике для этой цели используют различные алгоритмические приближения, рассматриваемые в данной работе. Наряду с определениями сложности, предполагающими возможность восстановления последовательности по её описанию, рассмотрен и ряд мер, не обладающих указанным свойством. Основное внимание уделено не столько количественной оценке сложности, сколько выявлению и классификации структурных закономерностей, обусловивших конкретное её значение. Все они в той или иной форме сводятся к проявлениям повторности в самом широком смысле.
Рассматриваемые меры сложности можно условно разделить на статистические, учитывающие частоту встречаемости символов или коротких слов в тексте, “словарные”, оценивающие число всевозможных подслов в анализируемой последовательности (тексте) и “структурные”, основанные на выделении длинных повторяющихся фрагментов текста и установлении взаимосвязей между ними.
Большинство методов ориентировано на последовательности произвольной языковой природы. Особое внимание, уделяемое ДНК-последовательностям, отраженное в названии статьи, обусловлено значимостью объекта, проявлениями повторности разного типа и многочисленными примерами использования понятия сложности при решении задач классификации и эволюции различных биологических объектов. Значительный интерес представляют локальные структурные особенности, выявляемые в режиме скользящего окна в ДНК-последовательностях, поскольку зачастую зоны пониженной сложности в геномах различных организмов имеют отношение к регуляции основных генетических процессов.
Ключевые слова: ДНК-последовательности, сложность, алгоритмы, сжатие данных, энтропия, статистические меры, лингвистическая сложность, структурные меры сложности.
Финансовая поддержка Номер гранта
Министерство образования и науки Российской Федерации 0314-2019-0015
Работа выполнена в рамках государственного задания ИМ СО РАН (проект № 0314-2019-0015).
Материал поступил в редакцию 23.10.2020, 14.11.2020, опубликован 30.11.2020
Тип публикации: Статья
Образец цитирования: В. Д. Гусев, Л. А. Мирошниченко, “Сложность ДНК-последовательностей. Различные подходы и определения”, Матем. биология и биоинформ., 15:2 (2020), 313–337
Цитирование в формате AMSBIB
\RBibitem{GusMir20}
\by В.~Д.~Гусев, Л.~А.~Мирошниченко
\paper Сложность ДНК-последовательностей. Различные подходы и определения
\jour Матем. биология и биоинформ.
\yr 2020
\vol 15
\issue 2
\pages 313--337
\mathnet{http://mi.mathnet.ru/mbb435}
\crossref{https://doi.org/10.17537/2020.15.313}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/mbb435
  • https://www.mathnet.ru/rus/mbb/v15/i2/p313
  • Эта публикация цитируется в следующих 1 статьяx:
    Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Статистика просмотров:
    Страница аннотации:156
    PDF полного текста:206
    Список литературы:13
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024