А. С. Гуменюк, А. А. Скиба, Н. Н. Поздниченко, С. Н. Шпынов, “О мерах сходства расположения компонентов в массивах естественно упорядоченных данных”, Тр. СПИИРАН, 18:2 (2019), 471

Труды СПИИРАН

RUS ENG

ЖУРНАЛЫ ПЕРСОНАЛИИ ОРГАНИЗАЦИИ КОНФЕРЕНЦИИ СЕМИНАРЫ ВИДЕОТЕКА ПАКЕТ AMSBIB

JavaScript is disabled in your browser. Please switch it on to enable full functionality of the website

	Общая информация
	Последний выпуск
	Архив

	Поиск публикаций
	Поиск ссылок

	RSS
	Последний выпуск
	Текущие выпуски
	Архивные выпуски
	Что такое RSS

Информатика и автоматизация:
Год:
Том:
Выпуск:
Страница:
	Найти

Персональный вход:
Логин:
Пароль:
	Запомнить пароль
	Войти
	Забыли пароль?
	Регистрация

Труды СПИИРАН, 2019, выпуск 18, том 2, страницы 471–503
DOI: https://doi.org/10.15622/sp.18.2.471-503 (Mi trspy1053)

Эта публикация цитируется в 3 научных статьях (всего в 3 статьях)

Математическое моделирование и прикладная математика

О мерах сходства расположения компонентов в массивах естественно упорядоченных данных

А. С. Гуменюк^a, А. А. Скиба^b, Н. Н. Поздниченко^a, С. Н. Шпынов^c

^a Омский государственный технический университет (ОмГТУ)
^b ООО "Компания Элмис"
^c Федеральное государственное бюджетное учреждение «Федеральный научно-исследовательский центр эпидемиологии и микробиологии имени почетного академика Н.Ф. Гамалеи»

PDF полного текста (1712 kB) Список цитирования (3)

DOI: https://doi.org/10.15622/sp.18.2.471-503

Аннотация: В настоящее время в публикациях специалистов по анализу массивов естественно упорядоченных данных различной природы (в том числе символьных последовательностей) не имеют широкого распространения математические средства, адекватно учитывающие расположение компонентов. Поэтому затруднены или невозможны измерение и сравнение порядка следования сообщений, выделенных в длинных информационных цепях. Основные подходы при сравнении символьных последовательностей используют вероятностные модели и статистический инструментарий, попарное и множественное выравнивание, позволяющее определить степень сходства цепей с помощью мер редакционного расстояния. Отмеченные подходы почти не уделяют внимания исследованию и обнаружению закономерностей конкретного расположения всех знаков, слов, компонентов массивов данных, составляющих отдельную целостную последовательность. Объектом исследования в наших работах является специальным образом организованный числовой кортеж — расположение компонентов (строй) в символьных или числовых последовательностях. При этом в качестве основы для количественного отображения строя цепи используются интервалы между ближайшими одинаковыми ее компонентами. Перемножение всех интервалов или суммирование их логарифмов позволяет получить числа, которые однозначно отображают расположение компонентов в конкретной последовательности. Эти числа, в свою очередь, позволяют получить целый набор нормированных характеристик строя, среди которых средний геометрический интервал и его логарифм. В данной работе представлен подход для количественного сравнения построений массивов естественно упорядоченных данных (информационных цепей) произвольной природы. Предложены меры сходства-расхождения и процедура сравнения строя цепей, основанные на выделении списка совпадающих и сходных по характеристикам строя подпоследовательностей. При этом для быстрого выделения списка совпадающих компонентов используются ранговые распределения. В работе представлен инструментарий для сравнения построений информационных цепей и продемонстрированы некоторые его возможности при исследовании строя нуклеотидных последовательностей.

Ключевые слова: знаковая последовательность, информационная цепь, строй цепи, глубина строя, средняя удаленность, нуклеотидная последовательность, меры сходства-расхождения, матрица сходства, alignment-free genome comparison, межнуклеотидное расстояние.

Поступила в редакцию: 22.05.2018

Реферативные базы данных:

Тип публикации: Статья

УДК: 006.72

Образец цитирования: А. С. Гуменюк, А. А. Скиба, Н. Н. Поздниченко, С. Н. Шпынов, “О мерах сходства расположения компонентов в массивах естественно упорядоченных данных”, Тр. СПИИРАН, 18:2 (2019), 471–503

Цитирование в формате AMSBIB

\RBibitem{GumSkiPoz19}

\by А.~С.~Гуменюк, А.~А.~Скиба, Н.~Н.~Поздниченко, С.~Н.~Шпынов

\paper О мерах сходства расположения компонентов в массивах естественно упорядоченных данных

\jour Тр. СПИИРАН

\yr 2019

\vol 18

\issue 2

\pages 471--503

\mathnet{http://mi.mathnet.ru/trspy1053}

\crossref{https://doi.org/10.15622/sp.18.2.471-503}

\elib{https://elibrary.ru/item.asp?id=37305501}

Образцы ссылок на эту страницу:

https://www.mathnet.ru/rus/trspy1053

https://www.mathnet.ru/rus/trspy/v18/i2/p471

Эта публикация цитируется в следующих 3 статьяx:

Citing articles in Google Scholar: Russian citations, English citations
Related articles in Google Scholar: Russian articles, English articles

Статистика просмотров:
Страница аннотации:	157
PDF полного текста:	122

Что такое QR-код?

Обратная связь:

Пользовательское соглашение

Регистрация посетителей портала

Логотипы