|
SQLite RDBMS extension for data indexing using B-tree modifications
[Компонент-расширение РСУБД SQLite для индексирования данных модификациями B-деревьев]
A. M. Rigin, S. A. Shershakov National Research University — Higher School of Economics
Аннотация:
Сильно ветвящиеся деревья являются одним из наиболее популярных решений для индексирования больших объёмов данных. Наиболее распространённой разновидностью сильно ветвящихся деревьев являются B-деревья. Существуют различные модификации B-деревьев, в том числе, рассматриваемые в настоящей работе B+-деревья, B*-деревья и B*+-деревья, однако данные модификации не поддерживаются по умолчанию в популярной реляционной СУБД с открытым исходным кодом SQLite. Данная работа выполняется на основе проведённого ранее исследования эффективности сильно ветвящихся деревьев в задаче индексирования структурированных данных, с использованием разработанной в рамках него C++-библиотеки структур данных - сильно ветвящихся деревьев. В этом исследовании было разработано B*+-дерево как структура данных, совмещающая в себе основные свойства B+-дерева и B*-дерева. Также в исследовании были измерены эмпирические вычислительные сложности различных операций над B-деревом и его модификациями и объём потребляемой данными операциями оперативной памяти. Целью настоящей работы является разработка расширения для реляционной СУБД SQLite, позволяющего использовать модификации B-дерева (B+-дерево, B*-дерево и B*+-дерево) в качестве индексирующих структур данных в РСУБД SQLite. Модификации базовой структуры данных были разработаны в виде C++-библиотеки. Данная библиотека подключается к SQLite, используя разработанный для неё в рамках настоящей работы API на языке C. Расширение для SQLite также реализует новый алгоритм выбора индексирующей структуры данных (одной из модификаций B-дерева) для заданной таблицы в базе данных. Предложенное расширение используется компонентом SQLite EventLog библиотеки LDOPA алгоритмов и структур данных для process mining. Кроме того, проведён эксперимент по сравнению эмпирической вычислительной сложности операций на деревьях разных типов в разработанном расширении для SQLite.
Ключевые слова:
B-дерево, индексирование данных, SQLite, СУБД, РСУБД, сильно ветвящееся дерево.
Образец цитирования:
A. M. Rigin, S. A. Shershakov, “SQLite RDBMS extension for data indexing using B-tree modifications”, Труды ИСП РАН, 31:3 (2019), 203–216
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/tisp433 https://www.mathnet.ru/rus/tisp/v31/i3/p203
|
Статистика просмотров: |
Страница аннотации: | 178 | PDF полного текста: | 60 | Список литературы: | 28 |
|