Д. Д. Янцен, М. Л. Цымблер, “Алгоритм репрезентативного сэмплинга для систем баз данных на основе фрагментного параллелизма”, Вестн. ЮУрГУ. Сер. Выч. матем. информ., 3:4 (2014), 36

Вестник Южно-Уральского государственного университета. Серия «Вычислительная математика и информатика»

RUS ENG

ЖУРНАЛЫ ПЕРСОНАЛИИ ОРГАНИЗАЦИИ КОНФЕРЕНЦИИ СЕМИНАРЫ ВИДЕОТЕКА ПАКЕТ AMSBIB

JavaScript is disabled in your browser. Please switch it on to enable full functionality of the website

	Общая информация
	Последний выпуск
	Архив

	Поиск публикаций
	Поиск ссылок

	RSS
	Последний выпуск
	Текущие выпуски
	Архивные выпуски
	Что такое RSS

Вестн. ЮУрГУ. Сер. Выч. матем. информ.:
Год:
Том:
Выпуск:
Страница:
	Найти

Персональный вход:
Логин:
Пароль:
	Запомнить пароль
	Войти
	Забыли пароль?
	Регистрация

Вестник Южно-Уральского государственного университета. Серия «Вычислительная математика и информатика», 2014, том 3, выпуск 4, страницы 36–50
DOI: https://doi.org/10.14529/cmse140402 (Mi vyurv54)

Информатика, вычислительная техника и управление

Алгоритм репрезентативного сэмплинга для систем баз данных на основе фрагментного параллелизма

Д. Д. Янцен, М. Л. Цымблер

Южно-Уральский государственный университет (Челябинск, Российская Федерация)

PDF полного текста (1568 kB)

Список литературы:

PDF

HTML

DOI: https://doi.org/10.14529/cmse140402

Аннотация: Сэмплинг является популярным подходом к обработке сверхбольших баз данных в широком спектре приложений, связанных с интеллектуальным анализом данных, построением гистограмм, приблизительное исполнение запросов и др. Использование сэмпла вместо оригинальной базы данных может уменьшить точность результатов, но компенсируется сокращением времени выполнения обработки. Репрезентативный сэмплинг позволяет сохранить в сэмпле определенные характеристики базы данных. Однако существующие алгоритмы репрезентативного сэмплинга не могут быть применены для параллельных систем баз данных, поскольку не учитывают характеристики данных, распределяемых по вычислительным узлам кластерной системы. В данной статье предлагается алгоритм репрезентативного сэмплинга для параллельных реляционных систем баз данных на основе фрагментного параллелизма. Приведены результаты вычислительных экспериментов над предложенным алгоритмом, показавшие адекватное сохранение репрезентативности свойств базы данных, распределенной по узлам кластерной системы.

Ключевые слова: реляционные базы данных, параллельные системы баз данных, репрезентативный сэмплинг.

Финансовая поддержка	Номер гранта
Российский фонд фундаментальных исследований	12-07-00443-а
Исследование выполнено при финансовой поддержке Российского фонда фундаментальных исследований в рамках научного проекта № 12-07-00443-а

Поступила в редакцию: 11.08.2014

Тип публикации: Статья

УДК: 004.65, 004.622

Образец цитирования: Д. Д. Янцен, М. Л. Цымблер, “Алгоритм репрезентативного сэмплинга для систем баз данных на основе фрагментного параллелизма”, Вестн. ЮУрГУ. Сер. Выч. матем. информ., 3:4 (2014), 36–50

Цитирование в формате AMSBIB

\RBibitem{YanTsy14}

\by Д.~Д.~Янцен, М.~Л.~Цымблер

\paper Алгоритм репрезентативного сэмплинга для систем баз данных на основе фрагментного параллелизма

\jour Вестн. ЮУрГУ. Сер. Выч. матем. информ.

\yr 2014

\vol 3

\issue 4

\pages 36--50

\mathnet{http://mi.mathnet.ru/vyurv54}

\crossref{https://doi.org/10.14529/cmse140402}

Образцы ссылок на эту страницу:

https://www.mathnet.ru/rus/vyurv54

https://www.mathnet.ru/rus/vyurv/v3/i4/p36

Citing articles in Google Scholar: Russian citations, English citations
Related articles in Google Scholar: Russian articles, English articles

Вестник Южно-Уральского государственного университета. Серия «Вычислительная математика и информатика»

Статистика просмотров:
Страница аннотации:	188
PDF полного текста:	47
Список литературы:	43

Что такое QR-код?

Обратная связь:

Пользовательское соглашение

Регистрация посетителей портала

Логотипы