|
Параллельный алгоритм кластеризации данных для многоядерных ускорителей Intel MIC
Т. В. Речкалов, М. Л. Цымблер Южно-Уральский государственный университет, г. Челябинск
Аннотация:
Алгоритм PAM (Partitioning Around Medoids) представляет собой разделительный алгоритм кластеризации, в котором в качестве центров кластеров выбираются только кластеризуемые объекты (медоиды). Кластеризация на основе техники медоидов применяется в широком спектре приложений: сегментирование медицинских и спутниковых изображений, анализ ДНК-микрочипов и текстов и др. На сегодня имеются параллельные реализации PAM для систем GPU и FPGA, но отсутствуют таковые для многоядерных ускорителей архитектуры Intel Many Integrated Core (MIC). В настоящей статье предлагается новый параллельный алгоритм кластеризации PhiPAM для ускорителей Intel MIC. Вычисления распараллеливаются с помощью технологии OpenMP. Алгоритм предполагает использование специализированной компоновки данных в памяти и техники тайлинга, позволяющих эффективно векторизовать вычисления на системах Intel MIC. Эксперименты, проведенные на реальных наборах данных, показали хорошую масштабируемость алгоритма.
Ключевые слова:
кластеризация, медоид, параллельный алгоритм, представление данных в памяти, векторизация вычислений.
Поступила в редакцию: 26.02.2019
Образец цитирования:
Т. В. Речкалов, М. Л. Цымблер, “Параллельный алгоритм кластеризации данных для многоядерных ускорителей Intel MIC”, Выч. мет. программирование, 20:2 (2019), 104–115
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/vmp952 https://www.mathnet.ru/rus/vmp/v20/i2/p104
|
|