|
Эта публикация цитируется в 1 научной статье (всего в 1 статье)
Генерация графа социальной сети с использованием Apache Spark
Ю. А. Белов, С. И. Вовчок Ярославский государственный университет им. П.Г. Демидова,
ул. Советская 14, г. Ярославль, 150003 Россия
Аннотация:
Планируется создать метод кластеризации графа социальной сети. Для тестирования будущего метода возникла необходимость в генерации графа, по своей структуре схожего с лежащими в основе существующих социальных сетей. В статье представлен алгоритм для распределенной генерации такого графа. Учитываются основные свойства социальной сети: степенное распределение количества сообществ для пользователей, плотные пересечения сообществ и другие. В данном алгоритме учтены проблемы, присутствующие в подобных работах других авторов, например, проблема кратных ребер при генерации. Особенностью созданного алгоритма стала реализация, зависящая от такого параметра как количество сообществ, а не от количества пользователей, как это делается в других работах. Это связано с особенностью развития структуры реальной существующей социальной сети. В работе перечислены свойства ее графа. Описана таблица, содержащая необходимые для алгоритма переменные. Составлен пошаговый алгоритм генерации. Для него определены соответствующие математические параметры. Генерация происходит распределенно с помощью фреймворка Apache Spark. Подробно описано, каким образом происходит разделение задач с помощью данного фреймворка. В алгоритме используется модель Эрдеша–Реньи для случайных графов как наиболее подходящая и достаточно простая для реализации. Основными преимуществами созданного метода являются использование малого количества ресурсов, по сравнению с другими подобными генераторами, и скорость выполнения. Быстрота достигается за счет распределенной работы и того, что при распределенной работе алгоритма в любой момент пользователи сети имеют свои уникальные номера и упорядочены по этим номерам, поэтому не требуется их сортировка. Разработанный алгоритм будет способствовать не только созданию эффективного метода кластеризации. Он может быть полезен в других областях, связанных, например, с поисковыми системами социальных сетей.
Ключевые слова:
социальная сеть, генерация.
Поступила в редакцию: 24.10.2016
Образец цитирования:
Ю. А. Белов, С. И. Вовчок, “Генерация графа социальной сети с использованием Apache Spark”, Модел. и анализ информ. систем, 23:6 (2016), 777–783
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/mais540 https://www.mathnet.ru/rus/mais/v23/i6/p777
|
|