|
Интеллектуальные системы и технологии
Применение модифицированного алгоритма LSH для кластеризации внешнего окружения веб-пространства университетов
В. Н. Корелин, И. С. Блеканов, С. Л. Сергеев Санкт-Петербургский государственный университет
Аннотация:
Проведен кластерный анализ внешних ресурсов сайтов крупных университетов. В качестве исследуемых объектов выбраны сайты университетов России, США и Великобритании, занимающие в своих регионах ведущие позиции в вебометрическом рейтинге. Цель работы – в выявлении для каждого сайта университета групп внешних веб-ресурсов с одинаковым родом деятельности. Проведен анализ найденных групп: определена степень влияния количества и размеров этих групп на вебометрический рейтинг сайтов университетов. Разработан алгоритм кластеризации, основанный на вероятностном методе понижения размерности многомерных данных (Locality-Sensitive Hashing – LSH). Поставлен эксперимент, в котором на тестовых данных показано, что алгоритм позволяет с высокой скоростью и допустимой точностью проводить кластеризацию большого объема данных. Приведены основные результаты исследования.
Ключевые слова:
вебометрика, веб-сайты университетов, кластерный анализ, locality-sensitive hashing, min hashing, кластеризация внешних веб-ресурсов, анализ гиперссылок.
Образец цитирования:
В. Н. Корелин, И. С. Блеканов, С. Л. Сергеев, “Применение модифицированного алгоритма LSH для кластеризации внешнего окружения веб-пространства университетов”, Научно-технические ведомости СПбГПУ. Информатика. Телекоммуникации. Управление, 2015, № 5(229), 79–87
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/ntitu128 https://www.mathnet.ru/rus/ntitu/y2015/i5/p79
|
Статистика просмотров: |
Страница аннотации: | 138 | PDF полного текста: | 53 |
|