|
Эта публикация цитируется в 2 научных статьях (всего в 2 статьях)
Эффективные реализации алгоритмов тематического моделирования
М. А. Апишев Московский государственный университет имени М.В. Ломоносова
Аннотация:
Представлен обзор эффективных алгоритмов вероятностного тематического моделирования больших текстовых коллекций. Рассматриваются алгоритмы обучения моделей латентного размещения Дирихле (LDA) и аддитивно регуляризованных тематических моделей (ARTM) для многопроцессорных систем. Предложена систематизация технических приёмов для организации параллельных вычислений, распределённого хранения данных, потоковой обработки, уменьшения потребления оперативной памяти, повышения отказоустойчивости. Проведён сравнительный анализ доступных реализаций.
Ключевые слова:
параллельные алгоритмы, распределённое хранение данных, обработка потоковых данных, отказоустойчивость, тематическое моделирование, EM-алгоритм, латентное размещение Дирихле, аддитивная регуляризация тематических моделей.
Образец цитирования:
М. А. Апишев, “Эффективные реализации алгоритмов тематического моделирования”, Труды ИСП РАН, 32:1 (2020), 137–152
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/tisp490 https://www.mathnet.ru/rus/tisp/v32/i1/p137
|
Статистика просмотров: |
Страница аннотации: | 242 | PDF полного текста: | 233 | Список литературы: | 15 |
|