|
Информатика
Modification biterm topic model input feature for detecting topic in thematic virtual museums
[Модификация метода тематического моделирования BTM для обнаружения тем в тематических виртуальных музеях]
S. Anggaia, I. S. Blekanov, S. L. Sergeev a St. Petersburg State University, 7–9, Universitetskaya nab., St. Petersburg,
199034, Russian Federation
Аннотация:
В статье описывается разработанный авторами метод обнаружения тем в коротких текстовых документах из виртуальной музейной коллекции. Данный метод получил название Feature BTM, поскольку основывается на модификации третьего шага генеративного процесса известной тематической модели BTM. Был поставлен эксперимент по оценке качества, который показал преимущество в эффективности детектирования тем модифицированной моделью Feature BTM перед классической моделью BTM. Была описана технология тематической кластеризации документов, необходимая для построения тематических виртуальных музеев. Проведена оценка производительности, показывающая при незначительной потери скорости (менее 30 с) большую эффективность применения Feature BTM для выполнения кластеризации виртуальной музейной коллекции, чем использования классической модели BTM. Полученный авторами метод позволяет решить проблемы зашумленности и смещения темы при их выявлении, которые имеются в модели BTM.
Ключевые слова:
тематическая модель, битерм, короткие тексты, модель BTM, кластеризация, тематический виртуальный музей.
Поступила: 10 марта 2018 г. Принята к печати: 14 июня 2018 г.
Образец цитирования:
S. Anggai, I. S. Blekanov, S. L. Sergeev, “Modification biterm topic model input feature for detecting topic in thematic virtual museums”, Вестн. С.-Петербург. ун-та. Сер. 10. Прикл. матем. Информ. Проц. упр., 14:3 (2018), 243–251
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/vspui373 https://www.mathnet.ru/rus/vspui/v14/i3/p243
|
Статистика просмотров: |
Страница аннотации: | 127 | PDF полного текста: | 42 | Список литературы: | 41 | Первая страница: | 3 |
|