Интеллектуальные системы. Теория и приложения
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Интеллектуальные системы. Теория и приложения:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Интеллектуальные системы. Теория и приложения, 2019, том 23, выпуск 4, страницы 7–23 (Mi ista246)  

Эта публикация цитируется в 1 научной статье (всего в 1 статье)

Часть 1. Общие проблемы теории интеллектуальных систем

Построение полного набора тем вероятностных тематических моделей

А. В. Сухарева, К. В. Воронцов
Список литературы:
Аннотация: Интерпретируемость, линейное увеличение сложности с ростом данных, масштабируемость сделали тематическое моделирование одним из наиболее популярных инструментов статистического анализа текстов. Однако есть и ряд недостатков, вызванных зависимостью решения от инициализации. Известно, что построение тематической модели сводится к решению некорректно поставленной задачи неотрицательного матричного разложения. Множество её решений в общем случае бесконечно. Всякий раз модель находит локальный экстремум. Многократное обучение модели по одной и той же коллекции может приводить к обнаружению всё новых и новых тем. На практике часто требуется определить все темы корпуса. Для решения этой задачи в статье предложен и исследован новый алгоритм нахождения полного набора тем, который основан на построении выпуклой оболочки. Экспериментально показано, что за конечное число моделей можно построить базис тем. Правдоподобие базиса тем выше, чем одной модели с аналогичным числом тем. Сравнение базисов моделей LDA (latent Dirichlet allocation) и ARTM (additive regularization for topic modeling) позволяет сделать вывод, что темы наборов совпадают с высокой точностью.
Ключевые слова: вероятностное тематическое моделирование, устойчивость тематических моделей, полный набор тем тематических моделей, латентное размещение Дирихле, регуляризация.
Тип публикации: Статья
Образец цитирования: А. В. Сухарева, К. В. Воронцов, “Построение полного набора тем вероятностных тематических моделей”, Интеллектуальные системы. Теория и приложения, 23:4 (2019), 7–23
Цитирование в формате AMSBIB
\RBibitem{SukVor19}
\by А.~В.~Сухарева, К.~В.~Воронцов
\paper Построение полного набора тем вероятностных тематических моделей
\jour Интеллектуальные системы. Теория и приложения
\yr 2019
\vol 23
\issue 4
\pages 7--23
\mathnet{http://mi.mathnet.ru/ista246}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/ista246
  • https://www.mathnet.ru/rus/ista/v23/i4/p7
  • Эта публикация цитируется в следующих 1 статьяx:
    Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Интеллектуальные системы. Теория и приложения
    Статистика просмотров:
    Страница аннотации:364
    PDF полного текста:232
    Список литературы:34
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024