Компьютерные исследования и моделирование
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Компьютерные исследования и моделирование:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Компьютерные исследования и моделирование, 2012, том 4, выпуск 4, страницы 693–706
DOI: https://doi.org/10.20537/2076-7633-2012-4-4-693-706
(Mi crm522)
 

Эта публикация цитируется в 14 научных статьях (всего в 14 статьях)

МАТЕМАТИЧЕСКИЕ ОСНОВЫ И ЧИСЛЕННЫЕ МЕТОДЫ МОДЕЛИРОВАНИЯ

Регуляризация, робастность и разреженность вероятностных тематических моделей

К. В. Воронцовa, А. А. Потапенкоb

a Лаборатория «РУКОНТ-ФизТех» ФУПМ МФТИ, Россия, 141700, г. Долгопрудный, Институтский переулок, д. 9
b ВМК МГУ, Россия, 119991 ГСП-1 г. Москва, Ленинские горы, МГУ имени М. В. Ломоносова, факультет ВМК
Список литературы:
Аннотация: Предлагается обобщенное семейство вероятностных тематических моделей коллекций текстовых документов, в котором эвристики регуляризации, сэмплирования, частого обновления параметров, робастности относительно шума и фона могут включаться независимо друг от друга в любых сочетаниях, порождая как известные модели PLSA, LDA, CVB0, SWB, так и новые. Показано, что робастная тематическая модель на основе PLSA, разделяющая термины на тематические, шумовые и фоновые, не нуждается в регуляризации и обеспечивает разреженность искомых дискретных распределений тем в документах и терминов в темах.
Ключевые слова: компьютерный анализ текстов, тематическое моделирование, вероятностный латентный семантический анализ, EM-алгоритм, латентное размещение Дирихле, сэмплирование Гиббса, байесовская регуляризация, перплексия, робастность.
Финансовая поддержка Номер гранта
Министерство образования и науки Российской Федерации 07.524.11.4002
Российский фонд фундаментальных исследований 11-07-00480
Работа выполнена при поддержке Министерства образования и науки РФ (Государственный контракт 07.524.11.4002) и Российского фонда фундаментальных исследований (проект No 11-07-00480).
Поступила в редакцию: 06.09.2012
Тип публикации: Статья
УДК: 004.852
Образец цитирования: К. В. Воронцов, А. А. Потапенко, “Регуляризация, робастность и разреженность вероятностных тематических моделей”, Компьютерные исследования и моделирование, 4:4 (2012), 693–706
Цитирование в формате AMSBIB
\RBibitem{VorPot12}
\by К.~В.~Воронцов, А.~А.~Потапенко
\paper Регуляризация, робастность и разреженность вероятностных тематических моделей
\jour Компьютерные исследования и моделирование
\yr 2012
\vol 4
\issue 4
\pages 693--706
\mathnet{http://mi.mathnet.ru/crm522}
\crossref{https://doi.org/10.20537/2076-7633-2012-4-4-693-706}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/crm522
  • https://www.mathnet.ru/rus/crm/v4/i4/p693
  • Эта публикация цитируется в следующих 14 статьяx:
    Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Компьютерные исследования и моделирование
    Статистика просмотров:
    Страница аннотации:289
    PDF полного текста:124
    Список литературы:33
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024