Аннотация:
Обсуждается задача вероятностного тематического моделирования, которая сводится к некорректно поставленной задаче стохастического матричного разложения. Предлагается метод аддитивной регуляризации тематических моделей (АРТМ), позволяющий учитывать разнообразную дополнительную информацию и проблемно-ориентированные ограничения. АРТМ существенно проще байесовского подхода, получившего в настоящее время наиболее широкое распространение в области тематического моделирования, и позволяет легко строить многоцелевые и комбинированные модели. Рассматриваются примеры регуляризаторов для прикладных задач анализа текстов.