Аннотация:
В докладе рассматриваются некорректно поставленные задачи неотрицательных матричных разложений, возникающие при кластеризации больших текстовых и транзакционных данных. Регуляризация этих задач требует математической формализации разнообразных априорных предположений о природе текста. В качестве одного из приложений будет продемонстрирована поисково-рекомендательная система arxiv.aithea.com, позволяющая собирать тематические подборки научных статей из arXiv.org.