|
|
Стохастический анализ в задачах
9 ноября 2013 г. 11:00, г. Москва, Большой Власьевский переулок, дом 11
|
|
|
|
|
|
Моделирование интернета и ранжирование web-страниц
Е. А. Самосватab, Л. А. Остроумоваab, М. Е. Жуковскийba, Е. Ю. Клочковcb a Московский физико-технический институт (государственный университет), г. Долгопрудный Московской обл.
b Компания «Яндекс»
c Лаборатория структурных методов анализа данных в предсказательном моделировании при МФТИ (ПреМоЛаб), г. Москва
|
Количество просмотров: |
Эта страница: | 288 |
|
Аннотация:
В докладке Егора Самосвата будет рассказано о применении метода максимального правдоподобия для валидации моделей веб графа, например, для валидации модели предпочтительного присоединения (на основе статьи http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.64.1812&rep=rep1&type=pdf).
В указанной статье авторам пришлось усреднять правдоподобие по разным перестановкам вершин, поскольку в данных не было информации о порядке появления вершин, необходимой для подсчета правдоподобия PA модели). Так как перестановок очень много, то авторы использовали MCMC метод.
Также планируется рассказ о валидации модели http://arxiv.org/abs/1209.4523 (в данных была информация о временах появления вершин). Ответа на вопросы о возможном количестве скрытых переменных и о том, наблюдается ли переобучение, пока нет, но данные вопросы могут вызвать интересную дискуссию. Также хочется обсудить, имеет ли смысл регуляризовывать MLE метод для моделей веб-графов и можно ли построить теорию переобучения моделей веб-графов.
|
|