Аннотация:
Доклад посвящен алгоритмам стохастической аппроксимации, которые широко используются для поиска приближенного решения уравнения $f(x*) = 0$ в случае, когда функция $f$ неизвестна, но может быть оценена через несмещённые наблюдения $F(x, Z_n), n>=1$. Будет рассмотрен случай, когда $Z_n, n>=1$, образуют последовательность независимых одинаково распределенных случайных величин, а также более общий случай эргодической цепи Маркова. Мы дадим неасимптотические оценки для процедуры усреднения Поляка–Рупперта и рассмотрим примеры приложения доказанных теорем к задачам теории оценивания, оптимизации и теории обучения с подкреплением. В завершение доклада обсудим вопрос построения доверительных интервалов для неизвестного решения.