Аннотация:
Целью генеративного моделирования является построение алгоритмов, способных воспроизводить объекты из распределения, задаваемого некоторым (обычно достаточно большим) количеством примеров. К генеративному моделированию относятся такие важные прикладные задачи, как синтезирование речи по тексту (text-to-speech), увеличение частоты дискретизации аудиосигнала (audio upsampling), копирования голоса (voice cloning/voice conversion), и т.д. Алгоритмы, решающие подобные задачи, должны генерировать качественные объекты за разумное время.
В докладе будет рассмотрен один из современных подходов к генеративному моделированию, основанный на диффузионных случайных процессах. Его математической основой, позволяющей генерировать объекты из нормального шума, служит утверждение о том, что процесс, обратный к диффузии, также является диффузией и допускает явное выражение для коэффициентов сноса и диффузии. Для частного случая, имеющего место в большинстве прикладных задач, будет приведена схема доказательства; кроме того, в докладе планируется рассмотреть метод обучения диффузионных генеративных алгоритмов, основанный на максимизации правдоподобия, а также обсудить недостатки этого типа алгоритмов и возможные способы их устранения.