Аннотация:
В последние 10 лет произошел скачок в развитии ИИ, в первую очередь, глубоких нейронных сетей, обученных на больших массивах данных. Они умеют работать с изображениями, текстами, видео, звуками. Большие языковые модели уже успешно решают ряд задач, которые еще год назад казались неподъемными.
При создании и исследовании таких моделей часто используются аналогии из различных математических областей. В частности, топологические подходы позволяют исследовать свойства данных, результаты из гиперболической геометрии — снижать количество параметров. Однако при этом существует целый ряд фундаментальных, нерешенных вопросов.
Доклад будет посвящен краткому обзору основных постановок задач машинного обучения, примеров использования подходов из разных областей математики для решения таких задач. В конце мы попробуем сформулировать “большие вызовы” для теории, которые сейчас остаются загадкой.