|
Эта публикация цитируется в 3 научных статьях (всего в 3 статьях)
ЧИСЛЕННЫЕ МЕТОДЫ И АНАЛИЗ ДАННЫХ
Новый подход к обучению нейронных сетей с помощью натурального градиентного спуска с импульсом на основе распределений Дирихле
Р. И. Абдулкадировa, П. А. Ляховb a Северо-Кавказский центр математических исследований, Северо-Кавказский федеральный университет, г. Ставрополь
b Северо-Кавказский федеральный университет
Аннотация:
В данной работе мы предлагаем алгоритм натурального градиентного спуска с импульсом на основе распределений Дирихле для ускорения обучения нейронных сетей. Данный подход учитывает не только направления градиентов, но и выпуклость минимизируемой функции, что значительно ускоряет процесс поиска экстремумов. Представлены вычисления натуральных градиентов, базирующихся на распределениях Дирихле, и реализовано внедрение предложенного подхода в схему обратного распространения ошибок. Результаты по распознаванию изображений и прогнозированию временных рядов во время проведения экспериментов показывают, что предложенный подход дает более высокую точность и не требует большого количества итераций для минимизации функций потерь, по сравнению с методами стохастического градиентного спуска, адаптивной оценки момента и адаптивным по параметрам диагональным квазиньютоновским методом для невыпуклой стохастической оптимизации.
Ключевые слова:
распознавание образов, машинное обучение, оптимизация, распределения Дирихле, натуральный градиентный спуск
Поступила в редакцию: 07.04.2022 Принята в печать: 24.08.2022
Образец цитирования:
Р. И. Абдулкадиров, П. А. Ляхов, “Новый подход к обучению нейронных сетей с помощью натурального градиентного спуска с импульсом на основе распределений Дирихле”, Компьютерная оптика, 47:1 (2023), 160–169
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/co1113 https://www.mathnet.ru/rus/co/v47/i1/p160
|
Статистика просмотров: |
Страница аннотации: | 31 | PDF полного текста: | 7 | Список литературы: | 10 |
|