|
Нелинейная динамика, 2011, том 7, номер 4, страницы 859–875
(Mi nd297)
|
|
|
|
Эта публикация цитируется в 2 научных статьях (всего в 2 статьях)
Обучение с подкреплением спайковой нейронной сети в задаче управления агентом в дискретной виртуальной среде
О. Ю. Синявский, А. И. Кобрин Национальный исследовательский университет «Московский энергетический институт»,
111250, Россия, г. Москва, Красноказарменная ул., д. 14
Аннотация:
В работе описываются методы обучения с подкреплением спайковой нейронной сети, управляющей роботом или интеллектуальным агентом. Применение спайковых нейронов в качестве базовых элементов сети позволяет использовать как пространственную, так и временную структуру входной сенсорной информации. Обучение сети производится с помощью подкрепляющих сигналов, идущих из внешней среды и отражающих степень успешности недавно выполненных агентом действий. Максимизация получаемого подкрепления ведется путем модулированной минимизации информационной энтропии функционирования нейрона, которая зависит от весов нейронов. Полученные законы изменения весов близки к явлениям синаптической пластичности, наблюдающейся в реальных нейронах. Работа алгоритма обучения с подкреплением проверяется на тестовой задаче поиска ресурсов агентом в дискретной виртуальной среде.
Ключевые слова:
спайковый нейрон, адаптивное управление, обучение с подкреплением, информационная энтропия.
Поступила в редакцию: 06.06.2011 Принята в печать: 30.09.2011
Образец цитирования:
О. Ю. Синявский, А. И. Кобрин, “Обучение с подкреплением спайковой нейронной сети в задаче управления агентом в дискретной виртуальной среде”, Нелинейная динам., 7:4 (2011), 859–875
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/nd297 https://www.mathnet.ru/rus/nd/v7/i4/p859
|
|