О. Ю. Синявский, А. И. Кобрин, “Обучение с подкреплением спайковой нейронной сети в задаче управления агентом в дискретной виртуальной среде”, Нелинейная динам., 7:4 (2011), 859

Нелинейная динамика

RUS ENG

ЖУРНАЛЫ ПЕРСОНАЛИИ ОРГАНИЗАЦИИ КОНФЕРЕНЦИИ СЕМИНАРЫ ВИДЕОТЕКА ПАКЕТ AMSBIB

JavaScript is disabled in your browser. Please switch it on to enable full functionality of the website

	Общая информация
	Последний выпуск
	Архив
	Импакт-фактор

	Поиск публикаций
	Поиск ссылок

	RSS
	Последний выпуск
	Текущие выпуски
	Архивные выпуски
	Что такое RSS

Rus. J. Nonlin. Dyn.:
Год:
Том:
Выпуск:
Страница:
	Найти

Персональный вход:
Логин:
Пароль:
	Запомнить пароль
	Войти
	Забыли пароль?
	Регистрация

Нелинейная динамика, 2011, том 7, номер 4, страницы 859–875 (Mi nd297)

Эта публикация цитируется в 2 научных статьях (всего в 2 статьях)

Обучение с подкреплением спайковой нейронной сети в задаче управления агентом в дискретной виртуальной среде

О. Ю. Синявский, А. И. Кобрин

Национальный исследовательский университет «Московский энергетический институт», 111250, Россия, г. Москва, Красноказарменная ул., д. 14

PDF полного текста (810 kB) Список цитирования (2)

Список литературы:

PDF

HTML

Аннотация: В работе описываются методы обучения с подкреплением спайковой нейронной сети, управляющей роботом или интеллектуальным агентом. Применение спайковых нейронов в качестве базовых элементов сети позволяет использовать как пространственную, так и временную структуру входной сенсорной информации. Обучение сети производится с помощью подкрепляющих сигналов, идущих из внешней среды и отражающих степень успешности недавно выполненных агентом действий. Максимизация получаемого подкрепления ведется путем модулированной минимизации информационной энтропии функционирования нейрона, которая зависит от весов нейронов. Полученные законы изменения весов близки к явлениям синаптической пластичности, наблюдающейся в реальных нейронах. Работа алгоритма обучения с подкреплением проверяется на тестовой задаче поиска ресурсов агентом в дискретной виртуальной среде.

Ключевые слова: спайковый нейрон, адаптивное управление, обучение с подкреплением, информационная энтропия.

Поступила в редакцию: 06.06.2011
Принята в печать: 30.09.2011

Тип публикации: Статья

УДК: 004.032.26, 004.852

MSC: 68T05, 68Q32

Образец цитирования: О. Ю. Синявский, А. И. Кобрин, “Обучение с подкреплением спайковой нейронной сети в задаче управления агентом в дискретной виртуальной среде”, Нелинейная динам., 7:4 (2011), 859–875

Цитирование в формате AMSBIB

\RBibitem{SinKob11}

\by О.~Ю.~Синявский, А.~И.~Кобрин

\paper Обучение с подкреплением спайковой нейронной сети в задаче управления агентом в дискретной виртуальной среде

\jour Нелинейная динам.

\yr 2011

\vol 7

\issue 4

\pages 859--875

\mathnet{http://mi.mathnet.ru/nd297}

Образцы ссылок на эту страницу:

https://www.mathnet.ru/rus/nd297

https://www.mathnet.ru/rus/nd/v7/i4/p859

Эта публикация цитируется в следующих 2 статьяx:

Citing articles in Google Scholar: Russian citations, English citations
Related articles in Google Scholar: Russian articles, English articles

Что такое QR-код?

Обратная связь:

Пользовательское соглашение

Регистрация посетителей портала

Логотипы