Нелинейная динамика
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив
Импакт-фактор

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Rus. J. Nonlin. Dyn.:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Нелинейная динамика, 2011, том 7, номер 4, страницы 859–875 (Mi nd297)  

Эта публикация цитируется в 2 научных статьях (всего в 2 статьях)

Обучение с подкреплением спайковой нейронной сети в задаче управления агентом в дискретной виртуальной среде

О. Ю. Синявский, А. И. Кобрин

Национальный исследовательский университет «Московский энергетический институт», 111250, Россия, г. Москва, Красноказарменная ул., д. 14
Список литературы:
Аннотация: В работе описываются методы обучения с подкреплением спайковой нейронной сети, управляющей роботом или интеллектуальным агентом. Применение спайковых нейронов в качестве базовых элементов сети позволяет использовать как пространственную, так и временную структуру входной сенсорной информации. Обучение сети производится с помощью подкрепляющих сигналов, идущих из внешней среды и отражающих степень успешности недавно выполненных агентом действий. Максимизация получаемого подкрепления ведется путем модулированной минимизации информационной энтропии функционирования нейрона, которая зависит от весов нейронов. Полученные законы изменения весов близки к явлениям синаптической пластичности, наблюдающейся в реальных нейронах. Работа алгоритма обучения с подкреплением проверяется на тестовой задаче поиска ресурсов агентом в дискретной виртуальной среде.
Ключевые слова: спайковый нейрон, адаптивное управление, обучение с подкреплением, информационная энтропия.
Поступила в редакцию: 06.06.2011
Принята в печать: 30.09.2011
Тип публикации: Статья
УДК: 004.032.26, 004.852
MSC: 68T05, 68Q32
Образец цитирования: О. Ю. Синявский, А. И. Кобрин, “Обучение с подкреплением спайковой нейронной сети в задаче управления агентом в дискретной виртуальной среде”, Нелинейная динам., 7:4 (2011), 859–875
Цитирование в формате AMSBIB
\RBibitem{SinKob11}
\by О.~Ю.~Синявский, А.~И.~Кобрин
\paper Обучение с подкреплением спайковой нейронной сети в задаче управления агентом в дискретной виртуальной среде
\jour Нелинейная динам.
\yr 2011
\vol 7
\issue 4
\pages 859--875
\mathnet{http://mi.mathnet.ru/nd297}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/nd297
  • https://www.mathnet.ru/rus/nd/v7/i4/p859
  • Эта публикация цитируется в следующих 2 статьяx:
    Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Нелинейная динамика
    Статистика просмотров:
    Страница аннотации:1015
    PDF полного текста:912
    Список литературы:64
    Первая страница:1
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024