|
Проблемы передачи информации, 1973, том 9, выпуск 4, страницы 58–65
(Mi ppi923)
|
|
|
|
Теория автоматов
Об одной модели оптимального поведения в неизвестной
среде
А. В. Васильев, А. В. Коганов
Аннотация:
В статье рассматривается модель приспособления к неизвестной среде,
в которой обучающийся объект имеет несколько действий, а среда выдает
фиксированный выигрыш за каждое действие. Объект имеет конечное
время обучения и должен за это время получить наибольшую сумму
выигрышей. Среда заранее неизвестна, но задан класс сред. Эту модель
можно рассматривать как игру, в которой стратегиями являются алгоритмы
поведения объекта (помнящего уже полученные ответы среды)
и задание до начала работы объекта некоторой среды из допустимого
класса сред == стратегия “природы”. Для игры исследуются минимаксные
и максиминные точки и находится седловая точка на классе смешанных
стратегий.
Поступила в редакцию: 20.03.1972
Образец цитирования:
А. В. Васильев, А. В. Коганов, “Об одной модели оптимального поведения в неизвестной
среде”, Пробл. передачи информ., 9:4 (1973), 58–65; Problems Inform. Transmission, 9:4 (1973), 314–320
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/ppi923 https://www.mathnet.ru/rus/ppi/v9/i4/p58
|
Статистика просмотров: |
Страница аннотации: | 236 | PDF полного текста: | 86 |
|