|
Математическая теория игр и её приложения, 2015, том 7, выпуск 4, страницы 40–55
(Mi mgta167)
|
|
|
|
Эта публикация цитируется в 7 научных статьях (всего в 7 статьях)
Альтруистическое поведение в неантагонистической позиционной дифференциальной игре
Анатолий Ф. Клейменов Институт математики и механики им. Н. Н. Красовского УрО РАН,
620990, Екатеринбург, ул. С. Ковалевской, 16
Аннотация:
Рассматривается неантагонистическая позиционная дифференциальная игра (НПДИ) двух лиц c динамикой, описываемой обыкновенным нелинейным векторным дифференциальным уравнением. Ограничения на значения управлений игроков являются геометрическими. Момент окончания игры фиксирован. Функционалы выигрыша обоих игроков являются терминальными. Формализация позиционных стратегий в НПДИ основана на формализации и результатах общей теории антагонистических позиционных дифференциальных игр (АПДИ) (см. монографии Н.Н. Красовского и А.И. Субботина [3, 4]). В настоящей статье дополнительно предполагается, что каждый игрок помимо обычного, нормального (nor), типа поведения, ориентированного на максимизацию собственного функционала, может использовать другие типы поведения, введенные в [1, 2]. В частности, это могут быть альтруистический (alt), агрессивный (agg) и парадоксальный (par) типы. Далее полагается, что по ходу игры игроки могут осуществлять переключения своего поведения с одного типа на другой.
Использование игроками возможности такого переключения в повторяющейся биматричной $2\times2$ игре позволило в работах [5, 6] получить новые решения этой игры.
В настоящей статье распространение указанного подхода на неантагонистические
позиционные дифференциальные игры приводит к новым постановкам задач.
В частности, представляет интерес как трансформируются выигрыши игроков, получаемые на нэшевских решениях. Актуальной становится задача минимизации времени «ненормального» поведения при условии достижения удовлетворительного результата.
В статье предлагается формализация НПДИ двух лиц с типами поведения
(НПДИсТП). Предполагается, что в НПДИсТП каждый игрок одновременно с
выбором позиционной стратегии выбирает также индикаторную функцию,
определенную на всем отрезке игры и принимающую значения в множестве
$\{$nor, alt, agg, par$\}$. Индикаторная функция игрока показывает динамику изменения типа поведения, которой придерживается этот игрок.
Таким образом, в НПДИсТП каждый игрок управляет выбором пары действий $\{$позиционная стратегия, индикаторная функция$\}$.
Дается определения понятия $BT$-решения такой игры. Ожидаемо, что в НПДИсТП использование типов поведения, отличных от нормального (так называемых ненормальных (abnormal) типов), в ряде случаев может привести к исходам, более предпочтительным для игроков, чем в игре НПДИ. В статье рассматриваются два примера игры с динамикой простого движения на плоскости, в каждом из которых один игрок придерживается альтруистического типа поведения в течение некоторого промежутка времени. Показывается, что по сравнению с игрой с нормальными типами поведения игроков, в первом примере на $BT$-решении происходит увеличение выигрыша каждого из игроков, а во втором примере — увеличивается суммарный выигрыш игроков.
Ключевые слова:
неантагонистическая позиционная дифференциальная игра, терминальные показатели качества, типы поведения игроков, альтруистический тип поведения, решения нэшевского типа.
Образец цитирования:
Анатолий Ф. Клейменов, “Альтруистическое поведение в неантагонистической позиционной дифференциальной игре”, МТИП, 7:4 (2015), 40–55; Autom. Remote Control, 78:4 (2017), 762–769
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/mgta167 https://www.mathnet.ru/rus/mgta/v7/i4/p40
|
Статистика просмотров: |
Страница аннотации: | 364 | PDF полного текста: | 112 | Список литературы: | 90 |
|