Понятие неантагонистической игры

Для рассмотренных ранее антагонистических игр характерно, что при любом исходе сумма выигрышей всех участников равна одному и тому же постоянному числу (в частности нулю). В экономике чаще встречается другая ситуация, при которой выигрыш одной стороны совсем необязательно означает проигрыш другой. Например, отношения между работником и работодателем несут в себе конфликт, т.к. эти лица имеют несовпадающие интересы. Тем не менее, существуют варианты, выгодные как работнику, так и работодателю. В частности, если фирма получает выгодный заказ, то это обеспечивает занятость и способствует повышению заработной платы многим работникам. С другой стороны, если фирма разоряется, это невыгодно как работнику, так и работодателю и этот конфликт не является антагонистическим.

Введём формальное описание неантагонистической игры (называемой также игрой с ненулевой или с непротивоположными интересами) двух лиц. Каждый игрок обладает некоторым набором стратегий:

– стратегии первого игрока, где x – его отдельная стратегия;

– стратегии второго игрока, где y – его отдельная стратегия.

Каждая пара называется исходом игры. На множестве исходов заданы две функции:

– функция полезности (выигрыш) первого игрока;

– функция полезности (выигрыш) второго игрока.

Частным случаем неантагонистической игры двух участников служит игра, в которой каждый игрок имеет конечное число стратегий. Рассмотренный в §1 пример «Дилемма заключенных» является примером биматричной игры.

В игре с непротивоположными интересами возможны случаи, когда

(2.1)

В случае (2.1) оба участника исходу предпочитают исход . Если бы участники могли договориться между собой, то они выбрали бы стратегии и Возможно также, что выполняется следующая система

(2.2)

В системе (2.2) для первого игрока исход лучше чем , а второму всё равно. Следовательно, возможен компромисс между игроками. В играх с непротивоположными интересами очень важным является вопрос, могут ли участники заключать между собой соглашения, т.е. могут ли они договариваться о совместных действиях. Игры, в которых участники могут заключать между собой соглашения, называются кооперативными. В противном случае, такие игры называются некооперативными. В этой главе будет рассмотрены только некооперативные игры

Возможны также случаи, когда один из участников выбирает свою стратегию, руководствуясь предполагаемыми действиями другого участника. Таким образом, возникают возможности, которых нет в игре с нулевой суммой:

1) сообщать друг другу о своих намерениях;

2) угрожать партнёру;

3) блефовать (т.е. давать ложные сигналы о своих действиях);



4) накапливать опыт игры;

5) принимать компромиссные решения.

Важно отметить следующее: если в игре с нулевой суммой игрокам было важно скрывать свои намерения, то в играх с нулевой суммой иногда бывает выгодно информировать партнёра о своих действиях. Для иллюстрации рассмотрим два примера.

Пример. «В этой речке утром рано утонули два барана».

Два барана встретились на разных концах мостика, оба хотят быстрее перейти мост. Проблема заключается в том, что каждый из баранов не склонен уступать дорогу другому. У каждого из баранов есть две стратегии: свернуть (уступить дорогу) и не сворачивать. Мостик узкий, если оба не свернут с дороги, то они столкнутся и упадут в речку. Запишем матрицу игры, примерно оценив выигрыши каждого игрока при различных исходах Таблица 1 :

Таблица 1

первый игрок
сворачивать не сворачивать
второй игрок сворачивать 0; 0 -5; 5
не сворачивать 5; -5 -100; -100

Найдем равновесные исходы и справедливые исходы.

Решение. Рассмотрим платёжные матрицы для каждого из игроков:

– доминирующих стратегий нет.

Если бы участники игры могли бы договориться, они бы исключили ситуацию и приняли единственное справедливое решение (правда, его недостаток в том, что никто не перейдет мост). Возможность для каждого игрока увеличить свой выигрыш, отказываясь от стратегии «не сворачивать», мешает реализации справедливого решения. Исход (0;0) не является равновесным, равновесие наблюдается в исходах (5;-5) и (-5;5), но они не являются справедливыми. Открываются возможности для угрозы, для демонстрации своей решимости перейти мост первым, чтобы второй игрок отступил.

Пример. «Рыночное коварство (блеф)»

Две фирмы выпускают одинаковый продукт, при этом первая фирма занимает доминирующее положение. Фирмы заключили неявный договор – не снижать цены. Если вторая фирма нарушит договор в одностороннем порядке, то первая фирма может ее наказать, например, прибегнув или к экспансии, или к демпингу. У второй фирмы таких возможностей нет. Фирмы могут демонстрировать свои намерения, с помощью рекламы, а также публикаций в СМИ. Так, например, публикация статьи о растущих производственных издержках фирмы служит сигналом о том, что фирма не намерена снижать цену на свою продукцию. Прибыли фирм в зависимости от избранных стратегий – «снижать цену» и «не снижать цену» приведены в Таблице 2. Может ли одна из фирм добиться максимально возможной прибыли?



Таблица 2

2 фирма 1 фирма Не снижать цену Снижать цену
Не снижать цену 3;3 2;0
Снижать цену 5;0 1;1

Решение.

Легко проверить, что в этой игре нет доминирующих стратегий, нет также равновесных исходов, так как от любого исхода игроки могут отклониться, действуя в своих интересах. Если первая фирма примет стратегию «Не снижать цену», то лучшей стратегией для второй фирмы будет такая же стратегия «Не снижать цену». Но обратное не верно: если вторая фирма примет стратегию «Не снижать цену», то лучшей стратегией первой фирмы будет «Снижать цену». Если первая фирма имеет возможность ввести вторую фирму в заблуждение, подав ей ложный сигнал о том, что собирается не снижать цену, а на самом деле снизит цену, то будет реализован исход с выигрышами (5;0), который дает первой фирме наибольшую прибыль.

§2.2.2. Биматричные игры

Частным случаем неантагонистической игры является игра, в которой принимают участие два игрока, каждый из которых имеет конечное число стратегий. Такие игры можно описать с помощью двух матриц, поэтому они называются биматричными.

Пусть первый участник имеет стратегий, а второй – стратегий. Количество исходов равно . Функция выигрышей первого участника может быть задана платёжной матрицей состоящую из элементов . Аналогично функция выигрышей второго участника будет задаваться матрицей состоящую из элементов Игру можно также описать с помощью таблицы . В каждой клетке такой таблицы указывается два числа, где первое число – это выигрыш первого участника, а второе число – выигрыш второго.

Рассмотрим пример.

Пример. Игра «Двое в горящем доме». Два человека находятся в горящем доме по разные стороны двери, которую нужно открыть для спасения каждого из них. Для того чтобы дверь открылась, им обоим необходимо приложить общие усилия, заключающиеся в том, что один должен потянуть за ручку двери, а второй, в свою очередь, должен её толкнуть. Запишем эту игры в матричной форме:

первый игрок
Толкать Не толкать
второй игрок Тянуть 100; 100 0; 0
Не тянуть 0; 0 0; 0

Выпишем платёжную матрицу для первого игрока, в которой первая строка доминирует вторую:

В платёжной матрице второго игрока первый столбец доминирует второй:

В этой игре каждому из участников нет необходимости сообщать партнёру о своих намерениях. Если игроки абсолютно рациональны, то каждый из них выберет свою доминирующую стратегию, обеспечивающую наилучший исход для обоих игроков.

§2.2.3. Равновесие Нэша

Рассмотрим неантагонистическую игру двух лиц. с функциями выигрышей и Исход игры будем называть равновесным, если ни одному из участников не выгодно отклоняться от нёё в одностороннем порядке. Именной такой смысл понятию равновесие придал Джон Нэш. Запишем строгое определение равновесия по Нэшу.

Стратегии и называются стратегиями равновесными по Нэшу, если выполняются следующие неравенства:

(2.3)

Таким образом, равновесие Нэша характеризуется тем, что ни одному из участников не выгодно отклоняться от своей равновесной стратегии, если другой участник применяет стратегию, равновесную по Нэшу. Заметим, что это определение сохраняется и для игры с любым числом участников.

Пример. Найти равновесные по Нэшу стратегии в примере 2 (Таблица 1).

Решение. Выпишем все возможные стратегии обоих участников в матрицу и отыщем для каждого из исходов альтернативные исходы, более предпочтительные с точки зрения одного из игроков:

В игре имеется два равновесия по Нэшу . Как правило, равновесие по Нэшу не является единственным.

Существуют игры, в которых нет равновесия в чистых стратегиях. Кроме равновесия в чистых стратегиях случае, может существовать равновесие Нэша в смешанных стратегиях.

Смысл смешанной стратегии для биматричной игры будем определять так же, как и для матричных игр. Смешанная стратегия первого и второго участников есть соответственно вектора X={x1, x2,…xm} и Y={y1, y2,…, yn}, где и (2.4)

Множества смешанных стратегий будем обозначать так же, как множества чистых стратегий – Sx для 1-го игрока и Sy для 2-го.

Функции выигрышей первого и второго игроков при смешанных стратегиях X и Y определяются по формулам

Η1(x,y)=∑aijxiyj, Η2(x,y)=∑bijxiyj (2.5)

Равновесные по Нэшу смешанные стратегии будем обозначать X* и Y* соответственно. Вопрос существования равновесия по Нэшу решается следующей теоремой, доказанной Дж. Нэшем.

Теорема о равновесии по Нэшу. В любой биматричной игре существует, по крайней мере, одно равновесие Нэша. (Без доказательства).

Замечание. Это могут быть равновесия в чистых или смешанных стратегиях.

В общем случае биматричной игры нахождение смешанных равновесий является сложной задачей, но для матриц размера 2x2 решение в смешанных стратегиях найти несложно.

Рассмотрим биматричную игру, в которой каждый игрок имеет две чистые стратегии. Смешанные стратегии игроков будем обозначать x={x1, x2} и y={y1, y2} соответственно, где 0≤xi≤1, 0≤yj≤1, x1+x2=1, y1+y2=1. Обозначая элементы платежных матриц 1-го и 2-го игроков aij и bij соответственно, получим Таблицу3 и Таблицу 4 для расчета функций выигрыша.

Таблица3 Таблица 4

y1 y2
x1 a11 a 12
x2 a 21 a 22
y1 y2
x1 b11 b 12
x2 b 21 b 22

Функция выигрыша 1-го игрока будет равна

Η1(x,y)= x1(a11 y1+ a 12 y2)+ x2(a 21 y1+ a 22 y2),

подставляя x2=1- x1 и y2=1- y1, получим

Η1(x,y)= x1(y1(a11+ a 22- a 12-a 21)+ a 12-a 22)+ y1(a 21- a 22)+ a 22.

Обозначим x*={x1*, x2*} и y *={ y 1*, y 2*} равновесные по Нэшу стратегии игроков и найдем функцию выигрыша 1-го игрока, при условии, что 2-й игрок применит равновесную по Нэшу стратегию y*, а 1-й игрок применит произвольную смешанную стратегию x

Η1(x,y*)= x1(y1*(a11+ a 22- a 12-a 21)+ a 12-a 22)+ y1*(a 21- a 22)+ a 22. (2.6)

Если 2-й игрок применит равновесную по Нэшу стратегию y*, и 1-й игрок применит равновесную по Нэшу стратегию x*, то функция выигрыша 1-го игрока будет равна

Η1(x*,y*)= x1*(y1*(a11+ a 22- a 12-a 21)+ a 12-a 22)+ y1*(a 21- a 22)+ a 22. (2.7)

Согласно определению равновесия по Нэшу для всех смешанных стратегий x должно выполняться неравенство

Η1(x*,y*)≥ Η1(x,y*). (2.8)

Подставляя в неравенство Η1(x*,y*)- Η1(x,y*)≥0 функции из уравнений (4) и (5), получим неравенство

(x1*- x1)( y1*(a11+ a 22- a 12-a 21)+ a 12-a 22) ≥0, (2.9)

которое должно выполняться для всех значений x1 из отрезка [0;1].

Интерес представляет случай, когда равновесная по Нэшу стратегия x* не совпадает ни с одной чистой стратегией, то есть, когда x1* удовлетворяет строгому неравенству 0< x1*<1. В этом случае неравенство (2.9) будет верно для всех x1 из отрезка [0;1] тогда и только тогда, когда

y1*(a11+ a 22- a 12-a 21)+ a 12-a 22=0. (2.10)

Уравнение (2.10) дает значение y1*, при котором существует смешанная стратегия x*, не совпадающая с чистыми стратегиями 1-го игрока.

Аналогично, для всех смешанных стратегий y 2-го игрока должно выполняться неравенство

Η2(x*,y*)≥ Η2(x*,y) (2.11)

Определяя функции Η2(x*,y) и Η2(x*,y*) из таблицы 2, получим условие, при котором 2-й игрок имеет равновесную смешанную стратегию y*. не совпадающую с его чистыми стратегиями

x 1*( b 11+ b 22- b 12- b 21)+ b 21- b 22=0. (2.12)

Если уравнения (2.10) или (2.12) не имеют решений на отрезке [0;1], то в игре существуют только равновесия в чистых стратегиях, существование которых непосредственно следует из неравенств (2.9) и аналогичного неравенства для 2-го игрока.

Пример. Отыскать равновесие Нэша в чистых, либо смешанных стратегиях в игре «орёл-решка».

Таблица 5

первый игрок
орёл решка
второй игрок орёл 1; -1 -1; 1
решка -1; 1 1; -1

Решение. Запишем матрицу игры:

Таблица 6

Очевидно, что равновесия по Нэшу в чистых стратегиях не существует. Будем искать решение в смешанных стратегиях x={x1, x2} и y={y1, y2} соответственно, где 0≤xi≤1, 0≤yj≤1, x1+x2=1, y1+y2=1. Найдем функцию выигрыша 1-го игрока

Η1(x,y)= x1y1- x1y2- x2y1+ x2y2= 4x1y1-2 x1-2y1+1= x1(4y1-2) -2y1+1.

Для равновесных по Нэшу стратегий x*={x1*, x2*} и y*={ y 1*, y 2*} найдем значение функции выигрыша будет равно

Η1(x*,y*)= x1*(4y1*-2) -2y1*+1

Если 2-й игрок применит равновесную по Нэшу стратегию y*, а 1-й игрок произвольную смешанную стратегию x, то функция выигрыша 1-го игрока составит значение

Η1(x,y*)= x1 (4y1*-2) -2y1*+1.

Из условия равновесия Η1(x*,y*)≥ Η1(x,y*) следует неравенство

(x1*- x1) (4y1*-2) ≥0

для всех x1 из отрезка [0;1]. Поскольку в игре нет равновесия в чистых стратегиях, то x1*≠0 и x1*≠1, то множитель (x1*- x1) может быть и положительным и отрицательным в зависимости от x1. Следовательно, последнее неравенство выполняется лишь при условии, что второй множитель равен нулю, то есть 4y1*-2=0. Откуда находим y 1*=0,5 и y 2*=0,5.

Аналогично находим равновесную по Нэшу стратегию 1-го игрока x1*= x2*=0,5. Значения игры для 1-го и 2-го игроков равны Η1(x*,y*)= Η2(x*,y*)=0,5.

Пример. «Семейный спор». Муж и жена собираются провести вместе выходной день. Муж предпочитает пойти на футбол, а жена на балет. Выигрыши мужа и жены в зависимости от принятых стратегий приведены в таблице:

Таблица 7

жена
Футбол балет
муж футбол 2; 1 0,5; 0,5
балет 0; 0 1; 2

Решение. Выпишем общую матрицу игры.

В этой игре существует два равновесия Нэша в чистых стратегиях. Кроме того, можно показать, что существует равновесие Нэша и в смешанных стратегиях. Для этого найдем платежную функцию 1-го игрока (мужа) для смешанных стратегий x={x1, x2} и y={y1, y2}.

Η1(x,y)=2x1y1+0,5 x1y2+x2y2=1,5 x1y1-0,5 x1+ y1-1= x1(2,5 y1-0,5) +1- y1.

Соответственно получаем

Η1(x*,y*)- Η1(x,y*)=(x1*- x1) (2,5y1*-0,5).

Неравенство Η1(x*,y*)≥ Η1(x,y*) будет верно для всех x1 из отрезка [0;1] и 0< x1*<1, если 2,5y1*-0,5=0, откуда y 1*=1/5 и y 2*=4/5.

Аналогично, для 2-го игрока (жены) получаем платежную функцию

Η2(x,y)= x1y1+0,5 x1y2+2x2y2=2,5x1y1-2y1-1,5x1+2.

Тогда Η2(x*,y*)- Η2(x*,y)=( y1*- y1) (2,5 x 1*-2).

Неравенство Η2(x*,y*)≥Η2(x*,y) будет верно для равновесной смешанной стратегии y*={y1*,y2*} и произвольной стратегии y={y1, y2} при условии, что 2,5x1*-2=0, откуда находим x1*=4/5, x2*=1/5 (муж выбирает футбол с вероятностью 4/5 и балет с вероятностью 1/5).

Аналогично находим y 1*=1/5, y 2*=4/5. Функции выигрыш игроков в смешанном равновесии будут равны Η1(x*,y*)= Η2(x*,y*)=4/5.

§2.2.4. Эффективность по Парето[2]

Если интересы игроков не противоположны, то в игре могут существовать исходы, один из которых предпочтительнее других с точки зрения всех игроков. Рассмотрим уже известный пример «Дилемма заключенных».

Пример. «Дилемма заключённых» (см §1.1).

Таблица 8

первый заключ.
сознаваться не сознаваться
второй заключ. сознаваться -5; -5 -1; -10
не сознаваться -10; -1 -2; -2

Решение. Выпишем матрицу игры и найдём равновесие по Нэшу.

Таблица 9

Равновесный по Нэшу исход (-5; -5) является менее выгодным для обоих участников, чем (-2; -2). Если бы игроки могли договориться, то они отказались бы от своих равновесных стратегий, чтобы перейти к более эффективному для каждого из них исходу (-2;-2).

Принцип эффективности по Парето позволяет сравнивать исходы игры попарно, пользуясь следующим определением.

Исход 1 называют более эффективным по Парето исходом, чем исход 2, если, переходя от исхода 2 к исходу 1, увеличивается выигрыш хотя бы одного игрока, а выигрыши других игроков, по крайней мере, не уменьшаются. В этом случае говорят, что исход 1 доминирует по Парето исход 2.

В биматричной игре доминирование по Парето исхода (l;k) над исходом (p;q) означает, что - либо верны неравенства alk> apq и blk≥ bpq, либо верны неравенства blk> bpq и alk≥ apq.

Если в игре существует исход, который доминирует по Парето все остальные исходы, то его называют Парето-оптимальным исходом. Легко проверить, что Парето-оптимальный исход, если он существует, является равновесным по Нэшу.

В рассмотренных выше примерах нет Парето-оптимальных исходов, но есть исходы, доминируемые по Парето всеми другими исходами. Например, в игре «Семейный спор» это исход (0;0).

Исходы, равновесные по Нэшу, могут быть не эффективными по Парето, и наоборот, что мы видим в примере «Дилемма заключенных». Наличие в игре Парето-оптимального исхода, или наличие исхода, доминируемого по Парето всеми другими исходами, создают предпосылки для выработки игроками совместных решений, то есть для создания коалиций. Однако, даже в случае бескоалиционной игры, игроки, как мы покажем в следующей лекции, имеют возможности избежать невыгодных для всех исходов.


3156329155715750.html
3156369644258139.html
    PR.RU™