WikiSort.ru - Не сортированное

ПОИСК ПО САЙТУ | о проекте
Равновесие дрожащей руки
Концепция решения в теории игр
Связанные множества решений
Надмножества Равновесие Нэша
Подмножества Собственное равновесие
Факты
Авторство Рейнхард Зельтен

Равновесие дрожащей руки (англ. trembling hand perfect equilibrium) — принцип оптимальности в некооперативных играх, представляющий собой равновесие Нэша, обладающее дополнительным свойством устойчивости к достаточно малым отклонениям игроков от равновесных стратегий. Сформулировано Р. Зельтеном в 1975 г. в работе[1].

Формальное определение

Пусть задана игра в нормальной форме . Набор смешанных стратегий игроков q называется равновесием дрожащей руки, если существует такая последовательность вполне смешанных стратегий {pε} → q, что стратегия qi является наилучшим ответом игрока i на стратегии остальных игроков из набора pε.

Как и равновесие Нэша, равновесие дрожащей руки существует в смешанном расширении в любой некооперативной игре с конечными множествами стратегий игроков.

Пример

Приведенная в таблице игра двух лиц отображенная в нормальной форме имеет два равновесия Нэша: (Верх, Лево) and (Низ, Право). Однако, только (В, Л) является равновесием дрожащей руки.

Лево Право
Верх 1, 1 2, 0
Низ 0, 2 2, 2


Соотношение равновесных концепций решения. Стрелками обозначено направление от рафинирований к менее требовательным концепциям

Действительно, предположим, что игрок 1 использует смешанную стратегию , для некоторого . Ожидаемый выигрыш игрока 2, если он играет Лево, составит:

.

Ожидаемый выигрыш игрока 2 при выборе стратегии Право составит:

.

Для достаточно малых значений ε, игрок 2 максимизирует свой ожидаемый выигрыш, используя стратегию Право с минимальным весом. Аналогично, игрок 1 должен использовать с минимальным весом стратегию Низ, если игрок 2 использует смешанную стратегию . Следовательно, (В, Л) является равновесием дрожащей руки.

Аналогичные рассуждения не выполняются для профиля стратегий (Н, П). Действительно, предположим, что игрок 1 использует смешанную стратегию . Ожидаемый выигрыш игрока 2, если он использует Л, составит:

.

Ожидаемый выигрыш игрока 2 при использовании стратегии П:

.

В этом случае для любых положительных значений ε, игрок 2 максимизирует свой ожидаемый выигрыш, используя П с минимальной частотой. Следовательно, (Н, П) не является равновесием дрожащей руки, так как при небольшой вероятности ошибок игрок 2 максимизирует свой ожидаемый выигрыш, отклоняясь от данной стратегии.

Ссылки

  1. Selten, R. (1975). “A reexamination of the perfectness concept for equilibrium points in extensive games”. International Journal of Game Theory. 4: 25–55.

Литература

  • Зелтен, Р., Харшаньи, Д. Общая теория выбора равновесия в играх. — СПб.: Экономическая школа, 2001.
  • Печерский, С. Л., Беляева, А. А. Теория игр для экономистов. Вводный курс. (Учебное пособие) — СПб.: Изд-во Европейского университета, 2001.
  • Selten, R. Evolutionary stability in extensive two-person games // Math. Soc. Sci. — 1983. — Vol. 5. — P. 269—363.
  • Selten, R. Evolutionary stability in extensive two-person games — correction and further development // Math. Soc. Sci. — 1988. — Vol. 16. — P. 223—266.

Данная страница на сайте WikiSort.ru содержит текст со страницы сайта "Википедия".

Если Вы хотите её отредактировать, то можете сделать это на странице редактирования в Википедии.

Если сделанные Вами правки не будут кем-нибудь удалены, то через несколько дней они появятся на сайте WikiSort.ru .




Текст в блоке "Читать" взят с сайта "Википедия" и доступен по лицензии Creative Commons Attribution-ShareAlike; в отдельных случаях могут действовать дополнительные условия.

Другой контент может иметь иную лицензию. Перед использованием материалов сайта WikiSort.ru внимательно изучите правила лицензирования конкретных элементов наполнения сайта.

2019-2024
WikiSort.ru - проект по пересортировке и дополнению контента Википедии