Какво представлява дилемата на затворниците?

В самата игра наказанията (и наградите, където е уместно) са представени от полезност номера. Положителните числа представляват добри резултати, отрицателните числа представляват лоши резултати и един резултат е по-добър от друг, ако числото, свързано с него, е по-голямо. (Внимавайте обаче как става това за отрицателни числа, тъй като -5 например е по-голям от -20!)

В таблицата по-горе първото число във всяко поле се отнася до резултата за играч 1, а второто число представя резултата за играч 2. Тези числа представляват само един от многото набори от числа, които съответстват на дилемата на затворниците.

След като играта бъде дефинирана, следващата стъпка в анализа на играта е да оцените стратегиите на играчите и да се опитате да разберете как е вероятно играчите да се държат. Икономистите правят няколко предположения, когато анализират игрите - първо предполагат, че и двамата играчи са наясно изплащанията както за себе си, така и за другия играч, и, второ, те приемат, че и двамата играчи търсят да се рационално максимизират собственото си изплащане от играта.

instagram viewer

Един лесен първоначален подход е да се търси онова, което се нарича доминиращи стратегии- стратегии, които са най-добри, независимо каква стратегия е избрал другият играч. В горния пример изборът на признание е доминираща стратегия и за двамата играчи:

Като се има предвид, че изповедта е най-подходяща за двамата играчи, не е изненадващо, че изходът, при който и двамата играчи признават, е равновесен резултат от играта. Това каза, че е важно да бъдем малко по-прецизни с нашата дефиниция.

Концепцията за a Равновесие на Наш е кодифициран от математика и теоретик на играта Джон Наш. Най-просто казано, равновесието на Наш е набор от най-добри стратегии за реагиране. За игра на двама играчи равновесието на Наш е резултат, при който стратегията на играч 2 е най-добрият отговор на стратегията на играч 1, а стратегията на играч 1 е най-добрият отговор на стратегията на играч 2.

Намирането на равновесието на Наш чрез този принцип може да бъде илюстрирано в таблицата на резултатите. В този пример най-добрите отговори на играч 2 на играч 1 се кръжат в зелено. Ако играч 1 признае, най-добрият отговор на играч 2 е да признае, тъй като -6 е по-добър от -10. Ако играч 1 не признае, най-добрият отговор на играч 2 е да признае, тъй като 0 е по-добър от -1. (Обърнете внимание, че това разсъждение е много подобно на разсъжденията, използвани за идентифициране на доминиращи стратегии.)

Най-добрите отговори на играч 1 са кръгли в синьо. Ако играч 2 признае, най-добрият отговор на играч 1 е да признае, тъй като -6 е по-добър от -10. Ако играч 2 не се изповяда, най-добрият отговор на играч 1 е да признае, тъй като 0 е по-добър от -1.

Равновесието на Наш е резултатът, когато има и зелен кръг, и син кръг, тъй като това представлява набор от най-добри стратегии за реакция и за двамата играчи. Като цяло е възможно да има множество равновесие на Nash или изобщо няма такива (поне в чисти стратегии, както са описани тук).

Може би сте забелязали, че равновесието на Наш в този пример изглежда неоптимално по някакъв начин (по-специално с това, че не е оптимално Pareto), тъй като е възможно и двамата играчи да получат -1 а не -6. Това е естествен резултат от взаимодействието, присъстващо в играта - на теория, не признаването би било преимущество оптимална стратегия за групата колективно, но индивидуалните стимули предотвратяват този резултат постигнати. Например, ако играч 1 мислеше, че играч 2 ще мълчи, той ще има стимул да го изкара, а не да мълчи, и обратно.

Поради тази причина равновесието на Наш може също да се разглежда като резултат, при който никой играч няма стимул да едностранно (т.е. от себе си) да се отклони от стратегията, довела до този резултат. В горния пример, след като играчите решат да признаят, нито един от играчите не може да се справи по-добре, като промени мнението си от себе си.