Dylemat więźnia

Dylemat Więźnia to gra stara jak… jak coś mniej więcej sześćdziesięcioletniego.

Wersja oryginalna, pochodząca z 1950 roku, mówi:

Jest dwóch podejrzanych o wspólnie popełnione ciężkie przestępstwo. Trafiają do osobnych pokojów przesłuchań, gdzie każdy z nich dostaje od policjantów następującą „ofertę”: jeżeli będziesz zeznawać przeciwko kumplowi, a kumpel będzie milczał, to wyjdziesz na wolność, a kumpel dostanie dziesięć lat więzienia. Jeżeli obydwaj będziecie zeznawać przeciw drugiemu, dostaniecie po pięć lat więzienia. Jeżeli zaś żaden z was nie wsypie kumpla, obydwaj traficie do pudła tylko na pół roku (za inne przewinienia).

Wersja „nowoczesna” gry brzmi tak: jeżeli obaj zdradzą, dostają po punkcie. Jeżeli jeden zdradzi, a drugi nie, to zdradzający dostaje pięć punktów, a zdradzony – zero. Jeżeli zaś żaden nie zdradzi, wówczas obydwaj dostają po trzy punkty.

Niezależnie od tego, którą wersję gry weźmiemy pod uwagę, okazuje się, że – chociaż milczenie obydwu więźniów daje najlepszy wynik z punktu widzenia grupy (obaj odsiedzą po pół roku, czyli nie tak źle, biorąc pod uwagę, że fest nabrolil) – że bardziej „opłaca się” zdradzić i wsypać kumpla.

Dlaczego?

Proste: jeżeli kumpel będzie milczał, wsypując go skracam sobie wyrok z pół roku do zera. Jeżeli zaś kumpel zezna przeciwko mnie, zrobienie tego samego skróci mój wyrok z dziesięciu lat do pięciu. Tym samym przy pojedynczej rozgrywce zawsze będzie tak, że obydwaj zdradzą, i w efekcie pójdą siedzieć na pięć lat. Ewentualnie dostają po jednym punkcie, chociaż mogliby dostać po trzy punkty, gdyby współpracowali ze sobą (czyli milczeli).

A co, jeżeli zamiast pojedynczej gry przeprowadzimy między tymi samymi dwoma graczami ciąg gier? Pięć, pięćdziesiąt, tysiąc? Nie będziemy ich po każdej grze wsadzać do więzienia, ale będziemy liczyć punkty. Czy istnieje jakaś strategia dająca nam w dłuższej perspektywie szansę ugrania większej ilości punktów, niż nasz przeciwnik?

A co, jeżeli graczy będzie więcej? Wyobraźmy sobie stu graczy rozgrywających wielki turniej w Dylemat Więźnia. Kto zgromadzi najwięcej punktów?

A co, jeżeli taki turniej wzbogacimy o możliwość dodawania nowych graczy? A co, jeżeli wprowadzimy eliminowanie graczy, którzy po pewnej określonej liczbie rund nie uzyskali pewnego, z góry założonego, minimum punktów?

Z prostej gry robi się z tego nagle całkiem interesująca symulacja, w której różne strategie mogą przynosić różne efekty; symulacja, w której niektóre strategie będą eliminowane przez inne. Być może trzeba będzie mutować (zmieniać strategię gry), żeby przetrwać dłużej. Być może warto będzie podjąć próbę rozpoznania strategii przeciwnika, żeby lepiej dopasować własną? I tak dalej.

Zasadniczo najpewniejszą strategią jest Oko Za Oko, czyli: w pierwszej rundzie współpracujemy, a w każdej następnej powtarzamy ruch przeciwnika. W efekcie zawsze doprowadzimy grę do okolic remisu i to niezależnie od tego, jakiej strategii użyje przeciwnik.

Jednak jeżeli wszyscy będą grać Oko Za Oko, zrobi się nudno. A więc prędzej czy później gracze zaczną kombinować, jak by tu uzyskać przewagę.

Jedna z ciekawszych strategii turniejowych, wymagająca jednak współpracy (a więc w turnieju musi wziąć udział grupa zawodników, którzy się wcześniej dogadali), wygląda tak:

Wyobraźmy sobie turniej, w którym pierwsze miejsce jest nagrodzone jakąś Dużą Kasą. Milion dolarów, czy coś w tym stylu.

Turniej działa na zasadzie „każdy z każdym” – każdy z uczestników gra po dziesięć partii przeciwko każdemu z pozostałych uczestników.

Wyobraźmy sobie teraz, że kilka osób dogaduje się ze sobą, nazywają swoją grupę Grupa G i dzielą się na dwie podgrupy: Przegranych i Wygranych. Jeżeli Przegrany trafi podczas turnieju na Wygranego, będzie mu się tak podkładał, żeby zmaksymalizować zysk Wygranego, czyli będzie zawsze współpracował – a Wygrany będzie zawsze zdradzał, dzięki czemu w każdej rundzie Wygrany ugra maksymalną ilość (pięć punktów).

Jeżeli Przegrany trafi na przeciwnika spoza Grupy G, będzie zawsze zdradzał, żeby zminimalizować zysk tamtego. Natomiast Wygrany, grając z przeciwnikiem spoza Grupy G, przyjmie strategię Oko Za Oko, czyli remisową – dostaną na koniec mniej więcej po tyle samo punktów.

W ten sposób okaże się, że pierwsze miejsca w turnieju będą obsadzone Wygranymi z Grupy G. Zwycięzca inkasuje nagrodę, dzieli się nią się po równo z resztą Grupy G, jest fajnie.

Z innej beczki, okazuje się, że Dylemat Więźnia ma bardzo dużo wspólnego z procesami zachodzącymi w prawdziwych społeczeństwach.

  1. Podatki. Jeżeli wszyscy płacą podatki, jest fajnie. Jeżeli pojedyncze osoby przestaną płacić podatki, wówczas”wygrywają”, bo zostaje im więcej kasy w kieszeni. Jeżeli jednak wszyscy przestaną płacić podatki, wtedy system się sypnie.
  2. Wyścig zbrojeń: dwa mocarstwa zbroją się, starając się zdobyć przewagę militarną nad tym drugim. Inwestują przez to coraz więcej pieniędzy w zbrojenia, bo przeciwnik prawdopodobnie robi to samo. Wszyscy lepiej wyszliby na zaprzestaniu wyścigu, ale jeżeli tylko jeden z graczy zatrzyma wyścig zbrojeń, drugi zdobędzie ogromną przewagę. W efekcie społeczeństwa cierpią, bo większość kasy idzie cały czas na dozbrajanie się.
  3. Kolarstwo. Jeżeli dwóch kolarzy wyprzedzi peleton, mogą współpracować (a więc, zmieniać się na pozycji prowadzącego, która wymaga więcej wysiłku), i wtedy obydwaj dotrą do mety w miarę równocześnie (jeden wprawdzie dostanie złoto, drugi srebro, ale obaj będą daleko przed resztą peletonu); mogą też unikać współpracy, ale wtedy dogoni ich peleton. Jeżeli tylko jeden będzie współpracował, a drugi jechał tuż za nim, to ten współpracujący przegra, bo w końcu tak się zmęczy, że nie tylko nie wygra złotego medalu, ale prawdopodobnie zostanie też prześcignięty przez czołówkę peletonu i w efekcie nic nie wygra.

Jak widać zagadnienie, chociaż oparte na trywialnych regułach, jest summa summarum dość mocno rozbudowane (zapewniam, że w dzisiejszym wpisie zaledwie musnąłem wierzchołek góry lodowej, temat jest o wiele szerszy).

Dobranoc.

Autor: xpil

Po czterdziestce. Żonaty. Dzieciaty. Komputerowiec. Krwiodawca. Emigrant. Rusofil. Lemofil. Sarkastyczny. Uparty. Mól książkowy. Ateista. Apolityczny. Nie oglądam TV. Uwielbiam matematykę. Walę prosto z mostu. Gram na paru instrumentach. Lubię planszówki. Słucham bluesa, poezji śpiewanej i kapel a’capella. || Kliknij tutaj po więcej szczegółów ||

Dodaj komentarz

Bądź pierwszy!

Powiadom o
avatar
wpDiscuz