Teoria gier w praktyce. Równowaga Nasha, optimum Pareto, dylemat więźnia, gry Blotto

Teoria gier w praktyce - równowaga Nasha, dylemat więźnia, gry Blotto

Gry najczęściej kojarzą się nam albo z ekranem komputera lub telewizora, albo z planszą na kawałku papieru lub tektury. Mało kto wie, że pod tym słowem kryją się dużo bardziej skomplikowane procesy niż rzucanie kostką czy zabijanie potworów. W poniższym artykule przedstawimy podstawy teorii gier oraz pokażemy, jak wielki wpływ ma ona na nasze codziennie życie.

Gry zmieniają świat

Zdaniem prof. Roberta Aumanna, noblisty w dziedzinie ekonomii z 2005 roku, wszystko, co się dzieje na świecie, jest grą. Od ewolucji po wojny. W tym sensie tylko gry zmieniają świat. W zasadzie każda decyzja, którą podejmujemy, jest swego rodzaju grą. Wsiadając do autobusu, możemy skasować bilet lub nie – gramy z pracownikami komunikacji miejskiej. Jeśli zamiast autobusu wybierzemy rower lub samochód, rozpoczyna się gra z innymi uczestnikami ruchu. To bardzo trywialne przykłady, ale wyraźnie pokazujące, że na każdym etapie życia bierzemy udział w bardzo małej grze, a zazwyczaj w ogromnej ich liczbie równocześnie.

Tego typu zagadnieniami – oczywiście na poziomie bardziej abstrakcyjnym niż kasowanie biletu w autobusie – zajmuje się dział matematyki zwany teorią gier. Gry w znaczeniu matematycznym nie są jednak tożsame z grami w rozumieniu potocznym – choć w wielu przypadkach pokrywają się ze sobą.

Elementy składowe teorii gier

Aby rozmawiać o elementach składowych teorii gier, najpierw należy wytłumaczyć, czym właściwie jest gra.

Grą możemy nazwać każdą sytuację konfliktową, w której bierze udział co najmniej dwóch graczy (osoby, przedsiębiorstwa, grupy osób, programy komputerowe itd.), między którymi zachodzi interakcja – a więc rezultat decyzji jednego gracza jest zależny od decyzji pozostałych. Jeśli gracz jest tylko jeden, mówimy o problemie decyzyjnym.

Wyobraźmy sobie dwie osoby spotykające się w restauracji. Jeśli każda z nich płaci wyłącznie za siebie, nie ma interakcji (niezależnie ile zamówi druga osoba, my płacimy zawsze tyle samo), a więc mamy do czynienia z dwoma niezależnymi problemami decyzyjnymi. Jeśli jednak wcześniej umówiono się, że rachunek jest dzielony na połowę, zachodzą warunki dla zaistnienia gry. Od tego, ile zapłacimy, zależy zarówno wartość naszego zamówienia, jak i zamówienia drugiej osoby.

Na każdą grę składają się:

  • gracze (np. dwie osoby w restauracji),
  • reguły (np. gracze zamawiają dania w restauracji, a rachunek płacą po połowie),
  • strategie – zbiór ruchów, które może wykonać każdy gracz (np. zamówienie albo niezamówienie dania),
  • wyniki (np. zapłacenie więcej lub mniej niż wartość naszego zamówienia),
  • wypłata – korzyść dla gracza z osiągnięcia danego wyniku (np. chcemy się najeść kosztem drugiej osoby, więc wypłata będzie wyższa, jeśli zapłacimy mniej niż wyniosła wartość naszego zamówienia); wypłaty, zwłaszcza w grach dwuosobowych, najczęściej przedstawia się w postaci tabeli lub macierzy.
 Opłata za rachunekAnia = TomekAnia < TomekAnia > Tomek
Ania1, 12, 00, 2
Tomek1, 10, 22, 0

Dwa z tych elementów – gracze oraz strategie – zasługują na nieco dłuższe omówienie ze względu na pewne właściwości, kluczowe dla teorii gier i późniejszych studiów przypadku.

Gracze

Podstawowym założeniem teorii gier jest to, że gracze (zwani również agentami) zachowują się w sposób racjonalny, tj. dążą do maksymalizacji swoich wypłat. Co za tym idzie, są w stanie określić możliwe wyniki w grze, jak i decyzje, które prowadzą do tych wyników. Każdy gracz posiada również preferencje, które warunkują wysokość wypłaty dla określonego wyniku. Na przykładzie restauracji:

  • gracz A może być niesamowicie bogaty, w związku z czym jest mu w zasadzie obojętne, ile ostatecznie wyniesie rachunek (wypłata w każdym przypadku będzie prawie identyczna);
  • gracz B może być bardzo głodny, w związku z czym chce się jak najwięcej najeść (im więcej dań zamówi, tym większa będzie jego wypłata).

W takim przypadku, skoro gracze są racjonalni, gracz B zamówi wszystkie możliwe dania z karty, natomiast gracz A – średnio co drugie danie (skoro nie posiada preferencji, zgodnie z rachunkiem prawdopodobieństwa możemy założyć, że połowę dań zamówi, a połowy nie).

Strategia

Strategią określamy plan działania gracza opisujący jego zachowanie w każdej możliwej sytuacji. Innymi słowy jest to zestaw ruchów, które dany gracz wykona, jeśli wystąpi konkretna sytuacja (np. jeśli trzy razy z rzędu wypadła reszka, to przy czwartym rzucie monetą gracz wybiera orła; w innym przypadku – wybiera reszkę). Wyróżniamy strategie mieszane i czyste:

  • strategie mieszane – oznaczają, że każdemu wyborowi przyporządkowane jest prawdopodobieństwo, z którym gracz dokona danego wyboru (np. przy rzucie monetą gracz w połowie przypadków – prawdopodobieństwo 0,5 – wybiera orła, a w połowie – reszkę);
  • strategie czyste – to szczególny przykład strategii mieszanej, w której gracz zawsze dokonuje tylko jednego, określonego wyboru (np. gracz wybiera orła w 100% przypadków – prawdopodobieństwo 1).

W grach, w których gracze wykonują ruchy po kolei i znają je, jeśli istnieje strategia optymalna, to istnieje optymalna strategia czysta. Z kolei w każdej grze o sumie stałej istnieje optymalna strategia mieszana – jeśli jest ich więcej, dają one średnio taki sam wynik.

Przykładowo: w grze w kółko i krzyżyk dowolny gracz może doprowadzić co najmniej do remisu, odpowiadając na określony ruch przeciwnika zawsze tym samym ruchem (np. jeśli przeciwnik postawił X w środkowym polu, należy zawsze postawić O w polu narożnym). Strategia optymalna jest więc strategią czystą. W grze w papier, kamień, nożyce strategią optymalną jest z kolei wybór każdej z trzech opcji z prawdopodobieństwem 1/3.

Strategie dzielimy również według stopnia dominacji:

  • strategie (silnie) dominujące to takie, które są zawsze nie gorsze (lepsze) od jakiejś innej strategii, niezależnie od jej wyboru przez przeciwnika;
  • strategie (silnie) zdominowane to, analogicznie, takie, które są zawsze nie lepsze (gorsze) od jakiejś innej strategii.

Jeśli jakaś strategia jest zdominowana, nie ma sensu jej rozpatrywać (ponieważ zawsze istnieje taka strategia, która da nie gorszy wynik). W ten sposób – odrzucając po kolei strategie zdominowane u każdego z graczy – możemy znaleźć rozwiązania wielu prostych gier.

Klasyfikacja gier

Istnieje wiele cech, według których możemy dokonać podziału gier. Najczęściej spotykane klasyfikacje to:

  • według ilości graczy: gry dwuosobowe i wieloosobowe;
  • według charakteru gry: gry kooperacyjne (gracze dążą do tworzenia koalicji, które dadzą im lepszy wynik niż gra solo; np. koalicje parlamentarne) i niekooperacyjne (każdy gracz gra wyłącznie na własny rachunek);
  • według czasu (kolejności) podejmowania decyzji: gry w postaci strategicznej (normalnej; obaj gracze podejmują decyzje jednocześnie, bez wiedzy o ruchu przeciwnika; np. papier, kamień, nożyce) i gry w postaci ekstensywnej (rozwiniętej; gracze podejmują decyzje na przemian, znając swoje wcześniejsze ruchy; np. szachy);
  • według posiadanej wiedzy: gry o doskonałej informacji (gracz zna wszystkie zachodzące do tej pory wydarzenia włącznie z układem startowym; np. szachy) i o niedoskonałej informacji (gracz nie zna któregoś elementu; np. poker – brak informacji o układzie startowym); gry o kompletnej informacji (gracz zna funkcje wypłat wszystkich graczy oraz możliwe strategie; np. szachy) i o niekompletnej informacji (gracz nie zna funkcji wypłat lub strategii; np. aukcje – znamy wartość danego przedmiotu dla nas, ale nie wiemy, jak bardzo ceni go sobie inny uczestnik);
  • według zbioru dostępnych akcji: gry skończone (zbiór strategii każdego gracza jest skończony; np. papier, kamień, nożyce) lub nieskończone (np. gra dyktator);
  • według charakteru wypłat: gry o sumie stałej (w szczególności gry o sumie zerowej; sumy wypłat wszystkich graczy są identyczne dla każdego wyniku; np. kółko i krzyżyk) i gry o sumie zmiennej (sumy wypłat graczy różnią się w zależności od wyniku; np. dylemat więźnia).

Teoria gier najszerzej zajmuje się niekooperacyjnymi grami dwuosobowymi o sumie stałej. W dalszej części pokażemy jedną z takich gier, a także – dla równowagi – grę o sumie zmiennej.

Równowaga Nasha

Równowagą Nasha nazywamy taki stan w grze niekooperacyjnej, w którym zachodzą następujące warunki:

  • każdy gracz zna optymalne strategie innych graczy;
  • strategie pozostałych graczy są niezmienne;
  • żadna zmiana strategii danego gracza nie powoduje polepszenia jego sytuacji.

Prześledźmy prostą „grę z życia”:

Dwóch kierowców jedzie wąską drogą naprzeciw sobie. Aby uniknąć zderzenia, obaj decydują się na skręt w lewo lub w prawo. Oczekiwanym wynikiem (przyjmijmy wygraną o wartości 10) będzie oczywiście niedoprowadzenie do kolizji. Sytuacji odwrotnej przypiszemy wartość 0. Tabelę wypłat możemy więc przedstawić w następującej postaci:

Kierowca A / Kierowca BSkręt w lewoSkręt w prawo
Skręt w lewo10, 100, 0
Skręt w prawo0, 010, 10

Jakie decyzje może podjąć kierowca A? Ponieważ macierz wypłat jest symetryczna, analogiczne warunki zachodzą dla kierowcy B.

  • jeżeli założymy, że kierowca B skręca w lewo, kierowca A też musi skręcić w lewo – zmiana decyzji spowoduje pogorszenie jego sytuacji (spadek wygranej z 10 do 0);
  • analogicznie, jeżeli założymy, że kierowca B skręca w prawo, kierowca A też musi skręcić w prawo;

Gra ma więc dwie równowagi Nasha w strategiach czystych: kiedy obaj kierowcy skręcają w lewo oraz kiedy obaj kierowcy skręcają w prawo.

W tym przypadku równowaga Nasha pokazuje rozwiązanie optymalne w sensie Pareto (maksymalne wypłaty dla obu graczy). Jak się później okaże, nie jest to regułą.

W odniesieniu równowagi Nasha do strategii dominujących zachodzą następujące warunki:

  • jeśli istnieje strategia silnie dominująca dla danego gracza, będzie on stosował ją w każdej równowadze Nasha;
  • jeśli obaj gracze posiadają strategię silnie dominującą, gra ma tylko jedną równowagę Nasha;
  • strategia silnie zdominowana nigdy nie jest częścią równowagi Nasha.

Na podstawie życia Johna Nasha, twórcy konceptu równowagi w grach, powstała książka Sylvii Nasar „Piękny umysł”, zekranizowana następnie pod takim samym tytułem. Poniżej przedstawiamy scenę z filmu, pokazującą jeszcze jedno praktyczne zastosowanie równowagi Nasha:

W tym miejscu warto wspomnieć o niewidzialnej ręce wolnego rynku, która pośrednio wspominana jest w filmie, a opisaliśmy ją dokładnie w tym artykule.

Optimum Pareto

Optimum Pareto jest terminem ekonomicznym oznaczającym taki podział dóbr, że nie można poprawić sytuacji jednego podmiotu, nie pogarszając jednocześnie sytuacji pozostałych. Odnosząc to do teorii gier, jest to sytuacja, w której nie da się zwiększyć wygranej jednego gracza tak, by wygrane pozostałych nie spadły.

Wróćmy do przykładu z kierowcami, wprowadzając jedną modyfikację: załóżmy, że obaj gracze wolą wykonywać skręt w lewo niż w prawo. Tabela wypłat mogłaby wtedy wyglądać następująco:

Kierowca A / Kierowca BSkręt w lewoSkręt w prawo
Skręt w lewo10, 100, 0
Skręt w prawo0, 05, 5

Równowagi Nasha pozostają identyczne (żółte komórki), natomiast optimum Pareto osiągamy wyłącznie wtedy, gdy obaj kierowcy skręcą w lewo.

Idealną sytuacją byłoby, gdyby równowaga Nasha i optimum Pareto pokrywały się ze sobą. Mielibyśmy wtedy stabilne rozwiązanie gry, będące jednocześnie rozwiązaniem najbardziej korzystnym dla wszystkich stron.

Dylemat więźnia

Dylemat więźnia jest jednym z najczęściej opisywanych problemów w teorii gier. To klasyczny przykład gry dwuosobowej o sumie zmiennej – w zależności od strategii graczy, otrzymujemy różne wypłaty.

Dylemat więźnia przedstawia się następująco:

Dwóch podejrzanych zostało zatrzymanych przez policję. Ponieważ brak jest dowodów, mogą oni zostać skazani za mniejsze przewinienie na rok więzienia. Jednocześnie obaj dostają możliwość zachowania milczenia (współpracy ze sobą) albo zeznawania (zdradzenia) na następujących warunkach:

  • jeśli obaj zdradzą się nawzajem, dostaną 2 lata więzienia,
  • jeśli jeden z nich zdradzi, a drugi będzie współpracował, pierwszy wyjdzie na wolność, a drugi dostanie wyrok 3 lat (za większe przewinienie),
  • jeśli obaj będą współpracować, dostaną 1 rok więzienia (za mniejsze przewinienie).

Podejrzani nie mają ze sobą kontaktu, więc wzajemne decyzje poznają dopiero przy ogłoszeniu wyroku. Tabela wypłat dla dylematu więźnia wygląda następująco:

Podejrzany A / Podejrzany BWspółpracujZdradzaj
Współpracuj-1, -1-3, 0
Zdradzaj0, -3-2, -2

Wartości ujemne oznaczają, że wypłata jest de facto karą (bo tak należy rozpatrywać wyrok więzienia). Ważne jest (żeby gra spełniała warunki dylematu), aby zachodziły następujące nierówności:

zdrada gdy drugi współpracuje  > obopólna współpraca > obopólna zdrada > współpraca gdy drugi zdradza

Naturalnie jedynym celem każdego podejrzanego jest minimalizacja własnego wyroku. Jakie możliwości stoją przed podejrzanym A (ponieważ macierz jest symetryczna, analogicznie możemy rozpatrywać sytuację podejrzanego B)?

  • jeśli założymy, że podejrzany B będzie współpracował, podejrzany A może otrzymać wolność lub rok więzienia (odpowiednio jeśli zdradzi i jeśli będzie współpracował);
  • jeśli założymy, że podejrzany B będzie zdradzał, podejrzany A może otrzymać 2 albo 3 lata więzienia (odpowiednio jeśli zdradzi i jeśli będzie współpracował).

Niezależnie od decyzji podejrzanego B (której nie znamy), strategia „zdradzaj” zawsze przynosi podejrzanemu A wyrok o rok krótszy niż strategia „współpracuj”. Ponieważ identyczne warunki zachodzą dla podejrzanego B, zgodnie z logiką obaj podejrzani będą się zdradzać, ponieważ zapewnia im to krótszy wyrok. Strategią ściśle dominującą w grze jest więc „zdradzaj” dla obu graczy. Tak też wygląda jedyna równowaga Nasha dla dylematu więźnia (w tabeli oznaczona żółtym kolorem).

Co ciekawe, nie jest to rozwiązanie najlepsze dla obu podejrzanych – wspólna strategia „współpracuj” dałaby lepsze rezultaty (rok więzienia dla każdego z nich). Dylemat więźnia jest więc przykładem na to, że równowaga Nasha wcale nie musi być tożsama z optimum Pareto.

Dylemat więźnia równie często rozpatruje się też w postaci iterowanej – tzn. ci sami gracze grają ze sobą wielokrotnie, wybierając strategie na podstawie wcześniejszych rund. Jak się okazuje, gdy nie znamy długości gry, strategie altruistyczne (a więc oparte na współpracy) dają relatywnie lepsze wyniki w porównaniu ze strategiami egoistycznymi (opartymi na zdradzaniu). Za najlepszą strategię w iterowanym dylemacie więźnia uważa się jednak strategię wet za wet. Opiera się ona na dwóch zasadach: w pierwszej rundzie współpracujemy, a w kolejnych robimy to, co przeciwnik zrobił rundę wcześniej (a więc jeśli np. w drugiej rundzie zdradził, to w trzeciej my zdradzamy). W ten sposób zachowujemy się przyjaźnie (nie zdradzimy, dopóki nie zdradzi nas drugi gracz), ale natychmiast odpowiadamy na zdradę, choć jesteśmy skłonni wybaczać (jeśli przeciwnik współpracuje, my też będziemy).

Dylemat więźnia ma wiele analogii w rzeczywistym świecie. Za przykład z życia możemy uznać np. okres zimnej wojny. Zarówno wojska NATO jak i Układu Warszawskiego mogły wybrać zbrojenie się lub nie. Jeśli tylko jedna strona zdecydowałaby się na zbrojenia, zyskałaby wyraźną przewagę. Obustronne zbrojenia z kolei utrzymywały impas (żadna ze stron nie była dość silna, by zaatakować rywala), a jednocześnie podnosiły koszty produkcji i utrzymania arsenału. Gdyby obie strony zdecydowały się na brak zbrojeń, zachowałyby równowagę sił, nie ponosząc jednocześnie nadmiernych kosztów.

Gry Blotto

Gry Blotto są przykładem dwuosobowej gry o sumie zerowej, co oznacza, że suma wypłat jednego gracza jest dokładnie przeciwna sumie wypłat drugiego gracza. Nazwa gry wzięła się od fikcyjnego pułkownika Blotto, którego zadaniem było zoptymalizowanie rozmieszczenia n żołnierzy na N polach walki w ten sposób zgodnie z następującymi założeniami:

  • celem gry jest zdobycie jak największej liczby pól walki,
  • ten z graczy, który ma na danym polu więcej żołnierzy, zdobywa to pole,
  • gracze nie znają rozmieszczenia żołnierzy rywala przed ogłoszeniem wyniku.

Ponieważ w grach Blotto liczby n i N mogą przyjmować dowolne wartości dodatnie, równowaga Nasha oraz strategie optymalne nie są z góry określone.

Przeanalizujmy przykładową, prostą grę Blotto z podanymi regułami:

  • każdy gracz ma do dyspozycji 6 żołnierzy do ulokowania na 3 polach;
  • na każdym polu należy ulokować co najmniej jednego żołnierza;
  • na każdym następnym polu należy ulokować co najmniej tylu samo żołnierzy (tzn. na drugim polu musi ich być co najmniej tylu, co na pierwszym, a na trzecim – co najmniej tylu, co na drugim).

Daje to trzy możliwe strategie dla każdego gracza: (1, 1, 4), (1, 2, 3) oraz (2, 2, 2). Łatwo zauważyć, że:

  • dwie takie same strategie zawsze dają remis;
  • (1, 1, 4) przeciwko (1, 2, 3) daje remis;
  • (1, 2, 3) przeciwko (2, 2, 2) daje remis;
  • (2, 2, 2) przeciwko (1, 1, 4) daje zwycięstwo.

Optymalną strategią jest więc (2, 2, 2), ponieważ w najgorszym przypadku daje ona remis, a w najlepszym – zwycięstwo. To też jedyna strategia, która może zapewnić zwycięstwo. Nie jest to jednak jedyna równowaga Nasha dla tak skonstruowanej gry.

Jeśli zwycięstwu przypiszemy wynik 1, remisowi 0, a porażce -1, tabela wypłat przedstawiać się będzie następująco:

Pułkownik Blotto / Wrogi pułkownik(1, 1, 4)(1, 2, 3)(2, 2, 2)
(1, 1, 4)0, 00, 0-1, 1
(1, 2, 3)0, 00, 00, 0
(2, 2, 2)1, -10, 00, 0

Komórki, w których zachodzi równowaga Nasha, zaznaczone są żółtym kolorem.

Ponieważ (1, 1, 4) jest strategią zdominowaną (każda inna strategia daje wynik nie gorszy), możemy ją – zgodnie z wcześniej opisanym algorytmem postępowania – odrzucić. Pozostałe dwie strategie są względem siebie równorzędne – zmiana jednej na drugą nie zmienia wyniku. Przedstawiona gra ma więc cztery równowagi Nasha.

Im więcej żołnierzy i pól, tym więcej opcji (dla 3 pól i 8 żołnierzy mamy już 25 możliwych układów, dla 3 pól i 10 żołnierzy – 64, dla 3 pól i 13 żołnierzy – 196; 4 pola i 13 żołnierzy to 324 różne kombinacje), a co za tym idzie – tym trudniej znaleźć równowagi Nasha.

Gry Blotto uznaje się za metaforę rozgrywek wyborczych, zwłaszcza w systemie dwupartyjnym. Każdy potencjalny wyborca jest „polem bitwy” do zdobycia poprzez odpowiednie ulokowanie zasobów („żołnierzy”).

„Życie to gra” – praktyczne zastosowanie teorii gier

Jak wspomnieliśmy na początku, w zasadzie każda podejmowana przez nas decyzja – często nawet nieświadomie – jest jedną z setek rozgrywanych jednocześnie minigier.

Teorię gier można za to stosować w znacznie poważniejszych sprawach. Gry Blotto pokazują mechanizm działania kampanii wyborczych. Wspomniany Robert Aumann użył teorii gier do analizy Talmudu – jednej z podstawowych ksiąg judaizmu – rozwiązując m.in. problem podziału spadku zmarłego męża między jego trzy żony. Do teorii gier odniósł się także przy kwestii wycofania wojsk izraelskich ze Strefy Gazy (powołując się na paradoks szantażysty pokazał, że z matematycznego punktu widzenia jest to decyzja nierozważna strategicznie). Jego prace pomogły zastosować teorię do poszukiwania odpowiedzi na pytanie, dlaczego niektóre grupy, organizacje i kraje odnoszą sukcesy we współpracy, natomiast inne popadają w konflikty.

Z noblowską mową prof. Aumanna (w jęz. angielskim) można zapoznać się pod tym adresem.

Innym przykładem praktycznego zastosowania teorii gier jest mechanizm przetargów. Tak mówi o nim Aumann:

Wiadomo, jak wygląda przetarg. Jest jakieś sprzedawane dobro i kto chce je mieć, oferuje swoją cenę. Ten, kto dał najwięcej, wygrywa i płaci cenę, jaką zadeklarował. (…) Jeżeli zwycięzca płaci tyle, ile zadeklarował, to każdy oferuje najwyżej tyle, ile wart jest dla niego licytowany przedmiot. Nikt nie zaoferuje więcej, a większość kupujących oferuje mniej. Każdy woli kupić trochę taniej i dodatkowo zyskać. W rezultacie zwykle na przetargach sprzedaje się poniżej możliwej do uzyskania ceny.

Profesor proponuje jedną zmianę:

Organizujemy przetarg odrobinę inaczej. To znaczy, że w dalszym ciągu wygrywa ten, kto zaoferował najwięcej, ale nie płaci kwoty, którą zadeklarował, tylko mniejszą, którą zadeklarował następny w kolejności. (…) Wtedy większość kupujących oferuje przynajmniej tyle, ile wart jest dla nich licytowany przedmiot, a część oferuje więcej. Bo każdy zakłada, że w razie wygranej zapłaci mniej, niż zaproponował. (…) Nie tylko zwycięzca tak myśli, ale także ci, którzy składają oferty kolejne pod względem wielkości.

Zdaniem Aumanna może to spowodować podniesienie kwoty ostatecznej transakcji nawet o 20 procent. Problemem natomiast jest to, że w powszechnym rozumieniu nie pozwala to na maksymalizację przychodu z przetargu. Skoro ostateczną ceną jest ta zadeklarowana przez pierwszego przegranego, stwarza się wrażenie, że zyskaliśmy mniej, niż mogliśmy.

Teorię gier można również zastosować w systemach wyborczych, co do pewnego stopnia realizuje tzw. system australijski. Tworząc rząd na drodze głosowania preferencyjnego, otrzymujemy maksymalnie szeroką akceptację w skali całego społeczeństwa (swoistą równowagę Nasha – wszystkie grupy społeczne są choć trochę zadowolone z wyboru) zamiast silnego poparcia z jednej strony i równie silnej niechęci z drugiej.

W biologii, do analizy zachowań osobników walczących o terytorium, powszechnie stosuje się koncept gry w cykora (nieco zmodyfikowana wersja dylematu więźnia, w której najlepszą sytuacją jest, gdy gracze podejmują przeciwne decyzje). Na teorii gier opiera się wiele aspektów ewolucji (istnieje nawet pojęcie tzw. ewolucyjnej teorii gier) – np. samiec jednego z gatunków jaszczurek (Uta stansburiana) posiada trzy polimorficzne formy, które rywalizują ze sobą na zasadzie gry w papier, kamień, nożyce (każda forma jest jednocześnie „lepsza” od jednej z pozostałych i „gorsza” od drugiej). Zachowania stadne (np. wybór między samotnym polowaniem na mniejszą ofiarę i polowaniem stadnym na większą, której nie da się upolować samodzielnie) określa z kolei gra w jelenia (kolejny wariant dylematu więźnia, w którym istnieją dwie równowagi Nasha – kiedy obaj gracze razem polują na ofiarę mniejszą lub razem polują na ofiarę większą).

Tak jak w biologii istnieje pojęcie ewolucyjnej teorii gier, tak informatyka wypracowała algorytmiczną teorię gier. Stosuje się ją m.in. przy wyświetlaniu linków sponsorowanych w wyszukiwarkach internetowych i aukcjach na te linki (gdzie powszechne jest użycie wspomnianej przy przetargach koncepcji drugiej ceny), przy tworzeniu sieci peer-to-peer lub w oprogramowaniu GPS (np. przy wyznaczaniu optymalnej trasy z punktu A do punktu B). Z algorytmicznej teorii gier korzystają również routery, optymalizując wysyłanie pakietów danych.

Czy warto grać?

Gry towarzyszą nam przez całe życie, nawet jeśli nie zdajemy sobie z tego sprawy. Teoria gier ułatwia podejmowanie pewnych decyzji – a przynajmniej daje możliwość innego spojrzenia na niektóre kwestie – jednak z pewnością nie jest złotym środkiem na wszystkie problemy. Wiąże się to przede wszystkim z kluczowym założeniem teorii gier, mówiącym, że gracze zachowują się w sposób racjonalny. W prawdziwym życiu na nasze decyzje wpływa znacznie więcej czynników niż tylko prosta macierz wypłat. Większość gier przebiega też w sposób iterowany – dzisiejsza decyzja ma wpływ na decyzje jutrzejsze i wynika z decyzji wczorajszych.

Teoria gier – podobnie jak wiele innych gałęzi matematyki – z pewnością pomaga w… typowych grach, np. w pokerze lub warcabach. Posiadając wiedzę teoretyczną, możemy w pewnym stopniu zwiększyć nasze szanse na wygraną. W prostszych grach, np. grze w kółko i krzyżyk, odpowiednia strategia może nawet zagwarantować nam brak porażki niezależnie od umiejętności przeciwnika.

W wielu dziedzinach życia teoria gier może jednak służyć jako punkt wyjścia do rozwiązania skomplikowanych zagadnień. Pełnymi garściami czerpią z niej m.in. biologia, politologia i informatyka. Warto więc znać przynajmniej jej podstawy, a równocześnie pamiętać, że to najwyżej jedno z narzędzi, którymi możemy się wspomóc w codziennym podejmowaniu decyzji.


Dajcie nam znać, czy powinniśmy poruszyć więcej zagadnień z obszaru teorii gier. A może jakiś aspekt jest dla Was szczególnie interesujący?

Źródła:

Teoria gier, Straffin P., Wydawnictwo Naukowe SCHOLAR, 2004

Wprowadzenie do teorii gier,  Kostecki R. P., (PDF)

Wstęp do Teorii Gier, Płatkowski T., (PDF)

Znajomość teorii gier może dawać przewagę – wywiad z Robertem Golańskim

Teoria gier pozwala zaoszczędzić publiczne pieniądze (artykuł z portalu ObserwatorFinansowy.pl)

Dodaj komentarz

5 komentarzy do "Teoria gier w praktyce. Równowaga Nasha, optimum Pareto, dylemat więźnia, gry Blotto"

avatar
Sortuj wg:   najnowszy | najstarszy | oceniany
Kama
Gość

Przemysł tytoniowy w USA to też fajny przykład z życia (dylemat więźnia). W latach 60. kampanie publiczne dołączane do reklam spowodowały spadek liczby palących, bo koncerny tytoniowe nie chciały zrezygnować z emisji reklam (i tym samym emisji rządowych spotów przeciwko paleniu), żeby nie przegrać z konkurencją.

Paweł
Gość

Chętnie bym jeszcze poczytał na ten temat. 🙂

Aaa
Gość

Przytoczona scena z filmu nie demonstruje równowagi Nasha.

Bbb
Gość

Zgadzam się z Aaa

Bbb
Gość

da się wytłumaczyć dlaczego chory ma tki mózg?

wpDiscuz