Teorie hry: Za základy

Hudební nauka - Čtení not (Listopad 2024)

Hudební nauka - Čtení not (Listopad 2024)
Teorie hry: Za základy
Anonim

Použitím teorie her může být stanoveno skutečné scénáře pro takové situace, jako je konkurence cen a vydávání produktů (a mnoho dalších), a jejich výsledky by měly být předpovězeny. Společnosti, které tento přístroj používají (a držet se) k určení Nashovy rovnováhy, mají obrovský přínos ve svých strategiích pro tvorbu rozpočtu. (Pro rychlé osvěžení viz Základy teorie her .)

Čí je to?
Zatímco postupné hry se hrají po otočení, hraje se současně s každým hráčem, který rozhoduje současně. Při současných hrách již nepoužíváme společnou úvodní metodu zpětné indukce. Zástupci herní teorie často uvádějí různé výsledky v tzv. Matici (viz níže).

(1, 3)
(4, 2) dolů (
3, 2) (3, 1)
Tato matice je označována jako normální forma. Možnosti hráčů jsou zobrazeny na levé vertikální ose a výběr dvou hráčů je zobrazen na horní vodorovné ose. Výplaty pro každého hráče jsou v odpovídajících křižovatkách a jsou zobrazeny takto (hráč jeden, hráč dva). Nash Equilibrium Nash Equilibrium je výsledkem toho, že jakmile se dosáhne, znamená to, že žádný hráč nemůže zvýšit výplata změnou rozhodnutí jednostranně. Lze je také považovat za "žádné ľutování", v tom smyslu, že jakmile bude rozhodnutí učiněno, hráč nebude mít žádné politování ohledně rozhodnutí, které zvažují důsledky.

Nashová rovnováha je dosažena v průběhu času ve většině případů. Nicméně, jakmile se dosáhne rovnováhy Nash, nebude se od ní odchýlit. Poté, co se naučíme nalézt Nashovu rovnováhu, podívejte se na to, jak jednostranný krok ovlivní situaci. Má smysl? To by nemělo a proto je Nash rovnováha popsána jako "žádná lítost".

Hledání Nash Equilibria První krok: Určete hráče nejlepší reakci na akce dvou hráčů.

Když zkoumáme možnosti, které mohou maximalizovat výplatu hráče, musíme se podívat na to, jak by měl hráč reagovat na každou možnost, kterou má hráč dva. Jednoduchý způsob, jak to udělat vizuálně, je zakrýt možnosti hráče dvou. Zvažte matici zobrazenou na začátku tohoto článku při použití této metody.

Hráč jeden / hráč dva

Vlevo Pravá
Nahoru

(9, 999) > (3, -) Hráč má dvě možnosti: "nahoru" nebo "dolů". Hráč dva má také dvě možnosti: "vlevo" nebo "správně". V tomto kroku určování Nashovy rovnováhy se podíváme na reakce na akce dvou hráčů. Pokud se hráč dva rozhodne hrát "vlevo", můžeme hrát "nahoru" s výplatou jednoho, nebo hrát "dolů" s výplatou tří. Vzhledem k tomu, že tři jsou větší než jedna, označíme tučně 3, což znamená, že zde hrajeme "dolů". Pokud se hráč dva rozhodne hrát "správně", můžeme se rozhodnout, že budeme hrát "nahoru" na výplatu čtyř hráčů nebo hrát "dolů" na playoff tři. Vzhledem k tomu, že čtyři jsou větší než tři, odvážili jsme čtyři, abychom označili možnost hrát "nahoru". Tučné výsledky jsou zobrazeny níže na celé matici.
Hráč jeden / hráč dva Levá Pravá
Nahoru (1, 3)

3

, 2)

(3, 1) Druhý krok: Zjistěte, zda hráč dvě nejlépe reaguje na akce hráče. Stejně jako předtím s hráčem dvě výhra pro hráče jedna, budeme skrývat odměny hráče jeden při určování nejlepší odpovědi pro hráče dva. (
) Hráč jeden / hráč dva Levá Pravá Nahoru
(-, 3 ) (-, 2) Dolů (-, 2) (-, 1)

Stejně jako při pohledu na hráče jedna, každý hráč má dvě možnosti hrát. Pokud se hráč rozhodne hrát "nahoru", můžeme hrát "vlevo" s výplatou tří, nebo "správně", s výplatou dvou. Jelikož tři jsou větší než dva, odvážili jsme tři, aby ukázali možnost hrát "vlevo". Pokud se hráč rozhodne hrát "dolů", můžeme hrát "vlevo", abychom získali výplatu dvou, nebo "správně", za výplatu jednoho. Vzhledem k tomu, že dva jsou větší než jeden, odvážili jsme oba označující možnost hrát "vlevo". Tučné výsledky jsou zobrazeny níže na celé matici.
Hráč jeden / hráč dva Levá Pravá

Nahoru ( 3 ) 3,
2 ) (3, 1)
Krok třetí: Určete, které výsledky mají oba odměny tučné. Tento konkrétní výsledek je Nashova rovnováha. Nyní kombinujeme tučné možnosti obou hráčů na celou matici. Hráč jeden / hráč dva

Levá

Pravá Nahoru ( 3
> Dolů ( 3 , 2
) (3, 1) Vyhledejte křižovatky, V tomto případě zjistíme, že křižovatka (Down, Left) s výplatou (3, 2) odpovídá našim kritériím. To naznačuje naši Nash rovnováhu. Tato metoda hledání Nashovy rovnováhy je vhodná k nalezení rovnováhy ve hrách, které jsou současně, protože se díváme na to, jak by hráč reagoval nezávisle na tom, jak ostatní jedná. Tento scénář souběžné hry se často hraje v podnicích, jako jsou letecké společnosti. Níže je příklad, podobný výše uvedené hře, o tom, jak se mohou ceny cen letenek řídit. Platby jsou v tisících dolarů. Nezapomeňte, jsou to výplaty, nikoliv ceny. Metoda, kterou jsme předtím použili, je již použita, aby se ukázalo, kde se Nash rovnováha objeví. Nízká cena

Nízká cena
( 3 000

, 3 000 (
4 000 , 2 000) Vysoká cena (2 000, 4 000Když se podíváme jen na volby A1, vidíme, že pokud se A2 rozhodne hrát nízkou cenu, vybereme si mezi Nízkou cenou za 3 000 nebo vysokou cenu za 2 000. Vybíráme "nízké" od 3 000> 2, 000.Děláme to samé pro A2 hrající High Price a uvidíme, že hrajeme "low", protože 4, 000> 3, 500. Naopak, jen při výběru A2, vidíme, že pokud se A1 rozhodne hrát nízkou cenu, vybereme si mezi "nízká cena" za 3 000 a "vysokou cenu" za 2 000. Protože 3 000> 2 000, zvolíme zde možnost "nízké ceny". Pokud A1 hraje vysokou cenu, můžeme účtovat nízkou cenu za 4, 000 nebo vysokou cenu za 3, 500. Od 4 000> 3 500 se rozhodneme hrát "nízkou cenu" zde.
Nash rovnováha je, že obě letecké společnosti budou účtovat nízkou cenu (vidíte, když jsou zvýrazněny volby pro každou stranu). Pokud by oběma leteckým společnostem účtovala vysoká cena, každý by byl lépe než oni v Nash rovnováze. Tak proč to nesouhlasí? Nejdřív je nezákonné dohodnout se. Zadruhé, pokud by k tomu došlo, jednostranná akce jménem jedné letecké společnosti, která by účtovala nízkou cenu, byla prospěšná, což mělo za následek, že letecká společnost získává zase více peněz. Tato logika také ukazuje, jak je dosaženo rovnováhy Nash, a proč není přínosné odchýlit se od ní jakmile je dosaženo. (Pro další čtení viz náš návod na Behavioral Finance .) Vícenásobná Nashová rovnováha a způsob, jakým Nash rovnováha vyhrává Obecně může dojít k více než jedné rovnováze ve hře. To se však obvykle vyskytuje v hrách se složitějšími prvky než ve dvou hráčích. V souběžných hrách, které se opakují v průběhu času, je jedna z těchto několikanásobných rovnováhy dosažena po nějaké zkoušce a omylu. Tento scénář rozdílného výběru v průběhu času před dosažením rovnováhy je nejčastěji vyvíjen v podnikatelském světě, když dvě firmy určují ceny velmi zaměnitelných produktů, jako jsou letecké tarify nebo soda pop. Bottom Line

Díky těmto pokročilým metodám lze modelovat a řešit více situací v reálném světě. Různé druhy Nashovy rovnováhy, o kterých jsme se zabývali, jsou nejčastěji nalezené řešení real-světových modelovaných her. Pracovní znalost Teorie her vám pomůže vytvořit strategii, ať už si hrajete kamaráda hrajícího tic-tac-toe nebo se snažíte dosáhnout největších zisků.