27 augusta 2009

Telepat II

Tentokrát nášmu telepatovi zaplatíme za každý uhádnutý symbol 1 euro. Telepat si postupne prikladá na čelo jednotlivé obálky, pričom vždy po chvíľke telepatovania danej obálky povie svoj tip, čo by sa v nej malo nachádzať. Vypočítajte strednú hodnotu jeho zisku, ak nemá žiadne telepatické schopnosti, avšak má dokonalú pamäť a pritom používa optimálnu stratégiu tipovania. Uvažujeme nasledovné spresnenia:

a) Počas tipovania nedostáva telepat žiadnu informáciu o obsahu obálok, t.j. všetky obálky sa otvoria až po ukončení jeho tipovania. b) Po každom tipe sa daná obálka otvorí a telepat sa dozvie, ktorý symbol v nej bol. c) Po každom tipe prezradíme telepatovi len to, či uhádol, alebo neuhádol, avšak nie to, ktorý konkrétny symbol sa v danej obálke nachádzal.


Riešenie ani jednej z týchto troch úloh nie je úplne triviálne (pokiaľ človek nenájde správny trik), preto sú veľmi vítané akékoľvek nápady, riešenia pre malé n, prípade simulačné výsledky.

Namiesto ilustračného obrázku mám dnes pre Vás link od Juraja.

Poznámka 27.8.: Ak som sa nepomýlil, tak tie stredné hodnoty zisku pri optimálnej stratégii vychádzajú vo všetkých troch prípadoch celkom pekne. Ak si s tým problémom neviete poradiť, pokúste sa aspoň odhadnúť, či pre rastúce n (n je počet rôznych symbolov, t.j. aj počet obálok) ide stredná hodnota zisku pri optimálnej stratégii do nekonečna, alebo naopak, či existuje hranica, ktorú stredná hodnota zisku nepresiahne pre žiadne n ani pri tej najlepšej stratégii. Čo hovorí Vaša intuícia?

3 komentáre:

Brano povedal(a)...

teda este pred tym ako sa vrhnem do riesenia, tak mam nejasnost v zadani.
co ten telepat maximalizuje?
napr. v a) strategia1 tipne same kruhy ma istotu jedneho eura
strategia2 tipne nahodnu permutaciu a EX=1euro, takze mu to je jedno,
ale keby bol rizkoaverzny tak napr. EX-DX^0.5 je horsie, alebo keby bol rizikofil tak EX+DX^0.5 je lepsie.

Brano povedal(a)...

teda v tom druhom pripade to mozno nieje 1e, ale asi chpes v com je pointa mojej nejasnosti

Radoslav Harman povedal(a)...

Ahoj Braňo; zdravím z Nemecka.

Tvojej otázke rozumiem. Jednoducho predpokladáme, že telepat sa snaží iba o maximalizáciu strednej hodnoty zisku nezávisle na disperzii. Inými slovami, všetky stretégie, ktoré maximalizujú strednú hodnotu zisku, považujeme za ekvivalentné.

Pre prípad a) teda otázka znie: Existuje stretégia, ktorá dáva strednú hodnotu zisku viac ako 1 euro, alebo je pri akejkoľvek stretégii a pre akékoľvek n stredný zisk len 1 euro? V časti b) zrejme bude existovať stratégia, ktorá telepatovi zaručí väčší stredný zisk pri optimálnej stratégii. Aká je tá stratégia a aký je príslušný priemerný zisk? V časti c) už môže človeku chvíľu trvať, kým si uvedomí, že existuje optimálna stratégia, ktorú je naviac možné vykonávať bez veľkých nárokov na rozmýšľanie a na pamäť. Dá sa čakať, že pri tejto optimálnej stratégii bude stredná hodnota zisku vyššia ako v časti a), ale nižšia ako v časti b), pretože telepat dostáva viac informácie ako v časti a), ale menej informácie ako v časti c)...