28 marca 2008

Virtuálny Da Vinciho kód

Určite ste si aj vy už mnohokrát vypočuli nasledovnú otázku: "Ako je možné, že taká v podstate priemerná kniha ako Da Vinciho kód sa stala jedným z najväčších bestsellerov všetkých čias?" Dôvodov je samozrejme veľmi veľa: niektorí ich vidia v reklame, ďalší v kontroverznej téme a niektorí v napínavom deji. Avšak masívnu reklamu, kontroverznú tému (niektoré dokonca presne tú istú) a napínavý dej malo aj veľa iných titulov, no napriek tomu sa žiadnemu z nich nepodarilo dosiahnuť takú predajnosť. Matematik má nasledovné vysvetlenie: "Success breeds success", a.k.a. Matúšov efekt.

Predstavme si nasledovný hypotetický model predaja kníh vo virtuálnom kníhkupectve: Uvažujme, že kníhkupectvo predáva K titulov, ktoré sa nijako nelíšia svojou kvalitou. Každý z N zákazníkov, ktorý sa zastaví v našom kníhkupectve, si kúpi jednu knihu. Na základe čoho si náš zákazník vyberie knihu, keď sú všetky rovnako dobré? Tu svoju úlohu zohráva samozrejme náhoda ale taktiež popularita jednotlivých titulov vyjadrená objemom doterajšieho predaja.

Predpokladajme teda, že prvý zákazník si vyberie svoju knihu úplne náhodne a každý ďalší si kúpi knihu k s pravdepodobnosťou

kde i je poradie zákazníka (i=2,...,N), hk,i znamená koľko kusov knihy k sa dosiaľ predalo a α je index, ktorý vyjadruje do akej miery je predajnosť ovplyvnená popularitou.

Napríklad ak α=0, tak počet predaných výtlačkov jednotlivých titulov nemá žiadny vplyv na pravdepodobnosť výberu novej zakúpenej knihy, t.j. každý zákazník si vyberie tú svoju knihu úplne nezávisle na tom, čo si vybrali zákazníci pred ním. Opačný extrém je α=1; v tomto prípade si zákazníci vyberajú tituly s pravdepodobnosťou priamo úmernou počtu dosiaľ predaných kusov jednotlivých titulov. Prípad α=0,5 zodpovedá zhruba nasledovnému správaniu sa zákazníkov: každý si hodí mincou; ak mu padne hlava, vyberie si jednu knihu úplne nezávisle na tom, ako sa jednotlivé tituly predávajú a ak mu padne znak, rozhodnuje sa medzi titulmi úplne na základe ich doterajšej predávanosti.

Nebudeme sa snažiť o (pomerne komplikovaný) výpočet teoretických charakteristík tohoto modelu. Dostatočnú predstavu o jeho správaní nám môže poskytnúť simulácia. Naprogramoval som si krátky programík v R-ku a spustil som ho s počtom kníh K=1000 a počtom nákupov N=milión postupne pre hodnoty α=0,1; 0,5 a 0,9. Výsledky sú znázornené na nasledovnom obrázku:


(Všimnite si, že zvislá os, ktorá vyjadruje počet predaných kusov jednotlivých titulov, je v logaritmickej škále!) V prípade α=0,1 a taktiež ešte aj v prípade α=0,5 sa počet predaných výtlačkov každého titulu pohybuje okolo 1000 kusov. Čo sa však stane v prípade, keď α=0,9, t.j. ak pri rozhodovaní zákazníkov výrazne dominuje popularita jednotlivých titulov? Jeden šťastný titul, svojou kvalitou úplne rovnaký ako 999 zvyšných titulov, sa v našej simulácii predal v počte presahujúcom 200000 kusov! Je to náš virtuálny Da Vinciho kód.

Poznámka: Samozrejme, že náš model je veľmi zjednodušený. Podľa môjho názoru je však užitočnejší zjednodušený a v mnohom nerealistický exaktný matematický model výskytu "čiernych labutí", než žiadny model.

2 komentáre:

johno povedal(a)...

Skvelé. Páči sa mi to.

Pavel Chalmovianský povedal(a)...

Heh...môj názor na Da Vinciho kód je, že zaťal do cirkvi v čase jej pomerne veľkého odlivu ovečiek (usudzujem len veľmi hrubo z pozorovaní okolo seba a z pozorovaní niektorých členov mojej rodiny, takže možno to ani nie je v globále pravda). Rozhodne musím súhlasiť, že ide o veľkú náhodu. Brown napísal pútavú, na čitateľa nezvyknutého overovať si fakty pomerne presvedčivú detektívku s historickou zápletkou. Myslím, že popularitu mu priniesla samotna cirkev, ktorá na tú knižku reagovala. Celkom rád by som videl nejakú serióznu časovú priamku predaja a jednotlivých reakcií rôznych oficiálnych inštitúcií.