31 marca 2008

Surf algebraic surfaces

Pod termínom algebraický povrch sa obvykle rozumie varieta dimenzie 2 pozostávajúca z tých bodov (x,y,z), ktoré spĺňajú rovnicu f(x,y,z)=0 pre nejaký polynóm f. Napríklad ak je f(x,y,z)=x2+y2+z2-1, tak príslušný algebraický povrch je sféra a ak je f(x,y,z)=(x2+y2+z2+2)2-10*(x2+y2), tak je to tórus. Avšak špeciálnou voľbou polynómov f vieme dostať nekonečnú plejádu oveľa exotickejších obyvateľov Platonického sveta matematických objektov, napríklad:


S programom Surfer, vytvorenom na Mathematischen Forschungsinstituts Oberwolfach v Nemecku, si zobrazovanie algebraických povrchov zamilujete.

28 marca 2008

Virtuálny Da Vinciho kód

Určite ste si aj vy už mnohokrát vypočuli nasledovnú otázku: "Ako je možné, že taká v podstate priemerná kniha ako Da Vinciho kód sa stala jedným z najväčších bestsellerov všetkých čias?" Dôvodov je samozrejme veľmi veľa: niektorí ich vidia v reklame, ďalší v kontroverznej téme a niektorí v napínavom deji. Avšak masívnu reklamu, kontroverznú tému (niektoré dokonca presne tú istú) a napínavý dej malo aj veľa iných titulov, no napriek tomu sa žiadnemu z nich nepodarilo dosiahnuť takú predajnosť. Matematik má nasledovné vysvetlenie: "Success breeds success", a.k.a. Matúšov efekt.

Predstavme si nasledovný hypotetický model predaja kníh vo virtuálnom kníhkupectve: Uvažujme, že kníhkupectvo predáva K titulov, ktoré sa nijako nelíšia svojou kvalitou. Každý z N zákazníkov, ktorý sa zastaví v našom kníhkupectve, si kúpi jednu knihu. Na základe čoho si náš zákazník vyberie knihu, keď sú všetky rovnako dobré? Tu svoju úlohu zohráva samozrejme náhoda ale taktiež popularita jednotlivých titulov vyjadrená objemom doterajšieho predaja.

Predpokladajme teda, že prvý zákazník si vyberie svoju knihu úplne náhodne a každý ďalší si kúpi knihu k s pravdepodobnosťou

kde i je poradie zákazníka (i=2,...,N), hk,i znamená koľko kusov knihy k sa dosiaľ predalo a α je index, ktorý vyjadruje do akej miery je predajnosť ovplyvnená popularitou.

Napríklad ak α=0, tak počet predaných výtlačkov jednotlivých titulov nemá žiadny vplyv na pravdepodobnosť výberu novej zakúpenej knihy, t.j. každý zákazník si vyberie tú svoju knihu úplne nezávisle na tom, čo si vybrali zákazníci pred ním. Opačný extrém je α=1; v tomto prípade si zákazníci vyberajú tituly s pravdepodobnosťou priamo úmernou počtu dosiaľ predaných kusov jednotlivých titulov. Prípad α=0,5 zodpovedá zhruba nasledovnému správaniu sa zákazníkov: každý si hodí mincou; ak mu padne hlava, vyberie si jednu knihu úplne nezávisle na tom, ako sa jednotlivé tituly predávajú a ak mu padne znak, rozhodnuje sa medzi titulmi úplne na základe ich doterajšej predávanosti.

Nebudeme sa snažiť o (pomerne komplikovaný) výpočet teoretických charakteristík tohoto modelu. Dostatočnú predstavu o jeho správaní nám môže poskytnúť simulácia. Naprogramoval som si krátky programík v R-ku a spustil som ho s počtom kníh K=1000 a počtom nákupov N=milión postupne pre hodnoty α=0,1; 0,5 a 0,9. Výsledky sú znázornené na nasledovnom obrázku:


(Všimnite si, že zvislá os, ktorá vyjadruje počet predaných kusov jednotlivých titulov, je v logaritmickej škále!) V prípade α=0,1 a taktiež ešte aj v prípade α=0,5 sa počet predaných výtlačkov každého titulu pohybuje okolo 1000 kusov. Čo sa však stane v prípade, keď α=0,9, t.j. ak pri rozhodovaní zákazníkov výrazne dominuje popularita jednotlivých titulov? Jeden šťastný titul, svojou kvalitou úplne rovnaký ako 999 zvyšných titulov, sa v našej simulácii predal v počte presahujúcom 200000 kusov! Je to náš virtuálny Da Vinciho kód.

Poznámka: Samozrejme, že náš model je veľmi zjednodušený. Podľa môjho názoru je však užitočnejší zjednodušený a v mnohom nerealistický exaktný matematický model výskytu "čiernych labutí", než žiadny model.

25 marca 2008

Nassim Nicholas Taleb: Black Swan

Keď odstránime z knihy Nassima Taleba "Black Swan" autobiografické spomienky neuznaného génia a výsmech nositeľov Nobelovej ceny písaný žlčou zraneného ega, zostanú nám už len nasledovné, nie nutne disjunktné skupiny myšlienok: banálne, mylné, arogantné a staré.

Ústrednou banálnou a starou myšlienkou je kritika, že v ekonomických a spoločenských vedách sa venuje veľa pozornosti metódam "Mediocristanu" (rozumej modelom založeným na normálnom rozdelení) a príliš málo "Extremistanskej" skutočnosti (občasným neočakávaným náhodným prípadom s ohromným dopadom, takzvaným "čiernym labutiam"). Na túto kritiku nadväzuje mylná a arogantná myšlienka, že všetci súčasní vedci, pochopiteľne s výnimkou samotného autora a ešte Mandelbrota, sú zaslepení hlupáci, ktorí si nespoľahlivosť súčasných finančno-matematických modelov neuvedomujú, alebo ju zo všetkých síl popierajú.

Samozrejme, čitateľ očakáva, že po zdrvujúcej kritike Taleb vytiahne z rukáva nejaký úžasný návrh, ktorým strčí modernú finančnú matematiku do vrecka. Omyl. Vyústením knihy je len veľmi vágne popísaný desiatky rokov starý návrh používať rozdelenia s ťažkými chvostami, napríklad tzv. "power laws". V knihe nie je skoro nič konštruktívne, čo by bolo súčasne originálne; iba narážky, z ktorých po dvadsiatom zopakovaní vyprchá akýkoľvek humor a zostane len pachuť trápnosti.

Táto kniha je pre mňa zaujímavá len ako podnet na zamyslenie, ako je možné, že sa niečo podobné stane bestsellerom. Ak sa zaujímate o rolu náhody v oblasti financií, tak Vám odporúčam prečítať si radšej síce taktiež nie veľmi originálnu, no ešte nenásilne a pomerne kultivovane písanú knihu "Fooled by Randomness" od toho istého autora.

Poznámka: Sám síce nie som expert na finančnú matematiku (na matfyze sú na to iné kapacity), ale do základných metód pravdepodobnosti a štatistiky sa rozumiem, aj keď len ako deluded Platonic sucker from Mediocristan, who speaks in a boring tone, relies on abstract mathematics and scientific papers instead of practice, while being precisely wrong. Možno Vás však moje názory aj tak budú zaujímať. V tom prípade sa ma neváhajte na čokoľvek opýtať.

19 marca 2008

Arthur C. Clarke

Vo veku 90 rokov dnes zomrel Arthur C. Clarke, jeden z najslávnejších autorov science fiction všetkých čias. Sir Arthur dokázal skombinovať svoju výnimočnú fantáziu s matematickým a fyzikálnym vzdelaním, čo mu umožnilo predbehnúť technologický pokrok o niekoľko desaťročí; napríklad už v roku 1945 prišiel s myšlienkou využitia geostacionárnych družíc na telekomunikáciu. Počas svojho mimoriadne plodného života publikoval vyše 50 románov a zbierok poviedok, medzi ktorými sú také klasiky ako 2001: A Space Odyssey, Childhood's End, alebo Rendezvous with Rama.

Výber najslávnejších výrokov A.C. Clarka (V zátvorke sú moje amatérske preklady.):

"Sometimes I think we're alone in the universe, and sometimes I think we're not. In either case the idea is quite staggering." ["Niekedy si myslím, že sme vo vesmíre sami a niekedy si myslím, že nie. V oboch prípadoch je táto myšlienka ohromujúca."]

"Any sufficiently advanced technology is indistinguishable from magic." ["Akákoľvek dostatočne pokročilá technológia je neodlíšiteľná od mágie."]

"Perhaps it is better to be un-sane and happy, than sane and un-happy. But it is the best of all to be sane and happy. Whether our descendants can achieve that goal will be the greatest challenge of the future. Indeed, it may well decide whether we have any future." ["Možno je lepšie byť ne-rozumný a šťastný, než rozumný a ne-šťastný. Ale najlepšie zo všetkého je byť rozumný a šťastný. Či naši potomkovia budú schopní dosiahnuť tento cieľ bude najväčšia výzva budúcnosti. Skutočne; môže kľudne rozhodnúť o tom, či vôbec máme nejakú budúcnosť."]

13 marca 2008

Ortogonálne krájanie

Je možné každý konvexný rovinný útvar rozdeliť dvomi navzájom kolmými priamkami na štyri časti s rovnakým obsahom?

Poznámka 1: Konvexná množina v rovine je taká, že ak obsahuje body A a B, tak obsahuje aj všetky body úsečky AB.

Poznámka 2: Táto úloha patrí k matematickým evergreenom. Ťažko vystopovať jej pôvod, každopádne riešenie obsahuje už slávna kniha "What is Mathematics?" z roku 1941.

12 marca 2008

Rýchly test slovnej zásoby pre angličtinu

Momentálne vediem diplomovú prácu týkajúcu sa optimalizácie náhodného výberu a napadlo ma, že by som pre Vás vedel zostaviť veľmi hrubý, ale pritom rýchly a jednoduchý test veľkosti Vašej anglickej slovnej zásoby.

Prechádzajte si postupne nasledovnými skupinami desiatich slov (všetko sú to podstatné mená) až pokým neprídete k prvej takej skupine, v ktorej poznáte význam polovice, alebo menej ako polovice slov (t.j. desiatich, alebo menej slov). Číslo v zátvorke uvedené pri tejto skupine slov je môj odhad veľkosti Vašej anglickej slovnej zásoby. Ak aj v poslednej skupine poznáte presný význam viac ako polovice slov, Vaša slovná zásoba zrejme presahuje 10000 slov. Snažte sa byť k sebe kritickí; ako "známe" slová berte len tie, s ktorých významom ste si úplne istí. Keď sa otestujete, označte prosím Váš výsledok v ankete v pravom stĺpci blogu. Poznámka: Anketa je už ukončená; výsledky nájdete na konci tohoto príspevku.  • (2000) girl, age, force, value, health, industry, class, church, century, table, bird, call, damage, edge, exchange, opposition, option, quarter, stock, whole

  • (4000) coast, defendant, distinction, enemy, fashion, impression, leadership, mass, neighbour, tear, bowl, burden, cheese, confusion, dish, satisfaction, schedule, storage, tube, wish

  • (6000) abbey, cliff, clue, devil, dock, flag, gender, heel, mud, rumour, bias, canvas, frontier, interference, joint, librarian, obstacle, ranger, skull, thumb

  • (8000) axis, biopsy, cord, eve, herd, inhibition, magnitude, nucleus, nun, prevalence, bead, cloak, entrepreneur, garlic, hurdle, ivory, marsh, pea, quest, stove

  • (10000) altitude, badger, chestnut, disgust, fatigue, gutter, mantle, outskirts, plague, setback, alloy, caterpillar, crumb, expatriate, glacier, heather, heron, ingenuity, mercury, orphan
Samozrejme, tento odhad nie je vycucaný z prsta, ale je založený na istom matematickom modeli využívajúcom frekvenčný slovník angličtiny. Ako každý model má však viaceré nedostatky a tiež neprešiel žiadnou skutočne odbornou oponentúrou. Naviac, je sporné čo sa presne myslí pod veľkosťou slovnej zásoby. Takže výsledok berte so značnou rezervou ;-)

Poznámka 14.3.: V komentároch som bol upozornený na pekný test veľkosti slovnej zásoby na http://www.freerice.org/. Skúste si ho (aspoň na takých 70 slovách) a do anekty v pravom stĺpci blogu prosím zaškrtnite v akých hodnotách sa Vám v priemere pohyboval "vocab level". Poznámka: Anketa je už ukončená; výsledky nájdete na konci tohoto príspevku.
(Najvyššia dosiahnutá hodnota nie je asi najlepšie merítko, pretože závisí jednak na tom, aké má človek na začiatku šťastie, alebo smolu a tiež na tom, ako dlho sa snaží.) Tiež by som chcel upozorniť, že "vocab level" 40 je oveľa vyššia ako v mojom teste 10000 slov; odhadol by som to tak, že 10000 slovám v mojom teste zodpovedajú približne levely 15-25.

Poznámky : Do slovnej zásoby nezapočítavam rôzne gramatické obmeny toho istého slova, t.j. napríklad sloveso work, spolu s works, worked a working sú pre mňa jedno a to isté slovo. Avšak podstatné meno work už započítavam ako nové slovo a taktiež ako nové slovo sa započítavajú aj frekventované zloženiny typu worksheet. Avšak nezapočítavajú sa žiadne vlastné podstatné mená, číslovky, skratky a citoslovcia (ktorých sa dá vytvoriť neohraničený počet :-) Možno Vás tiež zaujme stránka wordcount.org, kde si môžete nechať vypisovať slová na základe ich frekvencie výskytu v anglických textoch, avšak so zahrnutím vlastných podstatných mien, všetkých gramatických tvarov slov a podobne.Výsledky ankiet: