26 mája 2009

Prsty

Priebežné výsledky sú na konci príspevku. Ak neviete o čo ide, čítajte ďalej.

Skutočne je rozdiel medzi pomerom dĺžok ukazováka a prstenníka u mužov a u žien, alebo je tento takzvaný "fenomén 2D:4D" len výmysel na oživenie koktailových večierkov?

Napadlo ma, že toto tvrdenie by sme mohli spoločne overiť priamo tu na blogu QED. Stačí, ak si odmeriaš dĺžku ukazováka a prstenníka na pravej aj ľavej ruke a okrem týchto údajov uvedieš do komentára ešte informáciu o tom, či si žena, alebo muž. Ak budeš mať chvíľu čas a pri sebe priateľov, môžeš zmerať dĺžky týchto štyroch prstov aj im (inak pre nesmelých výborná metóda nadviazania kontaktu :-); čím viac údajov budeme mať, tým lepšie. Dĺžky meraj s presnosťou na 1 milimeter od konca prstov až po spodnú vrásku deliacu prst od dlane, tak ako je naznačené na fotografii mojej pravej ruky. Postupne budem robiť príslušné štatistické testy a uvidíme, či sa teória o rôznom pomere dĺžok prstov u žien a u mužov potvrdí.


Takže meranie číslo 1 bude zodpovedať mojim vlastným prstom (P znamená pravá ruka, L ľavá ruka, u ukazovák a p prstenník): Pu 7,6 mm; Pp 8,0 mm; Lu 7,4 mm; Lp 7,9 mm.

..............


Po údajoch od 17-tich ľudí zobrazuje nasledovný graf priebežné výsledky pomeru dĺžky ukazováka a prstenníka: jednotlivé hodnoty pomeru ako bodky a 95 percentné intervaly spoľahlivosti pre strednú hodnotu pomeru ako obdĺžniky. Vertikálna súradnica dát je mierne roztrasená, čo je bežný postup ako zamedziť "zliatiu" symbolov s takmer rovnakou horizontálnou súradnicou. Ako je očividné už z grafu, naše dáta zatiaľ nesvedčia o významnom rozdiele medzi mužmi a ženami. Formálne: nepárový dvojvýberový t-test pre rovnosť stredných hodnôt pre pravú ruku dáva zatiaľ p hodnotu približne 0,7 a pre ľavú ruku približne 0,9. Na zistenie signifikantného rozdielu (ak existuje) potrebujeme ešte pomerne veľa dát. Zapojte sa!


Každopádne už teraz je jasné, že rozdiel medzi mužmi a ženami je veľmi malý (aj keď možno zistiteľný pri veľkom súbore ľudí) a určovať pohlavie len na základe pomeru dĺžok prstov je skoro ako určovať ho hodením mincou.

22 mája 2009

Intervaly spoľahlivosti v prieskumoch verejnej mienky

S potešením konštatujem, že agentúra FOCUS ku prieskumu momentálnej podpory politických strán uvádza okrem samotných percentuálnych odhadov aj intervaly spoľahlivosti. Rozhodol som sa preto, že stručne popíšem o čo ide.

Predstavme si, že máme škatuľu, v ktorej je veľmi veľký počet farebných guliek, pričom nás zaujíma pomer p, koľko z týchto guliek je červených. (Pre prieskumy môže "škatuľa" znamenať rozsiahly reprezentatívny zoznam oprávnených voličov a "červené guľky" môžu byť povedzme tí voliči, ktorí by momentálne volili stranu SMER.)

Pri obrovskom počte guliek nie je mysliteľné, aby sme preskúmali farbu každej z nich. Takže vykonáme len jednoduchý náhodný výber relatívne malého počtu guliek (tento počet, nazývaný tiež rozsah výberu, si označíme n), zistíme koľko je z nich červených (nech je to k) a výsledný pomer (t.j. hodnotu k/n) prehlásime za náš odhad neznámej hodnoty p. Interval spoľahlivosti (IS) vyjadruje rozsah, v ktorom "s veľkou mierou istoty" leží skutočný pomer p, ktorého je k/n len často nepresným odhadom. Pokúsme sa vysvetliť tento intuitívny popis IS matematicky presnejšie.

Približný 95 percentný interval spoľahlivosti pre hodnotu p vypočítame ako k/n plus mínus δ, kde


V predchádzajúcom vzorci je p so strieškou náš odhad hodnoty p, t.j. k/n a konštanta 1,96 je takzvaná kritická hodnota normálneho rozdelenia. Hodnota δ sa v angličtine nazýva "margin of error" a v slovenčine ju budem nazývať hraničná chyba.

Odhad k/n je teda stredom IS a čím je väčšie n, t.j. čím je väčší rozsah nášho náhodného výberu, tým je menšia hraničná chyba a užší výsledný interval. To súhlasí s našou intuíciou ako asi by sa mal IS správať. Ale prečo práve takýto vzorec? A čo vlastne znamená číslo 95?

Predstavme si, že náš experiment s vybratím n guliek zopakujeme mnohokrát a zakaždým použijeme hore uvedený vzorec pre konštrukciu IS. Potom približne v 95 percentách prípadov bude skonštruovaný interval obsahovať skutočný pomer p červených guliek v škatuli. Presvedčiť sa o platnosti predchádzajúcej vety si vyžaduje absolvovať základný kurz teórie pravdepodobnosti (aspoň po centrálnu limitnú vetu), ale pochopiť význam IS je možné aj bez toho. Ešte raz inými slovami: 95 percentný IS je interval vypočítaný metódou, ktorá dáva v 95 percentách prípadov jej použitia interval obsahujúci hodnotu p skutočného podielu.

Predpokladajme napríklad, že zo škatule sme vybrali presne 1000 guliek. Potom hraničná chyba v závislosti od odhadu k/n je zobrazená na nasledovnom grafe (všetko som vynásobil číslom 100, t.j. aj odhad neznámeho pomeru p aj hraničná chyba je na grafe uvedená v percentách):


Napríklad ak by v našom náhodnom výbere bolo presne 40 percent červených guliek, je hraničná chyba približne 3 percentá a 95 percentný interval spoľahlivosti pre skutočné percento červených guliek v šaktuli je 37 až 43. Ak by spomedzi vybratých guliek bolo 20 percent červených, bola by hraničná chyba približne 2,5 percenta a 95 percentný IS by bol 17,5 až 22,5.

Čo sa týka prieskumov verejnej mienky, tak je situácia samozrejme trochu zložitejšia. Po prvé, prieskumná agentúra môže použiť sofistikovanejší výber respondentov ako je len obyčajný náhodný výber; napríklad môže robiť takzvaný stratifikovaný náhodný výber, ktorý odhady spresní. A po druhé, je pravdepodobné, že intervaly spoľahlivosti bude agentúra počítať exaktnou metódou a nie len našim jednoduchým, avšak len približným vzorčekom.

Každopádne intervaly spoľahlivosti uvedené v správe agentúry FOCUS s počtom odpovedajúcich respondentov n=709 sú prakticky identické s tým, čo by sme dostali použitím našej metódy (okrem uvedeného intervalu spoľahlivosti pre Slobodné Fórum, kde agentúra zjavne urobila chybu).

Poznámka: Všimnite si, že krajná chyba, t.j. vlastne presnosť nášho odhadu, nezávisí od počtu všetkých guliek v škatuli, resp. od počtu všetkých potenciálnych voličov (kvôli vrtákom: predpokladáme náhodný výber s vrátením, čo je však prakticky identická situácia ako náhodný výber bez vrátenia ak je rozsah výberu o niekoľko rádov menší ako veľkosť základnej populácie). Takže aj ak by bolo potenciálnych voličov milión, aj sto miliónov, aj sto miliárd, náhodný výber rozsahu 1000 nám poskytne zakaždým rovnako presný odhad o podiele potenciálnych voličov strán.

19 mája 2009

Veľký a malý trojuholník

Prednedávnom som natrafil na jeden príjemný a pomerne slávny príklad zo stredoškolskej geometrie, ktorý ma dosiaľ akosi obišiel. Možno ho nepoznáte a jeho riešenie Vás poteší tak ako potešilo mňa:

Majme "veľký" rovnostranný trojuholník ABC, pričom na stranách AB, BC, CA sú body D, E, F zakreslené tak, že |AD|/|AB|=|BE|/|BC|=|CF|/|CA|=1/3, kde symbol |.| označuje dĺžku úsečky. Prienik trojuholníkov ABF, BCD a CAE nazvime "malý" trojuholník. Aký je pomer plôch "malého" a "veľkého" trojuholníka?

Správna odpoveď je samozrejme len jediná, ale spôsobov ako sa k nej dopracovať je veľa. Som zvedavý, kto z Vás príde na ten najkrajší.

15 mája 2009

Odkazy 04/2009

Posledné tri týždne boli pre mňa mimoriadne náročné. Okrem vyučovania som sa musel venovať napríklad príprave záverečných projektov a písomiek, diplomovkám, ŠVOČke, mal som prednášku na TU v Mníchove a zakrátko aj na UK v Prahe. Hneď po návrate zo zahraničia som dostal silný zápal priedušiek a nemal som veľkú chuť písať príspevky na blog; preto tá dlhá prestávka. Situácia sa však rýchlo mení k lepšiemu.

Čo sa týka internetu, v poslednej dobe som mal len málo času browsovať, ale napriek tomu som natrafil na jeden veľmi zaujímavý projekt: BigThink, ktorý prezentuje pozvaných hostí vo forme videozáznamov ich odpovedí na rozličné otázky, pričom tieto odpovede sú adresované priamo divákovi (a nie publiku ako je to napríklad v TED talks). Výsledkom je dojem neformálneho, skoro až osobného rozhovoru. Navyše, k väčšine videí je naeditovaný prepis, čo môže pomôcť tým, ktorí sú si nie vždy celkom istí pochopením hovorenej angličtiny. Ľudí prezentujúcich svoje názory na stránkach BigThink je pomerne veľa, takže som sa pokúsil o výber len tých, ktorí ma z rôznych dôvodov oslovili najviac (to samozrejme neznamená, že s nimi vo všetkom súhlasím. Inak všimnite si pod videami odkaz "Next idea", čo Vám umožní postupne si prezrieť všetky príspevky daného človeka.)

Stephen Pinker: Mediálne veľmi známy profesor psychológie na Harvarde a autor bestsellerov ako napríklad The Language Instinct, alebo How the Mind Works. Ak Vás Pinkerove názory zaujmú, môžem Vám požičať jeho knihy Words and Rules a The Stuff of Thought. (Mimochodom, Pinker je váženým členom klubu vedcov s bujnou hrivou.)

Daniel Gilbert: Ďalší profesor psychológie z Harvardu, ktorý sa stal širšej verejnosti známy ako autor knihy Stumbling on Happiness. Gilbert má pozoruhodnú kariéru; ešte ako teenager si založil rodinu a keďže túžil stať sa autorom science fiction, chcel na lokálnej škole navštevovať nejaký predmet vhodný pre začínajúcich spisovateľov. Jediný voľný kurz bol však už len z psychológie. A to bol začiatok jeho cesty až na vrchol toho, čo akademický psychológ môže dosiahnuť. (Gilbert nie je členom klubu vedcov s bujnou hrivou.)

Ray Kurzweil: Tak toto je naozaj veľmi zaujímavý chlapík. Vynálezca, milionár a futurista, držiteľ 16-tich čestných doktorátov a autor kníh ako The Age of Spiritual Machines, alebo The Singularity is Near, na motívy ktorej momentálne dokončujú film. Kurzweil verí, že sa môže dožiť obdobia, v ktorom budú stroje myslieť a ľudia budú takmer nesmrteľní; asi kvôli tomu prešiel na špeciálny program starostlivosti o svoje zdravie a okrem iného každý deň užíva 150 syntetických doplnkov výživy. Bohužiaľ, jeho technooptimizmus s ním zdieľa málokto.

Oliver Sacks: Mimoriadne príjemný pán s veľkým srdcom, povolaním neurológ, autor takých bestsellerov ako The Man Who Mistook His Wife for a Hat, alebo tiež Awakenings, podľa ktorého vznikol dokonca scenár filmu (podobne ako Kurzweil; Sacks má však len 11 čestných doktorátov). Jeho kniha An Anthropologist on Mars, ktorú Vám rád požičiam, je jednou z najlepších populárno-náučných kníh, aké som kedy čítal.

Jonathan Haidt: Profesor na Univerzite vo Virginii; predstaviteľ takzvanej pozitívnej psychológie. Haidt verí v skupinovú selekciu a z tohto pohľadu študuje rôzne aspekty ľudskej morálky. Jeho kniha The Hapiness Hypothesis sa mi natoľko páčila, som jej venoval aj samostatný blogový príspevok. Prečítajte si prvú kapitolu z tejto knihy a ak sa Vám zapáči, zastavte sa u mňa a ja Vám tú knihu požičiam celú.

Dosť bolo filozofických úvah a vedy, dajme si na záver niečo ľahšie, napríklad toto krátke video o možno najkurióznejšom futbalovom zápase v histórii. (Dočítal som sa o ňom v peknej knihe J.D.Barrowa "100 essential things you didn't know you didn't know".) Video na YouTube je skrátené, takže sa pokúsim podrobnejšie vysvetliť, čo sa v danom zápase stalo: Na postup do ďalšej fázy súťaže potreboval Barbados vyhrať nad Grenadou o dva góly; v opačnom prípade by postúpila Grenada. Túto veľmi jednoduchú situáciu však značne skomplikovalo pravidlo, že v prípade remízy v normálnom hracom čase sa bude hrať predĺženie, v ktorom sa "zlatý gól" počíta za dva góly. Dlho vyhrával Barbados 2:0, avšak krátko pred koncom dala Grenada gól na 2:1. Hráči Barbadosu si uvedomili, že tretí gól už asi nestihnú dať a najlepším riešením je streliť si vlastný gól a potom sa pokúsiť vyhrať v predĺžení. Po vlastnom góle Barbadosu však hráčom Grenady rýchlo napadlo, že postup si zabezpečia tým, že si tiež strelia vlastný gól. To si však okamžite uvedomili aj hráči Barbadosu a do konca zápasu mali diváci možnosť sledovať veľmi kurióznu snahu Grenady dať si vlastný gól, čomu sa futbalisti Barbadosu snažili intenzívne brániť. Ak by si Grenada dala vlastný gól, museli by sa Barbadosania veľmi poponáhľať, aby si stihli dať ďalší vlastný gól, čo by sa im nemuselo podariť, lebo Grenada by im v tom zrejme bránila... Nakoniec však Barbados udržal v normálnom hracom čase remízu, v predĺžení dal zlatý dvojgól a postúpil. :-)