26 mája 2009

Prsty

Priebežné výsledky sú na konci príspevku. Ak neviete o čo ide, čítajte ďalej.

Skutočne je rozdiel medzi pomerom dĺžok ukazováka a prstenníka u mužov a u žien, alebo je tento takzvaný "fenomén 2D:4D" len výmysel na oživenie koktailových večierkov?

Napadlo ma, že toto tvrdenie by sme mohli spoločne overiť priamo tu na blogu QED. Stačí, ak si odmeriaš dĺžku ukazováka a prstenníka na pravej aj ľavej ruke a okrem týchto údajov uvedieš do komentára ešte informáciu o tom, či si žena, alebo muž. Ak budeš mať chvíľu čas a pri sebe priateľov, môžeš zmerať dĺžky týchto štyroch prstov aj im (inak pre nesmelých výborná metóda nadviazania kontaktu :-); čím viac údajov budeme mať, tým lepšie. Dĺžky meraj s presnosťou na 1 milimeter od konca prstov až po spodnú vrásku deliacu prst od dlane, tak ako je naznačené na fotografii mojej pravej ruky. Postupne budem robiť príslušné štatistické testy a uvidíme, či sa teória o rôznom pomere dĺžok prstov u žien a u mužov potvrdí.


Takže meranie číslo 1 bude zodpovedať mojim vlastným prstom (P znamená pravá ruka, L ľavá ruka, u ukazovák a p prstenník): Pu 7,6 mm; Pp 8,0 mm; Lu 7,4 mm; Lp 7,9 mm.

..............


Po údajoch od 17-tich ľudí zobrazuje nasledovný graf priebežné výsledky pomeru dĺžky ukazováka a prstenníka: jednotlivé hodnoty pomeru ako bodky a 95 percentné intervaly spoľahlivosti pre strednú hodnotu pomeru ako obdĺžniky. Vertikálna súradnica dát je mierne roztrasená, čo je bežný postup ako zamedziť "zliatiu" symbolov s takmer rovnakou horizontálnou súradnicou. Ako je očividné už z grafu, naše dáta zatiaľ nesvedčia o významnom rozdiele medzi mužmi a ženami. Formálne: nepárový dvojvýberový t-test pre rovnosť stredných hodnôt pre pravú ruku dáva zatiaľ p hodnotu približne 0,7 a pre ľavú ruku približne 0,9. Na zistenie signifikantného rozdielu (ak existuje) potrebujeme ešte pomerne veľa dát. Zapojte sa!


Každopádne už teraz je jasné, že rozdiel medzi mužmi a ženami je veľmi malý (aj keď možno zistiteľný pri veľkom súbore ľudí) a určovať pohlavie len na základe pomeru dĺžok prstov je skoro ako určovať ho hodením mincou.

22 mája 2009

Intervaly spoľahlivosti v prieskumoch verejnej mienky

S potešením konštatujem, že agentúra FOCUS ku prieskumu momentálnej podpory politických strán uvádza okrem samotných percentuálnych odhadov aj intervaly spoľahlivosti. Rozhodol som sa preto, že stručne popíšem o čo ide.

Predstavme si, že máme škatuľu, v ktorej je veľmi veľký počet farebných guliek, pričom nás zaujíma pomer p, koľko z týchto guliek je červených. (Pre prieskumy môže "škatuľa" znamenať rozsiahly reprezentatívny zoznam oprávnených voličov a "červené guľky" môžu byť povedzme tí voliči, ktorí by momentálne volili stranu SMER.)

Pri obrovskom počte guliek nie je mysliteľné, aby sme preskúmali farbu každej z nich. Takže vykonáme len jednoduchý náhodný výber relatívne malého počtu guliek (tento počet, nazývaný tiež rozsah výberu, si označíme n), zistíme koľko je z nich červených (nech je to k) a výsledný pomer (t.j. hodnotu k/n) prehlásime za náš odhad neznámej hodnoty p. Interval spoľahlivosti (IS) vyjadruje rozsah, v ktorom "s veľkou mierou istoty" leží skutočný pomer p, ktorého je k/n len často nepresným odhadom. Pokúsme sa vysvetliť tento intuitívny popis IS matematicky presnejšie.

Približný 95 percentný interval spoľahlivosti pre hodnotu p vypočítame ako k/n plus mínus δ, kde


V predchádzajúcom vzorci je p so strieškou náš odhad hodnoty p, t.j. k/n a konštanta 1,96 je takzvaná kritická hodnota normálneho rozdelenia. Hodnota δ sa v angličtine nazýva "margin of error" a v slovenčine ju budem nazývať hraničná chyba.

Odhad k/n je teda stredom IS a čím je väčšie n, t.j. čím je väčší rozsah nášho náhodného výberu, tým je menšia hraničná chyba a užší výsledný interval. To súhlasí s našou intuíciou ako asi by sa mal IS správať. Ale prečo práve takýto vzorec? A čo vlastne znamená číslo 95?

Predstavme si, že náš experiment s vybratím n guliek zopakujeme mnohokrát a zakaždým použijeme hore uvedený vzorec pre konštrukciu IS. Potom približne v 95 percentách prípadov bude skonštruovaný interval obsahovať skutočný pomer p červených guliek v škatuli. Presvedčiť sa o platnosti predchádzajúcej vety si vyžaduje absolvovať základný kurz teórie pravdepodobnosti (aspoň po centrálnu limitnú vetu), ale pochopiť význam IS je možné aj bez toho. Ešte raz inými slovami: 95 percentný IS je interval vypočítaný metódou, ktorá dáva v 95 percentách prípadov jej použitia interval obsahujúci hodnotu p skutočného podielu.

Predpokladajme napríklad, že zo škatule sme vybrali presne 1000 guliek. Potom hraničná chyba v závislosti od odhadu k/n je zobrazená na nasledovnom grafe (všetko som vynásobil číslom 100, t.j. aj odhad neznámeho pomeru p aj hraničná chyba je na grafe uvedená v percentách):


Napríklad ak by v našom náhodnom výbere bolo presne 40 percent červených guliek, je hraničná chyba približne 3 percentá a 95 percentný interval spoľahlivosti pre skutočné percento červených guliek v šaktuli je 37 až 43. Ak by spomedzi vybratých guliek bolo 20 percent červených, bola by hraničná chyba približne 2,5 percenta a 95 percentný IS by bol 17,5 až 22,5.

Čo sa týka prieskumov verejnej mienky, tak je situácia samozrejme trochu zložitejšia. Po prvé, prieskumná agentúra môže použiť sofistikovanejší výber respondentov ako je len obyčajný náhodný výber; napríklad môže robiť takzvaný stratifikovaný náhodný výber, ktorý odhady spresní. A po druhé, je pravdepodobné, že intervaly spoľahlivosti bude agentúra počítať exaktnou metódou a nie len našim jednoduchým, avšak len približným vzorčekom.

Každopádne intervaly spoľahlivosti uvedené v správe agentúry FOCUS s počtom odpovedajúcich respondentov n=709 sú prakticky identické s tým, čo by sme dostali použitím našej metódy (okrem uvedeného intervalu spoľahlivosti pre Slobodné Fórum, kde agentúra zjavne urobila chybu).

Poznámka: Všimnite si, že krajná chyba, t.j. vlastne presnosť nášho odhadu, nezávisí od počtu všetkých guliek v škatuli, resp. od počtu všetkých potenciálnych voličov (kvôli vrtákom: predpokladáme náhodný výber s vrátením, čo je však prakticky identická situácia ako náhodný výber bez vrátenia ak je rozsah výberu o niekoľko rádov menší ako veľkosť základnej populácie). Takže aj ak by bolo potenciálnych voličov milión, aj sto miliónov, aj sto miliárd, náhodný výber rozsahu 1000 nám poskytne zakaždým rovnako presný odhad o podiele potenciálnych voličov strán.

19 mája 2009

Veľký a malý trojuholník

Prednedávnom som natrafil na jeden príjemný a pomerne slávny príklad zo stredoškolskej geometrie, ktorý ma dosiaľ akosi obišiel. Možno ho nepoznáte a jeho riešenie Vás poteší tak ako potešilo mňa:

Majme "veľký" rovnostranný trojuholník ABC, pričom na stranách AB, BC, CA sú body D, E, F zakreslené tak, že |AD|/|AB|=|BE|/|BC|=|CF|/|CA|=1/3, kde symbol |.| označuje dĺžku úsečky. Prienik trojuholníkov ABF, BCD a CAE nazvime "malý" trojuholník. Aký je pomer plôch "malého" a "veľkého" trojuholníka?

Správna odpoveď je samozrejme len jediná, ale spôsobov ako sa k nej dopracovať je veľa. Som zvedavý, kto z Vás príde na ten najkrajší.