28 januára 2008

Ako inteligentný je najinteligentnejší Slovák?

V poslednej dobe je toto už tretí príspevok týkajúci sa inteligenčného kvocientu. Dôvod, prečo mi táto téma chodí v súčasnosti viac po rozume, je úplne prozaický: normálne rozdelenie hodnôt IQ v populácií predstavuje výborný námet na pravdepodobnostné úlohy, ktoré nie sú ani príliš triviálne, ani príliš komplikované, skrátka veľmi vhodné pre študentov na skúšky :-) Takou úlohou je aj nasledovná:

Odhadnite, aké je IQ najinteligentnejšieho človeka v skupine n nezávisle náhodne vybratých ľudí. Napríklad: V akom rozmedzí možno čakať IQ najinteligentnejšieho Slováka?

Pomocou základných metód teórie pravdepodobnosti a matematickej analýzy sa dá ukázať, že 100p-percentný kvantil maxima n nezávislých náhodných premenných s normálnym rozdelením so strednou hodnotou 100 a smerodajnou odchýlkou 15 je približne


kde Φ-1 je kvantilová funkcia štandardizovaného normálneho rozdelenia. Dobrú predstavu o hodnotách maximálneho IQ v populácii n nezávisle náhodne vybratých ľudí si môžeme vytvoriť na základe 5-percentného kvantilu, 50-percentného kvantilu (t.j. mediánu) a 95-percentného kvantilu. Graf týchto kvantilov (presnejšie, graf ich aproximácií Q(0,05), Q(0,5) a Q(0,95)) v závislosti na n je nasledovný:


Z grafu je možné vyčítať napríklad to, že pre 5 miliónov ľudí, čo zodpovedá zhruba počtu obyvateľov Slovenska, je 5-, 50- a 95-percentný kvantil pre maximum IQ rovný približne 173, 177, resp. 184. Voľne povedané, na 50 percent možno očakávať, že najinteligentnejší Slovák má IQ väčšie ako 177 a na 90 percent sa dá očakávať, že jeho IQ je v rozmedzí 173 až 184. Celkom dosť, čo poviete? Len aby nám aj on neubzikol do zahraničia.

Poznámka: Samozrejme všetky podobné úvahy a výpočty sú založené na zjednodušeniach (dal by sa spochybniť napríklad predpoklad nezávislosti, rozdelenie hodnôt IQ môže byť trochu odlišné pre rôzne skupiny ľudí a to ani nehovorím o tom, že samotný pojem číselne meraného IQ je diskutabilný.) Ale vo vede sa nemôžeme báť určitých zjednodušení, pretože by sme sa nikam nedostali. Nakoniec, ako povedal Karl Popper: “Science may be described as the art of systematic oversimplification.”

23 januára 2008

Sliepky hrajú tic-tac-toe

Tic-tac-toe je veľmi jednoduchá hra pre dvoch, podobná našim piškvorkám: Na šachovnicu s 3x3 políčkami striedavo zapisuje jeden hráč krížiky a druhý hráč krúžky, pričom vyhráva ten, komu sa podarí vytvoriť trojicu na niektorom stĺpci, riadku, alebo diagonále. Každý človek veľmi rýchlo zistí, že sa dá s istotou neprehrať, takže po pár hrách sa tic-tac-toe končí už iba remízou. Čo však v prípade, že proti sebe hrajú dve sliepky, ktoré si volia políčka na ťah úplne náhodne? S akou pravdepodobnosťou skončí hra remízou?

Poznámka: Predpokladáme, že sliepky si vyberajú políčka rovnomerne náhodne, t.j. na začiatku prvá sliepka umiestni svoj krížik do každého z 9 voľných políčok s pravdepodobnosťou 1/9, potom druhá sliepka umiestni svoj krúžok do každého z 8 voľných políčok s pravdepodobnosťou 1/8 a tak ďalej. To znamená, že sliepky nie sú na hru trénované, čo nie je až taký nezmysel, ako by sa mohlo zdať :-).

17 januára 2008

Smerujeme k individualizovanej karme článkov?

Otváram si blog.sme a vidím, že za posledný deň pribudlo vyše stovky nových príspevkov. Všetky sa samozrejme nedajú prečítať; dokonca len prejsť názvami je pomerne zdĺhavé. Rozmýšľam, ako si mám vybrať článok, ktorému obetujem svoj čas a nádej vkladám do článkov pod hlavičkou "Top karma". Ale chyba lávky. Články s top karmou určite zaujmú veľa ľudí, niektoré sa naozaj príjemne čítajú, ale žiadny z nich nie je presne to čo hľadám.

Je jasné, že nie každého zaujíma to, čo je vo všeobecnosti najpopulárnejšie. Ja osobne by som chcel čítať predovšetkým príspevky, ktoré viac stavajú na poznaní ako na emóciách. (Všimnite si, že emócie akoby boli nutnou podmienkou na dosiahnutie masovej obľúbenosti a to nielen na blogoch.) Kontroverzné a umelecky ladené blogové príspevky sú obvykle v poriadku, nemám nič proti ich publikovaniu, ale aj kockáč ako ja je predsa človek, ktorý má právo na to svoje počítaníčko. Či nie?

Riešenie by mohlo byť v inom systéme hodnotenia článkov; v čomsi, čo pracovne nazvem individualizovaná karma, skrátene i-karma, čiže hodnotenie príspevkov ušité na mieru každému užívateľovi zvlášť.

Predstavme si napríklad, že každý registrovaný užívateľ môže hodnotiť článok na stupnici od 0 do 10 bodov. Ja sám tiež budem články takto hodnotiť a po istom čase bude možné určiť, ktorí ľudia majú podobný vkus ako ja - totiž tí, ktorých hodnotenia článkov sa "veľmi nelíšia" od mojich hodnotení. Takýmto spôsobom bude teda možné vypočítať číselnú odchýlku, akúsi nepodobnosť, či "vzdialenosť vkusov" medzi dvojicami užívateľov. I-karma nejakého článku by potom mohla byť váženým priemerom hodnotení daného článku, pričom váhy by boli určené tak, že čím má niekto podobnejší vkus tomu môjmu, tým väčšiu váhu bude mať práve jeho hodnotenie článku na výpočet mojej i-karmy. Inými slovami, ak má niekto tendenciu hodnotiť články podobne ako ja, tak jeho hlas by mal mať väčší vplyv na moje rozhodnutie, či si daný článok mám prečítať, alebo nie.

Viem, že je to návrh, ktorý by bolo potrebné premyslieť do detailov; pričom niektoré sú technicky komplikované. Napríklad ma nevie napadnúť ako obísť to, že by sa musela uchovávať celá matica vzájomných vzdialeností vkusov registrovaných užívateľov, čo môže byť nielen náročné na pamäť, ale aj na vysoký výpočtový výkon spojený s priebežnou aktualizáciou údajov. Samozrejme, bolo by tiež treba vhodne navrhnúť matematickú špecifikáciu na výpočet vzájomných vzdialenosti medzi vkusom užívateľov a podobne. Som však presvedčený, že všetky tieto problémy by sa dali vyriešiť.

A ešte jedna poznámka na záver. V systéme s i-karmou (a možno aj v už existujúcich systémoch) by bolo lepšie vyzvať užívateľov na hodnotenie typu "Do akej miery ste spokojní s tým, že ste si tento článok prečítali". V súčasnosti používané výzvy zvádzajú skôr k hodnoteniu podľa miery súhlasu s obsahom, čo je prakticky nezávislé na kvalite daného článku. Vážnym rizikom systému i-karmy je totiž to, že môže viesť k vytváraniu oddelených a navzájom sa neustále vzďaľujúcich názorových klubov. Podľa mňa je však veľmi prospešná aj kultivovaná konfrontácia takých názorov, ktoré sú diametrálne odlišné.

pošli na vybrali.sme.sk pošli do vybrali.sme.sk

13 januára 2008

Valivá elipsa

Rovnako ako v úlohe "Valivá úsečka", predstavme si, že sa malá kružnica "valí" po vnútornej strane veľkej kružnice s dvojnásobným polomerom. Červenou farbou označme pevne zvolený bod na malej kružnici a modrou farbou pevne zvolený bod na úsečke spájajúcej tento bod so stredom malej kružnice. Je pravda, že modrý bod opisuje matematicky presnú elipsu? (Kliknutím na obrázok sa spustí animácia.)

10 januára 2008

Donald Knuth oslavuje 70-tiny

Autor biblie teórie algoritmov "The Art of Computer Programming", autor typografického systému TeX a profesor emeritus na Standford University Donald Knuth sa práve dnes dožíva 70 rokov. Okrem množstva bibliografických údajov, ktoré ľahko nájdete na nete, môžete si o Donaldovi Knuthovi prečítať aj pekný neformálny blogový príspevok na CS blogu Scotta Aaronsona. Môžete si tiež vypočuť toto mp3, kde Donald Knuth rozpráva o randomizovaných algoritmoch a príbuzných témach.

09 januára 2008

Richard Feynman: citát

"To those who do not know Mathematics it is difficult to get across a real feeling as to the beauty, the deepest beauty of nature. ... If you want to learn about nature, to appreciate nature, it is necessary to understand the language that she speaks in." Richard Feynman

Poznámka 10.1.: Tento citát dopadol najlepšie v ankete na Cut the knot, avšak niektorým (najmä nematematikom) sa môže zdať arogantný, s čím sa naozaj dá súhlasiť. Opatrnejšia a zrejme aj "pravdivejšia" formulácia by bola; pokúsim sa to formulovať v angličtine: "To those who do not know Mathematics it is difficult to get across a real feeling as to some aspects of the beauty of nature. ... If you want to learn about nature, to appreciate nature to the fullest, it is necessary to understand the language that she speaks in."

08 januára 2008

Valivá úsečka

Dnes mi zadal otec takúto peknú úlohu:

Malá kružnica sa "valí" po vnútornej strane veľkej kružnice s dvojnásobným polomerom. Zdá sa, že akýkoľvek bod zaznačený na malej kružnici kmitá presne po úsečke (kliknite na obrázok vľavo). Je to naozaj tak?

04 januára 2008

Oktily a Vaše IQ

Update: 25.1.2008 - výsledky ankety na konci príspevku

Tí z Vás, ktorí nemáte záujem o malé vzdelanie sa v štatistickej terminológii a súčasne Vás štatistika nebaví, môžete v tomto príspevku skočiť hneď na (*). My ostatní sa najprv vzdeláme, alebo zabavíme.

Nech x'1,...,x'n označuje usporiadanie čísel x1,...,xn. Ako asi viete, mediánom súboru čísel x1,...,xn nazývame buď "prostrednú" hodnotu x'(n+1)/2 (ak je n nepárne), alebo aritmetický priemer dvoch "prostredných" čísel x'n/2 a x'(n/2)+1 (ak je n párne). Okrem tejto trochu krkolomnej definície mediánu existuje aj definícia grafická, ktorá nám naviac umožňuje prirodzeným spôsobom zaviesť aj všeobecné kvantily - a ako špeciálny prípad kvartily a oktily.

Z dôvodu prehľadnosti zápisu označme číslo n-1 symbolom k. Zostrojme v rovine xy lomenú čiaru L spájajúcu body (x'1,0), (x'2,1/k), (x'3,2/k), ..., (x'n,1). Potom pre p z intervalu (0,1) dostaneme 100.p-percentný kvantil čísel x1,...,xn ako x-ovú súradnicu priesečníku priamky y=p s lomenou čiarou L.




Napríklad pre 6 čísel x1,...,x6 máme na priloženom obrázku znázornené ako skonštruovať 12,5-percentný kvantil (1.oktil), 25-percentný kvantil (2.oktil, alebo 1.kvartil), 37,5-percentný kvantil (3.oktil), 50-percentný kvantil (4.oktil, alebo 2.kvartil, alebo median :-), 67,5-percentný kvantil (5.oktil), 75-percentný kvantil (6.oktil, alebo 3.kvartil) a 87,5-percentný kvantil (7.oktil). (Uf, "37,5". alebo "87,5" sú také škaredé čísla; o čo krajšie by sa definovali oktily, keby nás evolúcia obdarila štyrmi prstami na každej ruke :-)

(*) Takže 7 oktilov nám delí skupinu čísel usporiadaných od najmenšej hodnoty po najväčšiu na 8 približne rovnako veľkých skupín. Ak by sme mali napríklad skupinu 80 rôznych čísel, tak z definície oktilov je zrejmé, že 10 z týchto čísel musí byť menších ako 1.oktil, 10 čísel musí byť medzi 1.oktilom a 2.oktilom, 10 čísel medzi 2.oktilom a 3.oktilom a tak ďalej.

V súlade s definíciou oktilov som položil nasledovnú anketovú otázku: Pokúste sa intuitívne odhadnúť, v akom rozmedzí je Vaše IQ spomedzi všetkých, ktorí sa zúčastnili, alebo zúčastnia tejto ankety. Možnosti sú:

  • Top IQ = Najinteligentnejších 12,5% spomedzi účastníkov tejto ankety
  • 7 = Rozmedzie od 6. po 7.oktil IQ
  • 6 = Rozmedzie od 5. po 6.oktil IQ
  • 5 = Rozmedzie od 4. po 5.oktil IQ
  • 4 = Rozmedzie od 3. po 4.oktil IQ
  • 3 = Rozmedzie od 2. po 3.oktil IQ
  • 2 = Rozmedzie od 1. po 2.oktil IQ
  • Bottom IQ = 12,5% najmenej inteligentných spomedzi účastníkov tejto ankety

Finta je samozrejme v tom, že ak by všetkých 40 účastníkov ankety odhadlo svoju pozíciu v rebríčku IQ správne, tak by každá kategória nutne musela obsahovať rovnaký počet odpovedí, t.j. 5. (Predpokladáme, že každý účastník ankety má inú hodnotu IQ; prípadné zhody by situáciu iba trochu zamotali.) Výsledok bol nasledovný:



Ako vidíme, do kategórie TopIQ sa zaradilo 15 ľudí, z ktorých sa teda minimálne 10 precenilo. Do hornej polovice tabuľky (kategória 5 a vyššie) sa zaradilo 35 ľudí, z ktorých aspoň 15 v skutočnosti patrí do dolnej polovice tabuľky. V najvyšších dvoch kategóriách je pritom 22 ľudí, z ktorých sa aspoň 12 precenilo a pritom minimálne dvaja precenili pozíciu svojho IQ veľmi výrazne, pretože v skutočnosti patria do dolnej polovice tabuľky :-) Z tejto ankety samozrejme nemôžeme povedať kto konkrétne sa precenil, ale s istotou môžeme tvrdiť, že veľa ľudí má tendenciu posudzovať svoje inteligenčné schopnosti veľmi nekriticky.

03 januára 2008

Ankety na blogu Q.E.D. v druhej polovici roku 2007

V prvom rade Vám všetkým želám šťastný rok 2008, plný intelektuálne hodnotnej zábavy :-) Možno ste si všimli, že s koncom roka 2007 sa na Q.E.D. uzavreli miniankety, takže poďme sa spolu pozrieť na ich výsledky.



Väčšina hlasujúcich si myslí, že úlohy na Q.E.D. sú zaujímavé a primerané (čo ma samozrejme veľmi teší), takže budem pokračovať v doterajšom štýle a náročnosti. Len sa trochu čudujem malému (často nulovému) počtu komentárov; z nich sa zdá, akoby ste niektoré úlohy nevedeli vyriešiť a to sa mi nechce veriť. Napríklad taká úloha o konštantnej šírke je pomerne jednoduchá, podľa mňa celkom pekná a už sa neviem dočkať, ako ju viac okomentujem. Alebo možno niektoré úlohy nikoho nezaujali natoľko, aby sa odhodlal k napísaniu riešenia. Nevadí; matematické úlohy nestarnú a v priebehu rokov sa snáď nejakí nadšenci nájdu.



Najväčší záujem je o úvahy (v novej klasifikácii tém predpokladám, že by podobne dopadli aj špekulácie). No; písanie úvah je síce zábava, ale pomerne náročná na čas :-) Rôznych nie celkom domyslených nápadov na úvahy aj divoké špekulácie mám však poznačených pomerne veľa a už sa teším, ako ich postupne spracujem. Budem sa tiež snažiť pridať trochu viac odkazov na www stránky na Slovensku a vo svete, ktoré by mohli byť zaujímavé pre čitateľov takého špecifického blogu akým je Q.E.D. Ale v tom by ste mi mohli pomôcť aj Vy.



Táto anketa sa týkala špeciálne príspevku Rudyho ontológie. Potešilo ma, ako veľa ľudí sa zapojilo do tejto špekulatívno-filozofickej ankety a aj to, že len šestina z nich si myslí, že sa jedná o úplný nezmysel (Aj Rudy by sa asi potešil :-) Taktiež je zaujímavé to, že každá "ontológia" si našla aspoň jedného priaznivca. A aký je môj osobný postoj? Pravdu povediac, nie som si úplne istý, ale ak by som musel zvoliť jednu možnosť, tak by som si asi ako väčšina vybral "common sense". (Určite by som si však zvolil jednu z prvých štyroch možností. Veľmi totiž neverím, že by mohlo platiť M>F, aj keď v zásade nevylučujem nič.)

Budem rád ak využijete tento príspevok na všeobecné komentáre k blogu Q.E.D. Napríklad aké ankety by Vás zaujali? Konkrétne akým témam by som mal dávať prednosť? Je podľa Vás blogspot vhodné umiestnenie blogu Q.E.D.?