24 septembra 2016

Svet má 600 univerzít lepších ako UK. Úspech? Neúspech?

V najnovšom rebríčku WUR sa umiestnila Univerzita Komenského na 601. až 800. mieste. Niektorí ľudia tento výsledok považujú za úspech, no iným sa zdá, že najlepšia slovenská univerzita s takýmto umiestnením je znakom zlyhávania kvality nášho vysokého školstva.

Majú Slováci z hľadiska kvality ich najlepšej vysokej školy smolu, že žijú práve na Slovensku?

Takto formulovaná otázka je veľmi nepresná a aby sme na ňu vedeli objektívnejšie odpovedať, potrebujeme si ju spresniť. (Spresňovanie nejasne formulovanej otázky je vo vedeckom výskume úplne bežné a často si vyžaduje veľkú dávku tvorivosti.)

Jedno matematické spresnenie je nasledovné: Na celom svete je N ľudí a Slovensko má n obyvateľov. Predstavme si, že populáciu sveta rozdelíme do N/n priečinkov, každý s n ľuďmi. Do týchto priečinkov rovnomerne nezávisle náhodne hodíme 600 univerzít lepších ako UK v rebríčku WUR; do jedného priečinka môže samozrejme padnúť aj viac univerzít. Aké je očakávané percento ľudí, ktorí budú mať to šťastie, že v ich priečinku bude aspoň jedna z týchto 600 najlepších univerzít?

Ak sa Vám podarí túto otázku zodpovedať (vlastne aj ak sa Vám to nepodarí), môžete sa pokúsiť formulovať lepšie spresnenie uvedenej otázky.

2 komentáre:

laffo povedal(a)...

pre jednoduchost: nech N je 6miliard a n je 6milionov a N/n = 1000.
potom hadzeme 600 univerzit do 1000 chlievikov.
nahodny vektor, ktory zodpoveda rozdeleniu univerzit v chlievikoch ma multinomicke rozdelenie s parametrom N=600 a p = (0.001, …, 0.001).
v kazdom chlieviku je rovnako vela ludi, teda 6mil, teda ratame strednu hodnotu cez multinomicky vektor pre priemerny pocet chlievikov s viac ako 1 univerzitou.
Vyslo mi zhruba 45%.

set.seed(23)
nDraws <- 100000
mean(apply(rmultinom(nDraws, size = 600, prob = rep(1/1000,1000)), 2, function(x) mean(x>=1)))
# 0.4513206 for nDraws<-100000

Radoslav Harman povedal(a)...

Laffo je to samozrejme tak (inak, super stručný simulačný kód). Presná hodnota je

1-dbinom(0,size=600,prob=0.001)
# 0.4513531

Ak by sme nemali funkciu na binomické pravdepodobnosti, tak slušný odhad je pomocou Poissonovho rozdelenia

1-exp(-0.6)
# 0.4511884

Týmto spresnením všeobecnej úlohy teda dostávame, veľmi voľne povedané, že je to so slovenským vysokým školstvom vzhľadom na veľkosť Slovenska trochu nadpriemerné, ale nie nejaké úžasné :)