22 mája 2009

Intervaly spoľahlivosti v prieskumoch verejnej mienky

S potešením konštatujem, že agentúra FOCUS ku prieskumu momentálnej podpory politických strán uvádza okrem samotných percentuálnych odhadov aj intervaly spoľahlivosti. Rozhodol som sa preto, že stručne popíšem o čo ide.

Predstavme si, že máme škatuľu, v ktorej je veľmi veľký počet farebných guliek, pričom nás zaujíma pomer p, koľko z týchto guliek je červených. (Pre prieskumy môže "škatuľa" znamenať rozsiahly reprezentatívny zoznam oprávnených voličov a "červené guľky" môžu byť povedzme tí voliči, ktorí by momentálne volili stranu SMER.)

Pri obrovskom počte guliek nie je mysliteľné, aby sme preskúmali farbu každej z nich. Takže vykonáme len jednoduchý náhodný výber relatívne malého počtu guliek (tento počet, nazývaný tiež rozsah výberu, si označíme n), zistíme koľko je z nich červených (nech je to k) a výsledný pomer (t.j. hodnotu k/n) prehlásime za náš odhad neznámej hodnoty p. Interval spoľahlivosti (IS) vyjadruje rozsah, v ktorom "s veľkou mierou istoty" leží skutočný pomer p, ktorého je k/n len často nepresným odhadom. Pokúsme sa vysvetliť tento intuitívny popis IS matematicky presnejšie.

Približný 95 percentný interval spoľahlivosti pre hodnotu p vypočítame ako k/n plus mínus δ, kde


V predchádzajúcom vzorci je p so strieškou náš odhad hodnoty p, t.j. k/n a konštanta 1,96 je takzvaná kritická hodnota normálneho rozdelenia. Hodnota δ sa v angličtine nazýva "margin of error" a v slovenčine ju budem nazývať hraničná chyba.

Odhad k/n je teda stredom IS a čím je väčšie n, t.j. čím je väčší rozsah nášho náhodného výberu, tým je menšia hraničná chyba a užší výsledný interval. To súhlasí s našou intuíciou ako asi by sa mal IS správať. Ale prečo práve takýto vzorec? A čo vlastne znamená číslo 95?

Predstavme si, že náš experiment s vybratím n guliek zopakujeme mnohokrát a zakaždým použijeme hore uvedený vzorec pre konštrukciu IS. Potom približne v 95 percentách prípadov bude skonštruovaný interval obsahovať skutočný pomer p červených guliek v škatuli. Presvedčiť sa o platnosti predchádzajúcej vety si vyžaduje absolvovať základný kurz teórie pravdepodobnosti (aspoň po centrálnu limitnú vetu), ale pochopiť význam IS je možné aj bez toho. Ešte raz inými slovami: 95 percentný IS je interval vypočítaný metódou, ktorá dáva v 95 percentách prípadov jej použitia interval obsahujúci hodnotu p skutočného podielu.

Predpokladajme napríklad, že zo škatule sme vybrali presne 1000 guliek. Potom hraničná chyba v závislosti od odhadu k/n je zobrazená na nasledovnom grafe (všetko som vynásobil číslom 100, t.j. aj odhad neznámeho pomeru p aj hraničná chyba je na grafe uvedená v percentách):


Napríklad ak by v našom náhodnom výbere bolo presne 40 percent červených guliek, je hraničná chyba približne 3 percentá a 95 percentný interval spoľahlivosti pre skutočné percento červených guliek v šaktuli je 37 až 43. Ak by spomedzi vybratých guliek bolo 20 percent červených, bola by hraničná chyba približne 2,5 percenta a 95 percentný IS by bol 17,5 až 22,5.

Čo sa týka prieskumov verejnej mienky, tak je situácia samozrejme trochu zložitejšia. Po prvé, prieskumná agentúra môže použiť sofistikovanejší výber respondentov ako je len obyčajný náhodný výber; napríklad môže robiť takzvaný stratifikovaný náhodný výber, ktorý odhady spresní. A po druhé, je pravdepodobné, že intervaly spoľahlivosti bude agentúra počítať exaktnou metódou a nie len našim jednoduchým, avšak len približným vzorčekom.

Každopádne intervaly spoľahlivosti uvedené v správe agentúry FOCUS s počtom odpovedajúcich respondentov n=709 sú prakticky identické s tým, čo by sme dostali použitím našej metódy (okrem uvedeného intervalu spoľahlivosti pre Slobodné Fórum, kde agentúra zjavne urobila chybu).

Poznámka: Všimnite si, že krajná chyba, t.j. vlastne presnosť nášho odhadu, nezávisí od počtu všetkých guliek v škatuli, resp. od počtu všetkých potenciálnych voličov (kvôli vrtákom: predpokladáme náhodný výber s vrátením, čo je však prakticky identická situácia ako náhodný výber bez vrátenia ak je rozsah výberu o niekoľko rádov menší ako veľkosť základnej populácie). Takže aj ak by bolo potenciálnych voličov milión, aj sto miliónov, aj sto miliárd, náhodný výber rozsahu 1000 nám poskytne zakaždým rovnako presný odhad o podiele potenciálnych voličov strán.

1 komentár:

rasťo povedal(a)...

Dobrý článok. Pobavil som sa na formulácii:

Pre prieskumy môže "škatuľa" znamenať rozsiahly reprezentatívny zoznam oprávnených voličov a "červené guľky" môžu byť povedzme tí voliči, ktorí by momentálne volili stranu SMER.Tiež je zaujímavá poznámka na konci o náhodnom výbere. Minule mi jedna kamarátka z GfK hovorila, že všetky (marketingové) prieskumy, ktoré robia, vykonávajú na 800-1500 respondentoch. Až teraz mi docvaklo, že to naozaj stačí, ak to vedia spraviť tak, aby ten výber naozaj bol náhodný.