15. april 2006

Hvit løgn, svart løgn, statistikk

Meningsmålinger i Norge foregår normalt med cirka tusen spurte. Når avisene sier at 4000 har sett et TV-program, betyr det at 1 av de 1000 med måleboks har sett på programmet. Når de sier at 8.000 har skiftet parti fra KrF til FrP, betyr det at 2 av de 1000 spurte tok dette spranget. De ganger tallet i målingen med 4000, evt. noe mer og runder av.

Metoden gir et godt nok resultat for store grupper. Sier målingen at åtte hundre tusen ser Skavlan eller en million stemmer Ap kan du anta noen få prosent slingringsmonn. Da er det greit at media ikke oppgir det statistiske avviket, for det gjør de jo som regel ikke i Norge.

Men for små grupper blir fremstillingen feil feil feil. Hvis avisen sier at 8.000 har skiftet mellom to bestemte partier kan du anta at det virkelige tallet ligger fra noen få og opp til 20-30.000. Det er slingringsmonn på over hundre prosent. For å måle små grupper godt må instituttene spørre flere folk. I USA spør instituttene gjerne 10.000, og i medisinske undersøkelser kan det spørres enda flere. (Heldigvis).

Et eksempel på hva jeg snakker om: MMI vil finne ut hvor mange som jobber med hva. De spør 1000 folk om hvilket yrke de har. Da vil de enten ikke spørre Kongen. I så fall finner undersøkelsen at Norge har null konger (og republikk). Eller de slumper til å spørre Kongen. Da vil undersøkelsen konkludere med at 1 av 1000 er konge, og at Norge ergo har 4000 konger. Rett svar, en konge, er umulig å få til.

Eksempelet er ekstremt, men det samme gjelder også alt som det finnes noen hundre av. De blir enten null eller minst 4000. Selv for en gruppe på 10000 blir det bingo om de blir fremstilt som 0, 4000, 8000, 12000, 16000 eller 20000. Eller mer.

De som driver med statistikk vet selvfølgelig dette, det er når media skal tolke statistikken at det kan dukke opp rare fremstillinger.

Men statistikk er kult nok det. Fornuftig brukt.

4 kommentarer:

Rigmor sa...

Personlig syntes jeg da at statistikk er kulest når det er ufornuftig brukt... avhengig av tema, kanskje. Men altså.

Visste du at man i USA kan få 300% i karakterer på en innleveringsoppgave?

Pfha!

Hjorthen sa...

Statistikk er gøy!

Men bruker vi målebokser for å måle TV-seere i Norge? Jeg innbilte meg faktisk at disse målingene ble gjort via gode gammedagse telefonintervjuer jeg?

Esquil sa...

Kult profilbilde, rigmor!

Hjorth: vi hadde en sånn boks hjemme i flere år. Man kan punsje inn at man har opptil ti gjester. Det vil si at jeg alene kunne legge til 40000 seere hvis jeg likte programmet. Nå kan jeg knapt huske å ha vært så kynisk, da.

Einar sa...

Tilsvarende avvik gjøres når man beregner folkemengder i f.eks. stordemonstrasjoner. Heldigvis har vi ikke nådd spanske tilstander ennå her til lands, hvor anslag nylig varierte mellom 110.000 og 1.750.000. Sekssifret feilmargin altså. Ikke ofte man opplever det.