Kako tumačiti predizborne ankete?
Da li je proizvod u skladu sa specifikacijom?
Kako fizičari znaju da su otkrili novu česticu?
Da bismo odgovorili na ova pitanja, trebamo razumjeti šta je standardna devijacija.
To je jedan od onih pojmova koji se često pojavljuju u medijima, ali mali broj nas zna o čemu se radi.
Ako imamo neki skup podataka, standardna devijacija predstavlja uobičajeno odstupanje od prosječne vrijednosti.
U gornjem primjeru, ako imamo brojeve: 10, 8, 10, 8, 8 i 4, prosječna vrijednost je 8, dok uobičajeno odstupanje od prosjeka iznosi 2,19 (poštedit ću vas formula).
Statistika najčešće nije bilo čiji omiljeni predmet, pa se sada već sigurno pitate zašto uopšte pišem o ovome.
Poznavanje ovog koncepta nam pomaže da bolje razumijemo svijet oko nas.
Što je veći skup podataka (npr. visina stanovništva, plate zaposlenih u nekoj zemlji, povrati američke berze u posljednjih stotinu godina…), to je veća šansa da će podaci biti ravnomjerno raspoređeni, što statističari zovu normalna distribucija.
A kada god se radi o normalnoj distribuciji, tada važi i pravilo 68-95-99 koje nam govori sljedeće:
- 68% svih podataka u skupu će odstupati jednu standardnu devijaciju od prosjeka
- 95% podataka će odstupati dvije standardne devijacije od prosjeka
- 99,7% podataka će odstupati tri standardne devijacije od prosjeka
Ako prosječan koeficijent inteligencije (IQ) iznosi 100, a standardna devijacija je 15, to znači da:
- 66% ljudi ima IQ između 85 i 115
- 95% ljudi ima IQ između 70 i 130
- 99,7% ljudi ima IQ između 55 i 145
Drugim riječima, postoji 0,15% šanse da neko ima IQ preko 145, te 0,15% šanse da je IQ ispod 55. Poređenja radi, procjenjuje se da je Nikola Tesla imao IQ preko 160.
Kada fizičari dobiju rezultat koji odstupa pet standardnih devijacija od prosjeka, to se zove pet sigma rezultat (sigma je drugi naziv za standardnu devijaciju) i ukazuje da se gotovo sigurno radi o novom otkriću, a ne o nekoj slučajnoj fluktuaciji.
A ako čitate predizborne ankete ili neki naučni članak, često ćete naići na pojam da je rezultat statistički značajan (signifikantan). To znači da je očekivana vjerovatnoća 95%, odnosno da je moguće odstupanje od dvije standardne devijacije.
Na kraju, ne zaboravite da statističke podatke uvijek treba uzimati s dozom opreza. Jer kao što je (vjerovatno) rekao jedan britanski premijer:
Postoje tri vrste laži: laži, proklete laži i statistika.
BENJAMIN DISRAELI