Standardavvik

Standardavviket er et mål for spredningen av verdiene i et datasett eller av verdien av en stokastisk variabel. Den er definert som kvadratroten av variansen.

En av grunnene til at standardavviket er en viktig parameter, er Tsjebysjevs ulikhet som sier at de fleste verdiene i et datasett av tilfeldige variabler vil ligge i nærheten av gjennomsnittet, hvor «i nærheten» er definert ved hjelp av standardavviket. Standardavviket ligger på det punktet hvor kurven i normalfordelingen endrer retning.

Animasjon som viser 1, 2 og 3 standardavvik fra gjennomsnittsverdiet i et datasett.

Før man bruker standardavvik bør man bruke et histogram eller en frekvenstabell for å undersøke om datasettet er normalfordelt da mange statistiske metoder ikke kan stoles på dersom datasettet har skjevhet eller ekstremverdier^[1].

Standardavviket ble introdusert av Francis Galton mot slutten av 1860-tallet.

Mørkeblå farge viser verdier som er under ett standardavvik fra gjennomsnittsverdien. I en normalfordeling vil 68,27 % av datasettet være under ett standardavvik fra gjennomsnittet. 95,45 % er under to standardavvik fra gjennomsnittet (himmelblå farge), 99,73 % under tre standardavvik og 99,994 % under fire.

Definisjon

Med en gitt en populasjon x₁, ..., x_N av reelle tall, er gjennomsnittet gitt ved

{\overline {x}}={\frac {1}{N}}\sum _{i=1}^{N}x_{i},

og standardavviket definert som

\sigma ={\sqrt {{\frac {1}{N}}\sum _{i=1}^{N}(x_{i}-{\overline {x}})^{2}}}

.

Standardavviket til en stokastisk variabel X er definert som

\sigma ={\sqrt {\operatorname {E} ((X-\operatorname {E} (X))^{2})}}={\sqrt {\operatorname {E} (X^{2})-(\operatorname {E} (X))^{2}}}

,

hvor E(X) er forventningsverdien til X.

Hvis man har stikkprøver x₁,...,x_n fra en større populasjon, defineres det empiriske standardavviket som

s={\sqrt {\frac {\sum _{i=1}^{n}(x_{i}-{\bar {x}})^{2}}{n-1}}}.

Relativt standardavvik

Ved å dividere standardavviket med gjennomsnittsverdien får en relativt standardavvik. Dette oppgis som regel i prosent.

Måleenhet

Standardavvik har som regel samme benevning som måleenheten til verdiene i datasettet. Et unntak er for verdier som har prosent som benevning. Siden en differanse mellom to prosentmålinger har enhet prosentpoeng, vil standardavviket til slike datasett ha enhet prosentpoeng. Det gjøres likevel ofte feil med dette, og prosent brukes som benevning også for standardavviket, noe som gjør det uklart om det er snakk om et vanlig standardavvik eller et relativt standardavvik.

Referanser

^ Fligner, Moore Notz (2015). The Basic Practice of Statistics. New York: W. H. Freeman and Company. s. 59.

[BasicPracticeStatistics-1] Fligner, Moore Notz (2015). The Basic Practice of Statistics. New York: W. H. Freeman and Company. s. 59.

[1]