Standardavvik
Standardavviket er et mål for spredningen av verdiene i et datasett eller av verdien av en stokastisk variabel. Den er definert som kvadratroten av variansen.
En av grunnene til at standardavviket er en viktig parameter, er Tsjebysjevs ulikhet som sier at de fleste verdiene i et datasett av tilfeldige variabler vil ligge i nærheten av gjennomsnittet, hvor «i nærheten» er definert ved hjelp av standardavviket. Standardavviket ligger på det punktet hvor kurven i normalfordelingen endrer retning.
Før man bruker standardavvik bør man bruke et histogram eller en frekvenstabell for å undersøke om datasettet er normalfordelt da mange statistiske metoder ikke kan stoles på dersom datasettet har skjevhet eller ekstremverdier[1].
Standardavviket ble introdusert av Francis Galton mot slutten av 1860-tallet.
Definisjon
[rediger | rediger kilde]Med en gitt en populasjon x1, ..., xN av reelle tall, er gjennomsnittet gitt ved
og standardavviket definert som
- .
Standardavviket til en stokastisk variabel X er definert som
- ,
hvor E(X) er forventningsverdien til X.
Hvis man har stikkprøver x1,...,xn fra en større populasjon, defineres det empiriske standardavviket som
Relativt standardavvik
[rediger | rediger kilde]Ved å dividere standardavviket med gjennomsnittsverdien får en relativt standardavvik. Dette oppgis som regel i prosent.
Måleenhet
[rediger | rediger kilde]Standardavvik har som regel samme benevning som måleenheten til verdiene i datasettet. Et unntak er for verdier som har prosent som benevning. Siden en differanse mellom to prosentmålinger har enhet prosentpoeng, vil standardavviket til slike datasett ha enhet prosentpoeng. Det gjøres likevel ofte feil med dette, og prosent brukes som benevning også for standardavviket, noe som gjør det uklart om det er snakk om et vanlig standardavvik eller et relativt standardavvik.
Referanser
[rediger | rediger kilde]- ^ Fligner, Moore Notz (2015). The Basic Practice of Statistics. New York: W. H. Freeman and Company. s. 59.