Grundläggande begrepp inom statistiken (glosor)

Här kommer en kort liten lista över viktiga ord tillsammans med en förklaring, alla knutna till statistiken. Först några begrepp som handlar om statistik i allmänhet.

Deskriptiv statistik = beskrivande statistik. Ett sätt att beskriva större mängder data (siffror, fördelningar) på ett organiserat sätt. Exempelvis med hjälp av tabeller.

Hypotes-testande statistik = statistik som gör det möjligt att dra slutsatser. Man använder sig av deskriptiv statistik för att kunna använda sig av hypotes-testande statistik.

Variabel = det man mäter. Detta skulle kunna vara blodtruck exempelvis.

Kvantitativ = numerisk, alltså en siffra. Detta är en typ av variabel.

Kvalitativ = kategorisk, alltså man, kvinna eller annan kategori. Detta är en typ av variabel.

Population = den grupp man undersöker. Det skulle kunna vara alla människor som bor i Dalarnas kommun.

Urval = den del av en population som studeras. Det skulle kunna vara alla kvinnor i åldern 24-34 år i Dalarna. Man kan ha flera urval i en population, exempelvis kan man undersöka alla Dalarnas kvinnor i åldern 24-34 år. Det är urval ett. Man kan också undersöka alla Dalarnas män i åldern 55-70, det blir då urval två.

Urvalsmedel = medelvärdet av urvalet.

Populationsmedel = medelvärdet av alla urval i populationen.

n = antalet uppmätta värden

Och nu över till några olika typer av mått och vad dessa mått innebär.

Centralmått = detta hör till den deskriptiva statistiken och visar var tyngdpunkten av de uppmätta värdena ligger.

Spidningsmått = ett mått på hur liten/stor spridningen är mellan de uppmätta värdena.

Precisionsmått =  att ge samma resultat vid upprepad mätning/analys.

Riktighetsmått = att ge ett resultat som stämmer överens med det sanna värdet.

Här kommer några exempel på centralmått.

Medelvärde = summan av värdet på gjorda observationer dividerat med antalet gjorda observationer.

Medianvärde = mittenvärde, alltså det värde som hamnar i mitten om man skriver upp alla värdet på en linje, från det minsta till det högsta, från vänster till höger. Medianen fungerar bra att använda sig av om fördelningen av värdena är skev. Dessutom kan det vara så att mittenlinjen bland alla värden hamnar mellan två värden. Då är det medelvärdet av dessa värden som är median.

Typvärde = det vanligaste värdet band alla uppmätta värden.

Och nu några exempel på spridningsmått.

Range = största uppmätta värdet minus minsta uppmätta värdet.

Standardavvikelse = hur mycket varje värde i medeltal avviker från medelvärdet. Detta är ett spridningsmått och ett precisionsmått.

Variationskoefficient = visar i procent hur stor del  standardavvikelsen är av medelvärdet. Detta är ett spridningsmått och ett precisionsmått.

Standard Error of the Mean = hur mycket varje urvalsmedel i medeltal avviker från populationsmedlet. Standard Error of the Mean är ett spridningsmått.

Några exempel på riktighetsmått.

Absolut fel = skillnaden mellan det värde man skulle få och medelvärdet av alla de värden man fick.

Relativt fel = samma sak som absolut fel, men räknar i procent i stället för med enhet.

Källa:

Eriksson, A. Metrologi. Föreläsning. Linköpings Universitet. 2014-03-06.

4 comments

Vad tycker du?