Standardavvikelse

Det är mycket statistik, metrologi och enklare matematik vi lär oss i skolan. Bland annat något som heter standardavvikelse, SD förkortas det.

SD är ett mått på hur mycket ett antal uppmätta värden i genomsnitt avviker från de uppmätta värdenas medelvärde.

SD talar alltså om hur stor spridning det är på de uppmätta värden. Ju lägre värdet för standardavvikelsen är, desto mindre är spridningen och det är jättebra! Jag ska försöka förklara. Formeln för att räkna ut standardavvikelse ser ut så här:

SD

Nyckel: 

∑ = summan av

x = uppmätt värde

m = medelvärde

n = antal mätningar

Vi säger att jag mäter hur många gångar hjärtat slår på en minut, och att jag mäter detta en gång på tio personer. Jag får då tio olika värden. 60, 67, 61, 62, 70, 61, 68, 69, 68, och 64.

1. Vi börjar med det enklaste. Jag har gjort 10 mätningar, alltså är n = 10. Vi stoppar in det i formeln på en gång.

∑ (x – m)^2 / 10 – 1

2. Nu räknar jag ut medelvärdet, m, för de uppmätta värdena. För att göra det lägger jag ihop summan av alla mätningar och dividera det med antalet mätningar, n som var 10, jag har gjort.

60 + 67 + 61 + 62 + 70 + 61 + 68 + 69 + 68 + 64 / 10 = 65

Medelvärdet, m = 65. Om vi stoppar in 65 på platsen för medelvärdet ser formeln ut såhär nu just nu:

∑ (x – 65)^2 / 10 – 1

3. X är det samma som varje uppmät värde. Men hur ska jag plocka in x i formeln när det finns så många x? Jo, jag lägger helt enkelt in alla x på samma sätt efter varandra:

∑(60-65)^2+(67-65)^2+(61-65)^2+(62-65)^2+(70-65)^2+(61-65)^2+(68-65)^2+(69-65)^2+(68-65)^2+(64-65)^2/10-1

4. Nu kan jag räkna ut allt med miniräknaren. I det här fallet är standardavvikelsen SD = 14.44444444. Och som du förstår är detta något man gör när man har några få mätningar. Har man gjort en stor utredning med flera hundra mätningar låter man en dator sköta räknandet.

Nu kommer några bilder som visar standardavvikelsen. Jag har använt mig av dataprogrammet GeoGebra för att räkna och rita. GeoGebra är gratis och superbra på många sätt, men använder sig an en annan formel för att räkna på standardavvikseln; ∑ (x – m)^2 / n. Det kan man också göra, om man räknar på en total population (hel befolkning) i stället för att räkna på ett stickprov; ∑ (x – m)^2 / n – 1, (del av populationen). Det är inget du behöver bry dig om just nu egentligen, men jag ville berätta detta om du skulle få för dig att provräkna på standardavvikelsen i kurvorna nedan. Om du använder formeln du fick högst upp kommer det inte att stämma.

Jag tänker att det kanske blir lättare att få förståelse för vad SD egentligen betyder om vi tittar på några exempel. Den första bilden visar fyra olika mätningar. I samtliga fall har det uppmätta värdet varit tre. Medelvärdet är alltså tre. Inget av de uppmätta värdena avviker från medelvärdet på något sätt. Spridningen på de uppmätta värdena är ingen alls, de har samma värde. SD är alltså noll.

SD0
Standardavvikelsen är 0.

Nästa bild visar fem andra uppmätta värden. De uppmätta värdena är; 1.2; 4.3; 2.6; 3.7; och 5.2. Medelvärdet är 3.4. Alla uppmätta värden avviker från medelvärdet, och de avviker olika mycket. Det första värdet på 1.2 ligger 2.2 under medelvärdet. Det andra uppmätta värdet på 4.3 ligger 0.9 över medelvärdet. Men alla uppmätta värden tillsammans avviker i genomsnitt 1.3871 från medelvärdet. Spridningen mellan de uppmätta värdena syns tydligt på bilden. I bilden ovan fanns det ingen spridning, alla uppmätta värden var detsamma. Men här skiljer sig värdena åt, det finns en spridning. Standardavvikelsen är 1.3871.

SD 1.3871
Standardavvikelsen är 1.3871.

Här kommer tredje och sista bilden. Inte nog med att det kan finnas en standardavvikelse. SD kan dessutom också vara större eller mindre. Det syns tydligt om du jämför bilden ovanför, där SD var 1.3871, med bilden nedanför. Där är standardavvikelsen mycket högre; 16.9517. Spridningen mellan de uppmätta värdena är nämligen större. Medelvärdet är 11.2, men ett av värdena sticker i väg. Det högst uppmätta värdet ligger på 45, medan det lägsta värdet är på 1. Därför är spridningen större, och standardavvikelsen blir större.

sista
Standardavvikelsen är 16.9517

Vad ska man ha det här till, då? Jo, exempelvis kan man kontrollera hur bra en elev är på att pipettera. Om jag gör en spädningsserie genom att först räkna ut spädningsfaktorn, sedan späda, och sedan pipettera lösningen ett antal gånger i en mikrotiterplatta… då kan jag låta spektrofotometern räkna ut absorbans och koncentration i varje brunn som jag har pipetterat i. Sedan räknar datorn ut standardavvikelsen. Det räcker att jag inte blandar ordentligt, eller att jag får en liten bubbla i brunnen, för att standardavvikelsen ska bli stor. När vi gör praktiska tentor där spädning ingår, då tittar läraren på vår standardavvikelse när betyget sätts. Ju mindre spridning, desto bättre betyg! Genom att räkna på standardavvikelsen kan man också jämföra två eller flera metoder med varandra. Den metod som ger minst spridning är bäst. När man analyserar patientprover skapar man en standardkurva som man kan jämföra patientens värden med.

Källa:

Eriksson, A. Metrologi. Föreläsning. Linköpings Universitet. 2014-03-06.

Whiss, P. Biomedicinsk Laboratorievetenskap. Föreläsning. Linköpings Universitet. 2013-10-21.

Vad tycker du?