Statistikhörnan I 'Statistikhörnan' publiceras kortare eller längre inlägg om statistisk analys eller problemformulering eller annat som hör till ämnet. På denna sida visas en kort beskrivning via siffran till vänster. Rubriken är en länk till ett större dokument.

      Alla är välkomna med bidrag!
— diverse olika dokument

 «1» «1» Rounding error and test of normality:

There is a common statistical test called Anderson-Darling (AD), (see the literature for details). It is very often used to test the normality of a set of data and is routinely incorporated in common computer programs. However, the normal distribution is a continuous distribution and thus numerical values have (theoretically) an unlimited number of decimals while real measurements always carry a limited, often small, number of decimals.

This paper shows, by simulation, how the test is influenced by number of decimals but also how adding a small random term improves the result. (NB that a set of data having a limited number of decimals is formally a discrete distribution and thus, by definition, not a normal distribution and thus correctly rejected by the test. Although, such an interpretation is usually too strict and perhaps useless).

(pages: 5, size: 324k, format: doc, language: eng)

Avrundning och normalitetstest...  «2» «2» Two normal distributions and five requirements:

Frequently the very mathematics or statistics of a problem is fairly straightforward. Instead, the formulation of the problem might need some extra thinking and this document discusses such a problem. Suppose that we have a process that welds two seams of a plastic bag containing a liquid. The liquid is released by squeezing the bag by hand until the weaker seam breaks.

This document discusses a rather simple situation involving two normal distributions but where an extra requirement makes the formulation slightly more difficult. By considering the problem as a bivariate situation it becomes simpler. We do not involve the theoretical bivariate distribution, as it would disturb the discussion. See also the button 'Webbinarium' and webbinarium 1. More info is available via the button Arkiv>Smått&gott and the document 'Webbinarium 1, Two normal.zip'.

(pages: 3, size: 209k, format: doc, language: eng)

Två normalfördelningar och fem krav...
 «3» «3» The following text comes from Canadian Family Physician Vol 38, Nov -92:

'Summary Fifteen percent of biopsy-proven respondents saw five or more doctors before 'Celiac Disease' was diagnosed. Mean delays in diagnosis ranged from 5.8 (±10.9) years for those with nausea and vomiting and 13.9 (±14.5) years for those with headache or migraine.'

The data material is very skewed and the minimum value is 1 month, median is one year, and maximum value is > 60 years. The example is illuminating as when it is shown many people starts to think using a normal distribution in the back of their minds and therefore become confused as already one standard deviation below the mean gives negative values!! The article is otherwise serious and correct.

(pages: 2, size: 51k, format: doc, language: eng)

Idén med plus/minus 3-sigma...  «4» «4» Shainins försöksplaner

Det finns problem av flera olika slag. Många av dem har sin grund i slumpmässig variation: vissa enheter funkar bra, andra sämre fast de ser likadana ut. En man som hette Shainin pekade ut en metod för att angripa sådana problem. Det här inlägget beskriver den typ av statistiska försöksplaner som Shainin utvecklade för detta ändamål.

(sidor: 3, storlek: 1.1Mb, format: pdf, språk: sv)

Shainins försöksplaner...
 «5» «5» 'Midnattsloppet' i Göteborg

Dokumentet innhehåller några grafer över data från Midnattsloppet, augusti 2009. Loppet går i centrala Göteborg (och på andra ställen) sent en lördagskväll genom delvis mörka gator. Festglada människor, ibland alltför festglada, kantar motionsvägen.

(sidor: 3, storlek: 872k, format: pdf, språk: sv)

'Midnattsloppet' i Göteborg...  «6» «6» Slumpmässiga stickprov

Om en statistiker vill lära sig något om en population brukar han eller hon ta ett stickprov från populationen och beräkna medelvärde, standardavvikelse eller vad man nu är intresserad av. Men vi vet alla att det är svårt att ta ett stickprov på ett sätt så att stickprovet blir representativt. Svårigheten illustreras i den här artikeln med ett exempel som är så tokigt att vi alla kan skratta åt det – men hade det formulerats i andra ord hade vi kanske gjort likadant själva!

(sidor: 2, storlek: 160k, format: pdf, språk: sv)

Slumpmässiga stickprov...
 «7» «7» 0 fel bland 'n' kontrollerade

A short story about the special case when you check 'n' items, humans, etc and you find 0 faulty items or 0 humans with a certain disease, attribute, etc. In most discussions people will react with a short 'good!' but what inference about the true fault rate can be done? An amazingly easy and powerful approximation can be used. The document also contain the theoretical derivation of the approximation.

(pages: 3, size: 102k, format: doc, language: eng)

0 fel bland 'n' kontrollerade...  «8» «8» 0 händelser under en tidsperiod

Suppose that you have observed an event process and found 0 events during the observed time, surface, volume or whatever you have studied. You have chosen the Poisson as a model for the outcome. How can you proceed using the available information to draw conclusions about the intensity λ of the process?
The document discusses some ideas.

(pages: 2, size: 55k, format: doc, language: eng)

0 händelser under en tidsperiod...
 «9» «9» EM-fotboll 2012

Sport och idrott innehåller ofta numeriska resultat som intresserar människor. De variabler som mäts kan också anses vara typiska för ett industriellt sammanhang.

Dokumentet använder bl.a. Poissonfördelningen för att beskriva resultatet från fotbolls-EM under sommaren 2012. 'StaM-Bladet' (se referenser i dokumentet) innehåller också ungefär samma beskrivning för VM 1990 0ch 1994.

(sidor: 5, storlek: 496k, format: pdf, språk: sv)

EM-fotboll 2012...  «10» «10» Lognormalfördelningen – några enkla iakttagelser

I de flesta läroböcker beskrivs ofta lognormalfördelningen, och de flesta andra fördelningar, med ett matematiskt uttryck inklusive dess parametrar. Från detta matematiska uttryck har sedan väntevärde och standardavvikelse härletts som en funktion av parametrarna.
Om man vill ta reda på vilka 'in-parametrar' som ger ett visst väntevärde och standardavvikelse kan det ibland bli besvärligt. Detta dokument anger några sätt hur man kan göra just detta i en lognormalfördelning.

(sidor: 3, storlek: 406k, format: pdf, språk: sv)

Lognormalfördelningen – några enkla iakttagelser...
 «11» «11» Stickprovsparadoxen

När man diskuterar ett stickprovsförfarande på ett företag blir det alltid tal om partistorlekar och att '...självklart måste man ta hänsyn till dessa då man tar sitt prov...'. Visst verkar det naturligt att öka stickprovets storlek då man har större partier. Det visar sig dock, kanske paradoxalt, att partistorleken spelar ingen eller mycket ringa roll vid praktiskt stickprovstagning. Detta faktum kallas ibland på engelska för 'The Sampling Paradox' och i dokumentet reder vi ut en del fakta med hjälp av statistikteori.

(sidor: 3, storlek: 332k, format: pdf, språk: sv)

Stickprovsparadoxen...  «12» «12» Beräkning av startat antal

Antag att vi producerar elektronikkomponenter, t.ex. mönsterkort. Vi börjar då med ett råmaterial, ett ämne, som vi sedan förädlar genom att borra hål för komponenter, etsa fram mönster, skyddslacka ytan, konturbearbeta. Varje sådan operation är inte helt felfri så i slutändan har man antagligen färre produkter än antal ämnen vid start. Om vi i slutändan har färre produkter än vi har lovat kunden uppstår kostnader av typ omstartskostnader, förseningskostnader, etc. Om vi i stället har fler produkter tvingas vi kassera eller ge bort dem utan ersättning. Hur skall man eller kan man resonera om det 'överantal' som man bör starta med?

(sidor: 4, storlek: 184k, format: doc, språk: sv)

Beräkning av startat antal...
Warning: include(../meny/menyerindstat.html): Failed to open stream: No such file or directory in /customers/1/5/b/indstat.se/httpd.www/stathornan/statistikhornan.html.php on line 246 Warning: include(): Failed opening '../meny/menyerindstat.html' for inclusion (include_path='.:/usr/share/php') in /customers/1/5/b/indstat.se/httpd.www/stathornan/statistikhornan.html.php on line 246