sådan…Vælg den rigtige statistiske teknik

Fundamentals

begynd at tænke over de teknikker, du vil bruge til din analyse, før du indsamler data.

Hvad vil du vide?

analysen skal vedrøre forskningsspørgsmålene, og dette kan diktere de teknikker, du skal bruge.

hvilken type data Har du?

den type data, du har, er også grundlæggende – de teknikker og værktøjer, der passer til interval-og forholdsvariabler, er ikke egnede til kategoriske eller ordinære foranstaltninger. (Se Sådan indsamles data for noter om datatyper)

hvilke antagelser kan – og kan ikke – du gøre?

mange teknikker er afhængige af, at prøveudtagningsfordelingen af teststatistikken er en normalfordeling (se nedenfor). Dette er altid tilfældet, når den underliggende distribution af dataene er Normal, men i praksis distribueres dataene muligvis ikke normalt. For eksempel kan der være en lang hale af svar på den ene eller den anden side (skæve data). Ikke-parametriske teknikker er tilgængelige til brug i sådanne situationer, men disse er uundgåeligt mindre kraftfulde og mindre fleksible. Men hvis stikprøvestørrelsen er tilstrækkelig stor, tillader den centrale grænse sætning brug af standardanalyser og værktøjer.

teknikker til en ikke-normalfordeling

parametrisk eller ikke-parametrisk statistik?

parametriske metoder og statistikker er afhængige af et sæt antagelser om den underliggende distribution for at give gyldige resultater. Generelt kræver de, at variablerne har en Normal fordeling.

ikke-parametriske teknikker skal bruges til kategoriske og ordinære data, men for interval & forholdsdata er de generelt mindre kraftfulde og mindre fleksible og bør kun bruges, hvor standard, parametrisk test ikke er passende – f.eks. når prøvestørrelsen er lille (Under 30 observationer).

Central limit theorem

efterhånden som prøvestørrelsen øges, har formen på prøveudtagningsfordelingen af teststatistikken en tendens til at blive Normal, selvom fordelingen af variablen, der testes, ikke er Normal.

i praksis kan dette anvendes til teststatistikker beregnet ud fra mere end 30 observationer.

billede: Normalfordelingsfunktionen

hvor meget kan du forvente at komme ud af dine data?

jo mindre prøvestørrelsen er, desto mindre kan du komme ud af dine data. Standardfejl er omvendt relateret til stikprøvestørrelse, så jo større din prøve er, desto mindre er standardfejlen, og jo større chance har du for at identificere statistisk signifikante resultater i din analyse.

grundlæggende teknikker

generelt kan enhver teknik, der kan bruges på kategoriske data, også bruges på ordinære data. Enhver teknik, der kan bruges på ordinære data, kan også bruges på forholds-eller intervaldata. Det modsatte er ikke tilfældet.

beskrivelse af dine data

det første trin i enhver analyse skal være at beskrive dine data og dermed den befolkning, hvorfra den er trukket. De statistikker, der passer til denne aktivitet, falder i tre brede grupper og afhænger af den type data, du har.

Hvad vil du gøre? med hvilken type data? passende teknikker
se på fordelingen kategorisk / ordinær Plot procentdelen
i hver kategori
(kolonne eller søjlediagram)
Ratio / Interval Histogram
kumulativ frekvens
diagram
beskriv
central tendens
kategorisk Ikke relevant
ordinær Median
tilstand
Ratio / Interval middel
Median
beskriv spredningen kategorisk Ikke relevant
ordinær rækkevidde
mellemkvartilområde
forhold / Interval interval
interkvartilområde
varians
standardvariation

Se grafisk præsentation for beskrivelser af de vigtigste grafiske teknikker.

gennemsnit – det aritmetiske gennemsnit, beregnet ved at summere alle værdierne og dividere med antallet af værdier i summen.

Median – midtpunktet for fordelingen, hvor halvdelen af værdierne er højere og halvdelen lavere.

Mode-den hyppigst forekommende værdi.

interval – forskellen mellem den højeste og laveste værdi.

interkvartilområde-forskellen mellem den øvre kvartil (værdien, hvor 25 procent af observationerne er højere og 75 procent lavere) og den lavere kvartil (værdien, hvor 75 procent af observationerne er højere og 25 procent lavere). Dette er især nyttigt, når der er et lille antal ekstreme observationer, der er meget højere eller lavere end flertallet.

varians – et mål for spredning, beregnet som gennemsnittet af de kvadratiske forskelle i observationerne fra deres gennemsnit.

standardafvigelse – kvadratroden af variansen.

forskelle mellem grupper og variabler

Chi-kvadreret test – bruges til at sammenligne fordelingerne af to eller flere sæt kategoriske eller ordinære data.

t-test – bruges til at sammenligne midlerne til to datasæt.

test – ikke-parametrisk ækvivalent af T-testen. Baseret på rangrækkefølgen for dataene kan den også bruges til at sammenligne medianer.

ANOVA – analyse af varians, for at sammenligne midlerne til mere end to grupper af data.

Hvad vil du gøre? med hvilken type data? passende teknikker
Sammenlign to grupper kategorisk Chi-kvadreret test
ordinær Chi-kvadreret test
Ratio / Interval t-test for
uafhængige prøver
sammenlign mere end to grupper kategorisk / ordinær Chi-kvadreret test
forhold / Interval ANOVA
Sammenlign to variabler
over det samme emner
kategorisk / ordinær Chi-kvadreret test
Ratio / Interval t-test for
afhængige prøver

forholdet mellem variabler

korrelationskoefficienten måler graden af lineær sammenhæng mellem to variabler med en værdi i området +1 til -1. Positive værdier indikerer, at de to variabler stiger og falder sammen; negative værdier, som den ene stiger, når den anden falder. En korrelationskoefficient på nul indikerer intet lineært forhold mellem de to variabler. Spearman-rangkorrelationen er den ikke-parametriske ækvivalent af Pearson-korrelationen.

hvilken type data? passende teknikker
kategorisk Chi-kvadreret test
ordinær Chi-kvadreret test
Spearman rang
korrelation (Tau)
Ratio / Interval Pearson
korrelation (Rho)

bemærk, at korrelationsanalyser kun registrerer lineære forhold mellem to variabler. Figuren nedenfor illustrerer to små datasæt, hvor der klart er forhold mellem de to variabler. Korrelationen for det andet datasæt, hvor forholdet ikke er lineært, er imidlertid 0,0. En simpel korrelationsanalyse af disse data tyder på, at der ikke er nogen sammenhæng mellem foranstaltningerne, når det klart ikke er tilfældet. Dette illustrerer vigtigheden af at gennemføre en række grundlæggende beskrivende analyser, inden man går i gang med analyser af forskellene og forholdet mellem variabler.

billede: to små datasæt, hvor der klart er forhold mellem de to variabler

Testing validitet

Signifikansniveauer

den statistiske signifikans af en test er et mål for Sandsynlighed – sandsynligheden for, at du ville have opnået det særlige resultat af testen på den prøve, hvis nulhypotesen (at der ikke er nogen effekt på grund af de parametre, der testes), du tester, var sand. Eksemplet nedenfor tester, om scoringer i en eksamen ændres, efter at kandidaterne har modtaget uddannelse. Hypotesen antyder, at de burde, så nullhyopotesen er, at de ikke vil.

generelt anses ethvert sandsynlighedsniveau over 5 procent (p>0,05) ikke for at være statistisk signifikant, og for store undersøgelser tages 1 procent (p>0,01) ofte som et mere passende niveau.

bemærk, at statistisk signifikans ikke betyder, at de resultater, du har opnået, faktisk har værdi i forbindelse med din forskning. Hvis du har en stor nok prøve, kan en meget lille forskel mellem grupper identificeres som statistisk signifikant, men en sådan lille forskel kan være irrelevant i praksis. På den anden side er en tilsyneladende stor forskel muligvis ikke statistisk signifikant i en lille prøve på grund af variationen inden for de grupper, der sammenlignes.

frihedsgrader

nogle teststatistikker (f.eks. chi-kvadreret) kræver, at antallet af frihedsgrader er kendt for at teste for statistisk signifikans mod den korrekte sandsynlighedstabel. Kort sagt er frihedsgraderne antallet af værdier, der kan tildeles vilkårligt inden for prøven.

for eksempel:

i en prøve af størrelse n opdelt i K-klasser er der k-1 frihedsgrader (de første K-1-grupper kan være af enhver størrelse op til n, mens den sidste er fastsat af summen af den første k-1 og værdien af n. i numeriske termer, hvis en prøve på 500 individer er taget fra Storbritannien, og det observeres, at 300 er fra England, 100 fra Skotland og 50 Fra skal være 50 fra Nordirland. I betragtning af tallene fra de første tre grupper er der ingen fleksibilitet i størrelsen af den endelige gruppe. Opdeling af prøven i fire grupper giver tre frihedsgrader.

i en tovejs beredskabstabel med p-rækker og K-kolonner er der (p-1)*(K-1) frihedsgrader (i betragtning af værdierne for de første rækker og kolonner, den sidste række og kolonne er begrænset af totalerne i tabellen)

test med en hale eller to hale

hvis det, som det generelt er tilfældet, er det, der betyder noget, simpelthen, at statistikken for befolkningerne er forskellig, så er det det er hensigtsmæssigt at anvende de kritiske værdier til en test med to haler.

hvis du dog kun er interesseret i at finde ud af, om statistikken for befolkning A har en større værdi end for befolkning B, ville en one-tailed test være passende. Den kritiske værdi for en one-tailed test er generelt lavere end for en to-tailed test, og bør kun bruges, hvis din forskningshypotese er, at population A har en større værdi end population B, og det betyder ikke noget, hvor forskellige de er, hvis population A har en værdi, der er mindre end den for population B.

for eksempel

Scenarie 1

Nulhypotese – der er ingen forskel i gennemsnitlige eksamensresultater før og efter træning (dvs.træning har ingen effekt på eksamensresultatet)
alternativ – der er en forskel i gennemsnitsresultater før og efter træning (dvs. træning har en uspecificeret effekt)
brug en test med to hale

scenario 2

nulhypotese-træning øger ikke den gennemsnitlige score
alternativ – gennemsnitlig score øges efter træning
brug en one – tail test, hvis der er en observeret stigning i gennemsnitlig score.
( hvis der er et observeret fald i score, er der ingen grund til at teste, da du ikke kan afvise nulhypotesen.)

scenarie 3

Nulhypotese – træning forårsager ikke, at Gennemsnitlige score falder
alternativ – gennemsnitlig score falder efter træning
brug en one-tail test, hvis der er et observeret fald i gennemsnitlig score.
(hvis der er en observeret stigning i score, er der ingen grund til at teste, da du ikke kan afvise nulhypotesen.)

t-Test: Parret to Prøve for midler
før efter
middel
varians

46,547

46,830

bemærkninger
frihedsgrader (df)
t Stat
P (T< =t) en-hale
t kritisk one-tail
P (T< =t) to-hale
t kritisk to-hale

hvis ovenstående testresultater blev opnået, kunne du under scenario 1 ved hjælp af en to-hale test konkludere, at der ikke var nogen statistisk signifikant forskel mellem scorerne (p=0,08), og som følge heraf havde træningen ingen effekt. Tilsvarende, under scenario 3, Du vil konkludere, at der ikke er noget bevis for, at træning får gennemsnitlige score til at falde, da de faktisk er steget. Men under scenario 2, ved hjælp af en one-tail test, ville du konkludere, at der var en stigning i Gennemsnitlige score, statistisk signifikant på 5 procent niveau (p=0.04).

en sidste advarsel!

statistiske pakker vil gøre, hvad du fortæller dem, i det hele taget. De ved ikke, om de data, du har leveret, er af god kvalitet, eller (med meget få undtagelser), om de er af en passende type til den analyse, du har foretaget.

skidt ind = skidt ud!

avancerede teknikker

disse værktøjer og teknikker har specialiserede applikationer og vil generelt blive designet til forskningsmetoden på et tidligt tidspunkt, inden der indsamles data. Hvis du overvejer at bruge nogen af disse, kan du ønsker at konsultere en specialist tekst eller en erfaren statistiker, før du starter.

i hvert tilfælde giver vi nogle eksempler på Smaragdartikler, der bruger teknikken.

faktoranalyse

for at reducere antallet af variabler til efterfølgende analyse ved at oprette kombinationer af de målte originale variabler, der tegner sig for så meget af den oprindelige varians som muligt, men muliggør lettere fortolkning af resultaterne. Almindeligt brugt til at oprette et lille sæt dimensionsvurderinger ud fra et stort antal udtalelseserklæringer, der er individuelt vurderet på Likert-skalaer. Du skal have flere observationer (emner), end du har variabler, der skal analyseres.

for eksempel

en Likert skala variabel: “Jeg kan godt lide at spise chokoladeis til morgenmad”

stærkt enig

stærkt uenig

en faktoranalyse af Page og Vongs tjenerledelsesinstrument
Rob Dennis og Bruce E. V.
lederskab & Organisationsudviklingsjournal , vol. 24 no. 8

forståelse af faktorer for benchmarking vedtagelse: nye beviser fra Malaysia
Yean Pin Lee, Keng Lin Soh
Benchmarking: International Journal, vol. 13 no. 5

klyngeanalyse

at klassificere emner i grupper med lignende egenskaber i henhold til værdierne for de målte variabler. Du skal have flere observationer, end du har variabler inkluderet i analysen.

undgåelse af økologisk produkt: årsager til afvisning og potentielle købers identifikation i en landsdækkende undersøgelse
C. Fotopoulos og A. Krystallis
British Food Journal, vol. 104 Nr. 3/4/5

påvisning af finansiel nød via multivariat statistisk analyse
S. Gamesalingam og Kuldeep Kumar
ledelsesøkonomi, vol. 27 no.4

Diskriminantanalyse

for at identificere de variabler, der bedst skelner mellem kendte grupper af emner. Resultaterne kan bruges til at allokere nye emner til de kendte grupper baseret på deres værdier af de diskriminerende variabler

påvisning af økonomisk nød via multivariat statistisk analyse
S. Gamesalingam og Kuldeep Kumar
Managerial Finance, vol. 27 no. 4

forståelse faktorer for benchmarking vedtagelse: Nye beviser fra Malaysia
Yean Pin Lee, Keng Lin Soh
Benchmarking: en International Journal , vol. 13 no. 5

metodologi

Diskriminantanalyse blev brugt til at bestemme, om der findes statistisk signifikante forskelle mellem den gennemsnitlige scoreprofil på et sæt variabler for to a priori definerede grupper og gjorde det muligt at klassificere dem. Desuden kan det hjælpe med at bestemme, hvilken af de uafhængige variabler der tegner sig mest for forskellene i de gennemsnitlige scoreprofiler for de to grupper. I denne undersøgelse var diskriminantanalyse det vigtigste instrument til at klassificere benchmarking adopter og ikke-adopter. Det blev også brugt til at bestemme, hvilke af de uafhængige variabler der ville bidrage til benchmarking vedtagelse.

Regression

for at modellere, hvordan en afhængig variabel opfører sig afhængigt af værdierne for et sæt andre uafhængige variabler. Den afhængige variabel skal være interval eller forhold i type; de uafhængige variabler kan være af enhver type, men særlige metoder skal anvendes, når kategoriske eller ordinære uafhængige variabler inkluderes i analysen.

udviklingen i mælkemarkedsføring i England og Danmark i løbet af 1990 ‘ erne
Jeremy Franks
British Food Journal, vol. 103 Nr. 9

uddannelse under beskydning: forholdet mellem hindringer for uddannelse og SMV’ ers udvikling i Palæstina
Mohammed Al Madhoun
Journal of European Industrial Training, vol. 30 no. 2

tidsserieanalyse

for at undersøge mønstre og tendenser i en variabel målt regelmæssigt over en periode. Kan også bruges til at identificere og justere for sæsonvariationer, f.eks. i finansiel statistik.

en analyse af tendenser og cykliske adfærd af huspriserne på de asiatiske markeder
Ming-Chi Chen, Yuichiro og Kanak Patel
Journal of Property Investment & Finans, vol. 22 no. 1

grafisk præsentation

præsentation af data i grafisk form kan øge tilgængeligheden af dine resultater til et ikke-teknisk publikum og fremhæve effekter og resultater, som ellers ville kræve langvarig forklaring eller komplekse tabeller. Det er derfor vigtigt, at der anvendes passende grafiske teknikker. Dette afsnit giver eksempler på nogle af de mest almindeligt anvendte grafiske præsentationer og angiver, hvornår de kan bruges. Alle, undtagen histogrammet, er produceret ved hjælp af Microsoft.

kolonne-eller søjlediagrammer

der er fire hovedvarianter, og om du viser dataene i vandrette søjler eller lodrette kolonner, er stort set et spørgsmål om personlig præference.

Histogram

for at illustrere en frekvensfordeling i kategoriske eller ordinære data eller grupperede forhold/intervaldata. Normalt vises som en kolonne graf.

 billede: Histogram

grupperet kolonne/bjælke

for at sammenligne kategoriske, ordinære eller grupperede forholds – /intervaldata på tværs af kategorier. De i fig.4 anvendte data er de samme som i fig. 5 og 6.

billede: grupperet kolonne/bar

stablet kolonne/bar

for at illustrere det faktiske bidrag til summen for kategoriske, ordinære eller grupperede forhold/intervaldata efter kategorier. De i Fig.5 anvendte data er de samme som i fig. 4 og 6.

billede: Stablet kolonne/bjælke

procentdel stablet kolonne/bjælke

for at sammenligne det procentvise Bidrag til det samlede antal for kategoriske, ordinære eller grupperede forholds – / intervaldata på tværs af kategorier. De i fig.6 anvendte data er de samme som i fig. 4 og 5.

billede: procentdel stablet kolonne/bar

linjegrafer

for at vise tendenser i ordinære eller forhold/intervaldata. Punkter på en graf bør kun forbindes med en linje, hvis dataene på h-aksen er mindst ordinære. En særlig anvendelse er at plotte en frekvensfordeling for interval / ratio data (fig 8).

billede: linjegrafer

cirkeldiagrammer

for at vise det procentvise Bidrag til hele kategoriske, ordinære eller grupperede forhold/intervaldata.

billede: cirkeldiagram

Scatter grafer

for at illustrere forholdet mellem to variabler af enhver type (selvom det er mest nyttigt, hvor begge variabler er forhold/interval i type). Også nyttig til identifikation af usædvanlige observationer i dataene.

 billede: Scatter graf

boks og knurhår plot

en specialist graf illustrerer den centrale tendens og spredning af et stort datasæt, herunder eventuelle outliers.

billede: kasse og knurhår plot

ressourcer

tilslutning af matematik
korte forklaringer af matematiske termer og ideer

statistik ordliste
udarbejdet af Valerie J. Easton og John H. McColl fra universitetet

statsoft elektronisk lærebog

100 statistiske tests af Gopal K. Kanji
(Sage, 1993, ISBN 141292376)

Ordbog over statistik af Graham Upton og Ian Cook
(University Press, 2006, ISBN 0198614314)

Skriv et svar

Din e-mailadresse vil ikke blive publiceret.