hur…Välj rätt statistisk teknik

grundläggande

börja tänka på de tekniker du kommer att använda för din analys innan du samlar in data.

Vad vill du veta?

analysen måste relatera till forskningsfrågorna, och detta kan diktera de tekniker du ska använda.

vilken typ av data Har du?

den typ av data du har är också grundläggande – de tekniker och verktyg som är lämpliga för intervall-och kvotvariabler är inte lämpliga för kategoriska eller ordinära åtgärder. (Se hur man samlar in data för anteckningar om typer av data)

vilka antaganden kan – och kan inte-du göra?

många tekniker är beroende av att provtagningsfördelningen för teststatistiken är en normalfördelning (se nedan). Detta är alltid fallet när den underliggande fördelningen av data är Normal, men i praktiken kanske data inte distribueras normalt. Till exempel kan det finnas en lång svans av svar på den ena eller den andra sidan (skev data). Icke-parametriska tekniker är tillgängliga att använda i sådana situationer, men dessa är oundvikligen mindre kraftfulla och mindre flexibla. Men om provstorleken är tillräckligt stor tillåter den centrala Gränssatsen användning av standardanalyser och verktyg.

tekniker för en icke-normalfördelning

parametrisk eller icke-parametrisk statistik?

parametriska metoder och statistik bygger på en uppsättning antaganden om den underliggande fördelningen för att ge giltiga resultat. I allmänhet kräver de att variablerna har en Normal fördelning.

icke-parametriska tekniker måste användas för kategoriska och ordinära data, men för intervall & förhållandedata är de i allmänhet mindre kraftfulla och mindre flexibla och bör endast användas där standard, parametrisk, testet inte är lämpligt – t.ex. när provstorleken är liten (Under 30 observationer).

Central limit theorem

när provstorleken ökar tenderar formen på provtagningsfördelningen för teststatistiken att bli Normal, även om fördelningen av variabeln som testas inte är Normal.

i praktiken kan detta tillämpas på teststatistik beräknad från mer än 30 observationer.

 bild: normalfördelningsfunktionen

hur mycket kan du förvänta dig att få ut av dina data?

ju mindre provstorlek, desto mindre kan du få ut av dina data. Standardfel är omvänt relaterat till provstorlek, så ju större ditt prov är, desto mindre är standardfelet och desto större chans har du att identifiera statistiskt signifikanta resultat i din analys.

grundläggande tekniker

i allmänhet kan alla tekniker som kan användas på kategoriska data också användas på ordinära data. Vilken teknik som helst som kan användas på ordinära data kan också användas på förhållande eller intervalldata. Det omvända är inte fallet.

beskriva dina data

det första steget i en analys bör vara att beskriva dina data och därmed befolkningen från vilken den dras. Statistiken som är lämplig för denna aktivitet delas in i tre breda grupper och beror på vilken typ av data du har.

Vad vill du göra? med vilken typ av data? lämpliga tekniker
titta på fördelningen kategorisk / ordinär Rita procentandelen
i varje kategori
(kolumn eller stapeldiagram)
förhållande / intervall Histogram
kumulativ frekvens
diagram
beskriv
central tendens
kategorisk n / a
ordinär Median
läge
förhållande / intervall medelvärde
Median
beskriv spridningen kategorisk n / a
ordinär intervall
interkvartilområde
förhållande / intervall intervall
interkvartilområde
varians
Standardvariation

se grafisk presentation för beskrivningar av de viktigaste grafiska teknikerna.

medelvärde – det aritmetiska medelvärdet, beräknat genom att summera alla värden och dividera med antalet värden i summan.

Median – mittpunkten för fördelningen, där hälften av värdena är högre och hälften lägre.

läge – det vanligaste värdet.

intervall – skillnaden mellan det högsta och lägsta värdet.

Interkvartilintervall-skillnaden mellan den övre kvartilen (värdet där 25 procent av observationerna är högre och 75 procent lägre) och den nedre kvartilen (värdet där 75 procent av observationerna är högre och 25 procent lägre). Detta är särskilt användbart när det finns ett litet antal extrema observationer som är mycket högre eller lägre än majoriteten.

varians – ett mått på spridning, beräknat som medelvärdet av de kvadrerade skillnaderna i observationerna från deras medelvärde.

standardavvikelse – kvadratroten av variansen.

skillnader mellan grupper och variabler

Chi-squared test – används för att jämföra fördelningarna av två eller flera uppsättningar kategoriska eller ordinära data.

t-test – används för att jämföra medel för två uppsättningar data.

Wilcoxon U – test-icke-parametrisk ekvivalent av t-testet. Baserat på rangordningen av data, det kan också användas för att jämföra medianer.

ANOVA – variansanalys, för att jämföra medel för mer än två grupper av data.

Vad vill du göra? med vilken typ av data? lämpliga tekniker
jämför två grupper kategorisk Chi-squared test
ordinär Chi-kvadratiskt test
Wicoxon U-test
förhållande / intervall t-test för
oberoende prover
jämför mer än två grupper kategorisk / ordinär Chi-squared test
förhållande / intervall ANOVA
jämför två variabler
över samma ämnen
kategorisk / ordinär Chi-kvadrerat test
förhållande / intervall t-test för
beroende prover

förhållanden mellan variabler

korrelationskoefficienten mäter graden av linjär association mellan två variabler, med ett värde i intervallet +1 till -1. Positiva värden indikerar att de två variablerna ökar och minskar tillsammans; negativa värden som den ena ökar när den andra minskar. En korrelationskoefficient på noll indikerar inget linjärt förhållande mellan de två variablerna. Spearman rank correlation är den icke-parametriska ekvivalenten av Pearson-korrelationen.

vilken typ av data? lämpliga tekniker
kategorisk Chi-kvadrat test
ordinär Chi-kvadrat test
Spearman rank
korrelation (tau)
förhållande / intervall Pearson
korrelation (Rho)

Observera att korrelationsanalyser endast kommer att upptäcka linjära relationer mellan två variabler. Figuren nedan illustrerar två små datamängder där det tydligt finns samband mellan de två variablerna. Korrelationen för den andra datamängden, där förhållandet inte är linjärt, är dock 0,0. En enkel korrelationsanalys av dessa data tyder inte på något samband mellan åtgärderna, när det helt klart inte är fallet. Detta illustrerar vikten av att genomföra en serie grundläggande beskrivande analyser innan man påbörjar analyser av skillnader och förhållanden mellan variabler.

 bild: två små datamängder där det tydligt finns samband mellan de två variablerna

Testgiltighet

Signifikansnivåer

den statistiska signifikansen för ett test är ett mått på Sannolikhet – sannolikheten att du skulle ha fått det specifika resultatet av testet på det provet om nollhypotesen (att det inte finns någon effekt på grund av parametrarna som testas) du testar var sant. Exemplet nedan testar om poängen i en tentamen ändras efter att kandidaterna har fått utbildning. Hypotesen antyder att de borde, så nollhyopotesen är att de inte kommer att göra det.

i allmänhet anses någon sannolikhetsnivå över 5 procent (p>0.05) inte vara statistiskt signifikant, och för stora undersökningar anses 1 procent (p>0.01) ofta vara en mer lämplig nivå.

Observera att statistisk signifikans inte betyder att de resultat du har fått faktiskt har värde i samband med din forskning. Om du har ett tillräckligt stort prov kan en mycket liten skillnad mellan grupper identifieras som statistiskt signifikant, men en sådan liten skillnad kan vara irrelevant i praktiken. Å andra sidan kan en uppenbarligen stor skillnad inte vara statistiskt signifikant i ett litet urval på grund av variationen inom grupperna som jämförs.

frihetsgrader

vissa teststatistik (t.ex. chi-kvadrat) kräver att antalet frihetsgrader är kända för att testa för statistisk signifikans mot rätt sannolikhetstabell. I korthet är frihetsgraderna antalet värden som kan tilldelas godtyckligt inom provet.

till exempel:

i ett urval av storlek N uppdelat i k-klasser finns k-1 frihetsgrader (de första K-1-grupperna kan vara av vilken storlek som helst upp till n, medan den sista är fastställd av summan av den första k-1 och värdet av n. i numeriska termer, om ett prov på 500 individer tas från Storbritannien, och det observeras att 300 är från England, 100 från Skottland och 50 Från Wales, måste det be 50 från Nordirland. Med tanke på siffrorna från de tre första grupperna finns det ingen flexibilitet i storleken på den slutliga gruppen. Att dela provet i fyra grupper ger tre grader av frihet.

i en tvåvägs beredskapstabell med p-rader och q-kolumner finns det (p-1)*(q-1) frihetsgrader (med tanke på värdena för de första raderna och kolumnerna begränsas den sista raden och kolumnen av totalerna i tabellen)

en-svans eller två-svans tester

om, som i allmänhet är fallet, det som är viktigt är helt enkelt att statistiken för populationerna är olika, då är det är lämpligt att använda de kritiska värdena för en två-tailed test.

om du emellertid bara är intresserad av att ta reda på om statistiken för befolkning A har ett större värde än för befolkning B, skulle ett ensidigt test vara lämpligt. Det kritiska värdet för ett ensidigt test är i allmänhet lägre än för ett tvåsidigt test och bör endast användas om din forskningshypotes är att befolkning A har ett större värde än befolkning B, och det spelar ingen roll hur olika de är om befolkning A har ett värde som är mindre än för befolkning B.

till exempel

Scenario 1

nollhypotes – det finns ingen skillnad i genomsnittliga provresultat före och efter träning (dvs. träning har ingen effekt på provresultatet)
alternativ – Det finns en skillnad i genomsnittliga poäng före och efter träning (dvs. träning har en ospecificerad effekt)
Använd ett två-svanstest

scenario 2

nollhypotes – träning ökar inte medelpoängen
alternativ – Medelpoängen ökar efter träning
använd ett svanstest om det finns en observerad ökning av Medelpoängen.
(om det finns ett observerat fall i poäng, behöver du inte testa, eftersom du inte kan avvisa nollhypotesen.)

Scenario 3

nollhypotes – träning orsakar inte genomsnittliga poäng att falla
alternativ – medelvärde faller efter träning
Använd ett en-tail-test, om det finns ett observerat fall i medelvärdet.
(om det finns en observerad ökning av poängen behöver du inte testa, eftersom du inte kan avvisa nollhypotesen.)

t-Test: Parat två prov för medel
före efter
medelvärde
varians

46,547

46,830

iakttagelser
grader av frihet (df)
t Stat
P (T< = t) en svans
t kritisk en svans
P (T< = t) två-svans
t kritisk två-svans

om ovanstående testresultat erhölls, kan du under scenario 1, med hjälp av ett tvåstegstest, dra slutsatsen att det inte fanns någon statistiskt signifikant skillnad mellan poängen (p=0,08), och som en följd av att träningen inte hade någon effekt. På samma sätt, under scenario 3, skulle du dra slutsatsen att det inte finns några bevis som tyder på att träning orsakar genomsnittliga poäng att falla, eftersom de faktiskt har stigit. Men under scenario 2, med hjälp av ett svanstest, skulle du dra slutsatsen att det fanns en ökning av medelvärdet, statistiskt signifikant på 5-procenten (p=0.04).

en sista varning!

statistiska paket kommer att göra vad du säger till dem, på det hela taget. De vet inte om de uppgifter du har lämnat är av god kvalitet, eller (med några få undantag) om det är av lämplig typ för den analys du har gjort.

skräp i = skräp ut!

avancerade tekniker

dessa verktyg och tekniker har specialistapplikationer och kommer i allmänhet att utformas i forskningsmetodiken i ett tidigt skede innan data samlas in. Om du funderar på att använda någon av dessa, kanske du vill konsultera en specialist text eller en erfaren statistiker innan du börjar.

i varje fall ger vi några exempel på Smaragdartiklar som använder tekniken.

faktoranalys

för att minska antalet variabler för efterföljande analys genom att skapa kombinationer av de ursprungliga variablerna uppmätta som står för så mycket av den ursprungliga variansen som möjligt, men möjliggöra enklare tolkning av resultaten. Vanligtvis används för att skapa en liten uppsättning dimensionsklassificeringar från ett stort antal åsiktsuttalanden individuellt rankade på Likert-skalor. Du måste ha fler observationer (ämnen) än du har variabler som ska analyseras.

till exempel

en Likert-skalvariabel: ”Jag gillar att äta chokladglass till frukost”

instämmer starkt

starkt oense

en faktoranalys av Page och Wongs servant leadership instrument
Rob Dennis och Bruce E. Winston
ledarskap & organisationsutveckling Journal , vol. 24 no. 8

förstå faktorer för benchmarking adoption: nya bevis från Malaysia
Yean Pin Lee, Suhaiza Zailani och Keng Lin Soh
Benchmarking: En internationell tidskrift, vol. 13 no. 5

klusteranalys

för att klassificera ämnen i grupper med liknande egenskaper, enligt värdena för de uppmätta variablerna. Du måste ha fler observationer än du har variabler som ingår i analysen.

undvikande av organisk produkt: orsaker till avslag och potentiella köpares identifiering i en landsomfattande undersökning
C. Fotopoulos och A. Krystallis
British Food Journal, vol. 104 no. 3/4/5

upptäckt av ekonomisk nöd via multivariat statistisk analys
S. Gamesalingam och Kuldeep Kumar
Managerial Finance, vol. 27 no. 4

diskriminantanalys

för att identifiera de variabler som bäst diskriminerar mellan kända grupper av ämnen. Resultaten kan användas för att allokera nya ämnen till de kända grupperna baserat på deras värden för de diskriminerande variablerna

upptäckt av ekonomisk nöd via multivariat statistisk analys
S. Gamesalingam och Kuldeep Kumar
Managerial Finance, vol. 27 no. 4

förstå faktorer för benchmarking adoption: Nya bevis från Malaysia
Yean Pin Lee, Suhaiza Zailani och Keng Lin Soh
Benchmarking: An International Journal, vol. 13 no. 5

metodik

diskriminantanalys användes för att bestämma om statistiskt signifikanta skillnader finns mellan den genomsnittliga poängprofilen på en uppsättning variabler för två a priori definierade grupper och så gjorde det möjligt för dem att klassificeras. Dessutom kan det hjälpa till att avgöra vilken av de oberoende variablerna som står mest för skillnaderna i de två gruppernas genomsnittliga poängprofiler. I denna studie var diskrimineringsanalys det viktigaste instrumentet för att klassificera benchmarking adopter och icke-adopter. Den användes också för att avgöra vilka av de oberoende variablerna som skulle bidra till antagandet av benchmarking.

Regression

för att modellera hur en, beroende, variabel beter sig beroende på värdena för en uppsättning andra, oberoende variabler. Den beroende variabeln måste vara intervall eller Förhållande i typ; de oberoende variablerna kan vara av vilken typ som helst, men speciella metoder måste användas när man inkluderar kategoriska eller ordinära oberoende variabler i analysen.

utvecklingen inom mjölkmarknadsföring i England och Wales under 1990-talet
Jeremy Franks
British Food Journal, vol. 103 no. 9

utbildning under eld: förhållandet mellan hinder för utbildning och små och medelstora företags utveckling i Palestina
Mohammed Al Madhoun
Journal of European Industrial Training, vol. 30 no. 2

tidsserieanalys

för att undersöka mönster och trender i en variabel mätt regelbundet under en tidsperiod. Kan också användas för att identifiera och justera för säsongsvariation, till exempel i finansiell statistik.

en analys av trender och cykliska beteenden av huspriserna på de asiatiska marknaderna
Ming-Chi Chen, Yuichiro Kawaguchi och Kanak Patel
Journal of Property Investment & Finans, Vol. 22 no. 1

grafisk presentation

att presentera data i grafisk form kan öka tillgängligheten för dina resultat till en icke-teknisk publik och markera effekter och resultat som annars skulle kräva lång förklaring eller komplexa tabeller. Det är därför viktigt att lämpliga grafiska tekniker används. Det här avsnittet ger exempel på några av de vanligaste grafiska presentationerna och anger när de kan användas. Alla, utom histogrammet, har producerats med hjälp av Microsoft Excel.

kolumn-eller stapeldiagram

det finns fyra huvudvariationer, och om du visar data i horisontella staplar eller vertikala kolumner är det till stor del en fråga om personlig preferens.

Histogram

för att illustrera en frekvensfördelning i kategoriska eller ordinära data eller grupperade förhållande/intervalldata. Visas vanligtvis som en kolumngraf.

 bild: Histogram

klustrad kolumn/stapel

för att jämföra kategoriska, ordinära eller grupperade förhållande/intervalldata mellan kategorier. De data som används i fig 4 är desamma som i fig 5 och 6.

bild: grupperad kolumn/stapel

staplad kolumn/stapel

för att illustrera det faktiska bidraget till summan för kategoriska, ordinära eller grupperade förhållande/intervalldata efter kategorier. De data som används i Fig 5 är desamma som i fig 4 och 6.

 bild: Staplad kolumn / stapel

procent staplad kolumn/stapel

för att jämföra det procentuella bidraget till summan för kategoriska, ordinära eller grupperade förhållande/intervalldata över kategorier. De data som används i fig 6 är desamma som i fig 4 och 5.

bild: procent staplad kolumn/stapel

linjediagram

för att visa trender i ordinära eller Förhållande/intervalldata. Punkter i en graf bör endast förenas med en linje om data på x-axeln är minst ordinära. En särskild tillämpning är att plotta en frekvensfördelning för intervall / förhållande data (fig 8).

bild: linjediagram

cirkeldiagram

för att visa det procentuella bidraget till hela kategoriska, ordinära eller grupperade förhållande/intervalldata.

bild: cirkeldiagram

Scatter-grafer

för att illustrera förhållandet mellan två variabler, av vilken typ som helst (även om de är mest användbara där båda variablerna är förhållande/intervall i typ). Också användbart vid identifiering av eventuella ovanliga observationer i data.

 bild: Scatter graf

Box och morrhår plot

en specialist graf som illustrerar den centrala tendensen och spridningen av en stor datamängd, inklusive eventuella avvikare.

bild: Box and whisker plot

resurser

Anslutande matematik
korta förklaringar av matematiska termer och ideer

Statistikordlista
sammanställd av Valerie J. Easton och John H. McColl från Glasgow University

StatSoft elektronisk lärobok

100 statistiska tester av Gopal K. Kanji
(Sage, 1993, ISBN 141292376X)

Oxford Dictionary of Statistics av Graham Upton och Ian Cook
(Oxford University Press, 2006, ISBN 0198614314)

Lämna ett svar

Din e-postadress kommer inte publiceras.