- Fundamentals
- wat wilt u weten?
- welk type gegevens heeft u?
- welke veronderstellingen kan-en kan-je maken?
- technieken voor een niet-normale verdeling
- parametrische of niet-parametrische statistieken?
- centrale limietstelling
- hoeveel kunt u verwachten van uw gegevens?
- basistechnieken
- beschrijving van uw gegevens
- verschillen tussen groepen en variabelen
- relaties tussen variabelen
- test validity
- Significantieniveaus
- vrijheidsgraden
- bijvoorbeeld:
- eenzijdige of tweezijdige test
- bijvoorbeeld
- een laatste waarschuwing!
- geavanceerde technieken
- factoranalyse
- bijvoorbeeld
- clusteranalyse
- Discriminant analysis
- regressie
- tijdreeksanalyse
- grafische presentatie
- kolom-of staafdiagrammen
- Histogram
- geclusterde kolom / staaf
- gestapelde kolom / staaf
- Percentage gestapelde kolom / staaf
- lijngrafieken
- cirkeldiagrammen
- spreidingsgrafieken
- Box and whisker plot
- Resources
Fundamentals
begin na te denken over de technieken die u zult gebruiken voor uw analyse voordat u gegevens verzamelt.
wat wilt u weten?
de analyse moet betrekking hebben op de onderzoeksvragen, en dit kan bepalen welke technieken u moet gebruiken.
welk type gegevens heeft u?
het type gegevens dat u hebt is ook fundamenteel – de technieken en hulpmiddelen die geschikt zijn voor interval-en ratio-variabelen zijn niet geschikt voor categorische of ordinale metingen. (Zie hoe gegevens te verzamelen voor notities over soorten gegevens)
welke veronderstellingen kan-en kan-je maken?
bij veel technieken wordt ervan uitgegaan dat de steekproefverdeling van de teststatistiek een normale verdeling is (zie hieronder). Dit is altijd het geval wanneer de onderliggende verspreiding van de gegevens Normaal is, maar in de praktijk kunnen de gegevens niet normaal worden verspreid. Bijvoorbeeld, er kan een lange staart van reacties op de ene of de andere kant (scheve gegevens). Niet-parametrische technieken zijn beschikbaar voor gebruik in dergelijke situaties, maar deze zijn onvermijdelijk minder krachtig en minder flexibel. Echter, als de steekproefgrootte voldoende groot is, staat de centrale limietstelling het gebruik van de standaardanalyses en hulpmiddelen toe.
technieken voor een niet-normale verdeling
parametrische of niet-parametrische statistieken?
parametrische methoden en statistieken zijn gebaseerd op een reeks aannames over de onderliggende distributie om geldige resultaten te verkrijgen. In het algemeen vereisen ze dat de variabelen een normale verdeling hebben.
niet-parametrische technieken moeten worden gebruikt voor categorische en ordinale gegevens, maar voor interval & ratio – gegevens zijn ze over het algemeen minder krachtig en minder flexibel en mogen alleen worden gebruikt wanneer de standaard parametrische test niet geschikt is-bijvoorbeeld wanneer de steekproefgrootte klein is (minder dan 30 waarnemingen).
centrale limietstelling
naarmate de steekproefgrootte toeneemt, wordt de vorm van de steekproefverdeling van de teststatistiek normaal, zelfs als de verdeling van de te testen variabele niet normaal is.
in de praktijk kan dit worden toegepast op teststatistieken die zijn berekend op basis van meer dan 30 waarnemingen.
hoeveel kunt u verwachten van uw gegevens?
hoe kleiner de steekproefgrootte, hoe minder u uit uw gegevens kunt halen. Standaardfout is omgekeerd gerelateerd aan de steekproefgrootte, dus hoe groter uw steekproef, hoe kleiner de standaardfout, en hoe groter de kans dat u statistisch significante resultaten in uw analyse zult identificeren.
basistechnieken
in het algemeen kan elke techniek die kan worden gebruikt voor categorische gegevens ook worden gebruikt voor ordinale gegevens. Om het even welke techniek die op ordinalgegevens kan worden gebruikt kan ook op Verhouding of intervalgegevens worden gebruikt. Het omgekeerde is niet het geval.
beschrijving van uw gegevens
de eerste fase van een analyse zou moeten zijn het beschrijven van uw gegevens, en dus de populatie waaruit deze zijn getrokken. De statistieken die geschikt zijn voor deze activiteit vallen in drie grote groepen, en zijn afhankelijk van het type gegevens dat u hebt.
wat wil je doen? | met welk type gegevens? | de Juiste technieken |
---|---|---|
Kijk naar de distributie | Categorische / Ordinale | Plot het percentage in elke categorie (kolom of staaf) |
Ratio / Interval | Histogram Cumulatieve frequentie diagram |
|
Beschrijf de de centrale tendens |
Categorische | n/a |
Ordinale | Mediaan Modus |
|
Ratio / Interval | Bedoel Mediaan |
|
het Beschrijven van de verspreiding | Categorische | n/a |
Ordinale | Assortiment Inter-kwartiel range |
|
Ratio / Interval | Assortiment Inter-kwartiel range Variantie Standaard variatie |
Zie Grafische presentatie voor een beschrijving van de belangrijkste grafische technieken.
Gemiddelde-het rekenkundig gemiddelde, berekend door alle waarden op te tellen en te delen door het aantal waarden in de som.
mediaan-het middelpunt van de verdeling, waarbij de helft van de waarden hoger en de helft lager is.
modus-de meest voorkomende waarde.
bereik – het verschil tussen de hoogste en laagste waarde.
interkwartielbereik – het verschil tussen het bovenste kwartiel (de waarde waarbij 25% van de waarnemingen hoger en 75% lager zijn) en het onderste kwartiel (de waarde waarbij 75% van de waarnemingen hoger en 25% lager zijn). Dit is vooral nuttig wanneer er een klein aantal extreme waarnemingen veel hoger of lager zijn dan de meerderheid.
variantie-een spreadmaat, berekend als het gemiddelde van de kwadraatverschillen van de waarnemingen ten opzichte van hun gemiddelde.
standaardafwijking-de vierkantswortel van de variantie.
verschillen tussen groepen en variabelen
Chi-kwadraat test-gebruikt om de verdelingen van twee of meer sets van categorische of ordinale gegevens te vergelijken.
t-tests-gebruikt om de middelen van twee reeksen gegevens te vergelijken.
Wilcoxon u-test-niet-parametrisch equivalent van de t-test. Op basis van de rangorde van de gegevens, kan het ook worden gebruikt om medianen te vergelijken.
ANOVA-variantieanalyse, om de gemiddelden van meer dan twee groepen gegevens te vergelijken.
wat wil je doen? | met welk type gegevens? | de Juiste technieken |
---|---|---|
het Vergelijken van twee groepen | Categorische | Chi-kwadraat test |
Ordinale | Chi-kwadraat test Wicoxon U test |
|
Ratio / Interval | t-test voor onafhankelijke steekproeven |
|
Vergelijk meer dan twee groepen | Categorische / Ordinale | Chi-kwadraat test |
Ratio / Interval | ANOVA | |
Vergelijk twee variabelen over dezelfde proefpersonen |
categorisch / ordinaal | Chi-kwadraattest |
Verhouding / Interval | t-test voor afhankelijke monsters |
relaties tussen variabelen
de correlatiecoëfficiënt meet de mate van lineaire associatie tussen twee variabelen, met een waarde tussen +1 en -1. Positieve waarden geven aan dat de twee variabelen samen toenemen en afnemen; negatieve waarden dat de ene toeneemt als de andere afneemt. Een correlatiecoëfficiënt van nul geeft geen lineair verband tussen de twee variabelen aan. De Spearman rank correlatie is het niet-parametrische equivalent van de Pearson correlatie.
wat voor gegevens? | de Juiste technieken |
---|---|
Categorische | Chi-kwadraat test |
Ordinale | Chi-kwadraat test Spearman rank correlatie (Tau) |
Ratio / Interval | Pearson correlatie (Rho) |
Merk op dat de correlatie analyses zullen alleen detecteren lineaire relatie tussen twee variabelen. Onderstaande figuur illustreert twee kleine gegevensverzamelingen waarbij er duidelijk verbanden zijn tussen de twee variabelen. De correlatie voor de tweede gegevensverzameling, waarbij de relatie niet lineair is, is echter 0,0. Een eenvoudige correlatieanalyse van deze gegevens zou erop wijzen dat er geen verband is tussen de maatregelen, terwijl dat duidelijk niet het geval is. Dit illustreert het belang van een reeks beschrijvende basisanalyses alvorens de verschillen en relaties tussen variabelen te analyseren.
test validity
Significantieniveaus
de statistische significantie van een test is een maat voor de waarschijnlijkheid – de waarschijnlijkheid dat u dat specifieke resultaat van de test op dat monster zou hebben verkregen als de nulhypothese (dat er geen effect is door de geteste parameters) waar was. In het onderstaande voorbeeld wordt getest of de scores in een examenwijziging worden gewijzigd nadat de kandidaten een opleiding hebben ontvangen. De hypothese suggereert dat ze zouden moeten, dus de nulhyopothese is dat ze niet zullen.
in het algemeen wordt elk waarschijnlijkheidsniveau boven 5 procent (p>0,05) niet als statistisch significant beschouwd, en voor grote enquêtes wordt 1 procent (p>0,01) vaak als een geschikter niveau beschouwd.
houd er rekening mee dat statistische significantie niet betekent dat de resultaten die u hebt verkregen daadwerkelijk waarde hebben in de context van uw onderzoek. Als je een voldoende grote steekproef hebt, kan een zeer klein verschil tussen groepen als statistisch significant worden geïdentificeerd, maar zo ‘ n klein verschil kan in de praktijk irrelevant zijn. Aan de andere kant is een schijnbaar groot verschil niet statistisch significant in een kleine steekproef, als gevolg van de variatie binnen de groepen die worden vergeleken.
vrijheidsgraden
sommige teststatistieken (bv. chi-kwadraat) vereisen dat het aantal vrijheidsgraden bekend is, om de statistische significantie te toetsen aan de correcte waarschijnlijkheidstabel. Kortom, de vrijheidsgraden is het aantal waarden dat willekeurig binnen het monster kan worden toegewezen.
bijvoorbeeld:
in een steekproef van grootte n, verdeeld in k-klassen, zijn er K-1 vrijheidsgraden (de eerste K-1-groepen kunnen van elke grootte tot n zijn, terwijl de laatste wordt vastgesteld door het totaal van de eerste k-1 en de waarde van n. in numerieke termen, als een steekproef van 500 individuen uit het Verenigd Koninkrijk wordt genomen en wordt vastgesteld dat 300 uit Engeland, 100 uit Schotland en 50 Uit Wales komen, dan moeten er 50 uit Noord-ierland zijn. Gezien de aantallen van de eerste drie groepen is er geen flexibiliteit in de grootte van de uiteindelijke groep. Het verdelen van het monster in vier groepen geeft drie vrijheidsgraden.
In een twee-weg contingency tabel met p rijen en q kolommen, er zijn (p-1)*(q-1) vrijheidsgraden (gegeven de waarden van de eerste rijen en kolommen, de laatste rij en kolom worden beperkt door de totalen in de tabel)
eenzijdige of tweezijdige test
Indien, zoals in het algemeen het geval is, wat belangrijk is, is dat de statistieken voor de populaties verschillend zijn, dan is het passend om de kritische waarden voor een tweezijdige toets.
als u echter alleen wilt weten of de statistiek voor populatie A een grotere waarde heeft dan die voor populatie B, dan is een eenzijdige test aangewezen. De kritische waarde voor een éénstaarttest is over het algemeen lager dan voor een tweestaarttest, en mag alleen worden gebruikt als uw onderzoekshypothese is dat populatie A een grotere waarde heeft dan populatie B, en het maakt niet uit hoe verschillend ze zijn als populatie A een waarde heeft die lager is dan die voor populatie B.
bijvoorbeeld
Scenario 1
nulhypothese – er is geen verschil in gemiddelde examenscores voor en na de training (d.w.z. training heeft geen effect op de examenscore)
alternatief – Er is een verschil in gemiddelde scores voor en na de training (d.w.z. training heeft een onbepaald effect)
gebruik een tweestaarttest
Scenario 2
nulhypothese-Training verhoogt de gemiddelde score
de alternatieve gemiddelde score stijgt na training
gebruik een éénstaarttest als er een waargenomen toename in de gemiddelde score is.
(als er een daling in scores is waargenomen, is het niet nodig om te testen, omdat u de nulhypothese niet kunt afwijzen.)
Scenario 3
nulhypothese-Training veroorzaakt geen daling van de gemiddelde score
daling van de alternatieve gemiddelde score na training
gebruik een éénstaarttest als er een daling van de gemiddelde score wordt waargenomen.
(als er een waargenomen toename in scores is, is het niet nodig om te testen, omdat u de nulhypothese niet kunt afwijzen.)
Voordat | Na | |
Gemiddelde | ||
Variantie |
46,547 |
46,830 |
Waarnemingen | ||
vrijheidsgraden (df) | ||
t-Stat | ||
P(T<=t) een-staart | ||
t-Kritisch-staart | ||
P(T<=t) twee-staart | ||
t Critical two-tail |
Als de bovenstaande test resultaten werden verkregen, dan onder scenario 1, met behulp van een tweezijdige test, je zou kunnen concluderen dat er geen statistisch significant verschil tussen de scores (p=0.08), en, als gevolg, dat de training had geen effect. Evenzo zou je in scenario 3 concluderen dat er geen aanwijzingen zijn dat training leidt tot een daling van de gemiddelde scores, omdat deze in feite zijn gestegen. Echter, onder scenario 2, met behulp van een one-tail test, zou je concluderen dat er een toename van de gemiddelde scores was, statistisch significant op het niveau van 5 procent (p=0,04).
een laatste waarschuwing!
statistische pakketten zullen doen wat u hen vertelt, over het algemeen. Zij weten niet of de door u verstrekte gegevens van goede kwaliteit zijn, of (op een paar uitzonderingen na) of zij geschikt zijn voor de door u uitgevoerde analyse.
afval naar binnen = afval naar buiten!
geavanceerde technieken
deze instrumenten en technieken hebben gespecialiseerde toepassingen en zullen in het algemeen in een vroeg stadium, voordat gegevens worden verzameld, in de onderzoeksmethodologie worden ontworpen. Als u overweegt om een van deze te gebruiken, kunt u een gespecialiseerde tekst of een ervaren statisticus raadplegen voordat u begint.
in elk geval geven we enkele voorbeelden van Emerald artikelen die de techniek gebruiken.
factoranalyse
het aantal variabelen voor latere analyse verminderen door combinaties van de oorspronkelijke gemeten variabelen te creëren die zoveel mogelijk van de oorspronkelijke variantie vertegenwoordigen, maar de resultaten gemakkelijker kunnen interpreteren. Vaak gebruikt om een kleine set van dimensie ratings te maken van een groot aantal opinieverklaringen individueel beoordeeld op Likert schalen. Je moet meer observaties (onderwerpen) hebben dan variabelen die geanalyseerd moeten worden.
bijvoorbeeld
een Likert-schaalvariabele: “Ik eet graag chocolade-ijs als ontbijt”
helemaal mee eens |
zeer oneens |
A factor analysis of Page and Wong ‘ s servant leadership instrument
Rob Dennis and Bruce E. Winston
Leadership & Organization Development Journal, vol. 24 no. 8
Understanding factors for benchmarking adoption: New evidence from Malaysia
Yean Pin Lee, Suhaiza Zailani and Keng Lin Soh
Benchmarking: An International Journal, vol. 13 no. 5
clusteranalyse
om proefpersonen te classificeren in groepen met vergelijkbare kenmerken, volgens de waarden van de gemeten variabelen. Je moet meer observaties hebben dan variabelen in de analyse.
organic product avoidance: Reasons for rejection and potential buyers ‘ identification in a country wide survey
C. Fotopoulos and A. Krystallis
British Food Journal, vol. 104 no. 3/4/5
detectie van financiële nood via multivariate statistische analyse
S. Gamesalingam en Kuldeep Kumar
Managerial Finance, vol. 27 no. 4
Discriminant analysis
om de variabelen te identificeren die het beste onderscheid maken tussen bekende groepen proefpersonen. De resultaten kunnen worden gebruikt om nieuwe proefpersonen toe te wijzen aan de bekende groepen op basis van hun waarden van de onderscheidende variabelen
detectie van financiële problemen via multivariate statistische analyse
S. Gamesalingam en Kuldeep Kumar
Management Finance, vol. 27 no. 4
inzicht in factoren voor benchmarking adoptie: New evidence from Malaysia
Yean Pin Lee, Suhaiza Zailani and Keng Lin Soh
Benchmarking: An International Journal, vol. 13 no. 5
methodiek
Discriminant analyse werd gebruikt om te bepalen of er statistisch significante verschillen bestaan tussen het gemiddelde scoreprofiel van een reeks variabelen voor twee a priori gedefinieerde groepen, waardoor deze konden worden geclassificeerd. Bovendien zou het kunnen helpen om te bepalen welke van de onafhankelijke variabelen het meest rekening houden met de verschillen in de gemiddelde score profielen van de twee groepen. In deze studie was discriminant analyse het belangrijkste instrument om de benchmarking adopter en niet-adopter te classificeren. Het werd ook gebruikt om te bepalen welke van de onafhankelijke variabelen zou bijdragen aan benchmarking adoptie.
regressie
om te modelleren hoe een afhankelijke variabele zich gedraagt afhankelijk van de waarden van een reeks andere onafhankelijke variabelen. De afhankelijke variabele moet interval of ratio van type zijn; de onafhankelijke variabelen kunnen van elk type zijn, maar er moeten speciale methoden worden gebruikt wanneer categorische of ordinale onafhankelijke variabelen in de analyse worden opgenomen.
Developments in milk marketing in England and Wales during the 1990s
Jeremy Franks
British Food Journal, vol. 103 no. 9
Training under fire:The relationship between obstacles facing training and SMEs ‘ development in Palestine
Mohammed Al Madhoun
Journal of European Industrial Training, vol. 30 no. 2
tijdreeksanalyse
om de patronen en trends in een variabele te onderzoeken die regelmatig over een periode worden gemeten. Kan ook worden gebruikt om seizoensgebonden variatie te identificeren en aan te passen, bijvoorbeeld in financiële statistieken.
An analysis of the trends and cyclically behaviours of house prices in the Asian markets
Ming-Chi Chen, Yuichiro Kawaguchi en Kanak Patel
Journal of Property Investment & Finance, vol. 22 no. 1
grafische presentatie
het presenteren van gegevens in grafische vorm kan de toegankelijkheid van uw resultaten voor een niet-technisch publiek vergroten en effecten en resultaten benadrukken die anders lange uitleg of complexe tabellen zouden vereisen. Daarom is het belangrijk dat passende grafische technieken worden gebruikt. Deze sectie geeft voorbeelden van enkele van de meest gebruikte grafische presentaties, en geeft aan wanneer ze kunnen worden gebruikt. Alle, behalve het histogram, zijn geproduceerd met behulp van Microsoft Excel®.
kolom-of staafdiagrammen
er zijn vier belangrijke variaties, en of u de gegevens in horizontale balken of verticale kolommen weergeeft is grotendeels een kwestie van persoonlijke voorkeur.
Histogram
ter illustratie van een frequentieverdeling in categorische of ordinale gegevens, of gegroepeerde ratio – /intervalgegevens. Meestal weergegeven als een kolom Grafiek.
geclusterde kolom / staaf
voor het vergelijken van categoriële, ordinale of gegroepeerde ratio/intervalgegevens tussen categorieën. De in Figuur 4 gebruikte gegevens zijn dezelfde als die in Figuur 5 en 6.
gestapelde kolom / staaf
ter illustratie van de werkelijke bijdrage aan het totaal voor categorische, ordinale of gegroepeerde ratio/intervalgegevens per categorie. De in Figuur 5 gebruikte gegevens zijn dezelfde als die in Figuur 4 en 6.
Percentage gestapelde kolom / staaf
om de procentuele bijdrage aan het totaal voor categorische, ordinale of gegroepeerde ratio/intervalgegevens over de categorieën te vergelijken. De in Figuur 6 gebruikte gegevens zijn dezelfde als die in Figuur 4 en 5.
lijngrafieken
om trends in ordinale of ratio/intervalgegevens weer te geven. Punten op een grafiek mogen alleen worden samengevoegd met een lijn als de gegevens op de x-as ten minste ordinaal zijn. Een bijzondere toepassing is het plotten van een frequentieverdeling voor interval/ratio data (fig.8).
cirkeldiagrammen
om de procentuele bijdrage aan het geheel van categorische, ordinale of gegroepeerde ratio – /intervalgegevens weer te geven.
spreidingsgrafieken
om de relatie tussen twee variabelen te illustreren, van elk type (hoewel het nuttigst wanneer beide variabelen ratio/interval in type zijn). Ook nuttig bij het identificeren van ongebruikelijke waarnemingen in de gegevens.
Box and whisker plot
een specialistische grafiek die de centrale tendens en verspreiding van een grote gegevensverzameling, inclusief eventuele uitschieters, illustreert.
Resources
Connecting Mathematics
korte uitleg van wiskundige termen en ideeën
Statistics Glossary
samengesteld door Valerie J. Easton en John H. McColl van de Universiteit van Glasgow
Statsoft electronic textbook
100 statistische Tests door Gopal K. Kanji
(sage, 1993, ISBN 141292376X)
Oxford Dictionary of Statistics by Graham Upton and Ian Cook
(Oxford University Press, 2006, ISBN 0198614314)