How to…Wählen Sie die richtige statistische Technik

Grundlagen

Beginnen Sie, über die Techniken nachzudenken, die Sie für Ihre Analyse verwenden werden, bevor Sie Daten sammeln.

Was möchten Sie wissen?

Die Analyse muss sich auf die Forschungsfragen beziehen, und dies kann die Techniken bestimmen, die Sie verwenden sollten.

Welche Art von Daten haben Sie?

Die Art der Daten, die Sie haben, ist ebenfalls von grundlegender Bedeutung – die Techniken und Werkzeuge, die für Intervall- und Verhältnisvariablen geeignet sind, eignen sich nicht für kategoriale oder ordinale Maßnahmen. (Hinweise zu Datentypen finden Sie unter Sammeln von Daten)

Welche Annahmen können Sie treffen – und welche nicht?

Viele Techniken beruhen darauf, dass die Stichprobenverteilung der Teststatistik eine Normalverteilung ist (siehe unten). Dies ist immer dann der Fall, wenn die zugrunde liegende Verteilung der Daten normal ist, die Daten jedoch in der Praxis möglicherweise nicht normal verteilt sind. Zum Beispiel könnte es einen langen Schwanz von Antworten auf die eine oder andere Seite geben (verzerrte Daten). In solchen Situationen stehen nichtparametrische Techniken zur Verfügung, die jedoch zwangsläufig weniger leistungsfähig und weniger flexibel sind. Wenn die Stichprobengröße jedoch ausreichend groß ist, ermöglicht der zentrale Grenzwertsatz die Verwendung der Standardanalysen und -werkzeuge.

Techniken für eine Nicht-Normalverteilung

Parametrische oder nicht-parametrische Statistik?

Parametrische Methoden und Statistiken beruhen auf einer Reihe von Annahmen über die zugrunde liegende Verteilung, um gültige Ergebnisse zu liefern. Im Allgemeinen erfordern sie, dass die Variablen eine Normalverteilung haben.

Nichtparametrische Techniken müssen für kategoriale und ordinale Daten verwendet werden, aber für Intervall & Verhältnisdaten sind sie im Allgemeinen weniger leistungsfähig und weniger flexibel und sollten nur verwendet werden, wenn der standardparametrische Test nicht geeignet ist – z. B. wenn die Stichprobengröße klein ist (unter 30 Beobachtungen).

Zentraler Grenzwertsatz

Mit zunehmender Stichprobengröße neigt die Form der Stichprobenverteilung der Teststatistik dazu, normal zu werden, selbst wenn die Verteilung der zu testenden Variablen nicht normal ist.

In der Praxis kann dies auf Teststatistiken angewendet werden, die aus mehr als 30 Beobachtungen berechnet wurden.

Bild: Die Normalverteilungsfunktion

Wie viel können Sie von Ihren Daten erwarten?

Je kleiner die Stichprobengröße ist, desto weniger können Sie aus Ihren Daten herausholen. Je größer also Ihre Stichprobe ist, desto kleiner ist der Standardfehler und desto größer ist die Wahrscheinlichkeit, dass Sie statistisch signifikante Ergebnisse in Ihrer Analyse identifizieren.

Grundlegende Techniken

Im Allgemeinen kann jede Technik, die für kategoriale Daten verwendet werden kann, auch für ordinale Daten verwendet werden. Jede Technik, die für Ordinaldaten verwendet werden kann, kann auch für Verhältnis- oder Intervalldaten verwendet werden. Das Gegenteil ist der Fall.

Beschreibung Ihrer Daten

Die erste Stufe einer Analyse sollte darin bestehen, Ihre Daten und damit die Grundgesamtheit zu beschreiben, aus der sie stammen. Die für diese Aktivität geeigneten Statistiken lassen sich in drei große Gruppen einteilen und hängen von der Art der Daten ab, über die Sie verfügen.

Was willst du machen? Mit welcher Art von Daten? Geeignete Techniken
Schauen Sie sich die Verteilung an Kategorial / Ordinal Zeichnen Sie den Prozentsatz
in jeder Kategorie
(Spalten- oder Balkendiagramm)
Verhältnis / Intervall Histogramm
Kumulative Häufigkeit
Diagramm
Beschreiben Sie die
zentrale Tendenz
Kategorisch n/a
Ordinal Median
Modus
Verhältnis / Intervall Mittelwert
Median
Spread beschreiben Kategorisch n/a
Ordinal Bereich
Interquartilbereich
Verhältnis / Intervall Bereich
Interquartilbereich
Varianz
Standardvariation

Siehe Grafische Darstellung für Beschreibungen der wichtigsten grafischen Techniken.

Mittelwert – der arithmetische Durchschnitt, berechnet durch Summieren aller Werte und Dividieren durch die Anzahl der Werte in der Summe.

Median – der Mittelpunkt der Verteilung, wobei die Hälfte der Werte höher und die Hälfte niedriger ist.

Modus – der am häufigsten vorkommende Wert.

Range – die Differenz zwischen dem höchsten und dem niedrigsten Wert.

Interquartilbereich – die Differenz zwischen dem oberen Quartil (dem Wert, bei dem 25 Prozent der Beobachtungen höher und 75 Prozent niedriger sind) und dem unteren Quartil (dem Wert, bei dem 75 Prozent der Beobachtungen höher und 25 Prozent niedriger sind). Dies ist besonders nützlich, wenn es eine kleine Anzahl extremer Beobachtungen gibt, die viel höher oder niedriger sind als die Mehrheit.

Varianz – ein Maß für die Streuung, berechnet als Mittelwert der quadratischen Differenzen der Beobachtungen von ihrem Mittelwert.

Standardabweichung – die Quadratwurzel der Varianz.

Unterschiede zwischen Gruppen und Variablen

Chi-Quadrat–Test – wird verwendet, um die Verteilungen von zwei oder mehr Sätzen von kategorialen oder ordinalen Daten zu vergleichen.

t-Tests – wird verwendet, um die Mittelwerte zweier Datensätze zu vergleichen.

Wilcoxon U-Test – nichtparametrisches Äquivalent des T-Tests. Basierend auf der Rangfolge der Daten kann es auch verwendet werden, um Mediane zu vergleichen.

ANOVA – Varianzanalyse, um die Mittelwerte von mehr als zwei Datengruppen zu vergleichen.

Was willst du machen? Mit welcher Art von Daten? Geeignete Techniken
Vergleichen Sie zwei Gruppen Kategorischer Chi-Quadrat-Test
Ordinal Chi-Quadrat-Test
Wicoxon U-Test
Verhältnis / Intervall t-Test für
unabhängige Stichproben
Vergleichen Sie mehr als zwei Gruppen Kategorisch / Ordinal Chi-Quadrat-Test
Verhältnis / Intervall ANOVA
Vergleichen Sie zwei Variablen
über dieselbe probanden
Kategorisch / Ordinal Chi-Quadrat-Test
Verhältnis / Intervall t-Test für
abhängige Proben

Beziehungen zwischen Variablen

Der Korrelationskoeffizient misst den Grad der linearen Assoziation zwischen zwei Variablen mit einem Wert im Bereich von +1 bis -1. Positive Werte zeigen an, dass die beiden Variablen zusammen zunehmen und abnehmen; negative Werte, dass eine zunimmt, wenn die andere abnimmt. Ein Korrelationskoeffizient von Null zeigt keine lineare Beziehung zwischen den beiden Variablen an. Die Spearman-Rangkorrelation ist das nichtparametrische Äquivalent der Pearson-Korrelation.

Welche Art von Daten? Geeignete Techniken
Kategorialer Chi-Quadrat-Test
Ordinal Chi-Quadrat-Test
Spearman-Rang
Korrelation (Tau)
Verhältnis / Intervall Pearson
Korrelation (Rho)

Beachten Sie, dass Korrelationsanalysen nur lineare Beziehungen zwischen zwei Variablen erkennen. Die folgende Abbildung zeigt zwei kleine Datensätze, in denen eindeutig Beziehungen zwischen den beiden Variablen bestehen. Die Korrelation für den zweiten Datensatz, bei dem die Beziehung nicht linear ist, beträgt jedoch 0,0. Eine einfache Korrelationsanalyse dieser Daten würde keinen Zusammenhang zwischen den Maßnahmen nahelegen, wenn dies eindeutig nicht der Fall ist. Dies zeigt, wie wichtig es ist, eine Reihe grundlegender deskriptiver Analysen durchzuführen, bevor mit der Analyse der Unterschiede und Beziehungen zwischen Variablen begonnen wird.

Bild: zwei kleine Datensätze, in denen eindeutig Beziehungen zwischen den beiden Variablen bestehen

Testvalidität

Signifikanzniveaus

Die statistische Signifikanz eines Tests ist ein Maß für die Wahrscheinlichkeit – die Wahrscheinlichkeit, dass Sie das bestimmte Ergebnis des Tests an dieser Stichprobe erhalten hätten, wenn die von Ihnen getestete Nullhypothese (dass aufgrund der zu testenden Parameter keine Wirkung vorliegt) zutrifft. Im folgenden Beispiel wird getestet, ob sich die Punktzahlen in einer Prüfung ändern, nachdem die Kandidaten eine Schulung erhalten haben. Die Hypothese legt nahe, dass sie es sollten, also ist die Null-Hyopothese, dass sie es nicht tun werden.

Im Allgemeinen wird jede Wahrscheinlichkeitsstufe über 5 Prozent (p > 0,05) nicht als statistisch signifikant angesehen, und für große Umfragen wird häufig 1 Prozent (p > 0,01) als geeigneteres Niveau angesehen.

Beachten Sie, dass die statistische Signifikanz nicht bedeutet, dass die Ergebnisse, die Sie erhalten haben, tatsächlich einen Wert im Kontext Ihrer Forschung haben. Wenn Sie eine ausreichend große Stichprobe haben, kann ein sehr kleiner Unterschied zwischen den Gruppen als statistisch signifikant identifiziert werden, aber ein so kleiner Unterschied kann in der Praxis irrelevant sein. Andererseits kann ein scheinbar großer Unterschied in einer kleinen Stichprobe aufgrund der Variation innerhalb der zu vergleichenden Gruppen statistisch nicht signifikant sein.

Freiheitsgrade

Einige Teststatistiken (z. B. Chi-Quadrat) erfordern, dass die Anzahl der Freiheitsgrade bekannt ist, um die statistische Signifikanz anhand der korrekten Wahrscheinlichkeitstabelle zu testen. Kurz gesagt, die Freiheitsgrade sind die Anzahl der Werte, die innerhalb der Stichprobe beliebig zugeordnet werden können.

Zum Beispiel:

In einer Stichprobe der Größe n, die in k Klassen unterteilt ist, gibt es k-1-Freiheitsgrade (die ersten k-1-Gruppen können bis zu n beliebig groß sein, während die letzte durch die Summe der ersten k-1 und den Wert von n. Numerisch ausgedrückt, wenn eine Stichprobe von 500 Personen aus Großbritannien entnommen wird und beobachtet wird, dass 300 aus England, 100 aus Schottland und 50 aus Wales stammen, muss sei 50 aus Nordirland. Angesichts der Zahlen aus den ersten drei Gruppen gibt es keine Flexibilität in der Größe der letzten Gruppe. Die Aufteilung der Probe in vier Gruppen ergibt drei Freiheitsgrade.

In einer Zwei-Wege-Kontingenztabelle mit p Zeilen und q Spalten gibt es (p-1) *(q-1) Freiheitsgrade (angesichts der Werte der ersten Zeilen und Spalten sind die letzte Zeile und Spalte durch die Summen in der Tabelle eingeschränkt)

One-Tail- oder Two-Tail-Tests

Wenn es, wie allgemein üblich, einfach darauf ankommt, dass die Statistiken für die Populationen unterschiedlich sind, dann ist es ist angebracht, die kritischen Werte für einen zweischwänzigen Test zu verwenden.

Wenn Sie jedoch nur herausfinden möchten, ob die Statistik für Grundgesamtheit A einen größeren Wert als für Grundgesamtheit B hat, wäre ein einseitiger Test angebracht. Der kritische Wert für einen einschwänzigen Test ist im Allgemeinen niedriger als für einen zweischwänzigen Test und sollte nur verwendet werden, wenn Ihre Forschungshypothese lautet, dass Population A einen größeren Wert als Population B hat und es keine Rolle spielt, wie unterschiedlich sie sind, wenn Population A einen Wert hat, der kleiner ist als der für Population B.

Zum Beispiel

Szenario 1

Nullhypothese – Es gibt keinen Unterschied in den mittleren Prüfungswerten vor und nach dem Training (dh das Training hat keinen Einfluss auf das Prüfungsergebnis)
Alternative – Es gibt einen Unterschied in den mittleren Werten vor und nach dem Training (dh das Training hat einen nicht spezifizierten Effekt)
Verwenden Sie einen Two-Tail–Test

Szenario 2

Nullhypothese – Training erhöht den mittleren Score nicht
Alternative – Der mittlere Score steigt nach dem Training
Verwenden Sie einen One-Tail-Test, wenn ein Anstieg des mittleren Scores beobachtet wird.
(Wenn ein Rückgang der Punktzahlen beobachtet wird, müssen Sie nicht testen, da Sie die Nullhypothese nicht ablehnen können.)

Szenario 3

Nullhypothese – Das Training führt nicht dazu, dass die mittleren Punktzahlen fallen
Alternative – Der mittlere Score fällt nach dem Training
Verwenden Sie einen One-Tail-Test, wenn ein Rückgang des mittleren Scores beobachtet wird.
(Wenn ein Anstieg der Punktzahlen beobachtet wird, müssen Sie nicht testen, da Sie die Nullhypothese nicht ablehnen können.)

t-Test: Gepaarte zwei Probe für Mittel
Vorher Nachher
Mittelwert
Varianz

46,547

46,830

Beobachtungen
Freiheitsgrade (df)
t Stat
P (T < = t) ein Schwanz
t-ein-Schwanz
P (T < = t) zwei-schwanz
t-zwei-Schwanz

Wenn die obigen Testergebnisse erhalten wurden, können Sie unter Szenario 1 unter Verwendung eines Two-Tail-Tests zu dem Schluss kommen, dass es keinen statistisch signifikanten Unterschied zwischen den Ergebnissen gab (p = 0,08) und folglich, dass das Training keine Auswirkungen hatte. In ähnlicher Weise würden Sie unter Szenario 3 zu dem Schluss kommen, dass es keine Beweise dafür gibt, dass das Training dazu führt, dass die mittleren Punktzahlen sinken, da sie tatsächlich gestiegen sind. Unter Szenario 2 würden Sie jedoch unter Verwendung eines One-Tail-Tests zu dem Schluss kommen, dass die mittleren Werte statistisch signifikant auf dem 5-Prozent-Niveau (p = 0.04) gestiegen sind.

Eine letzte Warnung!

Statistische Pakete werden im Großen und Ganzen tun, was Sie ihnen sagen. Sie wissen nicht, ob die von Ihnen bereitgestellten Daten von guter Qualität sind oder (mit wenigen Ausnahmen) ob sie für die von Ihnen durchgeführte Analyse geeignet sind.

Müll rein = Müll raus!

Fortgeschrittene Techniken

Diese Werkzeuge und Techniken haben spezielle Anwendungen und werden in der Regel frühzeitig in die Forschungsmethodik integriert, bevor Daten gesammelt werden. Wenn Sie erwägen, eine dieser Methoden zu verwenden, sollten Sie vor dem Start einen Facharzt oder einen erfahrenen Statistiker konsultieren.

In jedem Fall geben wir einige Beispiele von Artikeln, die die Technik verwenden.

Faktorenanalyse

Verringerung der Anzahl der Variablen für die nachfolgende Analyse durch Erstellen von Kombinationen der ursprünglich gemessenen Variablen, die so viel wie möglich von der ursprünglichen Varianz ausmachen, aber eine einfachere Interpretation der Ergebnisse ermöglichen. Wird häufig verwendet, um einen kleinen Satz von Dimensionsbewertungen aus einer großen Anzahl von Meinungsaussagen zu erstellen, die einzeln auf Likert-Skalen bewertet werden. Sie müssen mehr Beobachtungen (Probanden) als zu analysierende Variablen haben.

Zum Beispiel

Eine Likert-Skalenvariable: „Ich esse gerne Schokoladeneis zum Frühstück“

Stimme voll und ganz zu

Stark widersprechen

Eine Faktorenanalyse von Page und Wongs Servant Leadership Instrument
Rob Dennis und Bruce E. Winston
Führung & Organization Development Journal , vol. 24 nr. 8

Faktoren für die Einführung von Benchmarking verstehen: Neue Erkenntnisse aus Malaysia
Yean Pin Lee, Suhaiza Zailani und Keng Lin Soh
Benchmarking: Eine internationale Zeitschrift , vol. 13 nr. 5

Clusteranalyse

Zur Klassifizierung von Probanden in Gruppen mit ähnlichen Merkmalen gemäß den Werten der gemessenen Variablen. Sie müssen mehr Beobachtungen als Variablen in der Analyse enthalten haben.

Vermeidung von Bio-Produkten: Gründe für die Ablehnung und Identifizierung potenzieller Käufer in einer landesweiten Umfrage
C. Fotopoulos und A. Krystallis
British Food Journal, vol. 104 nr. 3/4/5

Erkennung von Finanznot durch multivariate statistische Analyse
S. Gamesalingam und Kuldeep Kumar
Managerial Finance, vol. 27 nr. 4

Diskriminanzanalyse

Zur Identifizierung derjenigen Variablen, die zwischen bekannten Subjektgruppen am besten unterscheiden. Die Ergebnisse können verwendet werden, um den bekannten Gruppen neue Probanden zuzuordnen basierend auf ihren Werten der diskriminierenden Variablen

Erkennung von Finanznot durch multivariate statistische Analyse
S. Gamesalingam und Kuldeep Kumar
Managerial Finance, vol. 27 nr. 4

Faktoren für die Einführung von Benchmarking verstehen: Neue Erkenntnisse aus Malaysia
Yean Pin Lee, Suhaiza Zailani und Keng Lin Soh
Benchmarking: Eine internationale Zeitschrift, vol. 13 nr. 5

Methodik

Die Diskriminanzanalyse wurde verwendet, um festzustellen, ob statistisch signifikante Unterschiede zwischen dem durchschnittlichen Score-Profil eines Variablensatzes für zwei a priori definierte Gruppen bestehen, und ermöglichte so deren Klassifizierung. Außerdem könnte es helfen zu bestimmen, welche der unabhängigen Variablen am meisten für die Unterschiede in den durchschnittlichen Score-Profilen der beiden Gruppen verantwortlich ist. In dieser Studie war die Diskriminanzanalyse das Hauptinstrument zur Klassifizierung des Benchmarking-Adopters und des Nicht-Adopters. Es wurde auch verwendet, um zu bestimmen, welche der unabhängigen Variablen zur Benchmarking-Annahme beitragen würde.

Regression

Um zu modellieren, wie sich eine abhängige Variable in Abhängigkeit von den Werten einer Menge anderer unabhängiger Variablen verhält. Die abhängigen Variablen müssen vom Typ Intervall oder Verhältnis sein; Die unabhängigen Variablen können von beliebigem Typ sein, es müssen jedoch spezielle Methoden verwendet werden, wenn kategoriale oder ordinale unabhängige Variablen in die Analyse einbezogen werden.

Entwicklungen im Milchmarketing in England und Wales in den 1990er Jahren
Jeremy Franks
British Food Journal, vol. 103 nr. 9

Ausbildung unter Beschuss: Die Beziehung zwischen Hindernissen für die Ausbildung und der Entwicklung von KMU in Palästina
Mohammed Al Madhoun
Journal of European Industrial Training, vol. 30 nr. 2

Zeitreihenanalyse

Untersuchung der Muster und Trends einer Variablen, die regelmäßig über einen Zeitraum gemessen werden. Kann auch verwendet werden, um saisonale Schwankungen zu identifizieren und anzupassen, beispielsweise in der Finanzstatistik.

Eine Analyse der Trends und des zyklischen Verhaltens der Immobilienpreise auf den asiatischen Märkten
Ming-Chi Chen, Yuichiro Kawaguchi und Kanak Patel
Journal of Property Investment & Finance, vol. 22 nr. 1

Grafische Darstellung

Die Präsentation von Daten in grafischer Form kann die Zugänglichkeit Ihrer Ergebnisse für ein nicht-technisches Publikum erhöhen und Effekte und Ergebnisse hervorheben, die sonst langwierige Erklärungen oder komplexe Tabellen erfordern würden. Es ist daher wichtig, dass geeignete grafische Techniken verwendet werden. Dieser Abschnitt enthält Beispiele für einige der am häufigsten verwendeten grafischen Darstellungen und gibt an, wann sie verwendet werden können. Alle, mit Ausnahme des Histogramms, wurden mit Microsoft Excel® erstellt.

Spalten- oder Balkendiagramme

Es gibt vier Hauptvarianten, und ob Sie die Daten in horizontalen Balken oder vertikalen Spalten anzeigen, hängt weitgehend von Ihren persönlichen Vorlieben ab.

Histogramm

Zur Veranschaulichung einer Häufigkeitsverteilung in kategorialen oder ordinalen Daten oder gruppierten Verhältnis-/Intervalldaten. Normalerweise als Spaltendiagramm angezeigt.

Bild: Histogramm

Gruppierte Spalte / Balken

Um kategoriale, ordinale oder gruppierte Verhältnis- / Intervalldaten über Kategorien hinweg zu vergleichen. Die in Figur 4 verwendeten Daten sind die gleichen wie in den Figuren 5 und 6.

Bild: Gruppierte Spalte / Balken

Gestapelte Spalte / Balken

Zur Veranschaulichung des tatsächlichen Beitrags zur Gesamtsumme für kategoriale, ordinale oder gruppierte Verhältnis- / Intervalldaten nach Kategorien. Die in Figur 5 verwendeten Daten sind die gleichen wie in den Figuren 4 und 6.

Bild: Gestapelte Spalte / Balken

Prozentsatz gestapelte Spalte / Balken

Zum Vergleich des prozentualen Beitrags zur Gesamtsumme für kategoriale, ordinale oder gruppierte Verhältnis- / Intervalldaten über Kategorien hinweg. Die in Figur 6 verwendeten Daten sind die gleichen wie in den Figuren 4 und 5.

 Bild: Prozent gestapelte Spalte / Balken

Liniendiagramme

Um Trends in Ordinal- oder Verhältnis- / Intervalldaten anzuzeigen. Punkte in einem Diagramm sollten nur dann mit einer Linie verbunden werden, wenn die Daten auf der x-Achse mindestens ordinal sind. Eine besondere Anwendung besteht darin, eine Häufigkeitsverteilung für Intervall- / Verhältnisdaten zu zeichnen (Abbildung 8).

Bild: Liniendiagramme

Kreisdiagramme

Um den prozentualen Beitrag zur Gesamtheit der kategorialen, ordinalen oder gruppierten Verhältnis- / Intervalldaten anzuzeigen.

 Bild: Kreisdiagramm

Streudiagramme

Zur Veranschaulichung der Beziehung zwischen zwei Variablen beliebiger Art (obwohl am nützlichsten, wenn beide Variablen vom Typ Verhältnis / Intervall sind). Auch nützlich bei der Identifizierung von ungewöhnlichen Beobachtungen in den Daten.

Bild: Streudiagramm

Box- und Whisker-Diagramm

Ein Spezialdiagramm, das die zentrale Tendenz und Ausbreitung eines großen Datensatzes einschließlich aller Ausreißer veranschaulicht.

Bild: Box and Whisker plot

Ressourcen

Mathematik verbinden
Kurze Erläuterungen zu mathematischen Begriffen und Ideen

Statistik-Glossar
zusammengestellt von Valerie J. Easton und John H. McColl von der Glasgow University

Statsoft elektronisches Lehrbuch

100 Statistische Tests von Gopal K. Kanji
(Sage, 1993, ISBN 141292376X)

Oxford Dictionary of Statistics von Graham Upton und Ian Cook
(Oxford University Press, 2006, ISBN 0198614314)

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.