Jak to zrobić…Wybierz odpowiednią technikę statystyczną

podstawy

zanim zbierzesz jakiekolwiek dane, zacznij myśleć o technikach, których użyjesz do analizy.

co chcesz wiedzieć?

analiza musi odnosić się do pytań badawczych, a to może dyktować techniki, których powinieneś użyć.

jakie masz dane?

Typ posiadanych danych jest również fundamentalny – techniki i narzędzia odpowiednie dla zmiennych interwałowych i proporcyjnych nie nadają się do miar kategorycznych lub porządkowych. (Zobacz jak zbierać dane dla uwag na temat typów danych)

jakie założenia można – a nie można-zrobić?

wiele technik polega na tym, że rozkład próbkowania statystyki badania jest rozkładem normalnym (patrz poniżej). Dzieje się tak zawsze, gdy podstawowy rozkład danych jest normalny, ale w praktyce dane mogą nie być normalnie rozpowszechniane. Na przykład może istnieć długi ogon odpowiedzi na jedną lub drugą stronę (Przekrzywione dane). Techniki nieparametryczne są dostępne do wykorzystania w takich sytuacjach, ale są one nieuchronnie mniej wydajne i mniej elastyczne. Jeśli jednak wielkość próby jest wystarczająco duża, centralne twierdzenie graniczne pozwala na zastosowanie standardowych analiz i narzędzi.

techniki rozkładu nienormalnego

Statystyka parametryczna czy nieparametryczna?

metody parametryczne i statystyka opierają się na zestawie założeń dotyczących podstawowego rozkładu, aby dać prawidłowe wyniki. Ogólnie rzecz biorąc, wymagają one, aby zmienne miały rozkład normalny.

techniki nieparametryczne muszą być stosowane dla danych kategorycznych i porządkowych, ale dla danych dotyczących proporcji interwałów & są one na ogół mniej wydajne i mniej elastyczne i powinny być stosowane tylko wtedy, gdy standardowy, parametryczny test nie jest odpowiedni-np. gdy wielkość próby jest mała (poniżej 30 obserwacji).

centralne twierdzenie graniczne

wraz ze wzrostem wielkości próby kształt rozkładu próbkowania statystyki badania ma tendencję do normalności, nawet jeśli rozkład zmiennej, która jest badana, nie jest normalny.

w praktyce można to zastosować do statystyk badań obliczonych na podstawie ponad 30 obserwacji.

obraz: funkcja rozkładu normalnego

ile możesz oczekiwać, aby uzyskać z danych?

im mniejszy rozmiar próbki, tym mniej można uzyskać z danych. Błąd standardowy jest odwrotnie związany z wielkością próbki, więc im większa próbka, tym mniejszy błąd standardowy i tym większa szansa na zidentyfikowanie statystycznie istotnych wyników w analizie.

podstawowe techniki

ogólnie rzecz biorąc, każda technika, która może być użyta na danych kategorycznych, może być również użyta na danych porządkowych. Każda technika, która może być stosowana na danych porządkowych, może być również stosowana na danych dotyczących proporcji lub interwałów. Odwrotnie nie jest.

opisywanie Twoich danych

pierwszym etapem każdej analizy powinno być opisanie Twoich danych, a tym samym populacji, z której są one czerpane. Statystyki odpowiednie dla tego działania dzielą się na trzy szerokie grupy i zależą od rodzaju posiadanych danych.

co chcesz zrobić? z jakim typem danych? odpowiednie techniki
spójrz na rozkład kategoryczny / porządkowy narysuj procent
w każdej kategorii
(wykres kolumnowy lub słupkowy)
stosunek / interwał Histogram
Częstotliwość skumulowana
diagram
opis
tendencja Centralna
kategoryczna Nie dotyczy
porządkowa Mediana
tryb
stosunek / interwał Średnia
Mediana
Nie dotyczy
Ordinal Range
Inter-quartile range
stosunek / interwał zakres
zakres międzykwartylowy
wariancja
zmiana Standardowa

zapoznaj się z prezentacją graficzną, aby zapoznać się z opisami głównych technik graficznych.

średnia-średnia arytmetyczna, obliczana przez zsumowanie wszystkich wartości i podzielenie przez liczbę wartości w sumie.

Mediana-środkowy punkt rozkładu, w którym połowa wartości jest wyższa, a połowa niższa.

Mode – najczęściej występująca wartość.

Range – różnica pomiędzy najwyższą i najniższą wartością.

zakres Międzykwartylowy-różnica między górnym kwartylem (wartość, w której 25% obserwacji jest wyższe i 75% niższe) a dolnym kwartylem (wartość, w której 75% obserwacji jest wyższe i 25% niższe). Jest to szczególnie przydatne, gdy istnieje niewielka liczba ekstremalnych obserwacji znacznie wyższa lub niższa niż większość.

wariancja-miara rozrzutu, obliczana jako średnia kwadratowych różnic obserwacji od ich średniej.

odchylenie standardowe-pierwiastek kwadratowy wariancji.

różnice między grupami i zmiennymi

test Chi-kwadrat – używany do porównywania rozkładów dwóch lub więcej zestawów danych kategorycznych lub porządkowych.

t-testy – używane do porównywania środków z dwóch zestawów danych.

test U Wilcoxona-nieparametryczny odpowiednik testu T. W oparciu o kolejność Rang danych, może być również używany do porównywania medianów.

ANOVA-analiza wariancji, aby porównać środki więcej niż dwóch grup danych.

co chcesz zrobić? z jakim typem danych? odpowiednie techniki
Porównaj dwie grupy kategoryczne test Chi-kwadrat
porządkowy test Chi-kwadrat
Test Wicoxon U
stosunek / interwał t-test dla niezależnych próbek
Porównaj więcej niż dwie grupy kategoryczny / porządkowy test Chi-kwadrat
stosunek / interwał ANOVA
Porównaj dwie zmienne
w tym samym tematy
kategoryczne / porządkowe test Chi-kwadrat
stosunek / interwał t-test dla próbek zależnych od

relacje między zmiennymi

współczynnik korelacji mierzy stopień liniowego powiązania między dwiema zmiennymi, o wartości w zakresie od + 1 do -1. Wartości dodatnie wskazują, że dwie zmienne zwiększają się i zmniejszają razem; wartości ujemne, które jedna zwiększa się, gdy druga maleje. Współczynnik korelacji równy zeru oznacza brak liniowej zależności między dwiema zmiennymi. Korelacja rang Spearmana jest nieparametrycznym odpowiednikiem korelacji Pearsona.

jakiego rodzaju dane? odpowiednie techniki
kategoryczny test Chi-kwadrat
porządkowy test Chi-kwadrat
ranking Spearmana
korelacja (Tau)
stosunek / interwał korelacja (Rho)

zauważ, że analizy korelacji wykrywają tylko liniowe zależności między dwiema zmiennymi. Poniższy rysunek ilustruje dwa małe zbiory danych, w których wyraźnie istnieją relacje między dwiema zmiennymi. Jednak korelacja dla drugiego zbioru danych, gdzie zależność nie jest liniowa, wynosi 0,0. Prosta analiza korelacji tych danych sugerowałaby brak związku między środkami, gdy wyraźnie tak nie jest. Ilustruje to znaczenie przeprowadzenia szeregu podstawowych analiz opisowych przed rozpoczęciem analiz różnic i zależności między zmiennymi.

 Obraz: dwa małe zestawy danych, w których istnieją wyraźnie relacje między dwoma zmiennymi

Ważność testowania

poziomy istotności

istotność statystyczna testu jest miarą prawdopodobieństwa – prawdopodobieństwo, że uzyskałbyś ten konkretny wynik testu na tej próbce, jeśli hipoteza zerowa (że nie ma efektu ze względu na testowane parametry) testujesz była prawdziwa. Poniższy przykład sprawdza, czy wyniki na egzaminie zmieniają się po przejściu szkolenia przez kandydatów. Hipoteza sugeruje, że powinny, więc zerowa hyopoteza jest taka, że nie będą.

ogólnie, każdy poziom prawdopodobieństwa powyżej 5% (p>0,05) nie jest uważany za statystycznie istotny, a dla dużych badań 1% (p>0,01) jest często brany za bardziej odpowiedni poziom.

zauważ, że istotność statystyczna nie oznacza, że uzyskane wyniki rzeczywiście mają wartość w kontekście twoich badań. Jeśli masz wystarczająco dużą próbkę, bardzo mała różnica między grupami może być zidentyfikowana jako statystycznie istotna, ale taka mała różnica może być nieistotna w praktyce. Z drugiej strony, pozornie duża różnica może nie być statystycznie istotna w małej próbie, ze względu na różnice w porównywanych grupach.

stopnie swobody

niektóre statystyki testowe (np. chi-kwadrat) wymagają znajomości liczby stopni swobody w celu sprawdzenia istotności statystycznej na podstawie prawidłowej tabeli prawdopodobieństwa. W skrócie, stopnie swobody to liczba wartości, które mogą być przypisane arbitralnie w próbce.

na przykład:

w próbce o wielkości N podzielonej na klasy k występują k-1 stopnie swobody (pierwsze grupy k-1 mogą mieć dowolną wielkość do n, podczas gdy ostatnia jest ustalona przez sumę pierwszego k-1 i wartość N. w kategoriach liczbowych, jeśli próbka 500 osobników jest pobierana z Wielkiej Brytanii i obserwuje się, że 300 pochodzi z Anglii, 100 ze Szkocji i 50 z Walii, to musi być być 50 z Irlandii Północnej. Biorąc pod uwagę liczby z pierwszych trzech grup, nie ma elastyczności w wielkości grupy końcowej. Podział próbki na cztery grupy daje trzy stopnie swobody.

w dwukierunkowej tabeli awaryjnej z wierszami p i kolumnami q istnieją (p-1)*(q-1) stopnie swobody (biorąc pod uwagę wartości pierwszych wierszy i kolumn, ostatni wiersz i Kolumna są ograniczone sumami w tabeli)

testy jedno-lub dwu-ogonowe

jeśli, jak zwykle, liczy się po prostu to, że statystyki dla populacji są różne, to właściwe jest, aby aby użyć wartości krytycznych do testu na dwóch ogonach.

jeśli jednak jesteś zainteresowany tylko tym, aby dowiedzieć się, czy Statystyka dla populacji A ma większą wartość niż dla populacji B, wtedy odpowiedni byłby test z jednym ogonem. Wartość krytyczna dla testu z jednym ogonem jest na ogół niższa niż dla testu z dwoma ogonami i powinna być stosowana tylko wtedy, gdy hipoteza badawcza mówi, że populacja a ma większą wartość niż populacja B i nie ma znaczenia, jak różne są, jeśli populacja a ma wartość mniejszą niż populacja B.

na przykład

scenariusz 1

hipoteza zerowa – nie ma różnicy w średnich wynikach egzaminu przed i po treningu (tzn. trening nie ma wpływu na wynik egzaminu)
alternatywa – Istnieje różnica w średnich wynikach przed i po treningu (tzn. trening ma nieokreślony efekt)
użyj testu z dwoma ogonami

scenariusz 2

hipoteza zerowa-trening nie zwiększa średniego wyniku
alternatywa – średni wynik wzrasta po treningu
użyj testu jednego ogona, jeśli obserwuje się wzrost średniego wyniku.
(jeśli obserwuje się spadek wyników, nie ma potrzeby testowania, ponieważ nie można odrzucić hipotezy zerowej.)

Scenariusz 3

hipoteza zerowa – trening nie powoduje spadku średnich wyników
alternatywa-średni wynik spada po treningu
użyj testu jednego ogona, jeśli obserwuje się spadek średniego wyniku.
(jeśli obserwuje się wzrost wyników, nie ma potrzeby testowania, ponieważ nie można odrzucić hipotezy zerowej.)

t-Test: Sparowane dwie próbki dla środków
przed po
Średnia
wariancja

46,547

46,830

uwagi
stopnie swobody (df)
T Stat
p(t<=t) one-tail
T Critical one-tail
p(t<=t) dwuogonowy
T Critical two-tail

jeśli powyższe wyniki testu zostały uzyskane, to w scenariuszu 1, przy użyciu testu z dwoma ogonami, można stwierdzić, że nie było statystycznie istotnej różnicy między wynikami (p=0,08), A w konsekwencji, że trening nie przyniósł żadnego efektu. Podobnie, w scenariuszu 3, można stwierdzić, że nie ma dowodów sugerujących, że trening powoduje spadek średnich wyników, ponieważ w rzeczywistości wzrosły. Jednak w scenariuszu 2, stosując test z jednym ogonem, można stwierdzić, że nastąpił wzrost średnich wyników, statystycznie istotny na poziomie 5% (p=0,04).

ostatnie ostrzeżenie!

Pakiety statystyczne zrobią to, co im powiesz, ogólnie. Nie wiedzą, czy podane przez Ciebie dane są dobrej jakości, czy też (z nielicznymi wyjątkami) czy są one odpowiedniego typu dla przeprowadzonej przez Ciebie analizy.

śmieci w = śmieci na zewnątrz!

zaawansowane techniki

te narzędzia i techniki mają specjalistyczne zastosowania i na ogół zostaną zaprojektowane do metodologii badań na wczesnym etapie, zanim zostaną zebrane jakiekolwiek dane. Jeśli rozważasz użycie któregokolwiek z nich, możesz skonsultować się ze specjalistycznym tekstem lub doświadczonym statystykiem przed rozpoczęciem.

w każdym przypadku podajemy kilka przykładów Szmaragdowych artykułów, które wykorzystują tę technikę.

Analiza czynnikowa

w celu zmniejszenia liczby zmiennych do późniejszej analizy poprzez utworzenie kombinacji zmierzonych zmiennych pierwotnych, które odpowiadają za jak najwięcej pierwotnej wariancji, ale pozwalają na łatwiejszą interpretację wyników. Powszechnie używany do tworzenia małego zestawu ocen wymiarowych z dużej liczby opinii indywidualnie ocenianych na skalach Likerta. Musisz mieć więcej obserwacji (przedmiotów) niż zmiennych do analizy.

na przykład

zmienna skali Likerta: „Lubię jeść lody czekoladowe na śniadanie”

zdecydowanie zgadzam się

zdecydowanie się nie zgadzam

a factor analysis of Page and Wong ’ s servant leadership instrument
Rob Dennis and Bruce E. Winston
Leadership & Organization Development Journal , vol. 24 no. 8

zrozumienie czynników dla przyjęcia benchmarkingu: nowe dowody z Malezji
Yean Pin Lee, Suhaiza Zailani i Keng Lin Soh
Analiza porównawcza: An International Journal, vol. 13 no. 5

Analiza klastrów

w celu sklasyfikowania badanych w grupy o podobnych cechach, zgodnie z wartościami mierzonych zmiennych. Musisz mieć więcej obserwacji niż zmiennych zawartych w analizie.

unikanie produktów ekologicznych: przyczyny odrzucenia i identyfikacja potencjalnych nabywców w ogólnopolskim badaniu
C. Fotopoulos i A. Krystallis
British Food Journal, vol. 104 nr 3/4/5

wykrywanie trudności finansowych za pomocą wielowymiarowej analizy statystycznej
S. Gamesalingam i Kuldeep Kumar
27 no. 4

Analiza dyskryminacyjna

w celu zidentyfikowania tych zmiennych, które najlepiej rozróżniają znane grupy badanych. Wyniki mogą być wykorzystane do przydzielenia nowych podmiotów do znanych grup na podstawie ich wartości zmiennych dyskryminujących

wykrywanie trudności finansowych za pomocą wielowymiarowej analizy statystycznej
S. Gamesalingam and Kuldeep Kumar
Managerial Finance, vol. 27 nr 4

: New evidence from Malaysia
Yean Pin Lee, Suhaiza Zailani and Keng Lin Soh
Benchmarking: an International Journal , vol. 13 no. 5

Metodologia

Analiza dyskryminacyjna została wykorzystana do określenia, czy istnieją statystycznie istotne różnice między średnim profilem punktacji na zestawie zmiennych dla dwóch grup zdefiniowanych a priori i w ten sposób umożliwiła ich klasyfikację. Poza tym może pomóc w ustaleniu, która z niezależnych zmiennych odpowiada najbardziej za różnice w średnich profilach punktacji w obu grupach. W tym badaniu Analiza dyskryminacyjna była głównym instrumentem klasyfikacji podmiotu przyjmującego i podmiotu nie przyjmującego. Wykorzystano go również do określenia, które ze zmiennych niezależnych przyczyniłyby się do przyjęcia analizy porównawczej.

regresja

do modelowania zachowania jednej, zależnej, zmiennej w zależności od wartości zestawu innych, niezależnych, zmiennych. Zmienna zależna musi być interwałem lub stosunkiem w typie; zmienne niezależne mogą być dowolnego typu, ale należy stosować specjalne metody, gdy włącza się do analizy zmienne niezależne kategoryczne lub porządkowe.

rozwój marketingu mleka w Anglii i Walii w latach 90.
Jeremy Franks
British Food Journal, vol. 103 no. 9

Training under fire: the relationship between obstacles faceing training and SMEs ’ development in Palestine
Mohammed Al Madhoun
Journal of European Industrial Training, vol. 30 no. 2

analiza szeregów czasowych

w celu zbadania wzorców i trendów w zmiennej mierzonej regularnie w danym okresie czasu. Mogą być również wykorzystywane do identyfikacji i korekty zmian sezonowych, na przykład w statystyce finansowej.

An analysis of the trends and cyclical behaviours of house prices in the Asian markets
Ming-Chi Chen, Yuichiro Kawaguchi and Kanak Patel
Journal of Property Investment & Finance, vol. 22 no. 1

prezentacja graficzna

Prezentacja danych w formie graficznej może zwiększyć dostępność wyników dla nietechnicznych odbiorców i wyróżnić efekty i wyniki, które w przeciwnym razie wymagałyby długich wyjaśnień lub złożonych tabel. Dlatego ważne jest stosowanie odpowiednich technik graficznych. Ta sekcja zawiera przykłady niektórych z najczęściej używanych prezentacji graficznych i wskazuje, kiedy mogą być używane. Wszystkie, z wyjątkiem histogramu, zostały wyprodukowane przy użyciu programu Microsoft Excel®.

wykresy kolumnowe lub słupkowe

istnieją cztery główne warianty, a wyświetlanie danych w poziomych lub pionowych kolumnach jest w dużej mierze kwestią osobistych preferencji.

Histogram

w celu zilustrowania rozkładu częstotliwości w danych kategorycznych lub porządkowych lub pogrupowanych danych stosunek/interwał. Zwykle wyświetlany jako wykres kolumnowy.

 Obraz: Histogram

Klastrowana kolumna / Pasek

aby porównać dane kategoryczne, porządkowe lub zgrupowane stosunek / interwał w różnych kategoriach. Dane użyte na fig. 4 są takie same jak dane na fig.5 i 6.

Obraz: Klastrowana kolumna/Pasek

ułożona Kolumna/Pasek

aby zilustrować rzeczywisty wkład w sumę dla danych kategorycznych, porządkowych lub zgrupowanych współczynników/interwałów według kategorii. Dane użyte na Fig. 5 są takie same jak dane na fig.4 i 6.

 Obraz: Stacked column / bar

procent stacked column/bar

aby porównać procentowy udział w sumie dla danych kategorycznych, porządkowych lub zgrupowanych stosunek/interwał w różnych kategoriach. Dane użyte na fig. 6 są takie same jak dane na fig.4 i 5.

Obraz: procent ułożonych kolumn/słupków

wykresy liniowe

, aby pokazać trendy w danych porządkowych lub proporcjach/interwałach. Punkty na wykresie powinny być połączone linią tylko wtedy, gdy dane na osi x są co najmniej porządkowe. Jednym ze szczególnych zastosowań jest wykreślenie rozkładu częstotliwości dla danych interwał/stosunek (ryc. 8).

Obraz: wykresy liniowe

wykresy kołowe

aby pokazać procentowy udział w całości danych kategorycznych, porządkowych lub zgrupowanych stosunek/interwał.

Obraz: Wykres kołowy

wykresy punktowe

aby zilustrować zależność między dwiema zmiennymi dowolnego typu (chociaż najbardziej przydatne, gdy obie zmienne są stosunkiem/interwałem w typie). Przydatne również w identyfikacji wszelkich nietypowych obserwacji w danych.

 Obraz: Wykres punktowy

Wykres Box and whisker

specjalistyczny wykres ilustrujący centralną tendencję i rozprzestrzenianie się dużego zbioru danych, w tym wszelkich wartości odstających.

Obraz: Box and whisker plot

zasoby

łączenie matematyki
krótkie wyjaśnienia terminów i idei matematycznych

Słownik Statystyczny
opracowany przez Valerie J. Easton i Johna H. Mccolla z Uniwersytetu w Glasgow

Statsoft Electronic textbook

100 testów statystycznych Gopala K. Kanji
(Sage, 1993, ISBN 141292376x)

Oxford Dictionary of Statistics by Graham Upton and Ian Cook
(Oxford University Press, 2006, ISBN 0198614314)

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.