- podstawy
- co chcesz wiedzieć?
- jakie masz dane?
- jakie założenia można – a nie można-zrobić?
- techniki rozkładu nienormalnego
- Statystyka parametryczna czy nieparametryczna?
- centralne twierdzenie graniczne
- ile możesz oczekiwać, aby uzyskać z danych?
- podstawowe techniki
- opisywanie Twoich danych
- różnice między grupami i zmiennymi
- relacje między zmiennymi
- Ważność testowania
- poziomy istotności
- stopnie swobody
- na przykład:
- testy jedno-lub dwu-ogonowe
- na przykład
- ostatnie ostrzeżenie!
- zaawansowane techniki
- Analiza czynnikowa
- na przykład
- Analiza klastrów
- Analiza dyskryminacyjna
- regresja
- analiza szeregów czasowych
- prezentacja graficzna
- wykresy kolumnowe lub słupkowe
- Histogram
- Klastrowana kolumna / Pasek
- ułożona Kolumna/Pasek
- procent stacked column/bar
- wykresy liniowe
- wykresy kołowe
- wykresy punktowe
- Wykres Box and whisker
- zasoby
podstawy
zanim zbierzesz jakiekolwiek dane, zacznij myśleć o technikach, których użyjesz do analizy.
co chcesz wiedzieć?
analiza musi odnosić się do pytań badawczych, a to może dyktować techniki, których powinieneś użyć.
jakie masz dane?
Typ posiadanych danych jest również fundamentalny – techniki i narzędzia odpowiednie dla zmiennych interwałowych i proporcyjnych nie nadają się do miar kategorycznych lub porządkowych. (Zobacz jak zbierać dane dla uwag na temat typów danych)
jakie założenia można – a nie można-zrobić?
wiele technik polega na tym, że rozkład próbkowania statystyki badania jest rozkładem normalnym (patrz poniżej). Dzieje się tak zawsze, gdy podstawowy rozkład danych jest normalny, ale w praktyce dane mogą nie być normalnie rozpowszechniane. Na przykład może istnieć długi ogon odpowiedzi na jedną lub drugą stronę (Przekrzywione dane). Techniki nieparametryczne są dostępne do wykorzystania w takich sytuacjach, ale są one nieuchronnie mniej wydajne i mniej elastyczne. Jeśli jednak wielkość próby jest wystarczająco duża, centralne twierdzenie graniczne pozwala na zastosowanie standardowych analiz i narzędzi.
techniki rozkładu nienormalnego
Statystyka parametryczna czy nieparametryczna?
metody parametryczne i statystyka opierają się na zestawie założeń dotyczących podstawowego rozkładu, aby dać prawidłowe wyniki. Ogólnie rzecz biorąc, wymagają one, aby zmienne miały rozkład normalny.
techniki nieparametryczne muszą być stosowane dla danych kategorycznych i porządkowych, ale dla danych dotyczących proporcji interwałów & są one na ogół mniej wydajne i mniej elastyczne i powinny być stosowane tylko wtedy, gdy standardowy, parametryczny test nie jest odpowiedni-np. gdy wielkość próby jest mała (poniżej 30 obserwacji).
centralne twierdzenie graniczne
wraz ze wzrostem wielkości próby kształt rozkładu próbkowania statystyki badania ma tendencję do normalności, nawet jeśli rozkład zmiennej, która jest badana, nie jest normalny.
w praktyce można to zastosować do statystyk badań obliczonych na podstawie ponad 30 obserwacji.
ile możesz oczekiwać, aby uzyskać z danych?
im mniejszy rozmiar próbki, tym mniej można uzyskać z danych. Błąd standardowy jest odwrotnie związany z wielkością próbki, więc im większa próbka, tym mniejszy błąd standardowy i tym większa szansa na zidentyfikowanie statystycznie istotnych wyników w analizie.
podstawowe techniki
ogólnie rzecz biorąc, każda technika, która może być użyta na danych kategorycznych, może być również użyta na danych porządkowych. Każda technika, która może być stosowana na danych porządkowych, może być również stosowana na danych dotyczących proporcji lub interwałów. Odwrotnie nie jest.
opisywanie Twoich danych
pierwszym etapem każdej analizy powinno być opisanie Twoich danych, a tym samym populacji, z której są one czerpane. Statystyki odpowiednie dla tego działania dzielą się na trzy szerokie grupy i zależą od rodzaju posiadanych danych.
co chcesz zrobić? | z jakim typem danych? | odpowiednie techniki |
---|---|---|
spójrz na rozkład | kategoryczny / porządkowy | narysuj procent w każdej kategorii (wykres kolumnowy lub słupkowy) |
stosunek / interwał | Histogram Częstotliwość skumulowana diagram |
|
opis tendencja Centralna |
kategoryczna | Nie dotyczy |
porządkowa | Mediana tryb |
|
stosunek / interwał | Średnia Mediana |
|
Nie dotyczy | ||
Ordinal | Range Inter-quartile range |
|
stosunek / interwał | zakres zakres międzykwartylowy wariancja zmiana Standardowa |
zapoznaj się z prezentacją graficzną, aby zapoznać się z opisami głównych technik graficznych.
średnia-średnia arytmetyczna, obliczana przez zsumowanie wszystkich wartości i podzielenie przez liczbę wartości w sumie.
Mediana-środkowy punkt rozkładu, w którym połowa wartości jest wyższa, a połowa niższa.
Mode – najczęściej występująca wartość.
Range – różnica pomiędzy najwyższą i najniższą wartością.
zakres Międzykwartylowy-różnica między górnym kwartylem (wartość, w której 25% obserwacji jest wyższe i 75% niższe) a dolnym kwartylem (wartość, w której 75% obserwacji jest wyższe i 25% niższe). Jest to szczególnie przydatne, gdy istnieje niewielka liczba ekstremalnych obserwacji znacznie wyższa lub niższa niż większość.
wariancja-miara rozrzutu, obliczana jako średnia kwadratowych różnic obserwacji od ich średniej.
odchylenie standardowe-pierwiastek kwadratowy wariancji.
różnice między grupami i zmiennymi
test Chi-kwadrat – używany do porównywania rozkładów dwóch lub więcej zestawów danych kategorycznych lub porządkowych.
t-testy – używane do porównywania środków z dwóch zestawów danych.
test U Wilcoxona-nieparametryczny odpowiednik testu T. W oparciu o kolejność Rang danych, może być również używany do porównywania medianów.
ANOVA-analiza wariancji, aby porównać środki więcej niż dwóch grup danych.
co chcesz zrobić? | z jakim typem danych? | odpowiednie techniki |
---|---|---|
Porównaj dwie grupy | kategoryczne | test Chi-kwadrat |
porządkowy | test Chi-kwadrat Test Wicoxon U |
|
stosunek / interwał | t-test dla niezależnych próbek | |
Porównaj więcej niż dwie grupy | kategoryczny / porządkowy | test Chi-kwadrat |
stosunek / interwał | ANOVA | |
Porównaj dwie zmienne w tym samym tematy |
kategoryczne / porządkowe | test Chi-kwadrat |
stosunek / interwał | t-test dla próbek zależnych od |
relacje między zmiennymi
współczynnik korelacji mierzy stopień liniowego powiązania między dwiema zmiennymi, o wartości w zakresie od + 1 do -1. Wartości dodatnie wskazują, że dwie zmienne zwiększają się i zmniejszają razem; wartości ujemne, które jedna zwiększa się, gdy druga maleje. Współczynnik korelacji równy zeru oznacza brak liniowej zależności między dwiema zmiennymi. Korelacja rang Spearmana jest nieparametrycznym odpowiednikiem korelacji Pearsona.
jakiego rodzaju dane? | odpowiednie techniki |
---|---|
kategoryczny | test Chi-kwadrat |
porządkowy | test Chi-kwadrat ranking Spearmana korelacja (Tau) |
stosunek / interwał | korelacja (Rho) |
zauważ, że analizy korelacji wykrywają tylko liniowe zależności między dwiema zmiennymi. Poniższy rysunek ilustruje dwa małe zbiory danych, w których wyraźnie istnieją relacje między dwiema zmiennymi. Jednak korelacja dla drugiego zbioru danych, gdzie zależność nie jest liniowa, wynosi 0,0. Prosta analiza korelacji tych danych sugerowałaby brak związku między środkami, gdy wyraźnie tak nie jest. Ilustruje to znaczenie przeprowadzenia szeregu podstawowych analiz opisowych przed rozpoczęciem analiz różnic i zależności między zmiennymi.
Ważność testowania
poziomy istotności
istotność statystyczna testu jest miarą prawdopodobieństwa – prawdopodobieństwo, że uzyskałbyś ten konkretny wynik testu na tej próbce, jeśli hipoteza zerowa (że nie ma efektu ze względu na testowane parametry) testujesz była prawdziwa. Poniższy przykład sprawdza, czy wyniki na egzaminie zmieniają się po przejściu szkolenia przez kandydatów. Hipoteza sugeruje, że powinny, więc zerowa hyopoteza jest taka, że nie będą.
ogólnie, każdy poziom prawdopodobieństwa powyżej 5% (p>0,05) nie jest uważany za statystycznie istotny, a dla dużych badań 1% (p>0,01) jest często brany za bardziej odpowiedni poziom.
zauważ, że istotność statystyczna nie oznacza, że uzyskane wyniki rzeczywiście mają wartość w kontekście twoich badań. Jeśli masz wystarczająco dużą próbkę, bardzo mała różnica między grupami może być zidentyfikowana jako statystycznie istotna, ale taka mała różnica może być nieistotna w praktyce. Z drugiej strony, pozornie duża różnica może nie być statystycznie istotna w małej próbie, ze względu na różnice w porównywanych grupach.
stopnie swobody
niektóre statystyki testowe (np. chi-kwadrat) wymagają znajomości liczby stopni swobody w celu sprawdzenia istotności statystycznej na podstawie prawidłowej tabeli prawdopodobieństwa. W skrócie, stopnie swobody to liczba wartości, które mogą być przypisane arbitralnie w próbce.
na przykład:
w próbce o wielkości N podzielonej na klasy k występują k-1 stopnie swobody (pierwsze grupy k-1 mogą mieć dowolną wielkość do n, podczas gdy ostatnia jest ustalona przez sumę pierwszego k-1 i wartość N. w kategoriach liczbowych, jeśli próbka 500 osobników jest pobierana z Wielkiej Brytanii i obserwuje się, że 300 pochodzi z Anglii, 100 ze Szkocji i 50 z Walii, to musi być być 50 z Irlandii Północnej. Biorąc pod uwagę liczby z pierwszych trzech grup, nie ma elastyczności w wielkości grupy końcowej. Podział próbki na cztery grupy daje trzy stopnie swobody.
w dwukierunkowej tabeli awaryjnej z wierszami p i kolumnami q istnieją (p-1)*(q-1) stopnie swobody (biorąc pod uwagę wartości pierwszych wierszy i kolumn, ostatni wiersz i Kolumna są ograniczone sumami w tabeli)
testy jedno-lub dwu-ogonowe
jeśli, jak zwykle, liczy się po prostu to, że statystyki dla populacji są różne, to właściwe jest, aby aby użyć wartości krytycznych do testu na dwóch ogonach.
jeśli jednak jesteś zainteresowany tylko tym, aby dowiedzieć się, czy Statystyka dla populacji A ma większą wartość niż dla populacji B, wtedy odpowiedni byłby test z jednym ogonem. Wartość krytyczna dla testu z jednym ogonem jest na ogół niższa niż dla testu z dwoma ogonami i powinna być stosowana tylko wtedy, gdy hipoteza badawcza mówi, że populacja a ma większą wartość niż populacja B i nie ma znaczenia, jak różne są, jeśli populacja a ma wartość mniejszą niż populacja B.
na przykład
scenariusz 1
hipoteza zerowa – nie ma różnicy w średnich wynikach egzaminu przed i po treningu (tzn. trening nie ma wpływu na wynik egzaminu)
alternatywa – Istnieje różnica w średnich wynikach przed i po treningu (tzn. trening ma nieokreślony efekt)
użyj testu z dwoma ogonami
scenariusz 2
hipoteza zerowa-trening nie zwiększa średniego wyniku
alternatywa – średni wynik wzrasta po treningu
użyj testu jednego ogona, jeśli obserwuje się wzrost średniego wyniku.
(jeśli obserwuje się spadek wyników, nie ma potrzeby testowania, ponieważ nie można odrzucić hipotezy zerowej.)
Scenariusz 3
hipoteza zerowa – trening nie powoduje spadku średnich wyników
alternatywa-średni wynik spada po treningu
użyj testu jednego ogona, jeśli obserwuje się spadek średniego wyniku.
(jeśli obserwuje się wzrost wyników, nie ma potrzeby testowania, ponieważ nie można odrzucić hipotezy zerowej.)
przed | po | |
Średnia | ||
wariancja |
46,547 |
46,830 |
uwagi | ||
stopnie swobody (df) | ||
T Stat | ||
p(t<=t) one-tail | ||
T Critical one-tail | ||
p(t<=t) dwuogonowy | ||
T Critical two-tail |
jeśli powyższe wyniki testu zostały uzyskane, to w scenariuszu 1, przy użyciu testu z dwoma ogonami, można stwierdzić, że nie było statystycznie istotnej różnicy między wynikami (p=0,08), A w konsekwencji, że trening nie przyniósł żadnego efektu. Podobnie, w scenariuszu 3, można stwierdzić, że nie ma dowodów sugerujących, że trening powoduje spadek średnich wyników, ponieważ w rzeczywistości wzrosły. Jednak w scenariuszu 2, stosując test z jednym ogonem, można stwierdzić, że nastąpił wzrost średnich wyników, statystycznie istotny na poziomie 5% (p=0,04).
ostatnie ostrzeżenie!
Pakiety statystyczne zrobią to, co im powiesz, ogólnie. Nie wiedzą, czy podane przez Ciebie dane są dobrej jakości, czy też (z nielicznymi wyjątkami) czy są one odpowiedniego typu dla przeprowadzonej przez Ciebie analizy.
śmieci w = śmieci na zewnątrz!
zaawansowane techniki
te narzędzia i techniki mają specjalistyczne zastosowania i na ogół zostaną zaprojektowane do metodologii badań na wczesnym etapie, zanim zostaną zebrane jakiekolwiek dane. Jeśli rozważasz użycie któregokolwiek z nich, możesz skonsultować się ze specjalistycznym tekstem lub doświadczonym statystykiem przed rozpoczęciem.
w każdym przypadku podajemy kilka przykładów Szmaragdowych artykułów, które wykorzystują tę technikę.
Analiza czynnikowa
w celu zmniejszenia liczby zmiennych do późniejszej analizy poprzez utworzenie kombinacji zmierzonych zmiennych pierwotnych, które odpowiadają za jak najwięcej pierwotnej wariancji, ale pozwalają na łatwiejszą interpretację wyników. Powszechnie używany do tworzenia małego zestawu ocen wymiarowych z dużej liczby opinii indywidualnie ocenianych na skalach Likerta. Musisz mieć więcej obserwacji (przedmiotów) niż zmiennych do analizy.
na przykład
zmienna skali Likerta: „Lubię jeść lody czekoladowe na śniadanie”
zdecydowanie zgadzam się |
zdecydowanie się nie zgadzam |
a factor analysis of Page and Wong ’ s servant leadership instrument
Rob Dennis and Bruce E. Winston
Leadership & Organization Development Journal , vol. 24 no. 8
zrozumienie czynników dla przyjęcia benchmarkingu: nowe dowody z Malezji
Yean Pin Lee, Suhaiza Zailani i Keng Lin Soh
Analiza porównawcza: An International Journal, vol. 13 no. 5
Analiza klastrów
w celu sklasyfikowania badanych w grupy o podobnych cechach, zgodnie z wartościami mierzonych zmiennych. Musisz mieć więcej obserwacji niż zmiennych zawartych w analizie.
unikanie produktów ekologicznych: przyczyny odrzucenia i identyfikacja potencjalnych nabywców w ogólnopolskim badaniu
C. Fotopoulos i A. Krystallis
British Food Journal, vol. 104 nr 3/4/5
wykrywanie trudności finansowych za pomocą wielowymiarowej analizy statystycznej
S. Gamesalingam i Kuldeep Kumar
27 no. 4
Analiza dyskryminacyjna
w celu zidentyfikowania tych zmiennych, które najlepiej rozróżniają znane grupy badanych. Wyniki mogą być wykorzystane do przydzielenia nowych podmiotów do znanych grup na podstawie ich wartości zmiennych dyskryminujących
wykrywanie trudności finansowych za pomocą wielowymiarowej analizy statystycznej
S. Gamesalingam and Kuldeep Kumar
Managerial Finance, vol. 27 nr 4
: New evidence from Malaysia
Yean Pin Lee, Suhaiza Zailani and Keng Lin Soh
Benchmarking: an International Journal , vol. 13 no. 5
Metodologia
Analiza dyskryminacyjna została wykorzystana do określenia, czy istnieją statystycznie istotne różnice między średnim profilem punktacji na zestawie zmiennych dla dwóch grup zdefiniowanych a priori i w ten sposób umożliwiła ich klasyfikację. Poza tym może pomóc w ustaleniu, która z niezależnych zmiennych odpowiada najbardziej za różnice w średnich profilach punktacji w obu grupach. W tym badaniu Analiza dyskryminacyjna była głównym instrumentem klasyfikacji podmiotu przyjmującego i podmiotu nie przyjmującego. Wykorzystano go również do określenia, które ze zmiennych niezależnych przyczyniłyby się do przyjęcia analizy porównawczej.
regresja
do modelowania zachowania jednej, zależnej, zmiennej w zależności od wartości zestawu innych, niezależnych, zmiennych. Zmienna zależna musi być interwałem lub stosunkiem w typie; zmienne niezależne mogą być dowolnego typu, ale należy stosować specjalne metody, gdy włącza się do analizy zmienne niezależne kategoryczne lub porządkowe.
rozwój marketingu mleka w Anglii i Walii w latach 90.
Jeremy Franks
British Food Journal, vol. 103 no. 9
Training under fire: the relationship between obstacles faceing training and SMEs ’ development in Palestine
Mohammed Al Madhoun
Journal of European Industrial Training, vol. 30 no. 2
analiza szeregów czasowych
w celu zbadania wzorców i trendów w zmiennej mierzonej regularnie w danym okresie czasu. Mogą być również wykorzystywane do identyfikacji i korekty zmian sezonowych, na przykład w statystyce finansowej.
An analysis of the trends and cyclical behaviours of house prices in the Asian markets
Ming-Chi Chen, Yuichiro Kawaguchi and Kanak Patel
Journal of Property Investment & Finance, vol. 22 no. 1
prezentacja graficzna
Prezentacja danych w formie graficznej może zwiększyć dostępność wyników dla nietechnicznych odbiorców i wyróżnić efekty i wyniki, które w przeciwnym razie wymagałyby długich wyjaśnień lub złożonych tabel. Dlatego ważne jest stosowanie odpowiednich technik graficznych. Ta sekcja zawiera przykłady niektórych z najczęściej używanych prezentacji graficznych i wskazuje, kiedy mogą być używane. Wszystkie, z wyjątkiem histogramu, zostały wyprodukowane przy użyciu programu Microsoft Excel®.
wykresy kolumnowe lub słupkowe
istnieją cztery główne warianty, a wyświetlanie danych w poziomych lub pionowych kolumnach jest w dużej mierze kwestią osobistych preferencji.
Histogram
w celu zilustrowania rozkładu częstotliwości w danych kategorycznych lub porządkowych lub pogrupowanych danych stosunek/interwał. Zwykle wyświetlany jako wykres kolumnowy.
Klastrowana kolumna / Pasek
aby porównać dane kategoryczne, porządkowe lub zgrupowane stosunek / interwał w różnych kategoriach. Dane użyte na fig. 4 są takie same jak dane na fig.5 i 6.
ułożona Kolumna/Pasek
aby zilustrować rzeczywisty wkład w sumę dla danych kategorycznych, porządkowych lub zgrupowanych współczynników/interwałów według kategorii. Dane użyte na Fig. 5 są takie same jak dane na fig.4 i 6.
procent stacked column/bar
aby porównać procentowy udział w sumie dla danych kategorycznych, porządkowych lub zgrupowanych stosunek/interwał w różnych kategoriach. Dane użyte na fig. 6 są takie same jak dane na fig.4 i 5.
wykresy liniowe
, aby pokazać trendy w danych porządkowych lub proporcjach/interwałach. Punkty na wykresie powinny być połączone linią tylko wtedy, gdy dane na osi x są co najmniej porządkowe. Jednym ze szczególnych zastosowań jest wykreślenie rozkładu częstotliwości dla danych interwał/stosunek (ryc. 8).
wykresy kołowe
aby pokazać procentowy udział w całości danych kategorycznych, porządkowych lub zgrupowanych stosunek/interwał.
wykresy punktowe
aby zilustrować zależność między dwiema zmiennymi dowolnego typu (chociaż najbardziej przydatne, gdy obie zmienne są stosunkiem/interwałem w typie). Przydatne również w identyfikacji wszelkich nietypowych obserwacji w danych.
Wykres Box and whisker
specjalistyczny wykres ilustrujący centralną tendencję i rozprzestrzenianie się dużego zbioru danych, w tym wszelkich wartości odstających.
zasoby
łączenie matematyki
krótkie wyjaśnienia terminów i idei matematycznych
Słownik Statystyczny
opracowany przez Valerie J. Easton i Johna H. Mccolla z Uniwersytetu w Glasgow
Statsoft Electronic textbook
100 testów statystycznych Gopala K. Kanji
(Sage, 1993, ISBN 141292376x)
Oxford Dictionary of Statistics by Graham Upton and Ian Cook
(Oxford University Press, 2006, ISBN 0198614314)