..適切な統計手法を選択する

ファンダメンタルズ

データを収集する前に、分析に使用する手法について考え始めます。

何が知りたいですか?

分析は研究の質問に関連しなければならず、これはあなたが使用すべき技術を指示するかもしれません。

どのような種類のデータがありますか?

あなたが持っているデータのタイプも基本的です–区間変数と比率変数に適した手法とツールは、カテゴリまたは順序メジャーには適していません。 (データの種類に関する注意事項については、データの収集方法を参照してください)

あなたはどのような仮定をすることができますか?

多くの手法は、検定統計量の標本化分布が正規分布であることに依存しています(下記参照)。 これは、データの基礎となる分布が正常である場合に常に当てはまりますが、実際には、データが正常に分布していない可能性があります。 たとえば、一方の側または他方の側(歪んだデータ)への応答の長い尾が存在する可能性があります。 ノンパラメトリック手法は、このような状況で使用することが可能ですが、これらは必然的にあまり強力ではなく、柔軟性がありません。 しかし、サンプルサイズが十分に大きい場合、中心極限定理は標準的な分析とツールを使用することを可能にします。

非正規分布のテクニック

パラメトリックまたはノンパラメトリック統計?

パラメトリック手法と統計は、有効な結果を得るために、基礎となる分布に関する一連の仮定に依存します。 一般に、それらは変数が正規分布を持つことを必要とします。

ノンパラメトリック手法は、カテゴリデータと順序データに使用する必要がありますが、区間&比データでは、一般的には強力ではなく、柔軟性が低く、標準、パラメトリック、検定が適切でない場合(サンプルサイズが小さい場合(30個の観測値以下))にのみ使用する必要があります。

中心極限定理

標本サイズが大きくなるにつれて、検定される変数の分布が正規でなくても、検定統計量の標本分布の形状が正規になる傾向があ

実際には、これは30以上の観測値から計算された検定統計に適用できます。画像:正規分布関数

データからどれくらいの量を得ることができますか?

サンプルサイズが小さいほど、データから抜け出すことができません。 標準誤差は標本サイズに反比例するため、標本が大きいほど標準誤差が小さくなり、分析で統計的に有意な結果を特定する可能性が高くなります。

基本的な技術

一般に、カテゴリデータに使用できる任意の技術は、順序データにも使用できます。 順序データに使用することができる任意の技術は、比または区間データにも使用することができる。 逆はそうではありません。

データを記述する

分析の最初の段階は、データを記述することであり、それが描画される母集団を記述することでなければなりません。 このアクティビティに適した統計は、3つの広範なグループに分類され、使用しているデータの種類によって異なります。

何がしたいんだ? どのようなタイプのデータですか?
分布を見てください カテゴリ/序数 各カテゴリ
のパーセンテージ
をプロットします(縦棒グラフまたは棒グラフ)
比率/間隔 ヒストグラム
累積頻度

中心傾向
カテゴリ n/aを記述します
序数 中央値
モード
比率/間隔 平均
中央値
スプレッドを記述する カテゴリ n/a
序数 範囲
四分位数間の範囲
比率/間隔 範囲
四分位間範囲
分散
標準変動

主なグラフィカル手法の説明については、グラフィカルな表示を参照してください。

Mean–すべての値を合計し、合計の値の数で除算することによって計算される算術平均。

中央値–分布の中間点で、値の半分が高く、半分が低くなります。

Mode–最も頻繁に発生する値。

Range–最高値と最低値の差。

Inter-quartile range–上の四分位数(観測値の25%が高く、75%が低い値)と下の四分位数(観測値の75%が高く、25%が低い値)の差。 これは、大多数よりもはるかに高い、または低い極端な観測の数が少ない場合に特に便利です。

分散–平均からの観測値の二乗差の平均として計算される広がりの尺度。

標準偏差-分散の平方根。

グループと変数の差

カイ二乗検定-カテゴリデータまたは順序データの2つ以上のセットの分布を比較するために使用されます。

t検定-2組のデータの平均を比較するために使用されます。

Wilcoxon U検定–t検定のノンパラメトリックに相当します。 データのランク順に基づいて、中央値を比較するために使用することもできます。

ANOVA–2つ以上のデータグループの平均を比較する分散分析。

何がしたいんだ? どのようなタイプのデータですか?
二つのグループを比較する カテゴリ カイ二乗検定
序数 カイ二乗検定
ウィコクソンU検定
比率/間隔
独立サンプルのt検定
2つ以上のグループを比較する カテゴリ/順序 カイ二乗検定
比率/間隔 ANOVA
同じ上の二つの変数
を比較します サブジェクト
カテゴリ/順序 カイ二乗検定
比率/間隔
従属サンプルのt検定

変数間の関係

相関係数は、+1から-1の範囲の値を持つ2つの変数間の線形結合の程度を測定します。 正の値は、二つの変数が一緒に増加し、減少することを示し、負の値は、他の変数が減少するにつれて増加することを示します。 相関係数がゼロの場合、2つの変数の間に線形関係がないことを示します。 スピアマンランク相関は、ピアソン相関のノンパラメトリック等価です。

どのようなタイプのデータですか?
カテゴリ カイ二乗検定
序数 カイ二乗検定
スピアマンランク
相関(タウ)
比率/間隔 ピアソン
相関(Rho)

相関分析では、2つの変数間の線形関係のみが検出されることに注意してください。 下の図は、2つの変数の間に明確な関係がある2つの小さなデータセットを示しています。 ただし、関係が線形でない2番目のデータセットの相関は0.0です。 これらのデータの単純な相関分析は、明らかにそうでない場合には、メジャー間の関係を示唆していないであろう。 これは、変数間の違いと関係の分析に着手する前に、一連の基本的な記述分析を行うことの重要性を示しています。

画像: 二つの変数の間に明確な関係がある二つの小さなデータセット

検定の妥当性

有意水準

検定の統計的有意性は確率の尺度であり、検定する帰無仮説(検定されるパラメータのために効果がないという)が真であった場合に、そのサンプルに対する検定の特定の結果を得た確率である。 次の例では、受験者がトレーニングを受けた後に試験のスコアが変化するかどうかをテストします。 一般に、5%を超える確率のレベル(p>0.05)は統計的に有意であるとはみなされず、大規模な調査では1%(p>0.01)がより適切なレベルと見なされることが多い。

統計的有意性は、あなたが得た結果が実際にあなたの研究の文脈で価値を持っていることを意味するものではないことに注意してください。 十分な大きさのサンプルがある場合、グループ間の非常に小さな差は統計的に有意であると識別できますが、そのような小さな差は実際には無関係 一方、明らかに大きな差は、比較されるグループ内の変動のために、小さなサンプルでは統計的に有意ではない可能性がある。

自由度

いくつかの検定統計(カイ二乗など)では、正しい確率表に対する統計的有意性を検定するために、自由度の数を知る必要があります。 簡単に言えば、自由度は、サンプル内で任意に割り当てることができる値の数です。

例えば、

サイズnをkクラスに分割したサンプルでは、k-1自由度があります(最初のk-1グループはnまでの任意のサイズであり、最後は最初のk-1とnの値の合計で固定されています。数値的には、500人のサンプルが英国から採取され、300人がイングランドから、100人がスコットランドから、50人がウェールズからであることが観察された場合、300人がイングランドから、100人がスコットランドから、50人がウェールズからであることが観察された場合、k-1自由度が存在しなければなりません。北アイルランドから50 最初の3つのグループからの数字を考えると、最終的なグループのサイズに柔軟性はありません。 サンプルを4つのグループに分割すると、3つの自由度が得られます。

p行とq列を持つ双方向分割表では、(p-1)*(q-1)自由度があります(最初の行と列の値が与えられ、最後の行と列はテーブル内の合計によって制約されます)

ワンテールまたはツーテイル検定

一般的にそうであるように、重要なのは単に母集団の統計が異なることである場合、それは適切です両側検定に臨界値を使用します。

ただし、母集団Aの統計量が母集団Bの統計量よりも大きい値を持つかどうかを調べるだけの場合は、片側検定が適切です。 片側検定の臨界値は、一般に両側検定の臨界値よりも低く、母集団Aが母集団Bよりも大きい値を持ち、母集団Aが母集団Bよりも小さい値を持

たとえば、

シナリオ1

帰無仮説–トレーニングの前後の平均試験スコアに差がない(つまり、トレーニングは試験スコアに影響を与えない)
代替–トレーニングの前後の平均スコアに差がある(つまり、トレーニングは不特定の効果を持つ)
ツーテイル検定を使用する

シナリオ2

帰無仮説-トレーニングで平均スコアが増加しない
代替–トレーニング後の平均スコアが増加する
平均スコアの増加が観察された場合は、ワンテール検定
(観測されたスコアの低下がある場合、帰無仮説を棄却することができないため、検定する必要はありません。)

シナリオ3

帰無仮説–トレーニングで平均スコアが低下しない
代替–トレーニング後の平均スコアが低下する
平均スコアが低下する場合は、ワンテール検定
(スコアの増加が観測された場合、帰無仮説を棄却することができないため、検定する必要はありません。)

t検定: 平均の対になった二つのサンプル
平均
分散

46,547

46,830

観察
自由度(df)
tスタット
p(T<=t)ワンテール
tクリティカルワンテール
P(T<=t)ツーテール
tクリティカルツーテイル

上記のテスト結果が得られた場合、シナリオ1では、2尾検定を使用して、スコア間に統計的に有意な差はなく(p=0.08)、結果としてトレーニングには効果 同様に、シナリオ3では、実際に上昇しているため、トレーニングが平均スコアを低下させることを示唆する証拠はないと結論づけます。 ただし、シナリオ2では、ワンテール検定を使用すると、平均スコアが増加し、5%レベル(p=0.04)で統計的に有意であると結論づけられます。

最終警告!

統計的なパッケージは、全体的に、あなたがそれらに言うことを行います。 彼らは、あなたが提供したデータが良い品質であるかどうか、または(非常に少数の例外を除いて)それがあなたが行った分析のための適切なタイプであ

ゴミイン=ゴミアウト!

高度な技術

これらのツールと技術は専門的なアプリケーションを持っており、一般的にデータが収集される前に、早い段階で研究方法論に設計されます。 これらのいずれかの使用を検討している場合は、開始する前に専門のテキストまたは経験豊富な統計学者に相談することをお勧めします。

いずれの場合も、この手法を使用するエメラルドの記事の例をいくつか示します。

因子分析

は、元の分散の可能な限り多くを占める測定された元の変数の組み合わせを作成することにより、後続の分析のための変数の数を減らす 一般的にLikertのスケールでそれぞれ評価される多数の意見の声明からの小さい一組の次元の評価を作成するために使用される。 分析する変数よりも多くの観測値(被験者)が必要です。

たとえば、

Likertスケール変数: “私は朝食のためのチョコレートアイスクリームを食べるのが好き”

強く同意する

強く同意しない

PageとWongのサーバント-リーダーシップ-インストゥルメントの要因分析
Rob Dennis and Bruce E.Winston
Leadership&Organization Development Journal,vol. 24no.8

ベンチマーク採用のための要因の理解:マレーシアからの新しい証拠
Yean Pin Lee、Suhaiza Zailani、Keng Lin Soh
ベンチマーク: 国際ジャーナルvol. 13no.5

クラスター分析

測定された変数の値に応じて、同様の特性を持つグループに被験者を分類します。 分析に含まれている変数よりも多くの観測値が必要です。

有機製品の回避:全国調査における拒絶理由と潜在的なバイヤーの識別
C.Fotopoulos and A.Krystallis
British Food Journal,vol. 104no.3/4/5

多変量統計分析による財政的苦痛の検出
S. ゲームサリンガムとクルディープクマール
27no.4

判別分析

被験者の既知のグループを最もよく区別する変数を特定する。 結果は、識別変数

の値に基づいて既知のグループに新しい被験者を割り当てるために使用することができます多変量統計分析による財政的苦痛の検出
S.Gamesalingam and Kuldeep Kumar
Managief Finance,vol. 27no.4

ベンチマーク採用のための要因の理解: マレーシア
Yean Pin Lee,Suhaiza Zailani and Keng Lin Soh
Benchmarking:An International Journal,vol. 13no.5

方法論

判別分析を使用して、二つの先験的に定義されたグループの変数のセットの平均スコアプロファイルの間に統計的に有意な差が存 さらに、どの独立変数が2つのグループの平均スコアプロファイルの差を最も占めているかを判断するのに役立ちます。 本研究では,ベンチマーク採用者と非採用者を分類するための判別分析が主な手段であった。 また、どの独立変数がベンチマークの採用に寄与するかを決定するためにも利用されました。

回帰

依存変数が他の独立変数のセットの値に応じてどのように動作するかをモデル化します。 独立変数は任意の型にすることができますが、分析にカテゴリ独立変数または順序独立変数を含める場合は、特別な方法を使用する必要があります。

1990年代のイングランドおよびウェールズにおける牛乳マーケティングの動向
Jeremy Franks
British Food Journal,vol. 103no.9

火災の下での訓練:パレスチナにおける訓練が直面する障害と中小企業の発展との関係
Mohammed Al Madhoun
Journal of European Industrial Training,vol. 30no.2

時系列分析

一定期間にわたって定期的に測定された変数のパターンと傾向を調査する。 また、例えば、財務統計において、季節変動を識別し、調整するためにも使用され得る。

アジア市場における住宅価格の動向と循環的行動の分析
Ming-Chi Chen,Yuichiro Kawaguchi and Kanak Patel
Journal of Property Investment&Finance,vol. 22no.1

グラフィカルプレゼンテーション

グラフィカルな形式でデータを提示すると、技術的でない聴衆に結果のアクセシビリティを高め、長い説明や複雑な表を必要とする効果や結果を強調表示することができます。 したがって、適切なグラフィカル手法を使用することが重要です。 このセクションでは、最も一般的に使用されるグラフィカルなプレゼンテーションの例を示し、それらがいつ使用されるかを示します。 ヒストグラムを除くすべては、Microsoft Excel®を使用して作成されています。

縦棒グラフまたは横棒グラフ

データを横棒グラフまたは縦棒グラフで表示するかどうかは、主に個人的な好みの問題です。

ヒストグラム

カテゴリデータまたは順序データ、またはグループ化された比率/間隔データの頻度分布を示します。 通常は縦棒グラフとして表示されます。

: ヒストグラム

クラスター化された列/バー

カテゴリ間でカテゴリ、順序、またはグループ化された比率/間隔のデータを比較します。 なお、図4で使用したデータは、図5および図6のものと同じである。

画像:Clustered column/bar

Stacked column/bar

カテゴリ別のカテゴリ、順序、またはグループ化された比率/間隔データの合計に対する実際の寄与を示します。 なお、図5で使用したデータは、図4および図6のものと同じである。

: 積み上げ列/棒

積み上げ列/棒

カテゴリ間のカテゴリ、順序、またはグループ化された比率/間隔データの合計に対する割合の貢献度を比較します。 なお、図6で使用したデータは、図4および図5のものと同じである。

画像:パーセンテージ積み重ね列/バー

折れ線グラフ

順序または比率/間隔データの傾向を表示します。 グラフ上の点は、x軸上のデータが少なくとも序数である場合にのみ、線と結合する必要があります。 特定のアプリケーションの1つは、間隔/比データの頻度分布をプロットすることです(図8)。

画像:折れ線グラフ

円グラフ

カテゴリ、順序、またはグループ化された比率/間隔データ全体に対する割合の寄与を示します。

画像:円グラフ

散布図

任意のタイプの2つの変数間の関係を示すために(両方の変数がタイプの比率/間隔である場合に最も有用ですが)。 また、データ内の異常な観測値の同定にも役立ちます。

画像: 散布図

Box and whisker plot

外れ値を含む大規模なデータセットの中心傾向と広がりを示す専門グラフ。

画像:ボックスとウィスカープロット

リソース

接続数学
数学的な用語とアイデアの簡単な説明

統計用語集
グラスゴー大学のヴァレリー J.イーストンとジョンH.マッコルによってコンパイル

Statsoft電子教科書

100gopal Kによる統計的検定。 漢字
(Sage,1993,ISBN141292376X)

Oxford Dictionary of Statistics by Graham Upton and Ian Cook
(Oxford University Press,2006,ISBN0198614314)

コメントを残す

メールアドレスが公開されることはありません。