Cómo hacerlo…Elija la técnica estadística correcta

Fundamentos

Comience a pensar en las técnicas que utilizará para su análisis antes de recopilar cualquier dato.

¿Qué quieres saber?

El análisis debe estar relacionado con las preguntas de investigación, y esto puede dictar las técnicas que debe usar.

¿Qué tipo de datos tiene?

El tipo de datos que tiene también es fundamental: las técnicas y herramientas apropiadas para las variables de intervalos y proporciones no son adecuadas para medidas categóricas u ordinales. (Consulte Cómo recopilar datos para obtener notas sobre tipos de datos)

¿Qué suposiciones puede hacer, y no puede hacer?

Muchas técnicas se basan en que la distribución muestral de la estadística de ensayo es una distribución normal (véase más adelante). Este es siempre el caso cuando la distribución subyacente de los datos es normal, pero en la práctica, es posible que los datos no se distribuyan normalmente. Por ejemplo, podría haber una larga cola de respuestas a un lado u otro (datos sesgados). Las técnicas no paramétricas están disponibles para su uso en tales situaciones, pero son inevitablemente menos potentes y menos flexibles. Sin embargo, si el tamaño de la muestra es lo suficientemente grande, el Teorema del Límite Central permite el uso de análisis y herramientas estándar.

Técnicas para una distribución no normal

¿Estadísticas paramétricas o no paramétricas?

Los métodos paramétricos y las estadísticas se basan en un conjunto de supuestos sobre la distribución subyacente para obtener resultados válidos. En general, requieren que las variables tengan una distribución normal.

Deben utilizarse técnicas no paramétricas para datos categóricos y ordinales, pero para datos de cocientes de intervalos & son generalmente menos potentes y menos flexibles, y solo deben utilizarse cuando el ensayo paramétrico estándar no es apropiado, por ejemplo, cuando el tamaño de la muestra es pequeño (menos de 30 observaciones).

Teorema del límite central

A medida que aumenta el tamaño de la muestra, la forma de la distribución de muestreo de la estadística de prueba tiende a volverse normal, incluso si la distribución de la variable que se está probando no es normal.

En la práctica, esto puede aplicarse a estadísticas de pruebas calculadas a partir de más de 30 observaciones.

 Imagen: la función de distribución normal

¿Cuánto puede esperar obtener de sus datos?

Cuanto menor sea el tamaño de la muestra, menos podrá obtener de sus datos. El error estándar está inversamente relacionado con el tamaño de la muestra, por lo que cuanto mayor sea la muestra, menor será el error estándar y mayores serán las posibilidades de identificar resultados estadísticamente significativos en el análisis.

Técnicas básicas

En general, cualquier técnica que pueda utilizarse en datos categóricos también podrá utilizarse en datos ordinales. Cualquier técnica que pueda utilizarse en datos ordinales también podrá utilizarse en datos de proporciones o intervalos. Lo contrario no es el caso.

Descripción de sus datos

La primera etapa de cualquier análisis debe ser describir sus datos y, por lo tanto, la población de la que se extraen. Las estadísticas apropiadas para esta actividad se dividen en tres grandes grupos y dependen del tipo de datos que tenga.

¿Qué desea hacer? ¿Con qué tipo de datos? técnicas Adecuadas
Mirar la distribución Categórica / Ordinal graficar el porcentaje
en cada categoría
(columna o de gráfico de barras)
Relación / Intervalo Histograma
frecuencia Acumulada
diagrama de
Describir el
tendencia central
Categórica n/a
Ordinal Mediana
Modo
Relación / Intervalo Media
Mediana
Describir la propagación Categórica n/a
Ordinal Alcance
Inter-cuartil rango de
Relación / Intervalo Alcance
Inter-cuartil rango
Varianza
Estándar de la variación de la

Ver presentación Gráfica para la descripción de las principales técnicas gráficas.

Media-la media aritmética, calculada sumando todos los valores y dividiendo por el número de valores de la suma.

Mediana-el punto medio de la distribución, donde la mitad de los valores son más altos y la mitad más bajos.Modo

: el valor que ocurre con más frecuencia.Rango

: la diferencia entre el valor más alto y el más bajo.

Intervalo intercuartílico: la diferencia entre el cuartil superior (el valor en que el 25% de las observaciones son superiores y el 75% inferiores) y el cuartil inferior (el valor en que el 75% de las observaciones son superiores y el 25% inferiores). Esto es particularmente útil cuando hay un pequeño número de observaciones extremas mucho más altas, o más bajas, que la mayoría.

Varianza-una medida de propagación, calculada como la media de las diferencias cuadradas de las observaciones con respecto a su media.

Desviación estándar – la raíz cuadrada de la varianza.

Diferencias entre grupos y variables

Prueba de Chi cuadrado-utilizada para comparar las distribuciones de dos o más conjuntos de datos categóricos u ordinales.

pruebas t-utilizadas para comparar las medias de dos conjuntos de datos.

Prueba U de Wilcoxon-equivalente no paramétrico de la prueba t. Basado en el orden de clasificación de los datos, también se puede usar para comparar medianas.

ANOVA: análisis de varianza para comparar las medias de más de dos grupos de datos.

¿Qué desea hacer? ¿Con qué tipo de datos? técnicas Adecuadas
Comparar dos grupos Categórica prueba de Chi-cuadrado
Ordinal prueba de Chi-cuadrado
Wicoxon U test
Relación / Intervalo t-test para
muestras independientes
Comparar más de dos grupos Categórica / Ordinal prueba de Chi-cuadrado
Relación / Intervalo ANOVA
Comparar dos variables
sobre el mismo sujetos
Categórico / Ordinal Prueba de Chi cuadrado
Relación / intervalo prueba t para muestras dependientes

Relaciones entre variables

El coeficiente de correlación mide el grado de asociación lineal entre dos variables, con un valor en el rango de +1 a -1. Los valores positivos indican que las dos variables aumentan y disminuyen juntas; los valores negativos indican que una aumenta a medida que la otra disminuye. Un coeficiente de correlación de cero indica que no hay relación lineal entre las dos variables. La correlación de rango de Spearman es el equivalente no paramétrico de la correlación de Pearson.

¿Qué tipo de datos? Técnicas apropiadas
Prueba de Chi cuadrado categórica
Ordinal Prueba de Chi cuadrado
Rango de Spearman
correlación (Tau)
Relación / Intervalo Correlación de Pearson
(Rho)

Tenga en cuenta que los análisis de correlación solo detectarán relaciones lineales entre dos variables. La figura siguiente ilustra dos pequeños conjuntos de datos en los que hay relaciones claras entre las dos variables. Sin embargo, la correlación para el segundo conjunto de datos, donde la relación no es lineal, es de 0,0. Un simple análisis de correlación de estos datos sugeriría que no hay relación entre las medidas, cuando claramente no es el caso. Esto ilustra la importancia de realizar una serie de análisis descriptivos básicos antes de embarcarse en análisis de las diferencias y relaciones entre variables.

Imagen: dos conjuntos de datos pequeños donde hay relaciones claras entre las dos variables

Validez de la prueba

Niveles de significación

La significación estadística de una prueba es una medida de probabilidad – la probabilidad de que usted hubiera obtenido ese resultado particular de la prueba en esa muestra si la hipótesis nula (que no hay efecto debido a los parámetros que se están probando) que está probando era verdadera. El siguiente ejemplo evalúa si los resultados de un examen cambian después de que los candidatos han recibido capacitación. La hipótesis sugiere que deberían, por lo que la hiopotesis nula es que no lo harán.

En general, cualquier nivel de probabilidad superior al 5% (p>0,05) no se considera estadísticamente significativo, y para encuestas grandes, el 1% (p>0,01) a menudo se toma como un nivel más apropiado.

Tenga en cuenta que la significación estadística no significa que los resultados que ha obtenido realmente tengan valor en el contexto de su investigación. Si tiene una muestra lo suficientemente grande, una diferencia muy pequeña entre los grupos se puede identificar como estadísticamente significativa, pero una diferencia tan pequeña puede ser irrelevante en la práctica. Por otro lado, una diferencia aparentemente grande puede no ser estadísticamente significativa en una muestra pequeña, debido a la variación dentro de los grupos que se comparan.

Grados de libertad

Algunas estadísticas de prueba (por ejemplo, chi cuadrado) requieren que se conozca el número de grados de libertad, para probar la significación estadística contra la tabla de probabilidad correcta. En resumen, los grados de libertad son el número de valores que se pueden asignar arbitrariamente dentro de la muestra.

Por ejemplo:

En una muestra de tamaño n dividida en clases k, hay grados de libertad k-1 (los primeros grupos k-1 podrían ser de cualquier tamaño hasta n, mientras que el último se fija por el total del primer k-1 y el valor de n. En términos numéricos, si se toma una muestra de 500 individuos del Reino Unido, y se observa que 300 son de Inglaterra, 100 de Escocia y 50 de Gales, entonces debe ser 50 de Irlanda del Norte. Dados los números de los tres primeros grupos, no hay flexibilidad en el tamaño del grupo final. Dividir la muestra en cuatro grupos da tres grados de libertad.

En una tabla de contingencia bidireccional con filas p y columnas q, hay (p-1)*(q-1) grados de libertad (dados los valores de las primeras filas y columnas, la última fila y columna están restringidas por los totales de la tabla)

Pruebas de una o dos colas

Si, como es generalmente el caso, lo que importa es simplemente que las estadísticas para las poblaciones son diferentes, entonces es apropiado utilice los valores críticos para una prueba de dos colas.

Sin embargo, si solo está interesado en averiguar si la estadística de la población A tiene un valor mayor que la de la población B, entonces sería apropiado una prueba de una cola. El valor crítico para una prueba de una cola es generalmente más bajo que para una prueba de dos colas, y solo debe usarse si su hipótesis de investigación es que la población A tiene un valor mayor que la población B, y no importa cuán diferentes sean si la población A tiene un valor menor que el de la población B.

Por ejemplo

Escenario 1

Hipótesis nula – no hay diferencia en las puntuaciones medias de los exámenes antes y después del entrenamiento (es decir, el entrenamiento no tiene efecto en la puntuación del examen)
Alternativa – hay diferencia en las puntuaciones medias antes y después del entrenamiento (es decir, el entrenamiento tiene un efecto no especificado)
Use una prueba de dos colas

Escenario 2

Hipótesis nula: El entrenamiento no aumenta la puntuación media
Alternativa: La puntuación media aumenta después del entrenamiento
Utilice una prueba de una sola cola, si se observa un aumento en la puntuación media.
(Si se observa una caída en las puntuaciones, no hay necesidad de probar, ya que no se puede rechazar la hipótesis nula.)

Escenario 3

Hipótesis nula: El entrenamiento no causa una caída de la puntuación media
Alternativa: La puntuación media cae después del entrenamiento
Utilice una prueba de una sola cola, si se observa una caída en la puntuación media.
(Si se observa un aumento en las puntuaciones, no hay necesidad de probar, ya que no se puede rechazar la hipótesis nula.)

prueba t: Dos para Muestras emparejadas Significa
Antes de Después de
la Media de
Varianza

46,547

46,830

Observaciones
Grados de libertad (df)
t Stat
P(T<=t) uno-cola
t Crítico-cola
P (T< = t) de dos colas
t Crítico de dos colas

Si se obtuvieron los resultados de la prueba anterior, en el escenario 1, utilizando una prueba de dos colas, se podría concluir que no hubo diferencia estadísticamente significativa entre las puntuaciones (p=0,08) y, como consecuencia, que el entrenamiento no tuvo efecto. De manera similar, en el escenario 3, usted concluiría que no hay evidencia que sugiera que el entrenamiento hace que las puntuaciones medias disminuyan, ya que de hecho han aumentado. Sin embargo, en el escenario 2, utilizando una prueba de una sola cola, se concluiría que hubo un aumento en las puntuaciones medias, estadísticamente significativo en el nivel del 5 por ciento (p=0,04).

¡Una advertencia final!

Los paquetes estadísticos harán lo que les digas, en general. No saben si los datos que ha proporcionado son de buena calidad o (con muy pocas excepciones) si son de un tipo apropiado para el análisis que ha realizado.

Basura dentro = Basura fuera !

Técnicas avanzadas

Estas herramientas y técnicas tienen aplicaciones especializadas, y generalmente se diseñarán en la metodología de investigación en una etapa temprana, antes de que se recopilen datos. Si está considerando usar cualquiera de estos, es posible que desee consultar un texto especializado o un estadístico experimentado antes de comenzar.

En cada caso, damos algunos ejemplos de artículos de Esmeralda que utilizan la técnica.

Análisis factorial

Para reducir el número de variables para el análisis posterior mediante la creación de combinaciones de las variables originales medidas que tengan en cuenta la mayor cantidad posible de la varianza original, pero que permitan una interpretación más fácil de los resultados. Se usa comúnmente para crear un pequeño conjunto de calificaciones de dimensión a partir de un gran número de declaraciones de opinión calificadas individualmente en escalas Likert. Debe tener más observaciones (sujetos) que variables a analizar.

Por ejemplo

Una variable de escala Likert: «Me gusta desayunar helado de chocolate»

Totalmente de acuerdo

Totalmente en desacuerdo

Un análisis factorial del instrumento de liderazgo de servicio de Page y Wong
Rob Dennis y Bruce E. Winston
Liderazgo & Revista de Desarrollo de la organización, vol. 24 no. 8

Comprensión de los factores para la adopción de benchmarking: Nueva evidencia de Malasia
Yean Pin Lee, Suhaiza Zailani y Keng Lin Soh
Benchmarking: An International Journal, vol. 13 no. 5

Análisis de conglomerados

Para clasificar a los sujetos en grupos de características similares, de acuerdo con los valores de las variables medidas. Debe tener más observaciones que variables incluidas en el análisis.

Evitación de productos orgánicos: Razones de rechazo e identificación de compradores potenciales en una encuesta a nivel nacional
C. Fotopoulos y A. Krystallis
British Food Journal, vol. 104 no. 3/4/5

Detección de dificultades financieras mediante análisis estadístico multivariado
S. Gamesalingam y Kuldeep Kumar
Managerial Finance, vol. 27 no. 4

Análisis discriminante

Para identificar aquellas variables que mejor discriminan entre grupos de sujetos conocidos. Los resultados se pueden utilizar para asignar nuevos sujetos a los grupos conocidos en función de sus valores de las variables discriminantes

Detección de dificultades financieras mediante análisis estadístico multivariante
S. Gamesalingam y Kuldeep Kumar
Managerial Finance, vol. 27 no. 4

Comprensión de los factores para la adopción de la evaluación comparativa: New evidence from Malaysia
Yean Pin Lee, Suhaiza Zailani and Keng Lin Soh
Benchmarking: An International Journal, vol. 13 no. 5

Metodología

Se utilizó el análisis discriminante para determinar si existen diferencias estadísticamente significativas entre el perfil de puntuación media en un conjunto de variables para dos grupos definidos a priori y así poder clasificarlos. Además, podría ayudar a determinar cuál de las variables independientes explica más las diferencias en los perfiles de puntuación media de los dos grupos. En este estudio, el análisis discriminante fue el principal instrumento para clasificar al adoptante de benchmarking y al no adoptante. También se utilizó para determinar cuáles de las variables independientes contribuirían a la adopción de la evaluación comparativa.

Regresión

Para modelar cómo se comporta una variable dependiente en función de los valores de un conjunto de otras variables independientes. La variable dependiente debe ser de tipo intervalo o razón; las variables independientes pueden ser de cualquier tipo, pero se deben usar métodos especiales cuando se incluyen variables independientes categóricas u ordinales en el análisis.

Evolución de la comercialización de la leche en Inglaterra y Gales durante la década de 1990
Jeremy Franks
British Food Journal, vol. 103 no. 9

Formación bajo fuego: La relación entre los obstáculos a la formación y el desarrollo de las PYME en Palestina
Mohammed Al Madhoun
Journal of European Industrial Training, vol. 30 no. 2

Análisis de series temporales

Para investigar los patrones y tendencias en una variable medida regularmente durante un período de tiempo. También puede utilizarse para identificar y ajustar la variación estacional, por ejemplo, en las estadísticas financieras.

An analysis of the trends and cyclical behaviours of housing prices in the Asian markets
Ming-Chi Chen, Yuichiro Kawaguchi and Kanak Patel
Journal of Property Investment & Finance, vol. 22 no. 1

Presentación gráfica

La presentación de datos en forma gráfica puede aumentar la accesibilidad de sus resultados a una audiencia no técnica y resaltar efectos y resultados que de otro modo requerirían una explicación larga o tablas complejas. Por lo tanto, es importante que se utilicen técnicas gráficas adecuadas. Esta sección da ejemplos de algunas de las presentaciones gráficas más utilizadas e indica cuándo se pueden usar. Todos, excepto el histograma, se han producido utilizando Microsoft Excel®.

Gráficos de columnas o barras

Hay cuatro variaciones principales, y si muestra los datos en barras horizontales o columnas verticales es en gran medida una cuestión de preferencia personal.

Histograma

Para ilustrar una distribución de frecuencia en datos categóricos u ordinales, o datos agrupados de relación / intervalo. Normalmente se muestra como un gráfico de columnas.

Imagen: Histograma

Columna/barra agrupada

Para comparar datos de relación/intervalo categóricos, ordinales o agrupados entre categorías. Los datos utilizados en la figura 4 son los mismos que los de las figuras 5 y 6.

 Imagen: Columna/barra agrupada

Columna/barra apilada

Para ilustrar la contribución real al total de datos de relación/intervalo categóricos, ordinales o agrupados por categorías. Los datos utilizados en la Figura 5 son los mismos que los de las Figuras 4 y 6.

Imagen: Columna/barra apilada

Porcentaje Columna/barra apilada

Para comparar la contribución porcentual con el total de datos de relación/intervalo categóricos, ordinales o agrupados entre categorías. Los datos utilizados en la figura 6 son los mismos que los de las figuras 4 y 5.

 Imagen: Columnas/barras apiladas de porcentaje

Gráficos de líneas

Para mostrar tendencias en datos ordinales o de relación/intervalo. Los puntos en un gráfico solo deben unirse con una línea si los datos en el eje x son al menos ordinales. Una aplicación particular es trazar una distribución de frecuencia para los datos de intervalo/relación (fig.8).

 Imagen: Gráficos de líneas

Gráficos circulares

Para mostrar la contribución porcentual al conjunto de datos de relación/intervalo categóricos, ordinales o agrupados.

 Imagen: Gráfico circular

Gráficos de dispersión

Para ilustrar la relación entre dos variables, de cualquier tipo (aunque es más útil cuando ambas variables son relación / intervalo de tipo). También es útil en la identificación de cualquier observación inusual en los datos.

Imagen: Gráfico de dispersión

Gráfico de caja y bigote

Gráfico especializado que ilustra la tendencia central y la propagación de un conjunto de datos de gran tamaño, incluidos los valores atípicos.

Imagen: Trama de caja y bigote

Recursos

Conectando matemáticas
Breves explicaciones de términos e ideas matemáticos

Glosario de estadísticas
compilado por Valerie J. Easton y John H. McColl de la Universidad de Glasgow

Libro de texto electrónico de Statsoft

100 Pruebas estadísticas de Gopal K. Kanji
(Sage, 1993, ISBN 141292376X)

Oxford Dictionary of Statistics de Graham Upton e Ian Cook
(Oxford University Press, 2006, ISBN 0198614314)

Deja una respuesta

Tu dirección de correo electrónico no será publicada.