Post on 07-Jun-2015
transcript
PRUEBAS PRUEBAS ESTADISTICASESTADISTICAS
Modulo: Procesamiento de DatosModulo: Procesamiento de DatosProfesores: Marcelo RiosecoProfesores: Marcelo Rioseco
Marjorie SámuelMarjorie Sámuel
Tipos de pruebasTipos de pruebas
Pruebas ParamétricasPruebas Paramétricas
Se llaman así porque su cálculo implica Se llaman así porque su cálculo implica una estimación de los parámetros de la una estimación de los parámetros de la población con base en muestras población con base en muestras estadísticas. Mientras más grande sea la estadísticas. Mientras más grande sea la muestra más exacta será la estimación, muestra más exacta será la estimación, mientras más pequeña, más mientras más pequeña, más distorsionada será la media de las distorsionada será la media de las muestras por los valores raros extremos. muestras por los valores raros extremos.
Tipos de pruebasTipos de pruebas
Ventajas de las Pruebas ParamétricasVentajas de las Pruebas Paramétricas
Tienen mas poder de contrasteTienen mas poder de contraste Más poder de eficiencia. Más poder de eficiencia. Más sensibles a los rasgos de los datos Más sensibles a los rasgos de los datos
recolectados. recolectados. Menos posibilidad de errores. Menos posibilidad de errores. Completas (dan estimaciones Completas (dan estimaciones
probabilísticas bastante exactas).probabilísticas bastante exactas).
Tipos de pruebasTipos de pruebas
Prueba t (student)Prueba t (student): : Es una prueba Es una prueba parametrica que es utilizada para parametrica que es utilizada para comparar las medias de dos grupos comparar las medias de dos grupos independientes. Nos permite establecer independientes. Nos permite establecer diferencias estadísticamente significativas diferencias estadísticamente significativas entre las medias de dos grupos.entre las medias de dos grupos.
Para esto se ve el valor de Para esto se ve el valor de p o de p o de significancia estadística debe ser significancia estadística debe ser mayor que 0.05.mayor que 0.05.
Tipos de pruebasTipos de pruebas
¿Que es el nivel de significancia?¿Que es el nivel de significancia? La probabilidad de que un evento La probabilidad de que un evento
ocurra oscila entre 0 y 1, donde:ocurra oscila entre 0 y 1, donde: 0= significa la imposibilidad de 0= significa la imposibilidad de
ocurrenciaocurrencia 1=la certeza de que ocurra el 1=la certeza de que ocurra el
fenómeno fenómeno
Tipos de pruebasTipos de pruebas
Anova: Es una prueba estadística Anova: Es una prueba estadística para analizar si dos o mas grupos para analizar si dos o mas grupos difieren significativamente entre si, difieren significativamente entre si, en cuanto a sus medias y en cuanto a sus medias y varianzas.varianzas.Se utiliza para la Se utiliza para la comparación de medias de 2 o mas comparación de medias de 2 o mas grupos. grupos.
Tipos de pruebasTipos de pruebas
Pruebas no parametricasPruebas no parametricas: Se : Se denominan pruebas no paramétricas denominan pruebas no paramétricas aquellas que no presuponen una aquellas que no presuponen una distribución de probabilidad para los distribución de probabilidad para los datos, por ello se conocen también datos, por ello se conocen también como de distribución libre como de distribución libre ((distribution freedistribution free).).
Las pruebas no parametricas mas Las pruebas no parametricas mas utilizadas utilizadas
Tipos de pruebasTipos de pruebas
Prueba de Wilcoxon para contrastar datos Prueba de Wilcoxon para contrastar datos pareados.pareados.
Prueba de Mann-Whitney para muestras Prueba de Mann-Whitney para muestras independientesindependientes
Prueba de Kruskal-Wallis para comparar K Prueba de Kruskal-Wallis para comparar K muestrasmuestras
Prueba de Friedman para comparar K muestras Prueba de Friedman para comparar K muestras pareadas (bloques)pareadas (bloques)
Coeficiente de correlación de Spearman para Coeficiente de correlación de Spearman para rangosrangos
Prueba de rachas de Wald-WolfowitzPrueba de rachas de Wald-Wolfowitz
Pregunta de investigación Pregunta de investigación Asociación de 2 variables (dep, Asociación de 2 variables (dep,
indep)indep)
Correlación Spearman Regresión lineal
CuantitativaCuantitativa
Prueba T
ANOVA
categóricaCuantitativa
Regresión logísticacuantitativacategórica
chi-cuadradocategóricacategórica
Prueba Tipos de variable
Dependiente independiente
Comparacion de variables Comparacion de variables (diferencias)(diferencias)
Kruskal wallis
Número de variables independientes
2 grupos datos pareados >2grupos
chi-cuadrada*
Wilcoxon Mann-Whitney
Prueba t pareadaPrueba tCuantitativa
Ordinal
Categórica
Variable
Medidas de DistribuciónMedidas de Distribución
Las medidas de distribución nos permiten Las medidas de distribución nos permiten identificar la forma en que se separan o identificar la forma en que se separan o aglomeran los valores de acuerdo a su aglomeran los valores de acuerdo a su representación gráfica. Estas medidas representación gráfica. Estas medidas describen la manera como los datos describen la manera como los datos tienden a reunirse de acuerdo con la tienden a reunirse de acuerdo con la frecuencia con que se hallen dentro de la frecuencia con que se hallen dentro de la información información
Sus principales medidas son la Sus principales medidas son la AsimetríaAsimetría y y la la CurtosisCurtosis
Medidas de DistribuciónMedidas de Distribución
ASIMETRÍA ASIMETRÍA
Esta medida nos permite identificar si Esta medida nos permite identificar si los datos se distribuyen de forma los datos se distribuyen de forma uniforme alrededor del punto central uniforme alrededor del punto central (Media aritmética). La asimetría (Media aritmética). La asimetría presenta tres estados diferentes, cada presenta tres estados diferentes, cada uno de los cuales define de forma uno de los cuales define de forma concisa como están distribuidos los concisa como están distribuidos los datos respecto al eje de asimetría.datos respecto al eje de asimetría.
Medidas de DistribuciónMedidas de Distribución
Se dice que la Se dice que la asimetría es positivaasimetría es positiva cuando la mayoría de los datos se cuando la mayoría de los datos se encuentran hacia el lado izquierdo de la encuentran hacia el lado izquierdo de la curva (por debajo de la media aritmética). curva (por debajo de la media aritmética).
La curva es La curva es SimétricaSimétrica cuando se cuando se distribuyen aproximadamente la misma distribuyen aproximadamente la misma cantidad de valores en ambos lados de la cantidad de valores en ambos lados de la media media
Medidas de DistribuciónMedidas de Distribución
Asimetría negativaAsimetría negativa : cuando la mayor : cuando la mayor cantidad de datos se aglomeran hacia la cantidad de datos se aglomeran hacia la derecha de la curva. (por encima de la derecha de la curva. (por encima de la media)media)
El El Coeficiente de asimetríaCoeficiente de asimetría, se representa mediante , se representa mediante la ecuación matemática, la ecuación matemática,
Donde (g1) representa el coeficiente Donde (g1) representa el coeficiente de asimetría de Fisher, (Xi) cada uno de asimetría de Fisher, (Xi) cada uno de los valores, (de los valores, ( X ) la media de X ) la media de la muestra y (ni) la frecuencia de la muestra y (ni) la frecuencia de cada valor. Los resultados de esta cada valor. Los resultados de esta ecuación se interpretan:ecuación se interpretan: (g1 = 0): Se acepta que la (g1 = 0): Se acepta que la distribución es Simétrica, es decir, distribución es Simétrica, es decir, existe aproximadamente la misma existe aproximadamente la misma cantidad de valores a los dos lados cantidad de valores a los dos lados de la media. Este valor es difícil de de la media. Este valor es difícil de conseguir por lo que se tiende a conseguir por lo que se tiende a tomar los valores que son cercanos tomar los valores que son cercanos ya sean positivos o negativos (± ya sean positivos o negativos (± 0.5). 0.5).
Medidas de DistribuciónMedidas de Distribución
(g1 > 0):(g1 > 0): La curva es asimétricamente La curva es asimétricamente positiva por lo que los valores se tienden a positiva por lo que los valores se tienden a reunir más en la parte izquierda que en la reunir más en la parte izquierda que en la derecha de la media. derecha de la media.
(g1 < 0):(g1 < 0): La curva es asimétricamente La curva es asimétricamente negativa por lo que los valores se tienden negativa por lo que los valores se tienden a reunir más en la parte derecha de la a reunir más en la parte derecha de la media. media.
Medidas de DistribuciónMedidas de Distribución
CURTOSIS CURTOSIS Esta medida determina el grado de Esta medida determina el grado de concentración que presentan los valores concentración que presentan los valores en la región central de la distribución. en la región central de la distribución.
Por medio del Por medio del Coeficiente de CurtosisCoeficiente de Curtosis, , podemos identificar si existe una gran podemos identificar si existe una gran concentración de valores concentración de valores
Medidas de DistribuciónMedidas de Distribución
Distribución Distribución leptocúrtica: presenta leptocúrtica: presenta un elevado grado de un elevado grado de concentración concentración alrededor de los valores alrededor de los valores centrales de la variable.centrales de la variable.
..
Medidas de DistribuciónMedidas de Distribución
Distribución Distribución mesocúrtica: presenta mesocúrtica: presenta un grado de un grado de concentración medio concentración medio alrededor de los valores alrededor de los valores centrales de la variable centrales de la variable (el mismo que presenta (el mismo que presenta una distribución una distribución normal).normal).
Medidas de DistribuciónMedidas de Distribución
Distribución Distribución platicúrtica: presenta platicúrtica: presenta un reducido grado un reducido grado de concentración de concentración alrededor de los alrededor de los valores centrales de valores centrales de la variable.la variable.
Medidas de DistribuciónMedidas de Distribución
Medidas de DistribuciónMedidas de Distribución