Date post: | 24-Jan-2016 |
Category: |
Documents |
Upload: | xavier-alvarez-castillo |
View: | 214 times |
Download: | 0 times |
Prueba de HipótesisSubtítulo
Una de las aplicaciones de la estadística es extraer inferencias en poblaciones a partir del estudio de muestras. Este proceso recibe el nombre de Estadística Inferencial y sus estudios pretenden deducir (inferir) propiedades o características de una población a partir de una muestra representativa.
La estadística inferencial
La estadística inferencial y la prueba de hipótesis
Para realizar el proceso inferencial se suele partir de hipótesis, es decir, de unas suposiciones cuya validez cabe confirmar o rechazar.
es una técnica estadística que se sigue para decidir si rechazamos o no una hipótesis estadística con base en la información de una muestra.
Hipótesis estadística
Prueba de hipótesis
“Es una verdad muy cierta que, cuando no esté a nuestro alcance determinar
lo que es verdad, deberemos buscar lo que es más probable.”
Descartes, en su Discurso del Método
PASO 1Formaliza las hipótesis:
Hipótesis nula Vs. Hipótesis alternativa
PASO 2Elige el test adecuado:
Paramétrico Vs. No paramétrico
PASO 3Determinar si la prueba de significancia tendrá
dos direcciones o una sola
PASO 4Especifica el nivel de significación
PASO 5Calcula el valor del test
La probabilidad teórica de obtener las diferencias observadas es menor o igual que el nivel de significación?
Aceptar la hipótesis nula: las diferencias observadas se deben simplemente a errores de muestreo
Rechaza la hipótesis nula: las diferencias entre los grupos son significativas
SINO
Paso 1Formaliza las hipótesis:
Hipótesis nula Vs. Hipótesis alternativa
Formaliza las hipótesis:Hipótesis nula Vs. Hipótesis alternativa
Hipótesis
Hipótesis Nula
indica que NO hay diferencias significativas entre dos medias
muestrales y afirma que la diferencia entre dos medias muestrales es
debida al azar, a la suerte, al error de muestreo
Hipótesis de Investigación
asume que SI hay diferencias significativas entre dos medias
muestrales y que esa diferencia se debe al empleo de un método
(medicamento, tratamiento,etc.) que es más efectivo que otro
En estadística, un resultado se denomina estadísticamente significativo cuando no es probable que haya sido debido al azar.
Un contraste de hipótesis estadístico se plantea como una decisión entre dos hipótesis.
El propósito del experimento es decidir si la prueba tiende
a apoyar o a refutar la Hipótesis Nula.
Veamos un ejemplo
Hipótesis científica: Escuchar la música de Mozart tiene un efecto sobre el CI diferente al Reggaeton.
Experimento: De la población venezolana seleccionamos 20 niños al azar en dos grupos de 10. Un grupo escuchará Mozart antes de hacer el test de CI. El otro escuchará Reggaeton. Después de realizar el test, se calculan las medias en cada uno de los dos grupos.
El efecto "Mozart vs. Reggaeton” :
Se sospecha que los individuos rinden más en un test de inteligencia tras escuchar música de Mozart que cuando han escuchado Reggaeton
Supongamos que la media del CI del grupo de Mozart fue 110, mientras que la media del grupo de Reggaeton fue de 102 . Entonces: ¿Podemos decir que hay diferencias a nivel poblacional entre ambos grupos?. Para tomar tal decisión necesitaremos plantear DOS hipótesis:
Hipótesis:
Hipótesis nula. Es la que proporciona la solución "más sencilla". En nuestro ejemplo sería que la media de ambos grupos es la misma. (Es decir, que no hay un efecto de la música sobre el CI.)
H0: μ1 = μ2
Hipótesis de Investigación. Es la hipótesis complementaria (y "más compleja"). En nuestro caso sería que la media de ambos grupos es diferente. (Es decir, que hay un efecto de la música sobre el CI.)
H1: μ1 ≠ μ2
La pregunta del investigador entonces es:…se acepta o no se acepta la hipótesis nula
Hay cuatro posibilidades:
La hipótesis nula es cierta y el investigador concluye que lo es…una decisión correcta
La hipótesis nula es falsa y el investigador concluye que lo es…una decision correcta
La hipótesis nula es cierta pero el investigador concluye que es falsa…una decision incorrecta
La hipótesis nula es falsa pero el investigador concluye que es cierta…una decision incorrecta
TIPOS DE ERROR
Aceptar Ho DecisiónCorrecta
Error Tipo IIAceptar la Hipótesis
Nula cuando ha debido rechazarse))
(β)
Rechazar Ho
Error Tipo I (α)
Un falso positivo. Rechazar la Ho (H. Nula) cuando ha
debido Aceptarse
Decisión Correcta
Verdadera Falsa
Deci
siones
Ho: El sujeto es inocenteHi: el sujeto es culpable
Obviamente interesa minimizar ambos errores, aunque en Estadística se da prioridad al error de tipo I, es decir se intenta evitar los falsos positivos, ya que es mejor dejar libre a un culpable que condenar a un inocente.
Reducir ambos errores a cero es imposible y, además, al disminuir uno se aumenta el otro, por lo que hay que elegir bien el test empleado para llegar al mejor balance posible entre el error de tipo I y el error de tipo II.
La única manera de disminuir ambos es aumentar el tamaño de muestra.
PASO 2
Elige el test adecuado:
Paramétrico Vs. No paramétrico
Pruebas paramétricas y NO paramétricas
para contrastar la veracidad o falsedad de las hipótesis enunciadas aplicamos unas pruebas estadísticas que se clasifican en pruebas paramétricas y pruebas no paramétricas.
Pruebas paramétricas
Son las mas potentes
Requiere que se cumplan una serie
de supuestos paramétricos
Pruebas NO paramétricas
Son las mas potentes
Son más flexibles porque NO Requiere que se cumplan una serie de supuestos
paramétricos
Cuál elegir?
Las pruebas paramétricas son más potentes que las NO paramétricasQué es la potencia
es la probabilidad de que la hipótesis nula sea rechazada cuando la hipótesis alternativa es verdadera (es decir, la probabilidad de NO cometer un error del tipo II)
Las pruebas paramétricas tienen menos posibilidades de cometer un error tipo II.
Potencia Error Tipo II
1.0 Si hay un efecto será detectado
0.8 Si hay un efecto será detectado el 80% de las veces
0.5 Si hay un efecto será detectado el 50% de las veces
0.2 Si hay un efecto será detectado el 20% de las veces
0.0 Si hay un efecto nunca será detectado
Con respecto a la potencia
Por ejemplo, la U de Mann-Whitney tiene una potencia relativa del 95% con respecto a la prueba paramétrica t de Student (significa que con una muestra de 100 sujetos, se consigue la misma potencia con la U de Mann-Whitney que con 95 sujetos para la t de Student).
U de Mann-Whitney t de Student
100 sujetos 95 sujetos
Igual potencia
la potencia de un test estadístico aumenta cuando lo hace el tamaño de la muestra; de esta forma, para conseguir la misma potencia que tiene un prueba paramétrica con una No paramétrica, necesitaremos aumentar el tamaño de la muestra
Con respecto a los supuestos paramétricos
Supuestos que subyacen a la utilización de
pruebas paramétricas
Normalidad
La VD debe ser medida en una
escala de intervalo o razón
Homocedasticidad o igualdad de varianza
Una muestra igual o superior a los 30
sujetos
Descripción
Normalidad
La población al estar constituida por un número grande de casos tiende a tener una distribución normal. Como las pruebas paramétricas estiman los parámetros de la población a partir de muestras estadísticas, se parte del supuesto que estas muestras también tienen una distribución normal
La VD debe ser medida en una escala de intervalo o razón
Los métodos estadísticos paramétricos requieren del empleo de datos medidos en una escala de intervalo o de razón.
En estos niveles de medición tienen sentido las operaciones aritméticas como el análisis de medias, desviación estándar y varianzas .
Homocedasticidad o igualdad de varianza
Las varianzas de la variable dependiente en los grupos que se comparan deben ser aproximadamente iguales. Existen varias pruebas que permiten comprobar la igualdad de varianzas, una de las más conocidas es la prueba de Levene
Una muestra igual o superior a los 30 sujetos
Dado que las pruebas paramétricas realizan estimación de parámetros de la población a partir de muestras estadísticas, es lógico pensar que cuanto más grande sea la muestra, más exacta será la estimación; en cambio, cuanto más pequeña, más distorsionada será la media de las muestras por los valores raros extremos.
Criterio paramétrico: Normalidad
distribución normal o distribución de Gauss o es la distribuciones de probabilidad de variable continua que con más frecuencia aparece aproximada en fenómenos reales.
La importancia de esta distribución radica en que permite modelar numerosos fenómenos naturales, sociales y psicológicos.
La población de cualquier fenómeno, al estar constituida por un número grande de casos tiende a tener una distribución normal.
Una observación es NORMAL cuando su comportamiento es Frecuente de acuerdo con un modelo matemático teórico que diferencia lo Frecuente de lo Raro
Como las pruebas paramétricas estiman los parámetros de la población a partir de muestras estadísticas, se parte del supuesto que estas muestras también tienen una distribución normal a partir de la cual se hará una estimación adecuada
Sin embargo, algunos autores han señalado que en ocasiones en el campo de las ciencias sociales puede resultar poco frecuente encontrar variables que se ajusten a este tipo de comportamiento.
Debido a esto es preciso comprobar si la distribución de nuestro estudio sigue esta estructura teórica. Una de las pruebas más usada para verificarlo es la prueba de Kolmogorov Smirnov
Criterio paramétrico: La VD debe ser medida en una escala de intervalo o razón
Los métodos estadísticos paramétricos requieren del empleo de datos medidos en una escala de intervalo o de razón.
En estos niveles de medición tienen sentido las operaciones aritméticas como el análisis de medias, desviación estándar y varianzas .
razón
intervalo
ordinal
Nominal
Pruebas paramétricas
Pruebas NO paramétricas
Mas cuantitativas
Mas cualitativas
Criterio paramétrico: Homocedasticidad
La homocedasticidad o igualdad de la varianza, significa que todos los grupos a analizar poseen la misma varianza
El dibujo de caja y bigote nos muestra “la media” en la línea central, el limite inferior es el Q1 y el límite superior es el Q3 y de esta forma se abarca el 95% de los casos
Cuando compramos 2 grupos y proyectamos la línea media de un grupo sobre el otro y esta proyección cae dentro de la caja, concluimos que los dos grupos son iguales. Pero si la proyección de la línea media de un grupo sobre el otro cae fuera de la caja, entonces los grupos son diferentes.
Por supuesto estos grupos tienen que tener una distribución normal. Las cajas tienen que tener las cajas del mismo tamaño (la misma varianza)
Si las varianzas son distintas (aunque se mantenga la simetría para el grupo comparativo) , ya no podemos usar el principio de proyectar la línea media de un grupo hacia otro para observar si cae dentro o fuera de la caja y así decidir si son iguales o distintos, puesto que ya las proyecciones NO son equivalentes
Para poder comparar grupos, la variabilidad tiene que ser equivalente
Criterio paramétrico: N > 30
Dado que las pruebas paramétricas realizan estimación de parámetros de la población a partir de muestras estadísticas, es lógico pensar que cuanto más grande sea la muestra, más exacta será la estimación; en cambio, cuanto más pequeña, más distorsionada será la media de las muestras por los valores raros extremos.
Tipo de prueba a elegir depende de
Número de muestras
una dos Más de dos
Cumplimiento deSupuestos
Paramétricos
SI
Use prueba paramétrica
NO
Use prueba NO
paramétrica
Número de muestrass
Pruebas estadísticas que se aplican
Pruebas Paramétricas
Pruebas No Paramétricas
Una muestra Prueba t de Student
para una muestra
nominal X2
ordinalZ de Kolmogorov-Smirnov
Dos muestras
Indep.
T de Student para muestras independientes
nominal Fisher
ordinalMediana y U de Mann Whitney
Relac.
T de Student para muestras relacionadas
Nominal Mc Nemar
ordinal Signos y Wilcoxon
Más de dos muestras
Indep. ANOVA
1 VI: ANOVA de 1 factor Nominal Chi Cuadrado
2 VI: ANOVA factorial Ordinal kruskal Wallis
Relac.
ANOVA de una via (intragrupos)
nominal Q de Cochran
ordinal
Friedman
PASO 3
Determinar si la prueba de significancia tendrá dos direcciones o una sola
• Si la hipótesis alternativa se formula simplemente como “la hipótesis nula no es cierta”, el contraste es bilateral o de dos colas.
• Por el contrario cuando se indica el sentido de la diferencia, el contraste es unilateral o de una sola cola
Contraste de dos colas
- /2= 0.025
área de rechazo de Ho
Área de no
rechazo de Ho
Z
t
F
x2
Estadísticos de prueba
Una prueba es de dos colas cuando no se establece una dirección específica de la hipótesis de investigación :
H0: el ingreso medio de las mujeres es igual al ingreso medio de los hombres.H1 : el ingreso medio de las mujeres no es igual al ingreso medio de los hombres.
prueba de dos colas, nivel de significancia de 0.05
/2= 0.025
área de rechazo de Ho
Contraste de una cola
prueba de una cola, nivel de significancia de .05
= 0.05
área de rechazo de Ho
Z
t
F
x2
Significación
Estadísticos de prueba
Area de no rechazo de
Ho
Una prueba es de una cola cuando la hipótesis de investigación establece una dirección, como:
H0 : el ingreso medio de las mujeres es igual al ingreso medio de los hombres. H1 : el ingreso medio de las mujeres es mayor que el de los hombres.
Paso 4Especifica el nivel de significación
El nivel de significación de un test es un concepto estadístico asociado a la verificación de una hipótesis. En pocas palabras, se define como la probabilidad de tomar la decisión de rechazar la hipótesis nula (H0) cuando ésta es verdadera.
Esta probabilidad (denotada como α) se suele especificar antes de tomar la muestra, de manera que los resultados obtenidos no influyan en la decisión
Probabilidad del 95%
1-α = 0.95 α = 0.05
Probabilidad del 90%
1-α = 0.90 α = 0.10
Probabilidad del 99%
1-α = 0.99 α = 0.01
Los valores más comunes de significancia son de 0.05, 0.01, 0.001, estos valores dependen de la rigurosidad que establezca el investigador para su análisis.
Cuando se define un a: 0.05 se está diciendo que se está dispuesto a cometer el error tipo I como máximo el 5% de las veces; o sea que de cada 100 veces que a partir de los datos se concluya a favor de la hipótesis alterna, se tolera equivocarse como máximo, en cinco de esas 100 veces.
La decisión se toma a menudo utilizando el valor P (o p-valor): si el valor P es inferior al nivel de significación, entonces la hipótesis nula es rechazada. Cuanto mayor sea la p (p > 0,05) más fuerte y segura será la evidencia a favor de la hipótesis nula (igualdad).
p < 0.05 A≠B p ≥ 0.05 A = B
Se rechaza la hipótesis nula Se acepta la hipótesis nula
No parece que el azar pueda explicarlo todo
No se puede descartar que el azar lo explique todo
Hay diferencias estadísticamente significativas
NO hay diferencias estadísticamente significativas
Existen evidencias a favor de la Hipótesis de investigación
No existen evidencias a favor de la Hipótesis de investigación
Paso 5Calcular el valor del test
Este paso se hará en cada una de las presentaciones al comparar la media de un grupo, de dos grupos y de más de dos grupos