ESTADISTICA
Describir y sintetizar
Analizar e inferir
Resumen estadístico
Tablas de frecuencias
y Gráficos
Estimación puntual
Contrastes de hipótesis
Intervalos de confianza
¿Qué es una hipótesis?
• Una creencia sobre la población, principalmente sus parámetros:
– Media
– Varianza
– Proporción
• Si queremos contrastarla, debe establecerse antesdel análisis.
• Dicha creencia puede ser o no ser verdadera
Creo que el porcentajede enfermos será el
5%
Contrastando una hipótesis
¿Es el peso medio de80 kg?
Son demasiados...
kg 65=x
¡Gran diferencia!
Rechazo la hipótesis
Muestra aleatoria
Contraste (Test) de Hipótesis
Conjunto de reglas que se usan para determinar si una afirmaciónacerca de una población puede rechazarse o no a partir de losresultados obtenidos en una muestra.
En todo contraste de hipótesis, hay 2 enunciados excluyentes:
� Hipótesis nula o H0: Hipótesis que se somete a comprobaciónpara ver si se rechaza o no.
� Hipótesis alternativa o H1: Hipótesis que se acepta cuando serechaza H0, es la negación de H0
Ambas hipótesis NO tienen igual fuerza, salvo que sedemuestre lo contrario, hay que asumir que H 0 es cierta .
Contraste de hipótesis: Filosofía
Un contraste de hipótesis tienen una presunción a favor deH0, de forma similar a como ocurre en los tribunales dejusticia, donde hay una presunción de inocencia . Dadoque uno es inocente hasta que se demuestre lo contrario,la evidencia aportada debe ser muy consistente paraadmitir la culpabilidad
Contraste de hipótesis
Hipótesis nula (H 0) versus alternativa (H 1)
Reglas de inferencia negativa
Se da por supuesto que la hipótesis nula es
verdadera
La decisión por H 1, viene dada a partir del rechazo de H 0
Razonamiento básico
80=µ65=x
Si supongo que H0 es cierta...
... el resultado del experimento sería improbable.
Sin embargo ocurrió.
¿qué hace un científico cuando
su teoría no coincide con sus
predicciones?
Razonamiento básico
80=µ65=x
Si supongo que H0 es cierta...
... el resultado del experimento sería improbable.
Sin embargo ocurrió.
Rechazo que H0
sea cierta.
Razonamiento básico
80=µ77=x
Si supongo que H0 es cierta...
... el resultado del experimento es coherente.
• No hay evidencia contra H0
•No se rechaza H0
•El experimento no es concluyente
•El contraste no es significativo
¿Si una teoría hace una
predicción con éxito, queda
probado que es cierta?
¡¡Siempre puede haber datos (no tomados), que contradigan H0!!
Elementos a establecer en Contraste Hipótesis
• Hipótesis nulaHo
– Afirmación en términos de igualdad– Hipótesis científicamente más simple– Los datos pueden refutarla– No debería ser rechazada sin una buena razón.
• Hipótesis Alternativa H1
– Niega a H0
– Hipótesis que se quiere demostrar fuera de toda duda– Si nos decantamos por ella se quiere estar prácticamente
seguro de que es cierta– Los datos pueden mostrar evidencia a favor– No debería ser aceptada sin una gran evidencia a favor.
≥≤= , ,
><≠ , ,
• Nivel de significación, α
– Probabilidad [Rechazar H0 / H0 es cierta] = α
– Es un valor tanto más pequeño cuántas más garantías se precisen de que una decisión a favor de H1 sea correcta. Usualmente se toma α = 0.05
• Estadístico de Contraste
– Variable aleatoria que se usa para realizar el test
– Es una función de los valores de la muestra que resume la información relevante de ella.
– Si se cumple H0, su comportamiento es conocido
Elementos a establecer en Contraste Hipótesis
¿Quién es H0?
• Ejemplo: «En la ejecución de una prueba diagnóstico del SIDAhay 2 posibilidades: que se obtenga resultado positivo, o que seobtenga resultado negativo. No obstante, la prueba no es 100%exacta, ya que existen los falsos negativos y falsos positivos.Determine quién sería H0»
• Hipótesis:
– El individuo está enfermo (el virus está en el individuo)
– El individuo está sano (no existe el virus)
– Seleccionar la hipótesis nula, H0 : El individuo está sano
¿Quién es H0?
• Ejemplo: «Se está estudiando un nuevo fármaco para poderutilizarlo contra el cáncer de piel. Se espera que sea eficazen la mayoría de los pacientes sobre los que se aplica. Laempresa que produce el fármaco desea alguna pruebaestadística que apoye tal afirmación»
• Hipótesis:
– El nuevo fármaco es efectivo en la mayoría de pacientes
– El nuevo fármaco no es efectivo en la mayoría de los pacientes
– Seleccionar la hipótesis nula, H0 : El nuevo fármaco no es efectivo
¿Quién es H0?
• Ejemplo: «Se está estudiando un nuevo fármaco para poderutilizarlo contra el cáncer de piel. Se espera que sea eficazen la mayoría de los pacientes sobre los que se aplica. Laempresa que produce el fármaco desea alguna pruebaestadística que apoye tal afirmación»
• Solución:
– Traducir a lenguaje estadístico:
– Establecer su opuesto:
– Seleccionar la hipótesis nula
5.0>p
5.0≤p
5.0:0 ≤pH
¿Quién es H0?
• Problema: El porcentaje de personas atacadas por cierta epidemia en una gran ciudad, no supera el 10%.
• Solución:
– Traducir a lenguaje estadístico:
– Establecer su opuesto:
– Seleccionar la hipótesis nula
1.0≤p
1.0>p
1.0:0 ≤pH
¿Quién es H0?
• Problema: ¿El peso medio de una población es 70kg?
• Solución:
– Traducir a lenguaje estadístico:
– Establecer su opuesto:
– Seleccionar la hipótesis nula
70=µ70≠µ
70:0 =µH
Región crítica y nivel de significación
Región crítica• Valores ‘improbables’ si Ho
cierta.• Es conocida antes de realizar
el experimento: son resultados experimentales que harían rechazar H0
Nivel de significación: α• Número pequeño: 1% , 5%• Fijado de antemano por el
investigador• Es la probabilidad de rechazar
H0 cuando es cierta
No rechazo H0
Reg. Crit.Reg. Crit.
α = 0.05=5%
Η0: µ=40
Contrastes: unilateral y bilateral
La posición de la región crítica depende de la hipótesis alternativa
Unilateral Unilateral
Bilateral
H1: µ<20 H1: µ>20
H1: µ≠20
Ejemplo 1: Se juzga a un individuo por la presunta comisión de un delito
• H0: Hipótesis nula– Es inocente
• H1: Hipótesis alternativa– Es culpable
Los datos pueden refutarla
La que se acepta si las pruebas no indican lo contrario
Rechazarla por error tiene graves consecuencias
Riesgos al tomar decisiones
No debería ser aceptada sin una gran evidencia a favor
Rechazarla por error tiene consecuencias menos graves
Tipos de error al tomar una decisión
Realidad
Inocente Culpable
Veredicto Inocente OK Error
Menos grave
Culpable Error
Muy grave
OK
Ejemplo 2: Se cree que un nueva dieta ofrece buenos resultados
Ejemplo 3: Parece que hay una incidencia de enfermedad más alta de lo normal
• H0: Hipótesis nula– (Ej.1) Es inocente– (Ej.2) La nueva dieta no tiene
efecto– (Ej.3) La incidencia es normal
• H1: Hipótesis alternativa– (Ej.1) Es culpable– (Ej.2) La nueva dieta es útil– (Ej. 3) La incidencia es anormal
Riesgos al contrastar hipótesis
Tipos de error al contrastar hipótesis
Realidad
Decisión H0 Cierta H0 Falsa
No Rechazo H0
(Retener H0)
CorrectoLa dieta no tiene efecto y así se decide
Probabilidad 1 -α«Especificidad del test»
Error de tipo IILa dieta sí tiene efecto pero no se percibe.
Probabilidadβ
«Falso negativo»
Rechazo H0
Acepto H1
Error de tipo ILa dieta no tiene efecto pero se decide que sí.
Probabilidad α«Falso positivo»
CorrectoLa dieta tiene efecto y el experimento lo confirma.
Probabilidad 1- β«Sensibilidad del test»
Toda decisión por H1 lleva implícita un posible error, llamado error α, o error Tipo I :
α = P [Rechazar H0 / H0 es cierta] ≡ Error Tipo I
Toda decisión por H0 lleva implícita un posible error, llamado error β, o error Tipo II :
β = P [Retener H0 / H1 es cierta] ≡ Error Tipo II
Tipos de error al contrastar hipótesis
� Consideraciones:
� α está controlado. Por eso una decisión por H 1 essiempre fiable (es posible que sea errónea, pero esmuy improbable)
� β no está controlado. Por eso una decisión por H0 NOes fiable (lo único que indica es que no se ha podidodemostrar que H0 es falsa)
Procedimiento para un contraste de hipótesis
1. Fijar H0 y H1 de acuerdo al problema.2. Seleccionar el estadístico de contraste (v.a.) que sea el
adecuado para resolver el contraste, y que si H0 es ciertatendrá un comportamiento conocido.
3. Fijar el nivel de significación,α4. Determinar la región crítica o de rechazo de H0
5. Seleccionar una muestra de tamaño n, para la cual elestadístico de contraste tomará un valor numérico (sedenomina valor experimental).
6. Adoptar una decisión sobre el rechazo o no de H0: Serechaza H0 si el valor experimental del estadístico estáen la región de rechazo.
Contraste de Hipótesis sobre µ
• Caso 1: Cuando σ2 es conocida, el estadístico de contraste es:
)1,0(N
n
xZ →−= σ
µ
• Caso 2: Cuando σ2 no es conocida, el estadístico de contraste es:
1ˆ −→−= nt
nsx
Tµ
Ejemplo 1Se estima que el peso medio de una población de adultos es deal menos 76.7 Kg. Por una investigación anterior se conoceque la desviación típica poblacional esσ = 8.6 kg. Seseleccionan 45 individuos aleatoriamente obteniéndose unpromedio de de 73.2 kg. Contraste la hipótesis de que elpromedio ha disminuido paraα = 0.01.
73.245/6.8
7.762.730exp −=−=−=
n
xz σ
µ zexp < zα/2 - 2.73 < - 2.326
Se rechaza Ho al nivel α=0.01
7.76:1 <µH
7.76: ≥µHo01.0=α
Z=-2.326
Ejemplo 2En un preparado alimenticio infantil se especifica que elcontenido medio de proteínas es del 42%. Se está comprobandola validez de esa especificación, y para ello se toman 10preparados que son analizados para determinar su contenido enproteínas, obteniendo una media del 40% y una cuasidesv.típica del 3.5% ¿Es correcta la especificación paraα = 0.05?
42:1 ≠µH
42: =µHo05.0=α
807.110/5.3
4240ˆ
0exp −=−=−=
ns
xt
µ texp > - t n-1; α/2 -1.807 > - 2.262
No se rechaza Ho al nivel α=0.05
t=-2.262 t=2.262
Contraste de Hipótesis sobre σ2
En este caso el estadístico de contraste es:
212
22 ˆ)1(
−→−= n
sn χσ
χ
• Se trata de efectuar un contraste de hipótesis acerca de variabilidad en la población, para ello se trabaja con la varianza poblacional σ2
Ejemplo 3
Para un tratamiento dietético se conoce que la reducción media
de peso en mujeres adultas es µ = 9kg con una variabilidad
dada por una varianza σ2 = 2.5 kg2. Un dietista está intentando
mejorar la dieta reduciendo la variabilidad. Para ello, en una
experiencia piloto con una muestra de 15 mujeres, modifica la
dieta obteniendo una cuasivarianza muestral de 2.1 kg2 . ¿Se
puede admitir para nivel significación α = 0.05 que el dietista
ha reducido la variabilidad?
Ejemplo 3
76.115.2
1.214ˆ)1(20
22exp =⋅=−=
σχ sn
5.2: 21 <σH
5.2: 2 ≥σHo 05.0=α
5706.6295.0;14
22/1);1( ==−− χχ αn
No se rechaza Ho al nivel α=0.05
• Se trata de efectuar un contraste de hipótesis acerca de la proporción p de individuos que presentan una cierta característica o atributo en una población.
)1,0()1(
ˆ
00
0 N
npp
ppZ →
−−=
Contraste de Hipótesis sobre p
En este caso el estadístico de contraste es (n ≥ 30):
Ejemplo 4
Se realizó una encuesta con el fin de estudiar las prácticas
sanitarias dentales, de cierta población urbana de adultos. De
300 adultos entrevistados, 123 dijeron que regularmente se
sometían a una revisión dental dos veces al año. Contraste la
hipótesis de que el 50 % de los adultos de dicha población se
someten regularmente a una revisión dental dos veces al año.
5.0:1 ≠pH
5.0: =pHo05.0=α
Ejemplo 4
1176.3300/)5.05.0(
5.041.0
)1(
ˆ
00
0exp −=
⋅−=
−−=
npp
ppz
41.0300
123ˆ ==p
Se rechaza Ho a nivel designificación α=0.05
Z=-1.96 Z=1.96
Ejemplo 5
Se conoce que el porcentaje de complejos vitamínicos
producidos cumple los requerimientos de calidad en al menos
90% de los casos. Para comprobar dicha afirmación, la
inspección selecciona una muestra aleatoria de 625 complejos
vitamínicos, encontrando que 550 son de calidad. Contraste
la hipótesis de que el porcentaje de complejos que se
producen con calidad es al menos el 90% para un nivel de
significaciónα = 0.01.
9.0:1 <pH
9.0: ≥pHo01.0=α
Z=-2.326
88.0625
550ˆ ==p
6666.1625/)1.09.0(
9.088.0
)1(
ˆ
00
0exp −=
⋅−=
−−=
npp
ppz
Ejemplo 5
No se rechaza Ho a nivelde significación α=0.01