Post on 12-Jun-2015
transcript
1
Prueba de Hipótesis
Tipos de inferencias (2)PRUEBA DE HIPOTESIS: busca responder a una pregunta sobre el valor de un parámetro en la población (siempre utilizando los resultadosde la muestra)
Esta pregunta sobre el valor del parámetro en la población se plantea utilizando hipótesis
El procedimiento cuantifica en que medida losdatos de la muestra apoyan la hipótesisplanteada
2
En el ejemplo anterior, la preguntaes si hay menos resistencia con el
nuevo antimalárico
En EstadísticaLos métodos estadísticos son herramientas de la ciencia para el contraste formal de hipótesis.
Las hipótesis para ser contrastadas con métodos estadísticos deben ser formuladas de modo particular
3
Elementos necesariosLas hipótesis
Un procedimiento para responder a la pregunta o hipótesis utilizando los datosde la muestra
Criterios para interpretar los resultados
Hipótesis
Son enunciados formulados comorespuestas tentativas a preguntas de investigación.
Pregunta de investigación → Hipótesis
4
Método CientíficoCómo funciona la Ciencia:
1. Se formula una hipótesis.2. Se obtienen datos (muestra)3. La hipótesis es contrastada con la
evidencia de la muestra.4. Conclusión
• La evidencia proviene de la información de las observaciones del fenómeno que se estudia.
• Las observaciones se obtienen de unidades de estudio (individuos), usualmente de una muestra.
5
Porqué hipótesis?La pregunta de investigación debe tratarde expresarse en forma de hipótesis
El método científico no permite determinarque una hipótesis es verdadera, solamentepuede determinar si es falsa
Por lo tanto debe plantearse una hipótesisque al ser rechazada dé respuesta a la pregunta de investigación
Las dos hipótesisHipótesis nula, H0Hipótesis de no diferencia o no asociación, esplanteada en forma opuesta a la pregunta de investigación de interés, definida para ser rechazada: “la tasa de resistencia a ambos antimaláricos es similar”
Hipótesis alternativa o alterna, HaEs la pregunta científica de interés. Aceptaremosque Ha es verdadera si los datos sugieren queH0 es falsa: “la tasa de resistencia difiere entreambos antimaláricos”
6
Ejemplos
β1 ≠ 0En una regresión, β1 = 0
Algún Xi es diferenteXint1 = Xint2 = Xint3 = Xint4
XCD4-intervención ≠XCD4-estándarXCD4-intervención = XCD4-estándar
Sensibtest1 > Sensibtest2Sensibtest1 ≤ Sensibtest2
Curaanalgésico1 ≥ Curaanalgésico2Curaanalgésico1 < Curaanalgésico2
Resistencia < 50%Resistencia ≥ 50%Riesgo relativo ≠ 1Riesgo relativo = 1
HaHo
Las hipótesis se plantean como:
– De existencia del EFECTO (de un tratamiento).– De una DIFERENCIA (de las medias del peso
al nacer ó las proporciones del bajo peso al nacer entre dos poblaciones).
– De la ASOCIACIÓN (entre el tipo de construcción de las casas y la distribución del Dengue).
7
Ejemplos adicionales:
– La Altura produce incremento en la frecuencia de nacimientos prematuros: Existe DIFERENCIA entre las Edades gestacionales de neonatos en la Altura vs. a Nivel del Mar.
– La sustancia X incrementa la posibilidad de malformaciones congénitas: Existe DIFERENCIA en la prevalencia de malformaciones congénitas entre gestantes expuestas a X vs. No expuestas.
Que los alumnos formulen sus preguntas de investigación y las conviertan en hipótesis
Formulación de Hipótesis (continuación)
Hipótesis Nula (Ho) :– Enunciado formal para el contraste de
hipótesis con métodos estadísticos: No hay asociación, No hay diferencia, No hay efecto.
Hipótesis alternativa (H1):– Hipótesis complementaria a Ho: Si hay
asociación, Si hay diferencia, Si hay efecto.
8
La Hipótesis nula y la Hipótesis alternativa habitualmente (p. ej. en Epidemiología) se plantean en función de una Medida del Efecto.Medidas del efecto son:– Diferencias de medias, – Diferencias de prevalencias– Razones de riesgo (Riesgos relativos)– Razones de chances (‘Odds ratios’)
Hipótesis de dos colas
Un clínico trata de demostrar que la reacciónal tratamiento es diferente entre el fármacoA y el fármaco B
Hipótesis: Ho: A = B (Nula)Ha: A ≠ B (Alterna)
9
Hipótesis de una colaInterés específico en una sola dirección
No existe interés/relevancia científica si el efecto se presenta en la otra dirección
Ejemplo: se quiere demostrar que el fármacoA tiene mayor efecto que el fármaco B
Hipótesis: Ho: A ≤ B (Nula)Ha: A > B (Alterna)
¿Cuál hipótesis es verdadera(o falsa)?
Con los datos de la muestra se calcula un valor (llamado estadístico de prueba) que sirve paradecidir si Ho es falsa y debe ser rechazada(única y exclusivamente para eso)
Si los resultados sugieren que se deberechazar Ho, entonces automáticamente se acepta que Ha es verdadera
Si los resultados no indican que se rechaze Ho tampoco se puede concluir nada sobre Ha
10
Usando el estadístico de prueba
Con el estadístico de prueba y una fórmulamatemática (distribución de probabilidades, que varía según el tipo de hipótesis evaluada), se calcula una probabilidad, el famoso valor p
El valor p, “p”, o p-value puede interpretarsecomo la probabilidad de que Ho sea verdadera
Por convención se acepta que si p < 0.05 (5%), entonces es muy probable que Ho sea falsa y por lo tanto debe ser rechazada
Ejemplo
Queremos determinar si el promedio de peso en varones es bajo (<70k)
Ho: Peso ≤ 70, Ha: Peso > 70
En 30 personas, promedio 50kg y D.E. 10 kg
11
El Valor P y la evidencia
El Valor P ó Significancia estadística es una medida (cuantitativa) de la fuerza de la evidencia en contra de la Hipótesis nula.
Escala de grises……
Mientras más pequeño sea el valor P, más fuerte es la evidencia en contra de la hipótesis nula.
12
El Valor P como una probabilidad
Utilizando el valor crítico
Región de rechazo:2.5% bajola curva
Tcrítico = -1. 70Zobservado = -10.96
13
Cálculo de probabilidad exacta
p exacto= áreabajo la curva
Zobservado = -10.96
Una interpretación práctica (aunque no exacta) del valor P es:
“P es la probabilidad de que la Hipótesis nula sea cierta”
14
Valor P (continuación)
Si las observaciones en la muestra soportan la Hipótesis nula. Entonces es más probable que esta Hipótesis sea cierta.
Reglas de Decisión
Para tomar una decisión sobre rechazar o no rechazar la hipótesis nula hay que especificar una Regla de decisión.Hay que especificar un punto de corte ópunto crítico:– Si P es menor que Alfa (α), se rechaza Ho
– Si P es mayor que Alfa (α), se rechaza Ho
15
Para cada prueba, el cálculode “p” puede diferir
Binomial o normal (Z)Una proporción
Z o TDiferencia de 2 medias
FRegresión lineal
Z o chi cuadradoDiferencia de 2 proporcionesChi cuadradoRazón de momios
DistribuciónPrueba sobre
La fórmula del estadístico de prueba también cambia!
Normal/Large Sample Data?
Inference on means?
Independent? Inference on variance?
Variance known?
Paired t
Z test
Variances equal?
T test w/ pooled
variance
T test w/ unequal variance
F test for variances
Yes
Yes
Yes Yes
Yes
Yes
No
No
No
No1
32
16
Normal/Large Sample Data?
Binomial?
Independent? Nonparametric test
Expected ≥5
2 sample Z test for proportions or contingency table
McNemar’s test
Fisher’s Exact test
No
No
No
No
Yes
Yes
Yes
4
AhoraAhora, , recordemosrecordemos queque estamosestamosusandousando unauna muestramuestra parapara
concluirconcluir sobresobre la la poblacipoblacióónn
Es Es posibleposible ((pocopoco probable, probable, ojalojaláá) ) queque la la decisidecisióónn tomadatomada de de
rechazarrechazar o no Ho sea o no Ho sea errerróóneanea
¿¿QuQuéé error error podrpodrííamosamos cometercometer??
17
Escenarios posiblesESTADO REAL (LA VERDAD)
H0 es verdadera,No hay diferencia
EVIDENCIA/
DATOS DE LA
MUESTRA
No diferencia(No rechaza H0))
Error Tipo I (α)
Error Tipo II (β)
Hay diferencia(Rechazar H0 y
aceptar Ha)
NO HAY ERROR
NO HAY ERROR
H0 es falsa yHa es verdaderaHay diferencia
Posibles escenariosESTADO REAL (VERDAD)
desconocidoHay Diferencia
EVIDENCIA( DATOS)observados
No diferencia(No rechazar H0)
No hay diferencia
Error Tipo II (β)
Error Tipo I (α)
Diferencia(Rechazar H0)
NO HAY ERROR
NO HAY ERROR
18
Errores en la toma de decisiones
Al tomar una decisión basados en un punto de corte se pueden cometer uno de dos errores:
1. Rechazar Ho siendo esta cierta(Error tipo I).
2. No rechazar Ho siendo esta falsa(Error tipo II)
Error Tipo I (α)PUEDE ocurrir cuando la evidencia (datos de la muestra) sugiere NO RECHAZAR Ho
El error consiste en reportar una diferencia o asociación que realmente no existe
Puede deberse a un tamaño de muestra muygrande que detecta diferencias no biológicas
También puede darse por azar, estimándoseque puede ocurrir con una probabilidad “p”
19
Error Tipo II (β)PUEDE ocurrir cuando la evidencia sugiereRECHAZAR Ho
El error consiste en reportar que no hay unadiferencia o asociación cuando si la hay
Puede deberse a tener una muestra pequeñaque no permite detectar diferencias reales
También puede darse por azar, aunque el cálculo de la probabilidad (ß) es muy complejo
Habitualmente (Tradicionalmente) se especifica a priori un punto de corte (α) de 0.05. Esto trasladado a nuestra regla de decisión, significa que el Error tipo I de la prueba estadística será del 5%.Una vez especificado el valor de α, tenemos controlada la magnitud del Error tipo I. El Error tipo II (β) se controla modificando el tamaño de la muestra. En general α y β se minimizan con tamaños de muestra grandes.
20
¿Cómo determinar el tamaño de los errores α yβ ? :Debiera depender de las consecuencias de cometer uno u otro error ? EJEMPLOS:Al investigar una nueva Droga en un estudio in vitro: Si el resultado es significativo→ se continua investigando; caso contrario se abandona el estudio. En este caso tiene más sentido minimizar β (abandonar para siempre el estudio de una droga efectiva).
En un ensayo clínico de una Droga para tratar una enfermedad (que tiene varios otros tratamientos efectivos). Si el resultado es significativo, la droga entra al mercado; caso contrario el trabajo en esta droga cesará.El error β (abandonar el estudio de una droga efectiva para la que existen varias opciones) noes tan importante como cometer un error α que implicaría sacar al mercado una droga inútil.En este caso α tendría prioridad en ser minimizada
21
Errores conceptuales comunes
Las inferencias son válidas sólo para lasmuestras donde se tomaron los datos
Si no rechazamos H0 eso significa que H0 esverdadera
Una diferencia estadísticamente significativatiene relevancia biológica
El valor p mide que tan diferentes son lospromedios/proporciones
Supuestos más comunes
Todas las observaciones son independientesentre sí
Tamaño de muestra “grande” para que se cumpla el teorema del límite central
En variables numéricas, no deben habervalores extremos o sesgos que limiten la representatividad del promedio como medidade tendencia central
22
Ejemplo: Prueba de Hipótesis
Un Clínico compara la proporción de pacientes con Hepatitis crónica queresponde favorablemente a dos tratamientos: A y B.
Hipótesis: Ho: A – B =0 (Nula)H1: A – B ≠0 (Alterna)
Se llevó a cabo un Ensayo clínico asignando de manera aleatoria (y ciega) la droga A y la droga B a 300 pacientes con Hepatitis crónica. Se observó que en el grupo que recibió la droga A, 30% tuvieron respuesta favorable. En contraste con el grupo que recibió la droga B (17% respondieron favorablemente).
23
Especificando un punto de corte para significancia: Alfa (α) = 0.05
Prueba estadística para comparar proporciones (30% versus 17%): P=0.015
Conclusión: La diferencia en las respuestas al tratamiento entre los grupos (droga A vs. droga B) es significativa.
Dependiendo de la Medida del efectoempleada (diferencias, odds ratios [OR], riesgos relativos [RR]) y del tipo de variables a analizar (promedios, proporciones, tiempo hasta un evento, etc...) las hipótesis varian, así como los métodos estadísticos que se deben usar.
24
Significancia estadística vs. Significancia biológica.
La significancia estadística no dice nada acerca de la verdadera magnitud o la importancia de un ‘efecto’.En muestras grandes, las diferencias muy pequeñas que tienen poca o ninguna importancia biológica pueden resultar significativas.Las Implicancias de un resultado ‘significativo’deben ser juzgados en otro terreno [el Biológico], además del estadístico.
Ejemplos con Stata (1)
Pregunta de investigación: ¿El sexo influye en la edad de inicio del consumo de cigarrillos?
Ho: Edadinicio consumo(varones-mujeres)=0H1: Edadinicio consumo(varones-mujeres)≠0
Datos: Encuesta de drogas
25
Variables: p59 (Edad de inicio del consumo de cigarrillos) e inf_sexo (Sexo)Prueba estadística: Prueba t para dos medias independientes
Ejemplos con Stata (2)
Pregunta de investigación: ¿Existen diferencias entre sexos en la prevalencia de consumo de cigarrillos?
Ho: P(varones) –P(mujeres)=0H1: P(varones) –P(mujeres)≠0
Datos: Encuesta de drogas
26
Variables: fuma (generada de p58) e inf_sexo (Sexo)Prueba estadística: Prueba Z para dos proporciones