Date post: | 30-Dec-2015 |
Category: |
Documents |
Upload: | zahir-wilcox |
View: | 49 times |
Download: | 0 times |
PROVES D’HIPÒTESIS
Objectius
Conèixer el procés per fer contrastos d’hipòtesis
Diferenciar entre hipòtesi nul·la i alternativa
Regió crítica i nivell de significació
Grau de significació
Presa de decisions, tipus d’errors i quantificació de l’error.
Que és una hipòtesi?
És una proposició sobre la població, principalment sobre algun paràmetre: Mitjana Proporció Variança
Normalment s’estableix abans de obtenir una mostra i fer l'anàlisi estadístic
Bioestadística FMCS Reus URV Curs 2012-13 4
Elements de les proves d’hipòtesi
Una prova d’hipòtesis consta de quatre elements:
Hipòtesis Nul·la (H0) Hipòtesis alternativa (Hα) El estadístic de la prova La regió de rebuig o regió crítica
Bioestadística FMCS Reus URV Curs 2012-13 5
Hipòtesis Nul·la (H0):
Una hipòtesi que fa referència a algun dels paràmetres que desconeixem de una variable aleatòria X
La hipòtesi nul·la serà la hipòtesi que volem contrastar Triarem la hipòtesi nul·la, sempre que les dades que
tenim no ens indiquen que es falsa
Elements de les proves d’hipòtesi
Bioestadística FMCS Reus URV Curs 2012-13 6
Hipòtesis alternativa (Hα) :
La hipòtesi alternativa es la contraria a la hipòtesi nul·la
Solament s'accepta si, amb les dades que tenim, hi ha una gran evidencia que la hipòtesi nul·la es falsa.
Elements de les proves d’hipòtesi
Hipòtesi nul·la Ho
La que contrastem o posem a prova
No es pot rebutjar sense una bona raó, les diferències observades poden ser degudes a l’atzar
Hipòtesi alternativa H1
Contradiu la H0
No s’ha d’acceptar sense una gran evidencia a favor de rebutjar la hipòtesi nul·la
Elements de les proves d’hipòtesi
Problema: La osteoporosi està relacionada amb el gènere? Si considerem que el 50 % són homes i l’altre 50 % dones.
Solució:
Traduir al llenguatge estadístic:
Establir el seu oposat:
Seleccionar la hipòtesi nul·la
%50=p
%50p ≠
%50=p:H0
Elements de les proves d’hipòtesi
Problema: El colesterol mitjà quan es segueix una dieta mediterrània és de 5 mmol/l?
Solució:
Traduir al llenguatge estadístic:
Establir el seu oposat:
Seleccionar la hipòtesis nul·la
5=μ
5μ ≠
5=μ:H0
Elements de les proves d’hipòtesi
Bioestadística FMCS Reus URV Curs 2012-13 10
El estadístic de la prova:
Es una funció que s’elabora a partir de dades mostrals. En funció del valor de l’estadístic de la prova.
Si el valor està dintre de la regió d'acceptació acceptarem la hipòtesi nul·la.
Si el valor està fora de la regió d'acceptació rebutjarem la hipòtesi nul·la i acceptarem la hipotesi alternativa
Elements de les proves d’hipòtesi
Raonament
X
Si se suposa que la H0 és certa...
... el resultat de l’experiment era improbable. No obstant ha
succeït
Què fa un investigador quan la seva teoria no coincideix amb els resultats que obté?
Exemple: Si H0 i el valor obtingut a la mostra és de
40=μ
20=X
... el resultat de l’experiment era poc probable. No obstant ha
succeït
Rebutjo que la H0 sigui certa i concloc que μ ≠ 40.
40 20=X
40=μ
38=X
... el resultat del experiment és coherent.
• No hi ha evidencia contra la H0
•No es pot refusar la H0
•L’experiment no és concloent
•El contrast no és significatiu
Exemple: Si H0: i el valor obtingut a la mostra és de 40 38X
Bioestadística FMCS Reus URV Curs 2012-13 14
La regió de rebuig o regió critica:
Son aquells valors de l'estadístic de la mostra en la cula es rebutja la hipòtesi nul·la (H0)
La regió crítica es defineix abans de realitzar el experiment Es basa en un nivell de significació α donat a priori Definim α com la probabilitat de rebutjar la
hipòtesi nul·la quan la hipòtesi nul·la és realment certa
Elements de les proves d’hipòtesi
Regió crítica i nivell de significació
Regió crítica On els valores són ‘improbables’ Es coneix abans de realitzar
l’experiment. Hi ha resultats experimentals que rebutjarien H0
Nivell de significació: Número petit: 1% , 5% Fixat de manera prèvia per
l’investigador És la probabilitat de refusar la
H0 quan és certa
No refús H0
Reg. Crit.Reg. Crit.
= 5%
• Paràmetre: µ• Hipòtesis Nul·la (H0) H0: µ = µ0
• Hipòtesis alternativa (Hα) Hα : µ ≠ µ0
• El estadístic de la prova (σ coneguda)• Sota la hipòtesi H0 certa
• La regió de rebuig o regió crítica
Rebuig de H0 si z Є (-∞,-zα/2) o z Є (zα/2,∞)
Acceptació de H0 si z Є (-zα/2,zα/2)
Si α=0.05 z α/2= z 0.025=1.96
( )nσ,μN~X0
)1,0(N
nσμ
=σ
μ=Z 0
X
X ≈-X-X
Elements de les proves d’hipòtesi
• Paràmetre: µ• Hipòtesis Nul·la (H0) H0: µ = µ0
• Hipòtesis alternativa (Hα) Hα : µ ≠ µ0
• El estadístic de la prova (σ desconeguda)• Sota la hipòtesi H0 certa
• La regió de rebuig o regió crítica
Rebuig de H0 si t Є (-∞,-t n-1,α/2) o t Є (t n-1,α/2,∞)
Acceptació de H0 si t Є (- t n-1,α/2,t n-1,α/2)
Si n gran la t-student es equivalent a una N(0,1)
)1n(
0
X
X t
nsμ
=σ
μ=T
-≈
-X-X
Elements de les proves d’hipòtesi
( )ns,μt~X0)1n( -
• Paràmetre: p• Hipòtesis Nul·la (H0) H0: p = p0
• Hipòtesis alternativa (Hα) Hα : p ≠ p0
• El estadístic de la prova• Sota la hipòtesi H0 certa
• La regió de rebuig o regió crítica
Rebuig de H0 si z Є (-∞,-zα/2) o z Є (zα/2,∞)
Acceptació de H0 si z Є (-zα/2,zα/2)
Si α=0.05 z α/2= z 0.025=1.96
),(N
n
)p(ppp̂pp̂
Zp̂
10≈-1--
00
00
Elements de les proves d’hipòtesi
n)p(p,pN~p̂ 000 -1
Contrastos: unilateral i bilateral
La posició de la regió crítica depèn de com es faci la hipòtesi alternativa
Unilateral Unilateral
Bilateral
H1: m < H1: m >
H1: m ≠
• Paràmetre: µ• Hipòtesis Nul·la (H0) H0: µ ≤ µ0
• Hipòtesis alternativa (Hα) Hα : µ > µ0
• El estadístic de la prova (σ coneguda)• Sota la hipòtesi H0 certa
• La regió de rebuig o regió crítica
Rebuig de H0 si z Є (zα,∞)
Acceptació de H0 si z Є (-∞,zα)
Si α=0.05 z α= z 0.05=1.645
Elements de les proves d’hipòtesi
( )nσ,μN~X0
)1,0(N
nσμ
=σ
μ=Z 0
X
X ≈-X-X
• Paràmetre: µ• Hipòtesis Nul·la (H0) H0: µ ≤ µ0
• Hipòtesis alternativa (Hα) Hα : µ > µ0
• El estadístic de la prova (σ desconeguda)• Sota la hipòtesi H0 certa
• La regió de rebuig o regió crítica
Rebuig de H0 si t Є (t n-1,α,∞)
Acceptació de H0 si t Є (-∞ ,t n-1,α)
Si n gran la t-student es equivalent a una N(0,1)
Elements de les proves d’hipòtesi
( )ns,μt~X0)1n( -
)1n(
0
X
X t
nsμ
=σ
μ=T
-≈
-X-X
• Paràmetre: p• Hipòtesis Nul·la (H0) H0: p ≤ p0
• Hipòtesis alternativa (Hα) Hα : p > p0
• El estadístic de la prova• Sota la hipòtesi H0 certa
• La regió de rebuig o regió crítica
Rebuig de H0 si z Є (zα,∞)
Acceptació de H0 si z Є (-∞,zα)
Si α=0.05 z α= z 0.05=1.645
),(N
n
)p(ppp̂pp̂
Zp̂
10≈-1--
00
00
Elements de les proves d’hipòtesi
n)p(p,pN~p̂ 000 -1
Nivell de significació
Nivell
És un número petit que s’escull al dissenyar l’experiment
Serveix per definir la regió crítica
Tipus d’error aleatori en una prova estadística de contrast d’hipòtesi: error tipus
I i tipus II
Realitat (població)
Hi ha diferència o associació (H0 falsa)
No hi ha diferència o associació (H0 certa)
Resultatde laprova
(mostra)
diferència o associació significativa(refús de H0)
No error error tipus I
diferència o associació no significativa (no refús de H0)
error tipus II
No error
[ ] [ ]falsaésH|HrefusaesnoobPr=IItipuserroruncometreobPr=β 00
[ ] [ ]certaésH|HrefusarobPr=ItipuserroruncometreobPr=α 00
Poder i nivell de confiança
DecisióPoblació real
H0 és falsa H0 és certa
Es refusa la H0 Decisió correcte1- (poder)
Risc (error tipus I)
No es refusa la H0 Risc (error tipus II)
Decisió correcte1- (confiança)
[ ]falsaésH|HrefusarobPr=potenciaoPoder=β1 00
1- és el nivell de confiança
Bioestadística FMCS Reus URV Curs 2012-13 26
EXERCICISPROVES D’HIPÒTESIS
Bioestadística FMCS Reus URV Curs 2012-13 27
Exemple 1: Un estudi clínic sobre la temperatura mitjana del cos
humà per adults sans afirma que la temperatura mitjana és una variable que es distribueix normalment amb mitjana =370C i desviació típica =0’90C.
Definim la hipòtesi de que la temperatura mitjana és
μ = 370 C Hipòtesi nul·la H0
μ ≠ 37 0C Hipòtesi alternativa H1
X~N(37,0’9)
Bioestadística FMCS Reus URV Curs 2012-13 28
Per poder fer aquest contrast és tria una mostra aleatòria formada per 10 persones adultes sanes i se'ls pren la temperatura, el resultat és:
37’7 36’7 37’5 37 37’9 37’6 37’1 37 36’8 37’1
nNX ,:
109'0,37: NX
xEn aquesta mostra la mitjana d'aquests valors és = 37’24C
nNX ,:
109'0,37: NX
Bioestadística FMCS Reus URV Curs 2012-13 29
Regió crítica
36’44
37,56
0’0250’025
37
0’95
Regió d’acceptació
Regió crítica
Comprovem si = 37’24C esta dintre de la regió critica o dintre de la regió d’acceptació
x
α= 0’05
Sota la hipòtesis:
109'0,37: NX
Bioestadística FMCS Reus URV Curs 2012-13 30
Z~N(0,1)
109'0,37: NX
109'037--X X
ZX
1’96
109'0,37NX
-1’9636’44 37,56
Bioestadística FMCS Reus URV Curs 2012-13 31
Es fixa un nivell de confiança, per exemple 1- α = 0’95
Acceptarem la hipòtesi nul·la si l'estadístic de contrast un cop tipificat cau dins de l'interval (- z/2 a z/2) és a dir dins de l'interval ( -1’96 a 1’96) que anomenem regió d'acceptació. En cas contrari
Rebutjarem la hipòtesi nul·la, Si l'estadístic de contrast un cop tipificat cau dins la regió complementaria, fora del interval (- z/2 a z/2) que anomenem regió crítica o regió de rebuig.
Bioestadística FMCS Reus URV Curs 2012-13 32
Així dons si segueix una llei N(37, 0’285) i tipifiquem el valor 37’24.
x
285'037x -
⇒ segueix una N(0,1) 84'0285'0
3724'37
com que 0’84 )96'1a96'1(-∈
No podem refusar la hipòtesi nul·la. Es a dir, la mostra és realment compatible amb la població en el 95% dels casos. També podem concloure que la mitjana de la temperatura del cos humà per adults sans és de 370C amb una confiança del 95%.
Bioestadística FMCS Reus URV Curs 2012-13 33
Regió crítica
-1’96 1’96
0’0250’025
0
0’95
Regió d’acceptació
Regió crítica
Regió d’acceptació i regió crítica
Hem efectuat un contrast bilateral
Bioestadística FMCS Reus URV Curs 2012-13 34
Contrastos: unilateral i bilateral
La posició de la regió crítica depèn de com es faci la hipòtesi alternativa
Unilateral Unilateral
Bilateral
H1: > 37ºC H1: < 37ºC
- z/2
z
H0: = 370 CH1: ≠ 37º C
- z
z/2
Bioestadística FMCS Reus URV Curs 2012-13 35
Valors crítics més usuals
Nivell de significació
Valors crítics per a contrastos unilaterals
z
Valors crítics per a contrastos bilaterals
z/2
0’1 ± 1’28 ± 1’645 0’05 ± 1’645 ± 1’96 0’01 ± 2’33 ± 2’58
0’005 ± 2’58 ± 2’81 0’002 ± 2’88 ± 3’08
Bioestadística FMCS Reus URV Curs 2012-13 36
Exemple 2:
L'Ajuntament d'una ciutat ha dut a terme un estudi per conèixer l’efecte de l'alcohol en els accidents juvenils dels caps de setmana. Com a conseqüència de l'estudi se sap que el 65% dels accidents juvenils amb víctimes durant els caps de setmana les persones causants havien begut alcohol. Com podríem comprovar aquesta hipòtesi sobre l’efecte de l’alcohol sobre els accidents que dóna l'Ajuntament ?
Un investigador que decideix comprovar aquesta hipòtesi, agafa una mostra formada per 35 accidents i observa que 24 han estat a causa de l’alcohol a partir d'aquí fa un contrast d'hipòtesis.
Bioestadística FMCS Reus URV Curs 2012-13 37
1er pas: es formulen les hipòtesis: H0 p = 0’65 = Po
Ha p ≠ 0’65
2on pas: es tria , per exemple = 0’01 3er pas: es tria l’estadístic de contrast
n
)p1(p
pp̂=z
oo
o
-
-
4art pas: es determina la regió d’acceptació. Com que es tracta d’un contrast bilateral, per a = 0’01, tenim que és (-2’58; 2’58) 5è pas
444'0=
35)65'01(65'0
65'0686'0=Z
35=n;686'0=3524
=p̂
Bioestadística FMCS Reus URV Curs 2012-13 38
6è pas: Com que 0’444 (-2’58;2’58), s’accepta la
hipòtesi nul·la i diem que al nivell de l’1% s’accepta que la proporció d’accidents a causa de l’alcohol és del 65 %
Bioestadística FMCS Reus URV Curs 2012-13 39
Exemple 3:Un entrenador assegura que els seus jugadors encistellen més del 92% dels tirs lliures. A fi de comprovar aquesta afirmació, s'han triat de manera aleatòria una mostra de seixanta llançaments dels quals quaranta-dos han entrat en cistella. Aquests resultats posen en qüestió l'entrenador ?1er pas
es formulen les hipòtesis:H0 p ≥ 0’92 = Po
Ha p < 0’92 2on pases tria ; per exemple = 0’1 3er pases tria l’estadístic de contrast
n
)p1(p
pp̂z
oo
o
Bioestadística FMCS Reus URV Curs 2012-13 40
4art pases determina la regió d’acceptació. Com que es tracta d’un contrast unilateral, per a = 0’1, tenim que la regió d’acceptació és (-1’28; ∞)
5è pas
2857'6
60)92'01(92'0
92'07'0z
60n;7'06042
p̂
6è pasCom que -6’29 (-1’28;∞), es rebutja la hipòtesi nul·la, per tant, es posa en qüestió l’afirmació de l’entrenador al nivell del 10 %.
Bioestadística FMCS Reus URV Curs 2012-13 41
Contrast per al paràmetre p
n
p1p
pp̂z
oo
o
- z
1 -
z
1 -
- z/2 z/2
1 -
Hipòtesi nul·la
Ha
Hipòtesi alternativa
Ha
Tipus de contrast
Estadístic de contrast
Regió d’acceptació
P = Po P ≠ po bilateral
segueix una llei N(0,1)
(-z/2,z/2)
P po P > po unilateral (-∞,z)
P ≥ po P < pp unilateral (-z,+∞)
Bioestadística FMCS Reus URV Curs 2012-13 42
Alguns exemples de regions d’acceptacióContrastos bilaterals (valors crítics)
0’90
-1’645 0 1’645
0’95
-1’96 0 1’96
0’99
-2’58 0 2’58
Contrastos unilaterals (valors crítics)
0’90
0’90 0’95 0’99
0’99 0’95
0 1’28 0 1’645 0 2’33
-1’28 0 -1’645 0 -2’33 0
Bioestadística FMCS Reus URV Curs 2012-13 43
Exercici
Diferents estudis han permès dir que la distribució de pesos al néixer presenta una mitjana = 3’200 gr. i una desviació estàndard = 360 gr. en la població.Suposem que es vol comprovar si l'hàbit de fumar durant l'embaràs disminueix el pes dels nens al néixer.
Per contrastar la hipòtesi anterior s'han registrat els pesos en gr. d'una mostra de nounats, fills de mares fumadores. Suposem que els valors registrats en gr. siguin :
3000, 3100, 2800, 3300, 2600, 2700, 2500, 2900, 3000, 3200
Bioestadística FMCS Reus URV Curs 2012-13 44
Quin valor correspon a la mitjana del pes al néixer de la mostra de nounats de l'estudi ?
x
3000, 3100, 2800, 3300, 2600, 2700, 2500, 2900, 3000, 3200
= 2910 x = 2910 x = 2910
Bioestadística FMCS Reus URV Curs 2012-13 45
Quin valor correspon a la desviació estàndard del pes al néixer de la mostra de nounats de l'estudi ?
3000, 3100, 2800, 3300, 2600, 2700, 2500, 2900, 3000, 3200
s0= 260,13
Bioestadística FMCS Reus URV Curs 2012-13 46
Quin valor correspon a la mitjana de la distribució mostral de la mitjana dels pesos al néixer en mostres de mida n = 10 procedents d'una població de mitjana = 3200 gr. i desviació estàndard = 360 gr. ?
3200
Bioestadística FMCS Reus URV Curs 2012-13 47
Quin valor correspon a la desviació estàndard de la distribució mostral de la mitjana dels pesos al néixer en mostres de mida n=10 procedents d'una població de mitjana = 3200 gr. i desviació estàndard = 360 gr?
nNX ,:
360/√10 = 113’84
Bioestadística FMCS Reus URV Curs 2012-13 48
Quin valor de z s'obté al fer la prova de comparació de la mitjana observada a l'estudi amb la mitjana teòrica = 3200?
84'1133200-2910
= 2’55
Bioestadística FMCS Reus URV Curs 2012-13 49
Quin grau de significació correspon al valor anterior ?.
p( Z > 2’55 ) = 0’0054
Bioestadística FMCS Reus URV Curs 2012-13 50
Que podem dir a partir dels resultats obtinguts fins ara ? (Se sap que el pes al néixer es distribueix normalment en la població de fills de mares no fumadores i en el de mares fumadores.)
Podem acceptar la hipòtesi que els fills de mares fumadores són d'una població amb mitjana de pes inferior a =3200gr.