Bioestadística FMCS Reus URV Curs 2012-13 1
Relació entre dues variables qualitatives amb dues o més categories.
Prova de Chi quadrat (2)
Bioestadística FMCS Reus URV Curs 2012-13 2
Distribució de freqüències: una variable qualitativa amb dues categories
(binaria) es descriu completament amb el percentatge o la freqüència de una de las categories i el número total de individus.
Relació entre dues variables qualitatives amb dues categories
Bioestadística FMCS Reus URV Curs 2012-13 3
Sexe: home/dona 30% o 57 homes i n = 190. 70% o 133 dones.
Obesitat: si/no 16% o 180 obesos i n = 1125. 84% o 945 no obesos.
Ingesta energètica insuficient: si/no 12% o 521 ingesta insuficient i n = 4342. 88% o 3821 ingesta no insuficient.
Descripció de la informació de variables qualitatives amb dues categories
Sexe: home/dona 30% o 57 homes i n = 190.
Obesitat: si/no 16% o 180 obesos i n = 1125.
Ingesta energètica insuficient: si/no 12% o 521 ingesta insuficient i n = 4342.
Bioestadística FMCS Reus URV Curs 2012-13 4
Distribució de freqüències: una variable qualitativa amb k (més de dues)
categories es descriu completament amb el percentatge o la freqüència de k-1 de les categories i el nombre total d’individus.
Relació entre dues variables qualitatives amb més de dues categories.
Bioestadística FMCS Reus URV Curs 2012-13 5
12’6% o 32 Alt
Descripció de la informació de variables qualitatives amb més de dues categories
Nivell socioeconòmic: Baix/Mig baix/ Mig alt/Alt 11’9% o 30 Baix o n =253 35’2% o 89 Mig baix 40’3% o 102 Mig alt
Bioestadística FMCS Reus URV Curs 2012-13 6
S’utilitza en estudis comparatius i en aquest cas la distribució teòrica de les categories de la variable d’interès (dependent) és desconeguda. No obstant, suposem que las mostres que desitgem comparar procedeixen de poblacions no diferents (Ho) i per tant aquesta distribució teòrica es pot estimar a partir de la suma de les mostres.
Chi quadrat (2) per la comparació de vàries distribucions observades.
Bioestadística FMCS Reus URV Curs 2012-13 7
Els càlculs es basen en la següent taula tipus:
La taula té f files i c columnesofc = freqüències observades; efc = freqüències esperades
Independent Total
c=1 c=2 c=3
Dependentf=3 o31/e31 o32/e32 o33/e33 n 3.
f=2 o21/e21 o22/e22 o23/e23 n 2.
f=1 o11/e11 o12/e12 o13/e13 n 1.
Total n.1 n.2 n.3 n
Bioestadística FMCS Reus URV Curs 2012-13 8
Condicions d’aplicació: efc 5Graus de llibertat: (c - 1)(f - 1) c = columnes; f =
files
nn n
e.cf.
fc
Freqüència esperada (efc):
Bioestadística FMCS Reus URV Curs 2012-13 9
Es calcula l’estadístic de contrast 2, mitjançant la fórmula:
∑∑-c
1c
f
1f
2
efc
)efco( fcχ2
Bioestadística FMCS Reus URV Curs 2012-13 10
Ho: Les distribucions de les categories de la variable dependent NO SÓN DIFERENTS entre les diferents categories de la variable independent.
H1: Les distribucions de les categories de la variable dependent SÓN DIFERENTS entre les diferents categories de la variable independent.
Formulació de les hipòtesis HHoo i H i H11
Bioestadística FMCS Reus URV Curs 2012-13 11
Exemple 1: Comparació de tres distribucions observades
En un període de 18 anys d’estudi, dels 2594 homes de l’estudi de Framingham (Massachusetts) en van morir 465. D’aquestos, 81 no havien fumat mai, 51 havien deixat de fumar (exfumadors) i 333 eren fumadors.
Ens preguntem si existeix una associació entre l’hàbit de fumar i el risc de morir, és a dir, si a la POBLACIÓ les distribucions de mortalitat (morts/no morts) SÓN DIFERENTS entre les tres categories de fumadors.
Bioestadística FMCS Reus URV Curs 2012-13 12
Hipòtesis nul·la: les distribucions de la mortalitat NO SÓN DIFERENTS entre les tres categories de fumadors.
Hipòtesis alternativa: les distribucions de la mortalitat SÓN DIFERENTS entre les tres categories de fumadors.
Hipòtesis HHipòtesis Hoo i H i H11
Bioestadística FMCS Reus URV Curs 2012-13 13
197'0=1693333=p;157'0=325
51=p;141'0=57681=p FEXNF
Freqüències observades a la mostra
Tabac Mortalitat No
Fumadors Ex
fumadors
Fumadors TOTAL
Morts 81 51 333 465 Vius 495 274 1360 2129 Total 576 325 1693 2594
Bioestadística FMCS Reus URV Curs 2012-13 14
Tabac
Resposta No fumadors
Ex fumadors
Fumadors
TOTAL
Morts 81/103’3 51/58’3 333/303’5 465 Vius 495/472’7 274/266’7 1360/1389’5 2129 Total 576 325 1693 2594
443'102
c
1c
f
1f
2 )χ
∑∑-(
fc
fcfceeo
Freqüències observades/esperades a la mostra
(3-1)(2-1) = 2 gll = (c -1)(f – 1) =
Bioestadística FMCS Reus URV Curs 2012-13 15
Percentatge esperat de morts i vius en no fumadors, ex fumadors i fumadors
Tabac Mortalitat no
fumadors ex
fumadors
fumadors TOTAL
morts 103’3 (17’9%)
58’3 (17’9%)
303’5 (17’9%)
465
vius 472’7 (82’1%)
266’7 (82’1%)
1389’5 (82’1%)
2129
Total 576 325 1693 2594
Bioestadística FMCS Reus URV Curs 2012-13 16
Percentatge esperat de no fumadors, ex fumadors i fumadors en morts y vius:
Tabac Mortalitat no
fumadors ex
fumadors
fumadors TOTAL
morts 103’3 (22’2%)
58’3 (12’5%)
303’5 (65’3%)
465
vius 472’7 (22’2%)
266’7 (12’5%)
1389’5 (65’3%)
2129
Total 576 325 1693 2594
Bioestadística FMCS Reus URV Curs 2012-13 17
Probabilitats g de ll 0’10 0’05 0’01 0’001 1 2’706 3’841 6’635 10’827 2 4’605 5’991 9’210 13’815 3 6’251 7’815 11’345 16’266 4 …
NS SIG SIG SIG p>0’10 p<0’10 p<0’05 p<0’01 p<0’001
El nostre resultat 2 = 10’443 correspon a un grau de significació p<0’01 (exactament 0’005), per tant refusem Ho i concloem que la distribució de la mortalitat és diferent entre les tres categories de fumadors.
Grau de significació de la prova Chi quadrat (2)
Bioestadística FMCS Reus URV Curs 2012-13 18
Mida de la mostra per comparar dues proporcions observades
Nombre d’individus necessaris per identificar com a significativa una comparació de dues proporcions observades
Bioestadística FMCS Reus URV Curs 2012-13 19
Mida de la mostra per comparar dues proporcions observades
BA
BBAAβα2
ppp1pp1pzp1p2z
----
2
n
n = nombre d’individus necessaris a cada grup z = valor de z corresponent al risc fixat z = valor de z corresponent al risc fixat pA = valor de la proporció esperada al grup A pB = valor de la proporció esperada al grup B pA-pB = valor mínim de la diferencia que es vol
detectar p = mitjana ponderada de les proporcions pA i pB
Bioestadística FMCS Reus URV Curs 2012-13 20
Valors Zα i Zβ
Bioestadística FMCS Reus URV Curs 2012-13 21
Quants individus necessitarem incloure en una mostra per comparar amb una prova d’hipòtesi bilateral, una confiança del 95% i una potència del 80% [ = 0’20], dues proporcions que esperem que siguin una proporció del 40% i l’altre del 50%?
Exemple 1:
5'04'0
5'015'04'014'0842'045'0145'0*296'12
----
2
n
45'387 = n
BA
BBAAβα2
ppp1pp1pzp1p2z
----
2
n
Bioestadística FMCS Reus URV Curs 2012-13 22
Exemple 2
Quants individus necessitarem incloure en una mostra per comparar amb una prova d’hipòtesi bilateral, una confiança del 95% i una potència del 80% [ = 0’20], dues proporcions que esperem que siguin una proporció del 5% i l’altre del 20%?
BA
BBAAβα2
ppp1pp1pzp1p2z
----
2
n
2'005'0
2'012'005'0105'0842'0125'01125'0*296'12
2
n
14'75 n
Bioestadística FMCS Reus URV Curs 2012-13 23
Risc I Risc II Uni/Bi pA pB N0'05 0'2 Bi 5 20 750'05 0'2 Bi 10 20 1990'05 0'2 Bi 45 60 1730'05 0'01 Uni 5 20 1490'05 0'01 Uni 10 20 3970'05 0'01 Uni 45 60 345
Risc I = risc ; Risc II = risc ; Uni= unilateral; Bi = Bilateral; pA i pB = proporcions esperades als grups A i B
Mida de la mostra per comparar dues proporcions observades
Bioestadística FMCS Reus URV Curs 2012-2013 24
Prova d’hipòtesi de comparació de dues reparticions observades utilitzant la prova de 2
Exercici
Bioestadística FMCS Reus URV Curs 2012-2013 25
Utilitzant les dades de l’exemple “Efecte de hàbit de fumar de la mare sobre el retard mental dels fills” decidiu si hi ha diferències significatives (A LA POBLACIÓ) en la freqüència de retard mental entre els nascuts de part eutòcic i els nascuts de part distòcic.
Bioestadística FMCS Reus URV Curs 2012-2013 26
Els càlculs es basen en la següent taula tipus:Independent Total
c=1 c=2 c=3
Dependentl=3 o31/e31 o32/e32 o33/e33 n 3.
l=2 o21/e21 o22/e22 o23/e23 n 2.
l=1 o11/e11 o12/e12 o13/e13 n 1.
Total n.1 n.2 n.3 n
La taula té l línies i c columnesolc = freqüències observades; elc = freqüències esperades
Bioestadística FMCS Reus URV Curs 2012-2013 27
Variable ? Total
Variable ?
Total 40
La taula te 2 línies i 2 columnesfreqüència observada
Bioestadística FMCS Reus URV Curs 2012-2013 28
Tipus de part Total
Eutòcicobs
Distòcicobs
Retard mental Si 20
No 20
Total 22 18 40
La taula te 2 línies i 2 columnesfreqüència observada
Bioestadística FMCS Reus URV Curs 2012-2013 29
Tipus de part Total
Eutòcicobs
Distòcicobs
Retard mental Si 8 12 20
No 14 6 20
Total 22 18 40
La taula te 2 línies i 2 columnesfreqüència observada
Bioestadística FMCS Reus URV Curs 2012-2013 30
Condicions d’aplicació: elc 5Graus de llibertat: (c - 1)(l - 1) c = columnes; l =
línies
Freqüència esperada (elc):
nn.c*.nlelc
Bioestadística FMCS Reus URV Curs 2012-2013 31
Graus de llibertat: (2-1)(2-1)= 1Condicions d’aplicació: elc 5
11=40
22 *20=e11
Freqüència esperada (elc):
Bioestadística FMCS Reus URV Curs 2012-2013 32
Tipus de part Total
Eutòcicobs/esp
Distòcicobs/esp
Retard mental Si 8/11 12/9 20
No 14/11 6/9 20
Total 22 18 40
La taula te 2 línies i 2 columnesfreqüència observada/freqüència esperada
Bioestadística FMCS Reus URV Curs 2012-2013 33
Es calcula l’estadístic de contrast 2, mitjançant la fórmula:
∑ ∑-c
c
l
l elc)elco( lc
1 1
2
2
Bioestadística FMCS Reus URV Curs 2012-2013 34
Es calcula l’estadístic de contrast 2
( ) ( ) ( ) ( ) 636'3=9+11+9+11= 961114912118χ2222
2 ----
Graus de llibertad: (2-1)*(2-1) = 1
Bioestadística FMCS Reus URV Curs 2012-2013 35
Càlcul de la p Àrea en l’extrem superior
gl 0’10 0’05 0’01 0’001 1 2’71 3’84 6’63 10’83 2 4’61 5’99 9’21 13’82 3 6’25 7’81 11’34 16’27
NS SIG SIG SIG p>0’10 p<0’10 p<0’05 p<0’01 p<0’001
El nostre resultat 2 = 3’636 correspon a un grau de significació p>0.05 (exactament 0’056), per tant no refusem la Ho i concloem que la freqüència de retard mental no és diferent entre els nascuts de parts eutòcics i distòcics
Bioestadística FMCS Reus URV Curs 2012-2013 36
Càlcul del nombre d’individus necessaris (mida de la mostra) per la comparació de dues proporcions observades
Exercici
Bioestadística FMCS Reus URV Curs 2012-2013 37
Quants individus necessitarem incloure en una mostra per estimar (per identificar com a significativa) amb una prova d’hipòtesi bilateral, una confiança del 95% (risc = 0’05) i una potencia del 80% ( = 0’20), a) dues proporcions que esperem que siguin una
del 15% i l’altre del 35%?b) dues proporcions que esperem que siguin del
40% i 45% respectivament?c) dues proporcions que esperem que siguin 55% i
80% respectivament?
Bioestadística FMCS Reus URV Curs 2012-2013 38
Mantenint constants (com en l’enunciat) la resta de criteris:
Calcula el nombre d’individus necessaris però en el cas d’una prova d’hipòtesi unilateral.
Calcula el nombre d’individus necessaris però per una prova amb una potencia del 90% ( = 0’10)
Bioestadística FMCS Reus URV Curs 2012-2013 39
Mida de la mostra per comparar dues proporcions observades
BA
BBAAβα2
ppp1pp1pzp1p2z
----
2
n
n = nombre d’individus necessaris a cada grup z = valor de z corresponent al risc fixat z = valor de z corresponent al risc fixat pA = valor de la proporció esperada al grup A pB = valor de la proporció esperada al grup B pA-pB = valor mínim de la diferencia que es vol
detectar p = mitjana ponderada de les proporcions pA i pB
Bioestadística FMCS Reus URV Curs 2012-2013 40
Valors Zα i Zβ
Bioestadística FMCS Reus URV Curs 2012-2013 41
Quants individus necessitarem incloure en una mostra per comparar amb una prova d’hipòtesi bilateral, una confiança del 95% i una potencia del 80% [ = 0’20], dues proporcions que esperem que siguin una proporció del 15% i l’altre del 35%?
35'015'0
235'0135'015'0115'0842'025'0125'0*296'1
----
2 n
41'72 = n
Bioestadística FMCS Reus URV Curs 2012-2013 42
Risc I Risc II Uni/Bi pA pB N0'05 0'2 Bi 15 35 720'05 0'2 Bi 40 45 15320'05 0'2 Bi 55 80 540'05 0'2 Uni 15 35 570'05 0'2 Uni 40 45 12060'05 0'2 Uni 55 80 42
Risc I = risc ; Risc II = risc ; Uni= unilateral; Bi = Bilateral
Mida de la mostra (N) per comparar dos grups amb dues proporcions observades pA i pB
Bioestadística FMCS Reus URV Curs 2012-2013 43
Risc I Risc II Uni/Bi pA pB N0'05 0'2 Bi 15 35 720'05 0'2 Bi 40 45 15320'05 0'2 Bi 55 80 540'05 0'1 Bi 15 35 960'05 0'1 Bi 40 45 20530'05 0'1 Bi 55 80 72
Risc I = risc ; Risc II = risc ; Uni= unilateral; Bi = Bilateral
Mida de la mostra (N) per comparar dos grups amb dues proporcions observades pA i pB