Grado Ciencias AmbientalesFacultad de CienciasDepartamento MatemáticasProfesor: Santiago de la Fuente Fernández
CÓMIC APLICACIONES CHI-CUADRADOTEST DE NORMALIDADTEST POISSON
Una empresa de imprimir, alimentada a mano, estaba sujeta a lo que parecía ser un númeroirrazonable de obstrucciones causadas por interferencias de las hojas de papel a la prensa.Se hizo una prueba para ver si diferentes operarios encontraban o no diferentes grados dedificultad con la máquina. Cada operario alimentó la máquina introduciendo el mismo númerode hojas, contándose luego el número de atascos sufridos por cada uno, lo que dio lugar a lasiguiente tabla:
Operario A B C D TotalObstrucciones 6 7 9 18 40
¿Existe o no diferencia entre los operarios a un nivel 05,0=α ?. ¿Y aun nivel 025,0=α ?.Analizar los resultados.
El valor teórico viene dado por la expresión: 348,9815,7 23;025,0
23;05,0 =χ=χ
En un hospital se ensayó la eficacia de cinco medicamentos en un grupo de pacientes, con elobjeto de determinar si al final del tratamiento un paciente determinado mejoraba o no.Las observaciones que se encontraron están anotadas en la siguiente tabla:
Tratamientos A B C D E TotalNúmero de pacientes 51 54 48 49 48 250Pacientes mejorados 12 8 10 15 5 50
¿Existe diferencia entre los medicamentos a un nivel de 0,05?.
50250
a51
=50250
b54
=50250
c48
=50250
d49
=50250
e48
=
2,10250
51.50a == 8,10250
54.50b == 6,9250
48.50b == 8,9250
49.50b == 6,9250
48.50e ==
El estadístico de contraste:
03,65003,56506,9
58,9
156,9
108,10
82,10
12neO 22222
i
2i
5
1i
215 =−=−⎟
⎟⎠
⎞⎜⎜⎝
⎛+⎟
⎟⎠
⎞⎜⎜⎝
⎛+⎟
⎟⎠
⎞⎜⎜⎝
⎛+⎟
⎟⎠
⎞⎜⎜⎝
⎛+⎟
⎟⎠
⎞⎜⎜⎝
⎛=−=χ ∑
=−
Por tanto, como 24;05,0
24 488,903,6 χ=<=χ , aceptamos la hipótesis nula oH , es decir,
no existe diferencia entre los diferentes medicamentos, con un riesgo 05,0=α , en lamejora de los pacientes al finalizar el medicamento.
Las leyes de la herencia de Mendel predicen la aparición de tipos de guisantes conascendencia específica 9:3:3:1 para las clases lisa y amarilla, lisa y verde, arrugada yamarilla, arrugada y verde. En cierto experimento se obtuvieron, respectivamente, 315,108, 101 y 32.A un nivel de 0,05, ¿coinciden los datos con la teoría?.
47,055647,55655675,34
3225,104
10125,104
10875,312
315neO 2222
i
2i
4
1i
214 =−=−⎟
⎟⎠
⎞⎜⎜⎝
⎛+⎟
⎟⎠
⎞⎜⎜⎝
⎛+⎟
⎟⎠
⎞⎜⎜⎝
⎛+⎟
⎟⎠
⎞⎜⎜⎝
⎛=−=χ ∑
=−
Se acepta la hipótesis nula oH porque 23;05,0
23 815,747,0 χ=<=χ , el valor teórico es
menor que el valor esperado, afirmando que los datos observados coinciden con la teoría.
En un laboratorio se observó el número de partículas α que llegan a una determinada zonaprocedentes de una sustancia radiactiva en un corto espacio de tiempo siempre igual,anotándose los resultados en la siguiente tabla:
Número de partículas 0 1 2 3 4 5Número de períodos de tiempo 120 200 140 20 10 2
Se pide:
a) Ajustar los datos a una distribución de Poisson.b) Calcular la probabilidad con que llegan las partículas.
c) Verificar si el ajuste es correcto mediante una 2χ , con un nivel 05.0=α
2,1492590
n
nx
x
6
1iii
====λ∑= . Por tanto, ( ) 2,1
ke.
!k2,1kxP −== 5,,1,0k L=
31,324928,15
127,42
207,106
1408,177
2002,148
120neO 222225
1i i
2i2
3 =−⎟⎟⎠
⎞⎜⎜⎝
⎛+⎟
⎟⎠
⎞⎜⎜⎝
⎛+⎟
⎟⎠
⎞⎜⎜⎝
⎛+⎟
⎟⎠
⎞⎜⎜⎝
⎛+⎟
⎟⎠
⎞⎜⎜⎝
⎛=−=χ ∑
=
Como ( )23;05,0
23 815,731,32 χ=>=χ el valor observado es mayor que el valor teórico,
rechazamos la hipótesis nula. Es decir, la distribución de datos en estudio no se puedeajustar a una distribución de Poisson a un nivel de confianza del 95%.
En una examen final de estadística, los estudiantes recibieron las siguientes calificaciones:
80 70 75 65 85 90 80 85 7575 95 50 90 75 55 85 65 9080 65 80 80 80 75 70 95 10070 75 70 80 85 60 80
Verificar si las calificaciones obtenidas siguen una distribución normal, con una fiabilidaddel 95%.
Intervalos ix iO ii O.x i2i O.x
45 - 55 50 1 50 250055 - 65 60 2 120 720065 - 75 70 7 490 3430075 - 85 80 13 1040 8320085 - 95 90 8 720 6480095 - 105 100 3 300 30000
34O6
1i
i =∑=
∑=
=6
1i
ii 2720O.x ∑=
=6
1i
i2i 222000O.x
8034
2720n
O.x
x
6
1i
ii
====μ∑=
( ) 4,1141,129640034
2220008034
O.x2
6
1i
i2i
2 =σ=−=−=σ∑=
Intervalos ix iO ip n.pe ii = 2iO i
2i eO
45 - 55 50 1 0,0129 0,41 1 2,4455 - 65 60 2 0,08 2,72 4 1,4765 - 75 70 7 0,2366 8,04 49 6,0975 - 85 80 13 0,34 11,56 169 14,6285 - 95 90 8 0,2366 8,04 64 7,9695 - 105 100 3 0,08 2,72 9 3,31
n = 34 87,35eO
6
1ii
2i =∑
=
Como ( )23;05,0
236 815,787,1 χ=<=χ − , el valor observado es menor que el valor teórico o
esperado, afirmamos que las calificaciones se distribuyen normalmente a un nivel deconfianza del 95%.
Tres métodos de empaquetado de tomates fueron probados durante un período de cuatromeses; se hizo un recuento del número de kilos por 1000 que llegaron estropeados,obteniéndose la tabla adjunta:
Meses A B C Total1 6 10 10 262 8 12 12 323 8 8 14 304 9 14 16 39
Total 31 44 52 127Se pide:
a) Observando simplemente los datos, ¿qué creeremos que se puede inferir sobre el experimento?
b) Con un nivel de significación 05,0=α , comprobar que los tres métodos son igualmente buenos.
81,7127
31.32nO.O
e 12 yx21 === 32,7
12731.30
nO.O
e 13 yx31 ===
09,11127
44.32nO.O
e 22 yx22 === 39,10
12744.30
n
O.Oe 23 yx
32 ===
10,13127
52.32nO.O
e 32 yx23 === 28,12
12752.30
n
O.Oe 33 yx
33 ===
97,15127
52.39e51,13127
44.39e52,9127
31.39e 434241 ======
El estadístico de contraste: ( ) ( )( )
ne
Ok
1i
m
1j ij
2ij
eeO
k
1i
m
1j
21m.1k ij
2ijij −==χ ∑∑∑∑
= =
−
= =−−
En nuestro caso, ( ) ( ) ( ) ( ) 613.141m.1k =−−=−−
24,112797,15
1651,13
1452,9
928,12
1439,10
832,7
8
10,1312
09,1112
81,78
65,1010
01,910
35,66n
e
O
222222
2222224
1i
3
1j ij
2ij2
6
=−⎟⎟⎠
⎞⎜⎜⎝
⎛+⎟
⎟⎠
⎞⎜⎜⎝
⎛+⎟
⎟⎠
⎞⎜⎜⎝
⎛+⎟
⎟⎠
⎞⎜⎜⎝
⎛+⎟
⎟⎠
⎞⎜⎜⎝
⎛+⎟
⎟⎠
⎞⎜⎜⎝
⎛+
+⎟⎟⎠
⎞⎜⎜⎝
⎛+⎟
⎟⎠
⎞⎜⎜⎝
⎛+⎟
⎟⎠
⎞⎜⎜⎝
⎛+⎟
⎟⎠
⎞⎜⎜⎝
⎛+⎟
⎟⎠
⎞⎜⎜⎝
⎛+⎟
⎟⎠
⎞⎜⎜⎝
⎛=−=χ ∑∑
= =
La siguiente tabla muestra el resultado de un experimento para investigar el efecto de lavacunación de animales de laboratorio contra una determinada enfermedad:
EnfermosVacuna
Sufrieron laenfermedad
No sufrieronla enfermedad
Vacunados 9 42No Vacunados 18 28
Se pide:a) ¿Afecta la vacuna a un nivel ?05,0=αb) ¿Y a un nivel ?01,0=αc) Responder al apartado (a) utilizando la corrección de Yates.
2,3397
70.46nO.O
e8,1297
27.46nO.O
e
8,3697
70.51nO.O
e2,1497
27.51nO.O
e
2212
2111
yx22
yx21
yx12
yx11
======
======
57,5972,33
288,12
188,36
422,14
9ne
O 22222
1i
2
1j ij
2ij2
1 =−⎟⎟⎠
⎞⎜⎜⎝
⎛+⎟
⎟⎠
⎞⎜⎜⎝
⎛+⎟
⎟⎠
⎞⎜⎜⎝
⎛+⎟
⎟⎠
⎞⎜⎜⎝
⎛=−=χ ∑∑
= =
Sobre una decisión de importancia nacional los votos de demócratas y republicanosregistraron los datos de la siguiente tabla:
A favor En contra AbstencionesDemócratas 85 79 40Republicanos 120 62 26
Se pide:a) ¿Hay diferencia entre ambos partidos a un nivel ?05,0=αb) ¿Y a un nivel ?01,0=α
32,33412
66.208nO.O
e68,32412
66.204nO.O
e
2,71412
141.208nO.O
e82,69412
141.204nO.O
e
5,103412
205.208nO.O
e5,101412
205.204nO.O
e
3231
2221
1211
yx23
yx13
yx22
yx12
yx21
yx11
======
======
======
El estadístico de contraste:
94,1041294,42241232,33
262,71
62
5,103120
68,3240
82,6979
5,10185n
e
O
22
22222
1i
3
1j ij
2ij2
2
=−=−⎟⎟⎠
⎞⎜⎜⎝
⎛+⎟
⎟⎠
⎞⎜⎜⎝
⎛+
+⎟⎟⎠
⎞⎜⎜⎝
⎛+⎟
⎟⎠
⎞⎜⎜⎝
⎛+⎟
⎟⎠
⎞⎜⎜⎝
⎛+⎟
⎟⎠
⎞⎜⎜⎝
⎛=−=χ ∑∑
= =
Se acepta la hipótesis nula oH cuando el estadístico de contraste ( ) ( )2
1m.1k −−χ es menor o
igual que el estadístico teórico ( ) ( )2
1m.1k; −−αχ . Atendiendo a que:
22;01,0
22
22;05,0
22 210,994,10991,594,10 χ=>=χχ=>=χ
En ambos casos, con un riesgo de 05,0=α y 01,0=α , se rechaza la hipótesis nula,concluyendo que existe diferencia entre los dos partidos cara a la votación.
96,1041243,21353,209
41266
2614162
205120.
208412
6640
14179
20585.
204412
nOO
OO
OO.
On
OO
OO
OO.
On
222222
y
223
y
222
y
221
xy
213
y
212
y
211
x
22
32123211
=−+=
=−⎥⎥⎦
⎤
⎢⎢⎣
⎡++⎥⎦
⎤⎢⎣⎡+
⎥⎥⎦
⎤
⎢⎢⎣
⎡++⎥⎦
⎤⎢⎣⎡=
=−⎥⎥⎦
⎤
⎢⎢⎣
⎡++
⎥⎥⎦
⎤
⎢⎢⎣
⎡+
⎥⎥⎦
⎤
⎢⎢⎣
⎡++
⎥⎥⎦
⎤
⎢⎢⎣
⎡=χ
22;01,0
22
22;05,0
22 210,996,10991,596,10 χ=>=χχ=>=χ
En ambos casos, con un riesgo de 05,0=α y 01,0=α , se rechaza la hipótesis nula,concluyendo que existe diferencia entre los dos partidos cara a la votación.
Un agricultor desea saber si existe diferencia entre diez abonos en el cultivo del plátanoen una determinada zona. Para ello abona seis matas con cada abono, observa el mismonúmero de kilos y obtiene los siguientes resultados:
Abono ix 1x 2x 3x 4x 5x 6x 7x 8x 9x 10x2is 9 3 4 3 5 4 2 4 5 3
( ≡2is varianza del abono ix ) )6n( =
¿Es cierto que hay diferencia entre los abonos a un nivel 01,0=α ?. ¿Y a un nivel 05,0=α ?
El estadístico de contraste: ( ≡in elementos muestra ix )
( ) ( ) ( ) ( )[ ]∑∑==
− −−⎥⎥
⎦
⎤
⎢⎢
⎣
⎡−=χ
k
1i
2ii
k
1ii
221k sLn.1n1n.sLn
• Si todas las muestras tuvieran los mismos elementos, esto es, k21 nnn === L , se
llega a una expresión más simplificada:
( ) ( )⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛−−=χ ∑
=−
k
1i
2i
221k sLnsLn.k.1n
Se acepta la hipótesis nula oH , para un nivel de significación α , cuando se verifica
( )2
1k;2
1k −α− χ<χ . En caso contrario se rechaza.
Abono ix 1x 2x 3x 4x 5x 6x 7x 8x 9x 10x2is 9 3 4 3 5 4 2 4 5 3 42
2isLn 2,20 1,10 1,39 1,10 1,61 1,39 0,69 1,39 1,61 1,10 13,58
2,41042
10
s
s
10
1i
2i
2 ===∑=
( ) ( ) ( ) ( ) 85,358,132,4Ln.10.16sLnsLn.k.1n 29
k
1i
2i
221k =−−=χ
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛−−=χ ∑
=− a
El estadístico teórico o esperado: 616,21919,16 29;01.0
29;05.0 =χ=χ
En ambos casos el estadístico observado 85,329 =χ es menor que el estadístico teórico
919,1629;05.0 =χ (nivel 0,05) o 616,212
9;01.0 =χ (nivel 0,01), por lo que aceptamos la
hipótesis nula de que no hay diferencia entre los abonos (las varianzas son iguales).
Se está estudiando la distribución de los grupos sanguíneos O, A, B, AB en doscomunidades. Los resultados obtenidos son:
O A B ABComunidad 1 121 120 79 33Comunidad 2 118 95 121 30
a) ¿Se puede considerar que son homogéneas ambas comunidades?
b) Considerando ahora sólo los datos de la Comunidad 1, el modelo teórico asigna lassiguientes probabilidades a cada uno de los grupos:
O2r
A
pr2p2 +
B
qr2q2 +
AB
pq2)1rqp( =++
A partir de los datos de la muestra se han obtenido las siguientes estimaciones de losparámetros: 2465,0p̂ = y 1732,0q̂ = . Obtener las frecuencias esperadas según elmodelo teórico y contrastar la hipótesis de que los datos se ajustan a él.
O A B AB
Comunidad 1 121(117,67)
120(105,85)
79(98,47)
33(31,02)
353O 1x =
Comunidad 2118
(121,33)95
(109,15)121
(101,53)30
(31,98) 364O 2x =
239O 1y = 215O 2y = 200O 3y = 63O 4y = 717
67,117717
239.353nO.O
e 11 yx11 === 33,121
717239.364
nO.O
e 12 yx21 ===
85,105717
215.353nO.O
e 21 yx12 === 15,109
717215.364
n
O.Oe 22 yx
22 ===
47,98717
200.353nO.O
e 31 yx13 === 53,101
717200.364
nO.O
e 32 yx23 ===
02,31717
63.353n
O.Oe 41 yx14 === 98,31
71763.364
n
O.Oe 42 yx
24 ===
b) Sea la hipótesis nula :Ho El modelo genético es correcto
O A B AB
Comunidad 1121
21 r.ne =
120
)pr2p(.ne 22 +=
79
)qr2q(.ne 23 +=
33)pq2(.ne4 =
43,035343,353353eO4
1i i
2i2
12
124 =−=−=χ=χ ∑=
−−
Como 21;05,0
21 841,343,0 χ=<=χ se acepta la hipótesis nula, concluyendo que
el modelo genético es correcto, a un nivel de significación de 0,05.
Se ha desarrollado un modelo teórico para las diferentes clases de una variedad demoscas. El modelo dice que la mosca puede ser de tipo L con probabilidad p2, de tipo M conprobabilidad q2 y de tipo N con probabilidad 2pq.Para confirmar el modelo experimentalmente se toma una muestra de 100 moscas,obteniendo 10, 50 y 40, respectivamente.
a) Hallar la estimación de máxima verosimilitud de p con los datos obtenidos.
b) ¿Se ajustan los datos al modelo teórico, al nivel de significación 0,05 ?
227,010042
4049
509
10neO 2223
1i i
2i2
12
1132
1pk =−⎥⎥⎦
⎤
⎢⎢⎣
⎡+
⎥⎥⎦
⎤
⎢⎢⎣
⎡+
⎥⎥⎦
⎤
⎢⎢⎣
⎡=−=χ=χ=χ ∑
=−−−−
El estadístico teórico 841,321;05,0 =χ
Como 21;05,0
2 841,3227,01
χ=<=χ se acepta la hipótesis nula Ho, y en consecuencia, se
acepta el modelo teórico, con una fiabilidad del 95%.
El número de defectos congénitos en una muestra de 100 individuos de una poblaciónestableció la siguiente distribución:
Número de defectos 0 1 2 3 4 5Frecuencia 84 9 3 2 1 1
¿Se ajustan los datos a una distribución de Poisson?.
Número de defectos 0 1 ≥ 2Probabilidad 0,7408 0,2222 0,0368
=−⎥⎥⎦
⎤
⎢⎢⎣
⎡+
⎥⎥⎦
⎤
⎢⎢⎣
⎡+
⎥⎥⎦
⎤
⎢⎢⎣
⎡=−=χ ∑
=
10068,3
722,22
908,74
84neO 2223
1i i
2i2
1 12,21
Siendo 21;01,0
21 635,621,12 χ=>=χ se rechaza la hipótesis nula, concluyendo que
el número de defectos congénitos no sigue una distribución de Poisson, con un nivel deconfianza del 99%.
Con el objeto de controlar la producción de una máquina que produce laminas de madera seinspeccionan 100 láminas al azar. Los resúmenes de los resultados muestrales son:
7,9xˆ ==μ 05,1ˆ =σ .20 láminas con espesor inferior a 9 mm - 38 láminas con espesor entre 9 y 10 mm - 25láminas con espesor entre 10 y 11 mm - 17 láminas con espesor superior a 11 mm -.¿Se ajustan los datos a una distribución normal, con una confianza del 95%?.
Como 21;05,0
21 841,306,5 χ=>=χ se rechaza la hipótesis nula y se concluye que el
espesor de las láminas de madera no se ajusta a una distribución normal, con un nivel designificación de 0,05.
Se clasificaron 1000 individuos de una población según el sexo y según fueran normales odaltónicos.
Masculino FemeninoNormal 442 514Daltónicos 38 6
p21 pqp
21 2 +
Según un modelo genético, las probabilidades son:q
21 2q
21
donde q = 1 - p = proporción de genes defectuosos de la población.A partir de la muestra se ha estimado que 087,0q̂ = . ¿Concuerdan los datos con elmodelo?.
La tabla de frecuencias observadas y esperadas [ ei = n . pi ] será:
Hombre Normal Hombre Daltónico Mujer Normal Mujer Daltónica442 38 514 6 1000
(456,5) (43,5) (496,2) (3,8) (1000)
Siendo 22;05,0
22 991,5068,3 χ=<=χ se acepta la hipótesis nula Ho y se concluye
que se acepta el modelo genético, con un nivel de confianza del 95%.
Grado Ciencias AmbientalesFacultad de CienciasDepartamento MatemáticasProfesor: Santiago de la Fuente Fernández