EJERCICIOS
1. ¿Qué tipo de datos se usan para la prueba con tablas de contingencia?
Los datos necesarios para la prueba con tablas de contingencia consisten en
medidas muestrales sobre dos variables categóricas (con escala nominal u
ordinal)
2. ¿Porque la prueba con tablas de contingencia es útil en las aplicaciones de
negocios?
La prueba con tablas de contingencia se usa ampliamente en los negocios porque
las investigaciones de mercado con frecuencia incluyen la recopilación de datos
categóricos.
3. ¿Cuál es el objetivo de la prueba con tablas de contingencia?
La prueba con tablas de contingencia determina si dos variables categóricas se
relacionan entre si
4. Establezca la hipótesis nula y alternativa para la prueba con tablas de
contingencia.
H0: Las variables en las filas y las columnas son independientes
H1: Las variables en las filas y las columnas son dependientes
5. ¿Cómo se calculan las frecuencias esperadas para la prueba con tablas de
contingencia?
( )( )
6. Si una tabla de contingencia tiene 4 columnas y tres filas, ¿Cuántos grados de
libertad se tienen para la prueba con tablas de contingencia ji cuadrada?
gl = (r – 1)(c – 1)
r = número de filas
c = número de columnas
Para nuestro caso:
gl = (3 – 1)(4 – 1) = 6
7. Los distribuidores Core- Mark clasifican sus cuentas por cobrar como pagadas
a tiempo o retrasadas. Core- Mark también clasifica las cuentas como locales o
nacionales. Los datos de las últimas semanas son:
SITUACION DEL PAGO PROXIMIDAD PAGADO RETRASADO total
LOCAL 75 95 170
NACIONAL 60 110 170
total 135 205 340
a) Establezca la hipótesis nula y alternativa
H0: Situación del pago y proximidad son independientes
H1: Situación del pago y proximidad son dependientes
b) Calcule los grados de libertad
gl = (2 – 1)(2 – 1) = 1
c) Establezca la regla de decisión con un nivel de significancia de 0.02
Si el valor de nuestro estadístico de prueba deja un área mayor a 0,02
aceptaremos nuestra hipótesis nula y concluiremos que la situación del
pago y proximidad son independientes, y en caso que esta área sea menor
que 0,02 rechazaremos nuestra hipótesis nula planteada
d) Prueba si la proximidad del deudor tiene alguna influencia en la situación
de sus pagos.
Por tanto concluimos que la situación del pago y proximidad son independientes, es decir
que la proximidad del deudor no influye en su situación de pago, aceptando así nuestra
hipótesis nula
8. Publicidad Pacific investiga la relación entre el tipo favorito el mensaje
comercial y el nivel de ingresos para una muestra de consumidores. Los datos
son:
COMERCIAL FAVORITO INGRESO A B C BAJO 25 40 70 135
MEDIO 30 30 30 90
ALTO 45 20 10 75
total 100 90 110 300
a) Establezca las hipótesis nula y alternativa
H0: Ingreso y comercial favorito son independientes
H1: Ingreso y comercial favorito son dependientes
b) Calcule los grados de libertad
gl = (3 – 1)(3 – 1) = 4
c) Establezca le regla de decisión con un nivel de significancia de 0.05
Si el valor de nuestro estadístico de prueba deja un área mayor a 0,05
aceptaremos nuestra hipótesis nula y concluiremos que el ingreso de las
personas con su comercial favorito son independientes, y en caso que esta
área sea menor que 0,05 rechazaremos nuestra hipótesis nula planteada
d) Pruebe si el nivel de ingreso se relaciona con la preferencia de
comerciales.
Por tanto concluimos que el nivel Ingreso y comercial favorito son dependientes, es decir
que el nivel de ingreso se relaciona con la preferencia de comerciales, rechazamos
nuestra hipótesis nula y aceptamos la hipótesis alternativa.
9. La corporación Computervision investiga si la calidad de las partes es
independiente del turno de producción. Los datos en número de partes no
defectuosas frente a defectuosas son:
CALIDAD DE LA PARTE
TURNO DEFECTUOSA NO DEFECTUOSA
MATUTINO 67 726 793
VESPERTINO 33 575 608
NOCTURNO 61 363 424
total 161 1664 1825
a) Establezca las hipótesis nula y alternativa
H0: calidad de la parte y turno de producción son independientes
H1: calidad de la parte y turno de producción son dependientes
b) Calcule los grados de libertad
gl = (3 – 1)(2 – 1) = 2
c) Establezca le regla de decisión con un nivel de significancia de 0.05
Si el valor de nuestro estadístico de prueba deja un área mayor a 0,05
aceptaremos nuestra hipótesis nula y concluiremos que la calidad de la
parte y turno de producción son independientes , y en caso que esta área
sea menor que 0,05 rechazaremos nuestra hipótesis nula planteada
d) Pruebe si la calidad de la parte es independiente del turno de producción
Por tanto concluimos que calidad de la parte y turno de producción son dependientes,
rechazamos nuestra hipótesis nula y aceptamos la hipótesis alternativa.
10. Los grandes almacenes A.D.Nickel vende vales de regalo durante la
temporada de navidad. El gerente de ventas, Leo Henneman, quiere
determinar si el valor de un vale tiene alguna relación con lo que el cliente
compra con dicho vale. Los datos recogidos de una muestra de clientes son:
VALOR DEL VALE DEPARTAMENTO $ 10 $ 50 $ 100 + ELECTRODOMESTICOS 22 26 54 102
ROPA 33 31 22 86
HERRAMIENTAS 41 43 19 103
total 96 100 95 291
a) Establezca las hipótesis nula y alternativa
H0: valor del vale y departamento son independientes
H1: valor del vale y departamento son dependientes
b) Calcule los grados de libertad
gl = (3 – 1)(2 – 1) = 2
c) Establezca le regla de decisión con un nivel de significancia de 0.01
Si el valor de nuestro estadístico de prueba deja un área mayor a 0,0
aceptaremos nuestra hipótesis nula y concluiremos que el valor del vale y
departamento son independientes , y en caso que esta área sea menor que
0,01 rechazaremos nuestra hipótesis nula planteada
d) Pruebe si el valor del vale se relaciona con lo que el cliente compra
De donde podemos concluir que el valor del vale si se relaciona con lo que el cliente
compra es decir rechazamos nuestra hipótesis nula y aceptamos la hipótesis alternativa.
11. La Asociación Metropolitana está planeando construir un nuevo club deportivo
en Pueblo, Colorado. El grupo emprendió una investigación de mercado en el
sur de Colorado para determinar las preferencias deportivas de los hombres
de varias edades. Una muestra aleatoria de 680 hombres dio los siguientes
resultados:
GRUPO DE EDAD DEPORTE 18-30 31-45 45-60 61+ total
HOCKEY 25 50 75 100 250
BASKETBOL 100 80 30 10 220
FUTBOL AMERICANO 5 25 25 30 85
FUTBOL 20 30 40 35 125
total 150 185 170 175 680
a) Establezca las hipótesis nula y alternativa
H0: Grupo de edad y deporte son independientes
H1: Grupo de edad y deporte son dependientes
b) Calcule los grados de libertad
gl = (4 – 1)(4 – 1) = 9
c) Establezca le regla de decisión con un nivel de significancia de 0.10
Si el valor de nuestro estadístico de prueba deja un área mayor a 0,1
aceptaremos nuestra hipótesis nula y concluiremos que el Grupo de edad y
deporte son independientes, y en caso que esta área sea menor que 0,1
rechazaremos nuestra hipótesis nula planteada
d) Se relaciona la edad con las preferencias deportivas.
Nuestra probabilidad p menor a o,10 nos da evidencia suficiente para rechazar la
hipótesis nula y aceptar la hipótesis alternativa y concluir que la edad si se
relaciona o es dependiente de la preferencias deportivas.
PRUEBAS DE BONDAD DE AJUSTE
12. ¿Qué tipo de datos se usan en la prueba de bondad de ajuste ji cuadrada? Se utilizan datos cualitativos o categóricos
13. ¿Por qué la prueba de bondad de ajuste ji cuadrada es útil en los negocios? Esta prueba se usa ampliamente en los negocios porque muchas situaciones requieren medidas sobre personas en lugar de cosas
14. ¿Cuál es el objetivo de la prueba de bondad de ajuste? El objetivo es medir el grado en el que las frecuencias observadas en cada categoría de una sola variable se ajustan a las frecuencias que se esperan para una población hipotética.
15. Establezca la hipótesis nula y alternativa para la prueba de bondad de ajuste. H0: La muestra procede de la población especificada H1: La muestra no procede de la población especificada
16. ¿Cómo se calcula las frecuencias esperadas en una prueba de bondad de ajuste?
A través del valor que se espera que tome cada una de estas frecuencias y en caso de que se quiera comprobar que la muestra proviene de alguna distribución en específica se usará la función de distribución correspondiente para sacar el valor de las frecuencias esperadas.
17. si una prueba de bondad de ajuste para investigar preferencias de marcas iguales tiene cuatro categorías, ¿Cuántos grados de libertad tiene la prueba?
gl = k - 1 – c gl = 4 – 1 – 0 = 3
18. Si una prueba de bondad de ajuste para investigar si una variable sigue una
distribución normal tiene ocho categorías, ¿Cuántos grados de libertad tiene la prueba?
gl = k - 1 – c gl = 8 – 1 – 2
gl = 5
19. ¿En que difieren la prueba con tablas de contingencia y la prueba de bondad de ajuste?
La prueba de bondad de ajuste solo incluye una variable categórica mientras que con tablas de contingencia se estudia la comparación de dos variables categóricas.
20. La compañía de refrescos Shaga está a punto de introducir en el mercado su refresco de cola dietético y quiere saber si los consumidores prefieren una marca determinada en una prueba de sabor a ciegas. Se ofrece 200 bebederos de refresco de cola dietético cuatro bebidas diferentes en recipientes idénticos y se les pide que indiquen su favorito. Los resultados son.
Refresco de cola dietético favorito
A B C D
Frec
observada 60 43 46 51
Frec esperada 50 50 50 50
a) Establezca la hipótesis nula y alternativa H0: La gente prefiere cualquier marca por igual H1: La gente prefiere una marca específica
b) Calcule los grados de libertad. gl = k – 1 – c gl = 4 – 1 – 0 gl = 3
c) Establezca la regla de decisión con un nivel de significancia de 0,01. Si el área que tiene el punto crítico de nuestro estadístico de prueba ji cuadrado que calcularemos es menor a 0,01 entonces se rechazará la hipótesis nula y se concluirá que la gente prefiere cualquier marca de cola por igual caso contrario no habrá evidencia para rechazar la hipótesis nula y se concluirá que la gente prefiere una marca específica
d) Pruebe si la gente prefiere una marca a otra.
Nuestro estadístico de prueba ji cuadrado de 3,32 deja un área de 0,3449 que es mayor que nuestro nivel de significancia 0,01 por lo que aceptamos nuestra hipótesis nula y concluimos que la gente prefiere cualquiera de las cuatro marcas por igual 21. Kay Brigth, supervisora de contabilidad en Westman Corporation, quiere saber
si el proceso contable de la compañía se puede simular usando una distribución de Poisson para describir si la incidencia de error. Kay toma una muestra aleatoria de 400 cuentas de los registros de contabilidad de la empresa y resume el número de errores encontrados en cada cuenta. Los resultados son:
Número de errores
0 1 2 3 4 ó mas
Número de cuentas 102 140 75 52 31
F. esperada (dist poisson) 0,99239885 1 0,31238423 0,00055273 2,30533582
a) Establezca las hipótesis nulas y alternativas.
H0: la muestra procede de una distribución de Poisson H1: la muestra no procede de una distribución de Poisson
b) Calcule los grados de libertad. gl = k – 1 – c gl = 5 – 1 – 1
gl = 3 c) Establezca la regla de decisión con un nivel de significancia de 0,05.
Al 95% de confianza probaremos si los datos obtenidos en la tabla dan evidencia suficiente para decir que los mismos provienen de una distribución de Poissón
d) Pruebe si la distribución de Poisson describe la incidencia de error en los registros contables de la compañía.
Nuestro valor chi cuadrado con un valor de 56551,63 deja un área menor al 0,05 por lo que rechazamos la hipótesis nula y concluimos que la muestra no procede de una distribución de Poisson
22. El First Intercountry Bank investigó el número de operaciones comerciales
fallidas en los condados en los que tiene sucursales. El vicepresidente, Cal Worship, intenta obtener datos que les sirven para decidir cómo distribuir a los ejecutivos de préstamos comerciales del banco entrenados especialmente en la gestión de bancarrotas. Los resultados del muestreo son:
Condado A B C D E
Fracaso observado 17 23 25 12 23
Fracaso esperado 20 20 20 20 20
a. Establezca las hipótesis nula y alternativa. H0: Los 5 condados tienen el mismo número de problemas H1: Los 5 condados no tienen el mismo número de problemas
b. Calcule los grados de libertad. gl = k – 1 – c gl = 5 – 1 – 0
gl = 4 c. Establezca la regla de decisión con un nivel de significancia de 0.10.
Al 90% de confianza probaremos si los 5 condados tienen el mismo número de problemas
d. Determine si es razonable o no que Cal asigne a los ejecutivos de préstamos bajo la suposición de que los 5 condados tienen el mismo número de problemas.
Nuestro chi cuadrado de 5,8 deja un área de 0,2146 que es mayor que 0,10 por lo que aceptamos la hipótesis nula y concluimos que los 5 condados tienen el mismo número de problemas
23. Los registros históricos indican el número promedio de llamadas solicitando un
servicio que se reciben en las instalaciones se servicio Magna es de cuatro llamadas a la hora. Se obtiene una muestra aleatoria de 200 intervalos de una hora y se registran las frecuencias de llamadas de servicio. Los resultados son:
Número de Llamadas Número de 200 intervalos de una hora
0 45
1 99
2 32
3 19
4 o más 5
Suma 200 Utilice un nivel de significancia de 0.05 para probar si la distribución de Poisson describe o no el número de llamadas de servicio recibidas en las instalaciones de Magna.
H0: la muestra procede de una distribución de Poisson H1: la muestra no procede de una distribución de Poisson Como nos podemos dar cuenta la probabilidad de nuestro estadístico chi cuadrado es menor a 0,05 que es nuestro nivel de significancia por lo que rechazamos nuestra hipótesis nula y concluimos que la muestra no procede de una distribución de Poisson
EJERCICIOS
24. ¿Cuál es la regla general respecto a la frecuencia esperada necesaria para realizar una prueba ji cuadrada válida?
Todas las frecuencias esperadas deben ser por la regla general mayores que 5
25. ¿Cómo puede usar el valor p el analista que lleva a cabo una prueba ji cuadrado?
El analista puede tomar una decisión racional para rechazar o no la hipótesis nula basada en el conocimiento del valor p
26. Después de rechazar la hipótesis nula en una prueba con tablas de contingencia. ¿Qué debe hacer el analista?
Cuando se rechaza la hipótesis nula en la prueba de tablas de contingencia, la conclusión es que existe dependencia entre las variables de las filas y las columnas
27. La compañía Aliance Pacific realizó una encuesta entre los electores para conocer su opinión sobre una proposición para proteger un área acuífera. Se les preguntó cuál sería su voto y se probó esta variable comparándola con el nivel de ingresos, en miles de dólares. Los resultados son:
Preferencia de los electores
Nivel de ingresos ($1000) Si No Indeciso
Menos de 15 155 55 35
De 15 a menos de 30 409 110 30
De 30 a menos de 50 269 45 26
50 ó más 84 11 9
a) Establezca las hipótesis nula y alternativa H0: La preferencia de los electores con su nivel de ingreso son independientes H1: La preferencia de los electores con su nivel de ingreso son dependientes
b) Calcule los grados de libertad
gl = (3 – 1)(4 – 1) gl = 6
c) Establezca la regla de decisión con un nivel de significancia de 0.05 Al 95% de confianza probaremos si el nivel de ingresos de una persona influye con su voto sobre la protección del área acuífera
d) Pruebe si el nivel de ingresos de una persona se relaciona con su voto sobre la protección del área acuífera
Nuestro valor de chi cuadrado deja un área menor que 0,05 por lo que rechazamos la hipótesis nula y concluimos que el nivel de ingreso de una persona se relaciona con su voto
28. En la investigación del ejercicio 27, la variable escolaridad también se
probó comparándola con la forma en que las personas planeaban votar en el plebiscito. Los resultados son:
Preferencia de los electores
Escolaridad Si No Indeciso
Preparatoria 303 65 30
Parte de universidad 282 70 40
En posgrado 332 86 30
a) Establezca la hipótesis nula y alternativa H0: La escolaridad de los electores no se relaciona con su voto H1: La escolaridad de los electores se relaciona con su voto
b) Calcule los grados de libertad gl = (3 – 1)(3 – 1) gl = 4
c) Establezca la regla de decisión con un nivel de significancia de 0.01 Al 90% de confianza probaremos si la escolaridad se relaciona o no con el voto positivo de una persona para el área acuífera
d) Pruebe si la escolaridad se relaciona con el voto positivo de una persona para la protección del área acuífera
Y como nos podemos dar cuenta el área generada es mayor que 0.01 por lo que
aceptamos nuestra hipótesis nula y concluimos que la escolaridad de los electores no se relaciona con su voto
29. La compañía Dayton trata de decidir sobre cómo debe distribuir su presupuesto de publicidad. Harold Ellis, el analista de la compañía sugiere que se haga un estudio para determinar la efectividad de los distintos tipos de publicidad en otras empresas. Obtiene los siguientes datos
Número de tiendas
Tipos de publicidad
Incremento en ventas
Ventas estables
Disminución en ventas
Periódico 18 12 4
Radio 12 16 3
TV 14 16 2
a) Establezca la hipótesis nula y alternativa H0: El tipo de publicidad y las ventas son independientes H1: El tipo de publicidad y las ventas son dependientes
b) Calcule los grados de libertad gl = (3 -1)(3 – 1 ) gl = 4
c) Establezca la regla de decisión con un nivel de significancia de 0.1 Al 90% de confianza probaremos si el tipo de publicidad afecta o no a las ventas
d) Pruebe si el tipo de publicidad afecta a las ventas
Y como nos damos cuenta nuestro valor p mayor que 0,1 nos da evidencia suficiente para aceptar la hipótesis nula y concluir que el tipo de publicidad no afecta a las ventas
EJERCICIOS 30. Cuando se usa la prueba de la ji cuadrad, ¿es necesario supones que la
población sique una distribución normal? No es necesario ya que la prueba ji cuadrada se usa solo para variables categóricas
31. ¿Cuáles son las similitudes entre la distribución ji cuadrada y la distribución t? ¿Cuáles son sus diferencias?
La distribución t y la distribución ji cuadrada se caracterizan por un solo parámetro los grados de libertad, y la diferencia es que la distribución t se usa para trabajar en datos numéricos y la ji cuadrada se utiliza para datos categóricos, además que la t también necesita dos parámetros mas que son la media y la varianza
32. ¿Por qué la hipótesis alternativa de las pruebas de ji cuadrada es de una cola? Esto se debe a que la distribución ji cuadrada tiene sesgo positivo y deja un área en la cola derecha mucho más significativa que el área de la cola izquierda
33. Janis Yee, el director de mercadotecnia de la compañía Financial Fleet, lleva a cabo un experimento para determinar si el tipo de timbres que se usa en los sobres con cuestionarios influye en el hecho de que lo devuelvan. Janis manda
por correo 4000 cuestionarios; la mitad con un sello postal y la otra mitad con una estampilla normal. Los resultados son:
Tipo de timbre
Sello Estampilla
Respondió 750 775
No respondió 1250 1225
a) Establezca la hipótesis nula y alternativa.
H0: la tasa de respuesta no varía con el tipo de timbre postal, (son indep) H1: la tasa de respuesta varía con el tipo de timbre postal
b) Calcule los grados de libertad. gl = (r – 1)(c – 1) gl = (2 – 1)(2 – 1) gl = 1
c) Establezca la regla de decisión con un nivel de significancia de 0,01. Si la probabilidad p de nuestro estadístico de prueba fuera mayor que 0,01 aceptaríamos la hipótesis nula y concluiríamos que la tasa de respuesta no varía con el tipo de timbre postal. Y si este valor fuera menor que 0,01 rechazaríamos H0 y concluiríamos que la tasa de respuesta varía con el tipo de timbre postal
d) Pruebe si la tasa de respuesta varía con el tipo de timbre postal.
Como podemos observar la probabilidad del estadístico de prueba es mayor que 0,01 por lo que aceptamos la hipótesis nula y concluimos que la tasa de respuesta no varía con el tipo de timbre postal 34. Tony Greenwell, analista de la compañía de seguros Wise, piensa que los
conductores de automóviles jóvenes tienen más accidentes y deben pagar más por el seguro de sus autos. Para probar esta hipótesis, Tony reúne evidencias estadísticas sobre las tasas de siniestros para diferentes grupos de edad en un promedio de cinco años:
Grupo de edad Con siniestro Sin siniestro
16 – 20 50 175
21 – 34 45 225
35 – 49 38 375
50 s más 34 225
a) Establezca la hipótesis nula y alternativa. H0: El número de siniestros no depende de la edad H1: El número de siniestros depende de la edad
b) Calcule los grados de libertad. gl = (r – 1)(c – 1) gl = (4 – 1)(3 – 1) gl = 6
c) Establezca la regla de decisión con un nivel de significancia de 0,05. Si la probabilidad p de nuestro estadístico de prueba fuera mayor que 0,05 aceptaríamos la hipótesis nula y concluiríamos que el número de siniestros no depende de la edad. Y si este valor fuera menor que 0,01 rechazaríamos H0 y concluiríamos que el número de siniestros depende de la edad
d) Pruebe si el número de siniestros depende de la edad.
Como podemos observar la probabilidad de nuestro estadístico de prueba es mucho menor que nuestro nivel de significancia de 0,05 por lo que rechazamos la hipótesis nula y concluimos que el número de siniestros depende de la edad 35. Holly Largent, vicepresidente de computación de la Northern University, ha
recogido datos sobre el número de veces que se interrumpió el servicio a los usuarios por día, durante el último año. Holly quiere determinar la distribución de probabilidad adecuada para estas variables de manera que pueda crear un proceso de simulación. Los datos son:
Interrupciones por día Número de días
0 117
1 128
2 63
3 30
4 13
5 o mas 14
¿A qué conclusión llegará Holly?
36. La compañía Bif Peanut Butter está preocupada por sus preferencias que tienen los consumidores por otras marcas de crema de cacahuete. Contrata los servicios de una empresa de investigación que realiza una encuesta telefónica de 400 casas y obtiene las siguientes preferencias de marca:
Marca A Bif Marca C Marca D Marca E
75 65 90 82 88
Escriba un memorándum para la empresa de investigación resumiendo estos resultados. Si no hubiera preferencias de marcas por parte de los consumidores se esesperaría las siguientes frecuencias
Marca A Bif Marca C Marca D Marca E
frec observadas 75 65 90 82 88
frec esperadas 80 80 80 80 80 Por lo que entonces probaremos las siguientes hipótesis: H0: Todas las marcas tienen igual demanda de crema de cacahuate H1: no todas las marcas tienen igual demanda de crema de cacahuate
Por lo que con este valor aceptamos la hipótesis nula y concluimos que todas las marcas tienen igual demanda de crema de cacahuate por lo que se puede hacer un informe a la empresa en la cual se detalle que los resultados de la investigación nos dicen que no hay
preferencia de los consumidores por ningún tipo de marca por lo que la empresa puede estar tranquila.
37. Diane Morton, directora de mercadotecnia para las Autoridades de Transito de Spokane, contrató a Decision Science Associates para llevar a cabo un estudio de mercado. Diane quiere determinar si los usuarios del transporte viven más cerca de una parada de autobús que los que no lo usan. La decision Science hace un estudio de 1201 residentes del condado de Spokane. Los resultados son:
Proximidad a la parada del autobus
Usuarios No usuarios Total
Menos de una manzana
200 234 434
1 o 2 manzanas 170 221 391
3 o 4 manzanas 55 112 167
5 manzanas o mas 52 117 169
No lo sabe 12 28 40
TOTALES 489 712 1201
Escriba un memorándum a Diane explicándole los resultados de este estudio. Vamos a plantear las siguientes hipótesis: H0: La proximidad a la parada del autobús no depende al momento de que una persona use o no este transporte H1: La proximidad a la parada del autobús influye al momento de que una persona use o no este transporte
Podemos observar de acuerdo a este estudio que la proximidad a la parada del autobús con respecto al lugar donde viven los usuarios del mismo influye en el hecho de que sean usuarios, es decir las personas que se encuentran más alejadas de la parada del autobús suelen no ser usuarias de este medio de transporte
38. Berry Wise creó un programa de computadora para generar números aleatorios de un digito y quiere estar seguro de que dicho programa funcione correctamente. Su amigo, Michelle Conrath, está realizando un curso de estadística y accede a probar el programa. Michelle usa el programa para generar 1000 números aleatorios.
Números Frecuencia
0 90
1 85
2 115
3 101
4 92
5 107
6 85
7 112
8 113
9 100
N 1000
¿Qué debe decir Michelle a Berry sobre el programa?
números 0 1 2 3 4 5 6 7 8 9
frec observada
90 85 115 101 92 107 85 112 113 100
frec esperada 100 100 100 100 100 100 100 100 100 100
Para que este sea un buen programa debería generar una población de números aleatorios iguales H0: población de números aleatorios p = 100 H1: p ≠ 100
Por lo que concluimos que es un buen programa ya que genera una población de números aleatorios iguales
39. Carla Parrish piensa que la demanda de buñuelos de mermelada los fines de semana en Strick’s Doughnut sigue una distribución normal. Si esta en lo cierto, podrá resolver el problema de inventario de cuantos buñuelos debe hacer los viernes. Carla recoge los datos de los últimos 100 fines de semana.
40 39 33 43 45 39 44 36 39 36
45 42 45 42 33 43 42 42 45 37
42 39 40 40 38 36 37 37 41 42
41 36 40 44 45 35 39 49 40 36
34 43 38 50 37 38 35 36 39 31
35 40 48 41 37 38 37 37 40 37
47 37 40 40 39 47 37 39 36 45
37 42 35 42 40 44 35 41 38 39
31 34 37 34 31 31 42 39 43 44
45 38 33 30 39 42 40 38 45 42
Y como podemos observar estos datos claramente siguen una distribución normal Si Carla usa un nivel de significancia de 0,05, ¿Cuál será sus conclusiones?
40. “Videophiles”, un articulo den el American Demographics (julio de 1992),
publica la demografía de los usuarios de kmedios de comunicación. Una vez al año, Simmons Market Research Bureau solicita a cerca de 20000 estadounidenses que den una idea detallada sobre un comportamiento de compras, uso de medios de comunicación, características demográficas y actitudes. El estudio pregunta sobre la mayoría de las formas de comunicación, incluso revistas y periódicos, películas, estaciones de radio, canales de televisión, alquiler de videos, y la compra de libros, juegos de video y discos compactos. Simmons identifica varios tipos de usuarios, cada uno con distintas características demográficas. Entre las personas que contestaron, se identificó un total de 3800, ya sea como videoadictos o compradores de discos compactos; la siguiente tabla desglosa los resultados por categorías de ingresos por casa.
Ingreso por casa Videoadictos Compradores de discos compactos
Total
Menos de $15000 208 84 292
$15000 a menos de $35000 512 300 812
$35000 a menos de $60000 560 384 944
$60000 o más 320 432 752
1600 1200 2800
Todd Corlett está interesado en abrir una tienda para videoadictos (usuarios constantes de videos, juegos y TV por cable) y quiere saber si los compradores de discos compactos prevalecen en las mismas categorías de ingresos de los videoadictos. Esta información le ayudará a determinar donde localizar su nueva tienda. ¿Debe concluir Todd que la clasificación de personas, ya sea como videoadictos o como compradores de discos compactos, es independiente de las categorías de ingresos por casa? Lo que haremos es probar las siguientes hipótesis bajo el estadístico de prueba chi cuadrado: H0: La clasificación de las personas es independiente de las categorías de ingresos por casa H1: La clasificación de las personas depende de las categorías de ingreso por casa
A un nivel de significancia de 0,01 rechazamos nuestra hipótesis nula y concluimos que la clasificación de las personas depende de las categorías de ingreso por casa
41. Investigaciones Robinson lleva a cabo un estudio de porcentajes de mercado en el ares de Atlanta. Bill Robinson, el presidente de la compañía, identificó siete tipos de usuarios de medios de comunicación, cada uno con características demográficas distintas. Para determinar si sus resultados pueden extrapolarse a toda la población, Bill los compara con los suministros por Simmons Market Research Bureau (American Demographics, julio de 1992). Los porcentajes de Simmons para cad a grupo fueron: fanáticos de TV (22%), radioyentes (22%), lectores de periódicos (20%), cinéfilos (12%), compradores de libro (10%), video adictos (8%), y compradores de discos compactos (6%). Cuando Robinson clasifico sus 500 personas de la muestra, los resultados fueron: fanáticos de TV (100), radioyentes (120), lectores de periódicos (80), cinéfilos (80), compradores de libros (35), video adictos (60) y compradores de discos compactos (25). ¿Son los resultados de Bill los mismos que los que publica Simmons Market Research Bureau?
Para este problema los datos tomados por Bill se constituirán en frecuencias observadas mientras que los datos que publica Simmons son los valores que Bill espera que tomen sus datos (frecuencias esperadas)
H0: Los datos tomados por Bill son los mismos que los de la publicación de Simmons H1: Los datos tomados por Bill son distintos a los de la publicación de Simmons
Con esta área mayor que 0,01 que deja nuestro estadístico de prueba aceptamos la hipótesis nula y concluimos que los datos tomados por Bill son los mismos que los de la publicación de Simmons
EJERCICIOS ADICIONALES: 1) BABBET ELECTRONICS
Joe Burt es el gerente de control de calidad de la planta de la compañía Babbet Electronics que fabrica discos compactos (CD). Su jefe, el gerente de la planta, hace poco explicó a la junta de ejecutivos que acababa de leer un artículo en la revista Gramophone (agosto de 1989) sobre las ventas de CD en el mercado japonés. El administrador estableció que la calidad de las unidades producidas por Babbet había disminuido ligeramente en el último año, lo que afectaba a la efectividad de la compañía en este mercado. Joe contesto que la calidad no había bajado, pero no tenía datos que lo respaldaran. Decidió buscar alguna evidencia que confirmara o contradijera la afirmación del gerente de la planta. Se obtuvieron los registros de la compañía anteriores al último año para tener una idea del nivel de calidad en ese momento. Después e tomó una muestra aleatoria de los informes de calidad de 224 CD a partir de los registros de los últimos seis meses. Se establecieron cinco categorías para las condiciones de los CD (Tabla 11.17). Los porcentajes históricos se multiplicaron por 224 (tamaño de la muestra) para producir las frecuencias esperadas. Estas se compararon con las frecuencias observadas en cada categoría para poder realizar una prueba de bondad de ajuste. La hipótesis nula es que no hubo cambio en la calidad durante los últimos meses. TABLA 11.17 Datos para el ejercicio adicional 45.
Calidad de producto
Adecuada Pequeña corrección
Volver a procesar
Vender con descuento
Descartar
Entonces 163 37 10 8 6
Ahora 125 56 12 15 16
Con los datos de la tabla 11.17 Joe calcula un valor de p de 41,82 para la prueba de bondad de ajuste. Considera que este es un valor de prueba muy grande y se da cuenta que su jefe tiene razón: la calidad de la línea de CD se ha deteriorado en el último año, por lo que deberán tomarse medidas.
a. ¿Calculó bien Joe el estadístico de prueba? Las hipótesis a evaluarse son las siguientes: H0: no hubo cambio en la calidad durante los últimos meses. H1: hubo cambio en la calidad durante los últimos meses.
Si, el estadístico de prueba calculado por joe es correcto
b. ¿Cuáles son los valores críticos de la tabla para ji cuadrada, para varios niveles de significancia?
Alfa 0,1 0,05 0,02 0,01
ji cuadrada 7,77944034 9,48772904 11,6678434 13,2767041
c. ¿Es correcto la conclusión final de Joe?
Es correcta en cuanto Joe da la razón al gerente de la Empresa al concluir que hubo cambio en la calidad durante los últimos meses.
2) COMPAÑIA PETROLERA SHELTY Durante muchos años, Shelty (un mayorista de gasolina y otros productos para automóvil, a nivel nacional) ha ofrecido al publico su propia tarjeta de crédito. Es caro mantener este servicio y la administración de Shelty se pregunta si debe eliminar las tarjetas. Se piensa que las tarjetas de créditos generales, tan populares en estos tiempos, se prefieren a las tarjetas que se pueden usar solo con una compañía. Se contrata a un consultor para diseñar una encuesta que se mandará a una muestra aleatoria de 1383 titulares de tarjetas de crédito. Una de preguntas demográficas pide a los encuestados que clasifiquen el uso de su tarjtea Shelty como: Frecuente, regular o nulo. Otra pregunta utiliza una escala de 1 a 7 para determinar la opinión de los encuestados sobre la conveniencia de continuar con la tarjeta Shelty. La tabla 11,18 contiene los datos que se obtuvieron.
a. ¿Cuál es la hipótesis nula en esta situación? H0: La conveniencia que tiene la tarjeta es independiente del uso que le da el usuario H1: La conveniencia de la tarjeta influye en el uso de la misma
b. ¿Cuál es el estadístico de prueba, el número de grados de libertad para la prueba y el valor crítico para un nivel de significancia de 0,05? El estadístico de prueba que utilizaremos es la prueba chi cuadrada con tablas de contingencia gl = (r – 1)(c – 1) gl = (3 – 1)(7 – 1) gl = 12 El valor crítico para un nivel de significancia de 0,05 es 21,03
c. Con un nivel de significancia de 0,05, establezca el resultado de esta prueba en términos sencillos.
No conveniente Bastante conveniente
Uso de tarjeta
1 2 3 4 5 6 7
Frecuente 56 79 87 93 128 59 21
Regular 67 89 94 132 32 21 16
Nulo 87 128 90 64 21 10 9
Con este valor rechazamos la hipótesis nula y concluimos que la conveniencia de la tarjeta influye en el uso de la misma
3) VELLEY HOSPITAL. Lane Samson, jefe de la administración de un pequeño hospital en el oeste de Estado Washington, contrató a un consultor para que lleve a cabo un estudio en el área de servicio de su hospital. Se puso en marcha una serie de grupos de interés, además de una encuesta de puerta en puerta. Entre los aspectos de interés para Lane se encuentra la respuesta a la siguiente afirmación: En lo que respecta a atención sanitaria, me sentiría mejor si me trataran en el Valley Hospital. Se preguntó a los encuestados su reacción a esta afirmación y se clasificó la información según las siguientes respuestas: Estoy en completo acuerdo, no estoy de acuerdo, neutral o sin opinión, estoy de acuerdo o estoy completamente de acuerdo. Lane ya vio la tabulación de las respuestas para toda la muestra, pero quiere compararlas según dos aéreas geográficas clave. La primera (área 1) es el área de la vecindad inmediata al hospital (cuadro millas alrededor).la segunda (área 2) es el condado en el que se encuentra el hospital, fuera de las cuatro millas. Los datos se ejecutaron en el programa de computadora SPSS, versión X. se presentan aquí los comandos para generar una tabla cruzada en el área según la respuesta a la afirmación: CROSSTABS TABLES= VAR5 BY VAR 14 STATISTICS 1 Cuando se introducen los datos en la computadora, el número de área (1 o 2) es la quinta variable, por lo que esta variable recibe el nombre de VAR5. La variable de la respuesta a la afirmación de interés para LANE se introdujo como la variable 14, por lo que recibe el nombre de VAR14. La segunda línea de comandos que se muestra pide al programa que calcule el valor ji cuadrado y el valor p de los datos. Una vez finalizada la ejecución del programa de computadora, se produjeron los siguientes resultados: VAR 14 VAR 5 SD D N A SA 1 9 30 53 65 17 2 21 45 42 15 11 CHI – SQUARE = 36,97 p = 0,0000 Lane interpreta estos resultados de la siguiente manera: la tabla cruzada indica el numero de respuestas en cada una de las 10 categorías, y el número total de respuestas es de 308, el tamaño de la muestra puerta en puerta. Se calculó el estadístico ji cuadrada, 36,97, mediante la ecuación 11,2. Lane calculó los grados de libertad, 4, lo que llevo a la tabla de 13,277 a un nivel de significancia de 0,01. Así, se rechaza la hipótesis de independencia entre filas y columnas y se concluye que las dos áreas reaccionan de la forma distinta a la posibilidad de que se les trate en el Valley Hospital. Al analizar la tabla cruzada, Lane encuentra que los residentes del área 1 (cerca del hospital) se sienten más cómodos con la idea de recibir tratamiento en el Valley Hospital que quienes viven más lejos. Lane decide que una campaña de publicidad puede mejorar esta situación.
a. ¿Llegó Lane a la conclusión adecuada según los resultados de la computadora?
Totalmente de acuerdo los cálculos están bien realizados
b. ¿Utilizó el valor correcto de los grados de libertad y el valor correcto de la tabla ji cuadrada? Efectivamente como nos podemos dar cuenta en el programa jmp hemos sacado los mismos valores que se saca en spss para los grados de libertad y para la tabla ji cuadrada
c. Lane no sabe cómo interpretar el valor p impreso en los resultados de la computadora. Escriba un breve comentario que explique este valor. El área que deja nuestro estadístico de prueba es de 0,0001 el cual es menor que un nivel de significancia de 0,01 por lo que rechazamos nuestra hipótesis nula de independencia y se concluye que las dos áreas reaccionan de la forma distinta a la posibilidad de que se les trate en el Valley Hospital.