Date post: | 20-Jan-2016 |
Category: |
Documents |
Upload: | ichaveza4058 |
View: | 158 times |
Download: | 10 times |
Fundamentos de Biología
Aplicada I
Cuaderno de Prácticas de Estadística con SPSS
Curso 2010-2011
Departamento de Estadística e I.O. Universidad de Granada
Autores: Ana María Lara Porras Nuria Rico Castro Ismael R. Sánchez Borrego
Profesores de la asignatura: Javier Esquivel Sánchez Mª Dolores Huete Ruiz Ismael R. Sánchez Borrego Diego Torrecillas de Amo Silvia Valenzuela Ruiz
Índice
pág.CONTRASTES DE HIPÓTESIS PARAMÉTRICOS Y NO PARAMÉTRICOS
3
Ejercicio 1 3 Ejercicio 2 5 Ejercicio 3 6 Ejercicio 4 7 Ejercicio 5 9
ANÁLISIS DE REGRESIÓN 10 Ejercicio 1 10 Ejercicio 2 14 Ejercicio 3 17 Ejercicio 4 19 Ejercicio 5 22
DISEÑO DE EXPERIMENTOS 25 Ejercicio 1 25 Ejercicio 2 27 Ejercicio 3 28 Ejercicio 4 29 Ejercicio 5 31 Ejercicio 6 33
ANÁLISIS DE LA COVARIANZA 35 Ejercicio 1 35 Ejercicio 2 37 Ejercicio 3 39 Ejercicio 4 41
ANÁLISIS CLUSTER 43 Ejercicio 1 43 Ejercicio 2 50
ANÁLISIS DE DATOS CUALITATIVOS 54 Ejercicio 1 54 Ejercicio 2 57 Ejercicio 3 60
Bibliografía 62
FBA I Cuaderno de Prácticas de Estadística con SPSS 3
Departamento de Estadística e I.O. Universidad de Granada
CONTRASTES DE HIPÓTESIS PARAMÉTRICOS Y NO PARAMÉTRICOS
Ejercicio 1: En un estudio sobre angina de pecho en ratas se dividió aleatoriamente a 18 animales afectados en dos grupos de 9 individuos cada uno. A un grupo se le suministró un placebo y al otro un fármaco experimental FL113. Después de un ejercicio controlado sobre una “cinta sin fin” se determinó el tiempo de recuperación de cada rata. Se piensa que el FL113 reducirá el tiempo medio de recuperación. Se dispone de la siguiente información:
Placebo 203 229 215 220 223 233 208 228 209 FL113 221 207 185 203 187 190 195 204 212
Suponiendo que las distribuciones del tiempo necesario para la recuperación son
normales, comparar las muestras dadas para saber si se puede admitir que ambas muestras provienen de la misma población. Efectuar los correspondientes contrastes (sobre medias y varianzas) al nivel de significación α = 0.05.
X: “tiempo de recuperación de las ratas tratadas con placebo” → N(μ1, σ1) Y: “tiempo de recuperación de las ratas tratadas con FL113” → N(μ2, σ2)
Primer contraste H0: μ1= μ2 H1: μ1≠ μ2
Segundo contraste H0: σ12= σ2
2 H1: σ1
2≠ σ22
FBA I Cuaderno de Prácticas de Estadística con SPSS 4
Departamento de Estadística e I.O. Universidad de Granada
Estadísticos de grupo
Grupo placebo o FL113 N Media Desviación típ. Error típ. de la
media Tiempo de recuperación Grupo placebo 9 218,67 10,524 3,508 Grupo FL113 9 200,44 12,126 4,042
FBA I Cuaderno de Prácticas de Estadística con SPSS 5
Departamento de Estadística e I.O. Universidad de Granada
Ejercicio 2: Se ha realizado un estudio para investigar el efecto del ejercicio físico en el nivel de colesterol en plasma, en el que participaron 11 sujetos. Antes del ejercicio, se tomaron muestras de sangre para determinar el nivel del colesterol de cada participante. Después, los individuos fueron sometidos a un programa de ejercicios que se centraba en carreras y marchas diarias. Al final del periodo de ejercicios, se tomaron nuevamente muestras de sangre y se obtuvo una segunda lectura del nivel de colesterol en plasma de los sujetos. Se quiere estimar la diferencia entre el nivel medio de colesterol antes y después del ejercicio. Se recogieron los siguientes datos
Decidir si existen diferencias significativas entre estos niveles antes y después del ejercicio físico.
Prueba de muestras relacionadas
33,18 51,066 15,397 -1,12 67,49 2,155 10 ,057Colesterol antes dejercicio - Colestedespues del ejerc
Par 1Media
Desviacióntíp.
Error típ. dela media Inferior Superior
95% Intervalo deconfianza para la
diferencia
Diferencias relacionadas
t gl Sig. (bilateral)
Nivel previo mg/dl Nivel posterior mg/dl 182 198 232 210 191 194 200 220 148 138 249 220 276 219 213 161 241 210 480 313 262 226
FBA I Cuaderno de Prácticas de Estadística con SPSS 6
Departamento de Estadística e I.O. Universidad de Granada
Ejercicio 3: En unos laboratorios clínicos se toman muestras de 650 análisis de sangre y se anota el número de eritrocitos por milímetro cúbico de sangre. ¿Se puede admitir que el número de eritrocitos se distribuye normalmente? Los resultados agrupados en 7 clases son los que figuran en la tabla adjunta
Nº de eritrocitos en millones Nº de muestras 0-2,5 8
2.5-3.5 52 3.5-4.5 140 4.5-5.5 210 5.5-6.5 160 6.5-7.5 70 7.5-8.5 10
Prueba de Kolmogorov-Smirnov para una muestra
Eritrocitos N 650
Parámetros normales(a,b) Media 5,0862 Desviación típica
1,23238
Diferencias más extremas Absoluta ,164 Positiva ,159 Negativa -,164
Z de Kolmogorov-Smirnov 4,192 Sig. asintót. (bilateral) ,000
a La distribución de contraste es la Normal. b Se han calculado a partir de los datos.
FBA I Cuaderno de Prácticas de Estadística con SPSS 7
Departamento de Estadística e I.O. Universidad de Granada
Ejercicio 4: Se realiza una investigación para determinar si el hecho de contraer hepatitis es independiente de haber sido vacunado contra la enfermedad. Para ello se utilizan 1083 voluntarios varones. De ellos, se eligen aleatoriamente 549 y son vacunados con un nuevo fármaco. Los restantes, 534, no son vacunados. Después de un cierto tiempo, se observó que 70 de los 534 voluntarios no vacunados contrajeron la hepatitis, mientras que solamente 11 de los 549 vacunados no la contrajeron. Los datos se muestran en la tabla adjunta
Vacunación
Hepatitis SI NO SI 11 70
NO 538 464 Contrastar la independencia entre la vacunación y la enfermedad con α=0.05.
Tabla de contingencia HEPATITI * VACUNACI
Recuento
VACUNACI Total
no si HEPATITI no 464 538 1002 si 70 11 81 Total 534 549 1083
FBA I Cuaderno de Prácticas de Estadística con SPSS 8
Departamento de Estadística e I.O. Universidad de Granada
Pruebas de chi-cuadrado
Valor gl Sig. asintótica
(bilateral) Sig. exacta (bilateral)
Sig. exacta (unilateral)
Chi-cuadrado de Pearson 48,242(b) 1 ,000 Corrección por continuidad(a) 46,650 1 ,000
Razón de verosimilitud 53,194 1 ,000 Estadístico exacto de Fisher ,000 ,000
Asociación lineal por lineal 48,197 1 ,000
N de casos válidos 1083 a Calculado sólo para una tabla de 2x2. b 0 casillas (,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mínima esperada es 39,94.
FBA I Cuaderno de Prácticas de Estadística con SPSS 9
Departamento de Estadística e I.O. Universidad de Granada
Ejercicio 5: Se realiza un estudio para investigar la asociación entre el color de las flores y la fragancia de las azaleas silvestres. Se observan 200 plantas floridas seleccionadas aleatoriamente. Cada una de ellas se clasifica según el color y la presencia o ausencia de fragancia. Los datos se muestran en la tabla adjunta
Color Fragancia Blanca Rosa Naranja
SI 12 60 58 NO 50 10 10
Pruebas de chi-cuadrado
Valor gl Sig. asintótica
(bilateral) Chi-cuadrado de Pearson 82,293(a) 2 ,000 Razón de verosimilitud 83,848 2 ,000 Asociación lineal por lineal 59,712 1 ,000 N de casos válidos
200
a 0 casillas (,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mínima esperada es 21,70.
FBA I Cuaderno de Prácticas de Estadística con SPSS 10
Departamento de Estadística e I.O. Universidad de Granada
ANÁLISIS DE REGRESIÓN Ejercicio 1: Se realiza un estudio para establecer una ecuación mediante la cual se pueda utilizar la longitud en cm. de una cierta variedad de planta al cabo de un año de vida para predecir la longitud de esa variedad de planta en edad adulta:
Longitud en cm. el primer año
Longitud en cm. en edad adulta
15.3 30.7 14.8 32.5 12.6 26.3 18.4 35.9 17.9 34.3 15.6 28.5 18.4 37.4 14.1 29.7 20.2 38.8 21.7 40.4 20.4 40.9 16.5 33.3 15.9 30.1 17.9 35.7 16.7 31.4
Se pide:
a) Representar el diagrama de dispersión b) Estimar los parámetros del modelo c) Coeficientes de correlación lineal y de determinación. Interpretación d) Plantear y contrastar el test para conocer la significación de la variable
independiente a un nivel de significación del 5 %
FBA I Cuaderno de Prácticas de Estadística con SPSS 11
Departamento de Estadística e I.O. Universidad de Granada
a) Diagrama de dispersión
FBA I Cuaderno de Prácticas de Estadística con SPSS 12
Departamento de Estadística e I.O. Universidad de Granada
LONG_1
222018161412
LON
G_A
DU
42
40
38
36
34
32
30
28
26
b) Estimación de los parámetros del modelo
Coeficientesa
5,296 2,694 1,965 ,0711,663 ,156 ,947 10,657 ,000
(Constante)LONG_1
Modelo1
B Error típ.
Coeficientes noestandarizados
Beta
Coeficientesestandarizad
ost Sig.
Variable dependiente: LONG_ADUa.
FBA I Cuaderno de Prácticas de Estadística con SPSS 13
Departamento de Estadística e I.O. Universidad de Granada
c) Coeficientes de correlación lineal y de determinación. Interpretación
Resumen del modelo
,947a ,897 ,889 1,4666Modelo1
R R cuadradoR cuadradocorregida
Error típ. de laestimación
Variables predictoras: (Constante), LONG_1a.
d) Test de significación de la variable independiente.
ANOVAb
244,306 1 244,306 113,577 ,000a
27,963 13 2,151272,269 14
RegresiónResidualTotal
Modelo1
Suma decuadrados gl
Mediacuadrática F Sig.
Variables predictoras: (Constante), LONG_1a.
Variable dependiente: LONG_ADUb.
FBA I Cuaderno de Prácticas de Estadística con SPSS 14
Departamento de Estadística e I.O. Universidad de Granada
Ejercicio 2: Se realiza un estudio para establecer una ecuación mediante la cual se pueda utilizar la concentración de estrona en la saliva para predecir la concentración de dicho esteroide en plasma libre. Se tomaron los siguientes datos de 13 varones sanos:
Concentración de estrona en saliva pg./mL.
Concentración de estrona en plasma libre en pg./mL.
7.4 30 7.5 25 8.5 31.5 9 27.5 9 39.5 11 38 13 43 14 49
14.5 55 16 48.5 17 51 18 64.5 20 63
Se pide:
a) Representar el diagrama de dispersión b) Plantear el modelo de regresión y estimar los parámetros del modelo.
Interprétalos c) Obtener el coeficiente de correlación lineal de Pearson y el coeficiente de
determinación d) Obtener un intervalo de confianza al 95 % para la pendiente de la recta de
regresión e) Contrastar la significación del coeficiente de regresión
a) Diagrama de dispersión
saliva20,017,515,012,510,07,5
estr
ona
70,0
60,0
50,0
40,0
30,0
20,0
FBA I Cuaderno de Prácticas de Estadística con SPSS 15
Departamento de Estadística e I.O. Universidad de Granada
b) Planteamiento del modelo, estimación de los parámetros y su interpretación
Coeficientesa
6,887 3,965 1,737 ,1102,886 ,297 ,946 9,705 ,000
(Constante)saliva
Modelo1
B Error típ.
Coeficientes noestandarizados
Beta
Coeficientesestandarizad
ost Sig.
Variable dependiente: plasmaa.
c) Coeficiente de correlación lineal de Pearson y coeficiente de determinación
Resumen del modelo
,946a ,895 ,886 4,3997Modelo1
R R cuadradoR cuadradocorregida
Error típ. de laestimación
Variables predictoras: (Constante), salivaa.
d) Obtener un intervalo de confianza al 95 % para la pendiente de la recta de regresión
Coeficientesa
6,887 3,965 1,737 ,110 -1,841 15,6142,886 ,297 ,946 9,705 ,000 2,232 3,541
(Constante)saliva
Modelo1
B Error típ.
Coeficientes noestandarizados
Beta
Coeficientesestandarizad
os
t Sig. Límite inferiorLímite
superior
Intervalo de confianza paraB al 95%
Variable dependiente: plasmaa.
FBA I Cuaderno de Prácticas de Estadística con SPSS 16
Departamento de Estadística e I.O. Universidad de Granada
e) Contrastar la significación del coeficiente de regresión
ANOVAb
1823,070 1 1823,070 94,180 ,000a
212,930 11 19,3572036,000 12
RegresiónResidualTotal
Modelo1
Suma decuadrados gl
Mediacuadrática F Sig.
Variables predictoras: (Constante), salivaa.
Variable dependiente: plasmab.
FBA I Cuaderno de Prácticas de Estadística con SPSS 17
Departamento de Estadística e I.O. Universidad de Granada
Ejercicio 3: Un aficionado a las apuestas en las carreras de caballos desea estudiar la descendencia de una conocida raza de caballos que tiene mucho éxito en dichas carreras. Para ello estudia la relación existente entre el peso en gramos de embriones de caballos y el número de días transcurridos de vida de los mismos. Los datos aparecen en la siguiente tabla:
Días Peso 7 51.3 8 79.1 9 127.4 10 183.5 11 271.3 12 431.5 13 743.7 14 1143.2 15 1893.8 16 3102.4 17 4702.7
Se pide: a) Representar la nube de puntos b) Plantear el modelo de regresión y obtener la ecuación del modelo ajustado c) Bondad del ajuste
a) Representar la nube de puntos
DIAS
181614121086
PE
SO
5000
4000
3000
2000
1000
0
-1000
b) Plantear el modelo de regresión y obtener la ecuación del modelo ajustado.
MODEL: MOD_1.
FBA I Cuaderno de Prácticas de Estadística con SPSS 18
Departamento de Estadística e I.O. Universidad de Granada
Lineal
ANOVA
16841317 1 16841317 25,551 ,0015932167,3 9 659129,69522773485 10
RegresiónResidualTotal
Suma decuadrados gl
Mediacuadrática F Sig.
La variable independiente esdías.
Resumen del modelo
,860 ,740 ,711 811,868R R cuadrado
R cuadradocorregida
Error típico dela estimación
La variable independiente esdías.
Exponencial
ANOVA
22,756 1 22,756 6384,193 ,000,032 9 ,004
22,789 10
RegresiónResidualTotal
Suma decuadrados gl
Mediacuadrática F Sig.
La variable independiente esdías.
Resumen del modelo
,999 ,999 ,998 ,060R R cuadrado
R cuadradocorregida
Error típico dela estimación
La variable independiente esdías.
FBA I Cuaderno de Prácticas de Estadística con SPSS 19
Departamento de Estadística e I.O. Universidad de Granada
Ejercicio 4: Una empresa fabricante de cereales para el desayuno desea conocer la ecuación que permita predecir las ventas (en miles de euros) en función de los gastos en publicidad infantil en televisión (en miles de euros), el tiempo diario de aparición en televisión (en minutos) y los gastos en publicidad en los periódicos (en miles de euros). Se realiza un estudio en el que se reúnen los datos mensuales correspondientes a los últimos 20 meses. Estos datos aparecen en la siguiente tabla:
Ventas Pub. en tv.
Tiempo en tv.
Pub. en per.
10 1 50 0.4 12 1.2 57 0.4 11 1.3 56 0.42 13 1.4 55 0.5 12 1.5 60 0.4 14 1.7 65 0.44 16 1.75 69 0.4 12 1.3 67 0.44 14 1.45 68 0.46 11 0.9 67 0.46 10 0.8 97 0.45 19 0.9 66 1.1 8.5 0.8 65 0.3 8 1 60 0.5 9 1.7 70 0.45 13 1.8 110 0.4 16 1.85 75 0.8 18 1.9 80 0.9 20 2 85 0.9 22 2 90 1.1
Se pide:
a) Ajustar un modelo de regresión lineal múltiple. Obtener una estimación de los
parámetros del modelo y su interpretación b) Obtener e interpretar el valor de la suma de cuadrados residual c) Contrastar la significación del modelo propuesto
FBA I Cuaderno de Prácticas de Estadística con SPSS 20
Departamento de Estadística e I.O. Universidad de Granada
a) Ajustar un modelo de regresión lineal múltiple. Obtener una estimación de los parámetros del modelo y su interpretación
Coeficientesa
2,108 2,055 1,026 ,3203,432 1,121 ,358 3,060 ,007
1,477E-03 ,030 ,006 ,050 ,96111,347 1,802 ,711 6,298 ,000
(Constante)PUBL_TVTIEMP_TVPUBL_PER
Modelo1
B Error típ.
Coeficientes noestandarizados
Beta
Coeficientesestandarizad
ost Sig.
Variable dependiente: VENTASa.
b) Obtener e interpretar el valor de la suma de cuadrados residual
ANOVAb
247,677 3 82,559 26,440 ,000a
49,960 16 3,123297,638 19
RegresiónResidualTotal
Modelo1
Suma decuadrados gl
Mediacuadrática F Sig.
Variables predictoras: (Constante), PUBL_PER, TIEMP_TV, PUBL_TVa.
Variable dependiente: VENTASb.
FBA I Cuaderno de Prácticas de Estadística con SPSS 21
Departamento de Estadística e I.O. Universidad de Granada
c) Contrastar la significación del modelo propuesto
ANOVAb
247,677 3 82,559 26,440 ,000a
49,960 16 3,123297,638 19
RegresiónResidualTotal
Modelo1
Suma decuadrados gl
Mediacuadrática F Sig.
Variables predictoras: (Constante), PUBL_PER, TIEMP_TV, PUBL_TVa.
Variable dependiente: VENTASb.
FBA I Cuaderno de Prácticas de Estadística con SPSS 22
Departamento de Estadística e I.O. Universidad de Granada
Ejercicio 5: Se desea estudiar la relación entre la intensidad de regadío (medida en litros por metro cuadrado) y la productividad (medida en Kg/Ha) de una huerta de tomates. Se han obtenido los siguientes datos:
Productividad de un cultivo
Intensidad de regadío
2500.9 590.5 2000.8 540.4 3300.4 690 2500.6 605.2 1995.8 650 3312.3 724 3409 704.8
Se pide:
a) ¿Podemos afirmar la existencia de relación lineal entre las variables? b) Coeficiente de correlación y coeficiente de determinación. Interpretación Además del regadío se cree que el empleo de un abono ha influido de forma lineal en la productividad del cultivo. Por tanto se introduce en el modelo de regresión la variable que mide el número de Kg. de abono por hectárea. Abono 200.6 160.6 407.6 212.7 145 387.8 355 c) Ajustar un modelo de regresión lineal múltiple d) Interpretación de los coeficientes del modelo de regresión. ¿Qué variable tiene
mayor influencia en la variación de la productividad? e) Valor de la suma de cuadrados de la regresión. Interpretación f) Contrastar la significación del modelo propuesto g) Coeficiente de determinación múltiple y coeficiente de determinación múltiple
corregido. Interpretación h) ¿Ha sido útil la adición de la variable abono?
FBA I Cuaderno de Prácticas de Estadística con SPSS 23
Departamento de Estadística e I.O. Universidad de Granada
a) ¿Muestran los datos una relación lineal?
REGADIO
800700600500
PR
OD
UC
T
3600
3400
3200
3000
2800
2600
2400
2200
2000
1800
ANOVAb
1557184,3 1 1557184,3 10,479 ,023a
743017,305 5 148603,4612300201,6 6
RegresiónResidualTotal
Modelo1
Suma decuadrados gl
Mediacuadrática F Sig.
Variables predictoras: (Constante), REGADIOa.
Variable dependiente: PRODUCTb.
b) Coeficiente de correlación lineal y coeficiente de determinación. Interpretación
Correlaciones
1,000 ,823,823 1,000
, ,012,012 ,
7 77 7
PRODUCTREGADIOPRODUCTREGADIOPRODUCTREGADIO
Correlación de Pearson
Sig. (unilateral)
N
PRODUCT REGADIO
Resumen del modelo
,823a ,677 ,612 385,491Modelo1
R R cuadradoR cuadradocorregida
Error típ. de laestimación
Variables predictoras: (Constante), REGADIOa.
FBA I Cuaderno de Prácticas de Estadística con SPSS 24
Departamento de Estadística e I.O. Universidad de Granada
c) Ajustar un modelo de regresión lineal múltiple Coeficientesa
942,755 988,031 ,954 ,394,674 1,897 ,073 ,355 ,740
5,021 1,141 ,911 4,402 ,012
(Constante)REGADIOABONO
Modelo1
B Error típ.
Coeficientes noestandarizados
Beta
Coeficientes
estandarizados
t Sig.
Variable dependiente: PRODUCTa.
e) Valor de la suma de cuadrados de la regresión. Interpretación
ANOVAb
2173045,5 2 1086522,8 34,179 ,003a
127156,069 4 31789,0172300201,6 6
RegresiónResidualTotal
Modelo1
Suma decuadrados gl
Mediacuadrática F Sig.
Variables predictoras: (Constante), ABONO, REGADIOa.
Variable dependiente: PRODUCTb.
g) Coeficiente de determinación múltiple y coeficiente de determinación múltiple corregido
Resumen del modelo
,972a ,945 ,917 178,295Modelo1
R R cuadradoR cuadradocorregida
Error típ. de laestimación
Variables predictoras: (Constante), ABONO, REGADIOa.
FBA I Cuaderno de Prácticas de Estadística con SPSS 25
Departamento de Estadística e I.O. Universidad de Granada
DISEÑO DE EXPERIMENTOS
Ejercicio 1: Se sabe que el dióxido de carbono tiene un efecto crítico en el crecimiento microbiológico. Cantidades pequeñas de CO2 estimulan el crecimiento de muchos microorganismos, mientras que altas concentraciones inhiben el crecimiento de la mayor parte de ellos. Este último efecto se utiliza comercialmente cuando se almacenan productos alimenticios perecederos. Se realizó un estudio para investigar el efecto del CO2 sobre la tasa de crecimiento de Pseudomonas fragi, un corruptor de alimentos. Se administró dióxido de carbono a cinco presiones atmosféricas diferentes. La respuesta anotada fue el cambio porcentual en la masa celular después de un tiempo de crecimiento de una hora. Se utilizaron diez cultivos en cada nivel. Se obtuvieron los siguientes datos:
Nivel del factor (presión de CO2 en atmósferas) 0.0 0.083 0.29 0.5 0.86 62.6 50.9 45.5 29.5 24.9 59.6 44.3 41.1 22.8 17.2 64.5 47.5 29.8 19.2 7.8 59.3 49.5 38.3 20.6 10.5 58.6 48.5 40.2 29.2 17.8 64.6 50.4 38.5 24.1 22.1 50.9 35.2 30.2 22.6 22.6 56.2 49.9 27 32.7 16.8 52.3 42.6 40 24.4 15.9 62.8 41.6 33.9 19.6 8.8
a) Se suponen efectos fijos: ¿qué implica esto respecto de los niveles atmosféricos elegidos?
b) Plantear la hipótesis nula a contrastar c) Evaluar el estadístico F utilizado para contrastar H0 d) ¿Puede rechazarse H0? Explicarlo basándose en el p-valor del contraste
FBA I Cuaderno de Prácticas de Estadística con SPSS 26
Departamento de Estadística e I.O. Universidad de Granada
ANOVA
CRECIMIE
11274,319 4 2818,580 101,628 ,0001248,038 45 27,734
12522,357 49
Inter-gruposIntra-gruposTotal
Suma decuadrados gl
Mediacuadrática F Sig.
FBA I Cuaderno de Prácticas de Estadística con SPSS 27
Departamento de Estadística e I.O. Universidad de Granada
Ejercicio 2: Una compañía textil utiliza diversos telares para la producción de telas. Aunque se desea que los telares sean homogéneos con el objeto de producir tela de resistencia uniforme se supone que puede existir una variación significativa en la resistencia de la tela debida a la utilización de distintos telares. A su disposición tiene 5 tipos de telares con los que realiza determinaciones de la resistencia de la tela. Este experimento se realiza en orden aleatorio y los resultados se muestran en la tabla adjunta. Analizar los datos y obtener las conclusiones apropiadas.
Telares Resistencia 1 51 49 50 49 51 50 2 56 60 56 56 57 3 48 50 53 44 45 4 47 48 49 44 5 43 43 46 47 45 46
a) Plantear la hipótesis nula a contrastar b) ¿Puede rechazarse 0H ? Explicarlo basándose en el p-valor del contraste c) Comprobar la hipótesis de homocedasticidad
ANOVA
RESIST
439,885 4 109,971 23,565 ,00098,000 21 4,667
537,885 25
Inter-gruposIntra-gruposTotal
Suma decuadrados gl
Mediacuadrática F Sig.
Prueba de homogeneidad de varianzas
RESIST
2,367 4 21 ,086
Estadísticode Levene gl1 gl2 Sig.
FBA I Cuaderno de Prácticas de Estadística con SPSS 28
Departamento de Estadística e I.O. Universidad de Granada
Ejercicio 3: En una determinada fábrica de galletas se desea saber si las harinas de sus cuatro proveedores producen la misma viscosidad en la masa. Para ello, produce durante un día 16 masas, 4 de cada tipo de harina y mide su viscosidad. Los resultados obtenidos se muestran en la siguiente tabla:
Proveedor A
Proveedor B
Proveedor C
Proveedor D
98 97 99 96 91 90 93 92 96 95 97 95 95 96 99 98
a) Plantear la hipótesis nula a contrastar b) ¿Puede rechazarse 0H ? Explicarlo basándose en el p-valor del contraste c) Comprobar la hipótesis de normalidad
ANOVA
VISCOSID
14,188 3 4,729 ,581 ,63997,750 12 8,146
111,938 15
Inter-gruposIntra-gruposTotal
Suma decuadrados gl
Mediacuadrática F Sig.
Normal gráfico Q-Q de Residuo para VIS
Valor observado
6420-2-4-6
Val
or N
orm
al e
sper
ado
6
4
2
0
-2
-4
-6
FBA I Cuaderno de Prácticas de Estadística con SPSS 29
Departamento de Estadística e I.O. Universidad de Granada
Ejercicio 4: Los científicos comprometidos en el tratamiento del agua residual de arenas asfálticas estudiaron tres métodos de tratamientos para la eliminación del carbono orgánico (basado en W.R. Pirie, Statistical Planning and Analysis for Treatments of Tar Sand Waste-water, Centro de Información Técnica, Oficina de Información Tecnológica y Científica, Departamento de Energía de Estados Unidos). Los tres métodos de tratamiento utilizados fueron: flotación de aire (FA), separación de espuma (SF) y coagulación ferroclórica (CFC). Las mediciones del material de carbono orgánico para los tres tratamientos arrojaron los siguientes datos:
FA SE CFC34.6 38.8 26.7 35.1 39.0 26.7 35.6 40.1 27.0 35.8 40.9 27.1 36.1 41.0 27.5 36.5 43.2 28.1 36.8 44.9 28.1 37.2 46.9 28.7 37.4 51.6 30.7 37.7 53.6 31.2
a) Contrastar 0 1 2 3:H μ μ μ= = al nivel α =0.10 b) Si se rechaza 0H utilizar los contrastes de Tukey para precisar qué métodos difieren
estadísticamente entre sí
ANOVA
CARBONO
1251,603 2 625,801 60,742 ,000278,172 27 10,303
1529,775 29
Inter-gruposIntra-gruposTotal
Suma decuadrados gl
Mediacuadrática F Sig.
FBA I Cuaderno de Prácticas de Estadística con SPSS 30
Departamento de Estadística e I.O. Universidad de Granada
Comparaciones múltiples
Variable dependiente: carbonoHSD de Tukey
-7,72000* 1,43546 ,000 -10,7960 -4,64408,10000* 1,43546 ,000 5,0240 11,17607,72000* 1,43546 ,000 4,6440 10,7960
15,82000* 1,43546 ,000 12,7440 18,8960-8,10000* 1,43546 ,000 -11,1760 -5,0240
-15,82000* 1,43546 ,000 -18,8960 -12,7440
(J) metodo231312
(I) metodo1
2
3
Diferencia demedias (I-J) Error típico Sig. Límite inferior
Límitesuperior
Intervalo de confianza al90%
La diferencia entre las medias es significativa al nivel .1.*.
FBA I Cuaderno de Prácticas de Estadística con SPSS 31
Departamento de Estadística e I.O. Universidad de Granada
Ejercicio 5: Se ha realizado un estudio sobre el efecto de las temporadas de caza del ciervo en los hábitos de éstos. Se seleccionan cuatro sendas que se sabe utilizan los ciervos. Antes de comenzar la temporada de caza, durante la temporada y al terminar la temporada se determinó el promedio de huellas halladas por semana en un área específica de cada senda. Las sendas se trataron como bloques y se obtuvieron los siguientes datos:
Senda Antes Durante Después 1 62.5 57 49 2 46.5 53.3 50 3 45 59.3 37 4 24 35.7 50
a) Contrastar la hipótesis nula de igualdad de medias en los tratamientos al nivel α =0.05 b) Contrastar la hipótesis nula de igualdad de medias en los bloques al nivel α =0.05
FBA I Cuaderno de Prácticas de Estadística con SPSS 32
Departamento de Estadística e I.O. Universidad de Granada
Pruebas de los efectos inter-sujetos
Variable dependiente: HUELLAS
700,631a 5 140,126 1,376 ,35127008,541 1 27008,541 265,137 ,000
98,482 2 49,241 ,483 ,639602,149 3 200,716 1,970 ,220611,198 6 101,866
28320,370 121311,829 11
FuenteModelo corregidoIntersecciónTEMPORADSENDAErrorTotalTotal corregida
Suma decuadrados
tipo III glMedia
cuadrática F Significación
R cuadrado = ,534 (R cuadrado corregida = ,146)a.
FBA I Cuaderno de Prácticas de Estadística con SPSS 33
Departamento de Estadística e I.O. Universidad de Granada
Ejercicio 6: Una industria desea comprobar el efecto que tienen cinco productos químicos sobre la resistencia de un tipo particular de fibra. Como también puede influir la máquina empleada en la fabricación, decide utilizar un diseño en bloques aleatorizados, considerando las distintas máquinas como bloques. La industria dispone de cuatro máquinas a las que asigna los cinco productos químicos en orden aleatorio. Los resultados obtenidos se muestran en la tabla adjunta.
Tipos de máquinas Producto químico A B C D
1 87 86 88 83 2 85 87 95 85 3 90 92 95 90 4 89 97 98 88 5 99 96 91 90
a) Contrastar la hipótesis nula de igualdad de medias en los tratamientos al nivel α =0.05 b) Contrastar la hipótesis nula de igualdad de medias en los bloques al nivel α =0.05 c) Si se rechaza 0H en los apartados a) o b), utilizar los contrastes LSD y Tukey, respectivamente, para precisar qué medias difieren estadísticamente entre sí
FBA I Cuaderno de Prácticas de Estadística con SPSS 34
Departamento de Estadística e I.O. Universidad de Granada
Comparaciones múltiples
Variable dependiente: RESISTDMS
-2,00 2,336 ,409 -7,09 3,09-5,75* 2,336 ,030 -10,84 -,66-7,00* 2,336 ,011 -12,09 -1,91-8,00* 2,336 ,005 -13,09 -2,912,00 2,336 ,409 -3,09 7,09
-3,75 2,336 ,134 -8,84 1,34-5,00 2,336 ,054 -10,09 ,09-6,00* 2,336 ,025 -11,09 -,915,75* 2,336 ,030 ,66 10,843,75 2,336 ,134 -1,34 8,84
-1,25 2,336 ,602 -6,34 3,84-2,25 2,336 ,355 -7,34 2,847,00* 2,336 ,011 1,91 12,095,00 2,336 ,054 -,09 10,091,25 2,336 ,602 -3,84 6,34
-1,00 2,336 ,676 -6,09 4,098,00* 2,336 ,005 2,91 13,096,00* 2,336 ,025 ,91 11,092,25 2,336 ,355 -2,84 7,341,00 2,336 ,676 -4,09 6,09
(J)PRODUCT 2 3 4 5 1 3 4 5 1 2 4 5 1 2 3 5 1 2 3 4
(I)PRODUCT 1
2
3
4
5
Diferenciaentre
medias (I-J) Error típ. Significación Límite inferiorLímite
superior
Intervalo de confianza al95%.
Basado en las medias observadas.La diferencia de medias es significativa al nivel ,05.*.
Se ha detectado el símbolo ,05 donde se esperaba un paréntesis de cierre en el subcomandoTEST.
*.
FBA I Cuaderno de Prácticas de Estadística con SPSS 35
Departamento de Estadística e I.O. Universidad de Granada
ANÁLISIS DE LA COVARIANZA
Ejercicio 1: Un distribuidor de bebidas está estudiando la efectividad de los métodos de descarga, para lo cual se mide el tiempo de descarga de unas cajas en minutos. Las bebidas se distribuyen en tres tipos distintos de furgonetas (atendiendo a su diferente capacidad de carga y antigüedad). Se conoce que el tiempo de descarga guarda una estrecha relación con el volumen de cajas descargadas. Se obtuvieron los siguientes datos:
Furgoneta 1 2 3
y x y x y x 12 20 70 64 31 27 19 23 64 62 28 25 15 22 55 47 25 22 21 30 77 66 22 26 11 15 66 50 29 28 19 22 44 42 28 29
a) Planteamiento del modelo b) Contrastar los efectos del factor y de la covariable sobre la variable respuesta c) Indicar el porcentaje de variabilidad explicada por el modelo propuesto SOLUCIÓN: b) Contrastar los efectos del factor y de la covariable sobre la variable respuesta
FBA I Cuaderno de Prácticas de Estadística con SPSS 36
Departamento de Estadística e I.O. Universidad de Granada
Pruebas de los efectos inter-sujetos
Variable dependiente: TIEMPO
7679,373a 3 2559,791 160,974 ,0003,758 1 3,758 ,236 ,634
174,246 2 87,123 5,479 ,017592,373 1 592,373 37,252 ,000027222,627 14 15,902
30374,000 187902,000 17
FuenteModelo corregidoIntersecciónFURGONETVOLUMENErrorTotalTotal corregida
Suma decuadrados
tipo III glMedia
cuadrática F Significación
R cuadrado = ,972 (R cuadrado corregida = ,966)a.
FBA I Cuaderno de Prácticas de Estadística con SPSS 37
Departamento de Estadística e I.O. Universidad de Granada
Ejercicio 2: Se quiere analizar el efecto que tienen tres tipos distintos de terreno en el rendimiento de una determinada plantación de almendros. Se sospecha que el rendimiento del cultivo (medido en kg.) está relacionado con la cantidad de kg. de abono recibidos. Los datos observados se muestran en la tabla adjunta:
Terreno A B C
Y x y x y x 130,5 20,3 110,3 15,9 155,9 44,9 144,6 44,9 100,8 22 149,1 42,33 133,9 33,8 109,6 16,9 188,9 58,9 128,4 20,8 122,7 20,2 199,4 70,8 119,2 18,2 97,4 16,9 185,7 61,9 133,8 32,8 122,8 33,9 119,4 18,3 122,7 22,7 130,8 29,7
Se pide
a) Indicar el valor de la suma de cuadrados entre tratamientos ajustada. Interpretación
b) Contrastar los efectos del factor y de la covariable sobre la variable respuesta
FBA I Cuaderno de Prácticas de Estadística con SPSS 38
Departamento de Estadística e I.O. Universidad de Granada
Pruebas de los efectos inter-sujetos
Variable dependiente: PRODUCC
14135,521a 3 4711,840 69,764 ,00010205,154 1 10205,154 151,098 ,000
404,959 2 202,479 2,998 ,0781804,347 1 1804,347 26,715 ,0001080,639 16 67,540
381321,724 2015216,159 19
FuenteModelo corregidoIntersecciónTERRENOABONOErrorTotalTotal corregida
Suma decuadrados
tipo III glMedia
cuadrática F Significación
R cuadrado = ,929 (R cuadrado corregida = ,916)a.
FBA I Cuaderno de Prácticas de Estadística con SPSS 39
Departamento de Estadística e I.O. Universidad de Granada
Ejercicio 3: Una empresa pretende estudiar la resistencia a la ruptura de la fibra de la que está compuesta una cuerda. Se realiza un estudio para determinar si existe diferencia significativa en la resistencia de los tres tipos de cuerdas disponibles (atendiendo al tipo de fibra disponible). Se cree que la temperatura a la que se realiza el experimento puede influir en la resistencia, por lo que se utiliza un diseño en bloques aleatorizados considerando la temperatura como bloque, con 4 niveles. La resistencia de la cuerda a la ruptura (medida en libras) se ve afectada por su grosor (medido en 310− pulgadas). Los datos se presentan en la siguiente tabla:
Cuerda 1 2 3
Temperatura y x y x y x 1 33 20 44 28 41 23 2 41 25 23 22 39 22 3 35 24 44 33 37 23 4 42 25 37 27 26 21
Se pide
a) Formular el diseño empleado b) Analizar estos datos y extraer las conclusiones apropiadas
FBA I Cuaderno de Prácticas de Estadística con SPSS 40
Departamento de Estadística e I.O. Universidad de Granada
Pruebas de los efectos inter-sujetos
Variable dependiente: Y
423,966a 6 70,661 4,928 ,05055,091 1 55,091 3,842 ,107
170,503 2 85,251 5,945 ,04891,799 3 30,600 2,134 ,215
358,133 1 358,133 24,974 ,00471,701 5 14,340
16776,000 12495,667 11
FuenteModelo corregidoIntersecciónCUERDATEMPXErrorTotalTotal corregida
Suma decuadrados
tipo III glMedia
cuadrática F Significación
R cuadrado = ,855 (R cuadrado corregida = ,682)a.
FBA I Cuaderno de Prácticas de Estadística con SPSS 41
Departamento de Estadística e I.O. Universidad de Granada
Ejercicio 4: Se pretende comparar la presión arterial sistólica de un grupo de fumadores según su nivel de estudios. Para ello se realiza un estudio en el que se controla el número de cigarrillos consumidos al día por cada una de estas personas. El nivel de estudios se clasifica en tres niveles: estudios básicos, estudios de Secundaria y estudios universitarios, codificados por 1, 2 y 3 respectivamente. Además se cree que la presión arterial que sufren estos individuos podría relacionarse en forma lineal con la edad de los fumadores. Los datos se muestran en la tabla adjunta:
Nivel de estudios 1 2 3
y X z y x z y x z 153,4 24,2 46 141,3 18,3 22 135,5 20,3 35 157,5 25,6 55 133,9 28 51 137,9 22,9 17 140,5 24,9 49 128,7 12,1 36 140,4 33 40 162,7 57,2 44 144,2 27,4 51 126,9 20,3 39 153,5 46,3 64 137,4 33,5 35 130,1 11,2 29
a) Formular el diseño empleado b) Variación de la presión arterial sistólica que queda sin explicar y suma total de
cuadrados de la respuesta ajustada por la covariable c) Contrastar la igualdad de los efectos del factor, así como la significación de cada
covariable d) Proporción de variación explicada por el modelo propuesto e) Comprobar que se cumple la hipótesis de homocedasticidad
FBA I Cuaderno de Prácticas de Estadística con SPSS 42
Departamento de Estadística e I.O. Universidad de Granada
Pruebas de los efectos inter-sujetos
Variable dependiente: PRESIÓN
1294,773a 4 323,693 9,629 ,00211452,003 1 11452,003 340,655 ,000
410,072 2 205,036 6,099 ,019203,031 1 203,031 6,039 ,034
24,663 1 24,663 ,734 ,412336,176 10 33,618
302361,030 151630,949 14
FuenteModelo corregidoInterceptESTUDIOSNº_CIGAREDADErrorTotalTotal corregida
Suma decuadrados
tipo III glMedia
cuadrática F Significación
R cuadrado = ,794 (R cuadrado corregida = ,711)a.
Contraste de Levene sobre la igualdad de las varianzas error
Variable dependiente: PRESIÓN
,973 2 12 ,406F gl1 gl2 Significación
Contrasta la hipótesis nula de que la varianza error de lavariable dependiente es igual a lo largo de todos los grupos.
FBA I Cuaderno de Prácticas de Estadística con SPSS 43
Departamento de Estadística e I.O. Universidad de Granada
ANÁLISIS CLUSTER Ejercicio 1: Se analiza la leche de las hembras de 20 mamíferos, obteniéndose los porcentajes en agua, proteínas, grasa y lactosa siguientes:
Mamífero Agua Proteínas Grasa Lactosa CABALLO 90.1 2.6 1.0 6.9 BURRO 90.3 1.7 1.4 6.2 CEBRA 86.2 3.0 4.8 5.3 HAMSTER 81.9 7.4 7.2 2.7 RATA 72.5 9.2 12.6 3.3 OVEJA 82.0 5.6 6.4 4.7 RENO 64.8 10.7 20.3 2.5 MULA 90.0 2.0 1.8 5.5 CERDO 82.8 7.1 5.1 3.7 CAMELLO 87.7 3.5 3.4 4.8 BÚFALO 82.1 5.9 7.9 4.7 ZORRO 81.6 6.6 5.9 4.9 CONEJO 71.3 12.3 13.1 1.9 LLAMA 86.5 3.9 3.2 5.6 CIERVO 65.9 10.4 19.7 2.6 BISONTE 86.9 4.8 1.7 5.7 GATO 81.6 10.1 6.3 4.4 PERRO 76.3 9.3 9.5 3.0 FOCA 46.4 9.7 42.0 0.0 DELFÍN 44.9 10.6 34.9 0.9
Clasificar estos mamíferos de forma jerárquica atendiendo a dichas variables realizando el estudio de acuerdo a las siguientes opciones de medidas de asociación y métodos de amalgamamiento:
a) Distancia euclídea y linkage simple b) Distancia bloque y linkage simple c) Distancia euclídea y método del centroide d) Distancia bloque y método del centroide
Para cada uno de las anteriores opciones se pide la matriz de distancias, el dendrograma y la clasificación resultante si se toman 2, 3, 4 o 5 grupos diferentes.
FBA I Cuaderno de Prácticas de Estadística con SPSS 44
Departamento de Estadística e I.O. Universidad de Granada
FBA I Cuaderno de Prácticas de Estadística con SPSS 45
Departamento de Estadística e I.O. Universidad de Granada
FBA I Cuaderno de Prácticas de Estadística con SPSS 46
Departamento de Estadística e I.O. Universidad de Granada
Historial de conglomeración
2 8 ,911 0 0 36 12 1,204 0 0 61 2 1,225 0 1 117 15 1,292 0 0 18
10 14 1,510 0 0 76 11 1,533 2 0 9
10 16 1,797 5 0 83 10 1,884 0 7 116 9 1,942 6 0 104 6 2,512 0 9 121 3 3,254 3 8 154 17 3,329 10 0 155 18 3,969 0 0 145 13 4,389 13 0 161 4 5,227 11 12 161 5 6,352 15 14 18
19 20 7,367 0 0 191 7 8,765 16 4 191 19 24,733 18 17 0
Etapa12345678910111213141516171819
Conglomerado 1
Conglomerado 2
Conglomerado que secombina
CoeficientesConglomerado 1
Conglomerado 2
Etapa en la que elconglomerado
aparece por primeravez
Próximaetapa
FBA I Cuaderno de Prácticas de Estadística con SPSS 47
Departamento de Estadística e I.O. Universidad de Granada
Conglomerado de pertenencia
1 1 1 11 1 1 11 1 1 11 1 1 12 1 1 11 1 1 13 2 2 11 1 1 11 1 1 11 1 1 11 1 1 11 1 1 12 1 1 11 1 1 13 2 2 11 1 1 11 1 1 12 1 1 14 3 3 25 4 3 2
Caso1:caballo2:burro3:cebra4:hamster5:rata6:oveja7:reno8:mula9:cerdo10:camello11:búfalo12:zorro13:conejo14:llama15:ciervo16:bisonte17:gato18:perro19:foca20:delfín
5conglome
rados
4conglome
rados
3conglome
rados
2conglome
rados
FBA I Cuaderno de Prácticas de Estadística con SPSS 48
Departamento de Estadística e I.O. Universidad de Granada
* * * * * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * * * * * Dendrogram using Single Linkage Rescaled Distance Cluster Combine C A S E 0 5 10 15 20 25 Label Num +---------+---------+---------+---------+---------+ burro 2 òø
mula 8 òôòòòø
caballo 1 ò÷ ó
camello 10 òø ùòòòø
llama 14 òôòø ó ó
bisonte 16 ò÷ ùò÷ ó
cebra 3 òòò÷ ó
oveja 6 òø ùòø
zorro 12 òôòø ó ó
búfalo 11 ò÷ ó ó ó
cerdo 9 òòòôòø ó ùòòòòòø
hamster 4 òòò÷ ùòòò÷ ó ó
gato 17 òòòòò÷ ó ó
rata 5 òòòòòòòø ó ùòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòø
perro 18 òòòòòòòôòòò÷ ó ó
conejo 13 òòòòòòò÷ ó ó
reno 7 òûòòòòòòòòòòòòòòò÷ ó
ciervo 15 ò÷ ó
foca 19 òòòòòòòòòòòòòûòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòò÷
delfín 20 òòòòòòòòòòòòò÷
3 gr
upos
2 gr
upos
4 gr
upos
5
grup
os
FBA I Cuaderno de Prácticas de Estadística con SPSS 49
Departamento de Estadística e I.O. Universidad de Granada
FBA I Cuaderno de Prácticas de Estadística con SPSS 50
Departamento de Estadística e I.O. Universidad de Granada
Ejercicio 2: Se pretende clasificar un conjunto de 26 animales mamíferos en 4 grupos homogéneos atendiendo a su configuración dental. La información de la que se dispone es la del número de piezas dentales. Los datos de los que se dispone son los siguientes:
Mamífero
Incisivos Sup.
Incisivos Inf.
Caninos Sup.
Caninos Inf.
Premolares Inf.
Premolares Sup.
Molares Sup.
Molares Inf.
ALCE ANTÍLOPE ARDILLA BISONTE BUEY CABRA CASTOR CIERVO COMADREJA HURÓN JAGUAR LEÓN LINCE LOBO MARTA MOFETA MURCIÉLAGO NUTRIA OCELOTE OSO OVEJA RATÓN RENO TEJÓN VISÓN ZORRO
0 0 1 0 0 0 1 0 3 3 3 3 3 3 3 3 2 3 3 3 0 1 0 3 3 3
4 4 1 4 4 4 1 4 3 3 3 3 3 3 3 3 3 2 3 3 4 1 4 3 3 3
1 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 0 0 1 1 1 1
0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 0 0 0 1 1 1
3 3 1 3 3 3 2 3 3 3 3 3 2 4 4 3 1 1 3 4 3 0 3 3 3 4
3 3 1 3 3 3 1 3 3 3 2 2 2 4 4 3 2 2 2 4 3 0 3 3 3 4
3 3 3 3 3 3 3 3 1 1 1 1 1 2 1 1 3 3 1 2 3 3 3 1 1 2
3 3 3 3 3 3 3 3 2 2 1 1 1 3 2 2 3 3 1 3 3 3 3 2 2 3
Clasificar estos mamíferos utilizando el método de las k-medias para agrupar a los mamíferos en 4 grupos.
FBA I Cuaderno de Prácticas de Estadística con SPSS 51
Departamento de Estadística e I.O. Universidad de Granada
FBA I Cuaderno de Prácticas de Estadística con SPSS 52
Departamento de Estadística e I.O. Universidad de Granada
Centros iniciales de los conglomerados
Conglomerado
1 2 3 4 Incisivos Superiores 3 0 1 3 Incisivos Inferiores 3 4 1 3 Caninos Superiores 1 0 0 1 Caninos Inferiores 1 0 0 1 Premolares Inferiores 2 3 0 4 Premolares Superiores 2 3 0 4 Molares Superiores 1 3 3 2 Molares Inferiores 1 3 3 3
Historial de iteraciones(a)
Iteración
Cambio en los centros de los conglomerados
1 2 3 4 1 1,150 ,250 1,202 ,354 2 ,000 ,000 ,000 ,000
a Se ha logrado la convergencia debido a que los centros de los conglomerados no presentan ningún cambio o éste es pequeño. El cambio máximo de coordenadas absolutas para cualquier centro es de ,000. La iteración actual es 2. La distancia mínima entre los centros iniciales es de 3,606.
Pertenencia a los conglomerados
Número de caso MAMIFERO Conglome
rado Distancia 1 alce 2 ,7502 antílope 2 ,2503 ardilla 3 ,3334 bisonte 2 ,2505 buey 2 ,2506 cabra 2 ,2507 castor 3 1,0548 ciervo 2 ,2509 comadrej 1 ,82810 hurón 1 ,82811 jaguar 1 1,11012 león 1 1,11013 lince 1 1,15014 lobo 4 ,35415 marta 4 1,06116 mofeta 1 ,82817 murciéla 1 2,73918 nutria 1 2,73919 ocelote 1 1,11020 oso 4 ,35421 oveja 2 ,25022 ratón 3 1,20223 reno 2 ,75024 tejón 1 ,82825 visón 1 ,82826 zorro 4 ,354
FBA I Cuaderno de Prácticas de Estadística con SPSS 53
Departamento de Estadística e I.O. Universidad de Granada
Centros de los conglomerados finales
Conglomerado
1 2 3 4 Incisivos Superiores 3 0 1 3 Incisivos Inferiores 3 4 1 3 Caninos Superiores 1 0 0 1 Caninos Inferiores 1 0 0 1 Premolares Inferiores 3 3 1 4 Premolares Superiores 2 3 1 4 Molares Superiores 1 3 3 2 Molares Inferiores 2 3 3 3
Distancias entre los centros de los conglomerados finales
Conglomerado 1 2 3 4 1 3,974 4,353 2,353 2 3,974 4,417 3,897 3 4,353 4,417 5,633 4 2,353 3,897 5,633
Número de casos en cada conglomerado
Conglomerado 1 11,000 2 8,000 3 3,000 4 4,000Válidos 26,000Perdidos ,000
FBA I Cuaderno de Prácticas de Estadística con SPSS 54
Departamento de Estadística e I.O. Universidad de Granada
ANÁLISIS DE DATOS CUALITATIVOS Ejercicio 1: Un grupo de biólogos ha opinado acerca del plan de actuación de la Administración sobre el Parque Natural de Doñana clasificando el mismo como Bueno, Aceptable o Malo. Los resultados de opinión teniendo en cuenta la procedencia laboral de los mismos, según trabajen para algún organismo público o pertenezcan a otros organismos no gubernamentales se muestran a continuación:
Opinión Procedencia
Bueno Aceptable Malo
Organismo Público 67 56 35 Organismo no Gubernamental 12 40 50
a) Clasificar las variables contempladas. b) Introducir la información anterior y construir la tabla de contingencia plasmando
los porcentajes por columna. Comentar los resultados. c) ¿La procedencia laboral de los biólogos influye en la opinión que expresan sobre
el plan de actuación?
FBA I Cuaderno de Prácticas de Estadística con SPSS 55
Departamento de Estadística e I.O. Universidad de Granada
Tabla de contingencia Procedencia * Opinión
67 56 35 15884,8% 58,3% 41,2% 60,8%
12 40 50 10215,2% 41,7% 58,8% 39,2%
79 96 85 260100,0% 100,0% 100,0% 100,0%
Recuento% de OpiniónRecuento% de OpiniónRecuento% de Opinión
Público
No Gubernamental
Procedencia
Total
Bueno Aceptable MaloOpinión
Total
FBA I Cuaderno de Prácticas de Estadística con SPSS 56
Departamento de Estadística e I.O. Universidad de Granada
Pruebas de chi-cuadrado
33,078a 2 ,00035,395 2 ,000
32,401 1 ,000
260
Chi-cuadrado de PearsonRazón de verosimilitudesAsociación lineal porlinealN de casos válidos
Valor glSig. asintótica
(bilateral)
0 casillas (,0%) tienen una frecuencia esperada inferior a 5.La frecuencia mínima esperada es 30,99.
a.
Medidas simétricas
,357 ,000,357 ,000
,336 ,000
260
PhiV de CramerCoeficiente decontingencia
Nominal pornominal
N de casos válidos
ValorSig.
aproximada
A i d l hi ót i lt tia Medidas direccionales
,135 ,071 1,816 ,069,147 ,083 1,635 ,102,128 ,083 1,445 ,149,127 ,037 ,000c
,060 ,019 ,000c
SimétricaProcedencia dependienteOpinión dependienteProcedencia dependienteOpinión dependiente
Lambda
Tau de Goodmany Kruskal
Nominalpor nominal
ValorError típ.
asint.a T aproximadabSig.
aproximada
FBA I Cuaderno de Prácticas de Estadística con SPSS 57
Departamento de Estadística e I.O. Universidad de Granada
Ejercicio 2: Se está llevando a cabo un estudio sobre la raza canina Boxer para investigar el grado de agresividad que presentan los perros de dicha raza. Se supone en principio, que los síntomas de agresividad dependen fundamentalmente del nivel de adiestramiento que han tenido estos perros durante los dos primeros años de su vida. Por este motivo, se han investigado a 208 perros Boxer ofreciendo los siguientes resultados:
Nivel de adiestramientoGrado de agresividad
Bajo Medio Alto
Bajo 12 13 28 Medio 28 34 15 Alto 42 31 5
a) ¿Qué tipo de variables son? b) Obtener la distribución condicionada del grado de agresividad al nivel de
adiestramiento. c) ¿Son independientes?.
FBA I Cuaderno de Prácticas de Estadística con SPSS 58
Departamento de Estadística e I.O. Universidad de Granada
Tabla de contingencia Grado de Agresividad * Grado de Adiestramiento
12 13 28 53
14,6% 16,7% 58,3% 25,5%
28 34 15 77
34,1% 43,6% 31,3% 37,0%
42 31 5 78
51,2% 39,7% 10,4% 37,5%
82 78 48 208
100,0% 100,0% 100,0% 100,0%
Recuento% de Grado deAdiestramientoRecuento% de Grado deAdiestramientoRecuento% de Grado deAdiestramientoRecuento% de Grado deAdiestramiento
Bajo
Medio
Alto
Grado deAgresividad
Total
Bajo Medio AltoGrado de Adiestramiento
Total
FBA I Cuaderno de Prácticas de Estadística con SPSS 59
Departamento de Estadística e I.O. Universidad de Granada
Pruebas de chi-cuadrado
41,629a 4 ,00040,522 4 ,000
31,093 1 ,000
208
Chi-cuadrado de PearsonRazón de verosimilitudesAsociación lineal porlinealN de casos válidos
Valor glSig. asintótica
(bilateral)
0 casillas (,0%) tienen una frecuencia esperada inferior a 5.La frecuencia mínima esperada es 12,23.
a.
Medidas direccionales
-,336 ,058 -5,668 ,000
-,338 ,058 -5,668 ,000
-,334 ,058 -5,668 ,000
SimétricaGrado de AgresividaddependienteGrado de Adiestramientodependiente
d de SomersOrdinal por ordinalValor
Error típ.asint.a T aproximadab
Sig.aproximada
Asumiendo la hipótesis alternativa.a.
Empleando el error típico asintótico basado en la hipótesis nula.b.
Medidas simétricas
-,336 ,058 -5,668 ,000-,330 ,058 -5,668 ,000-,492 ,078 -5,668 ,000
208
Tau-b de KendallTau-c de KendallGamma
Ordinal por ordinal
N de casos válidos
ValorError típ.
asint.a T aproximadabSig.
aproximada
Asumiendo la hipótesis alternativa.a.
Empleando el error típico asintótico basado en la hipótesis nula.b.
FBA I Cuaderno de Prácticas de Estadística con SPSS 60
Departamento de Estadística e I.O. Universidad de Granada
Ejercicio 3: En la siguiente tabla se muestra la información de la Unidad de Paritorio de un hospital granadino, donde aparecen las frecuencias observadas de utilización de analgesia epidural y realización de episiotomía a las mujeres cuyo parto es asistido en dicho centro. Los responsables de esta Unidad creen que la utilización de analgesia epidural en el proceso del parto influye en la realización de episiotomía.
Analgesia EpiduralEpisitomía
No Sí
No 405 243Sí 239 235
Se pide la realización de un estudio de asociación que de respuesta a los
responsables de la Unidad de Paritorio.
Tabla de contingencia Realización de Episiotomía * Utilización deanalgesia epidural
405 243 64862,9% 50,8% 57,8%
239 235 47437,1% 49,2% 42,2%
644 478 1122100,0% 100,0% 100,0%
NO
Si
Realización deEpisiotomía
Total
No Sí
Utilización deanalgesia epidural
Total
FBA I Cuaderno de Prácticas de Estadística con SPSS 61
Departamento de Estadística e I.O. Universidad de Granada
Pruebas de chi-cuadrado
16,332b 1 ,000
15,841 1 ,000
16,316 1 ,000
,000 ,000
1122
Chi-cuadrado de PearsonCorrección porcontinuidad
a
Razón de verosimilitudesEstadístico exacto deFisherN de casos válidos
Valor glSig. asintótica
(bilateral)Sig. exacta(bilateral)
Sig. exacta(unilateral)
Calculado sólo para una tabla de 2x2.a.
0 casillas (,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mínima esperadaes 201,94.
b.
Medidas simétricas
,121 ,000,121 ,000
,120 ,000
1122
PhiV de CramerCoeficiente decontingencia
Nominal pornominal
N de casos válidos
ValorSig.
aproximada
Asumiendo la hipótesis alternativa.a.
Empleando el error típico asintótico basado en la hipótesisnula.
b.
Medidas direccionales
,000 ,000 .c .c
,000 ,000 .c
.c
,000 ,000 .c
.c
d
SimétricaRealización deEpisiotomía dependienteUtilización AnalgesiEpidural dependienteRealización de
Lambda
Tau de Goodman
Nominalpor nominal
ValorError típ.
asint.a T aproximadabSig.
aproximada
FBA I Cuaderno de Prácticas de Estadística con SPSS 62
Departamento de Estadística e I.O. Universidad de Granada
Bibliografía Recomendada:
• Aguilera del Pino, A. M. (2001). “Tablas de Contingencia Bidimensionales”. Ed La Muralla, S.A.
• García Leal, J., Lara Porras, A.M., Navarrete Álvarez, E., Rico Castro, N., Román Montoya, Y., Ruiz Castro, E. y Sánchez Borrego, I.R. (2007). “Técnicas Estadísticas aplicadas en Biología con SPSS”. Editorial Proyecto Sur.
• Gutiérrez Jáimez, R., González Carmona, A., Torres Ruiz, F y Gallardo Sansalvador, J.A. (1994). “Técnicas de Análisis de datos Multivariable. Tratamiento computacional”. Universidad de Granada.
• Lara Porras, A.M. (2001) “Diseño Estadístico de Experimentos, Análisis de la Varianza y Temas relacionados. Tratamiento Informático mediante SPSS”. Ed. Proyecto Sur.
• Lara Porras, A.M., Sánchez Borrego, I.R., Ramos Ábalos, E.M.Raya Miranda, R., Tarifa Blanco, J.A. y Alfonso Uxó, A. (2008) “Guía Interactiva de Autoaprendizaje de SPSS. versión 2.1” Ed. Proyecto Sur.
• Visauta Vinacua, B. (1998) “Análisis Estadístico con SPSS para Windows. Volumen II: Estadística multivariante”. McGraw-Hill.
• Visauta Vinacua, B. (2007) “Análisis Estadístico con SPSS 14. Estadística Básica”. McGraw-Hill.
Bibliografía General:
• Box, G.E.P., Hunter W.G. & Hunter J.S. (1988). “Estadística para Investigadores”. Ed. Reverté.
• Canavos, G.C. (1990). “Probabilidad y Estadística. Aplicaciones y Métodos”. Ed. McGraw-Hill.
• Ferrán Aranaz, M. (1996). “SPSS para Windows. Programación y Análisis Estadístico”. Serie McGraw-Hill de informática.
• García Leal, J. y Lara Porras, A.M. (1998). “Diseño Estadístico de Experimentos. Análisis de la Varianza”. Grupo Editorial Universitario.
• Lara Porras, A.M. (2010) “Estadística para Biología y Ciencias Ambientales: Tratamiento Informático mediante SPSS”. Ed. Proyecto Sur.
• Lara Porras, A.M. y Román Montoya, Yolanda (2010) “Aprender Estadística analizando datos: Métodos multimedia”. Ed. Proyecto Sur.
• Lizasoain, L. y Joaristi, L. (1998) “SPSS para Windows”. Ed Paraninfo. • Ludwig, J.A. y Reynolds, J.F. (1988) “Statistical Ecology”. J. Willey & Sons. • Martin Andrés, A., Luna del Castillo, J.D. (2004). “Bioestadística para las
Ciencias de la Salud”. Ed. Capitel. • Mason, R.L., Gunst, R.F. y Hess, J.L. (1989), “Statistical Design and Analysis
of Experiments”. J. Willey & Sons. • Milton, J.S. (2007) “Estadística para Biología y Ciencias de la Salud”. Ed.
McGraw-Hill. • Ollero Hinojosa, J., García Leal, J., Lara Porras. A.M., Martínez Andrés, A.,
Rodríguez, C., Ramos, H. (1997) “Diseño y Análisis Estadístico de Experimentos”. Grupo Editorial Universitario.
• Sharma, S. (1996) “Applied Multivariate Techniques”. Ed. J. Wiley & Sons.