Capítulo III
Análisis de varianza
Introducción
• En el capítulo anterior se analizaron únicamente dos grupos, sin embargo, la realidad es usualmente más compleja que eso.
• Frecuentemente se requiere comparar tres, cuatro, cinco o más muestras de grupos.
• No es posible emplear la razón t para comparar por pares dichas muestras, ya que implicaría gran trabajo y errores (alpha), por ello existe el ANÁLISIS DE VARIANZA.
La lógica del análisis de varianza
• Para efectuar dicho análisis se requieren dos conceptos:– VARIACIÓN DENTRO DE LOS GRUPOS: Es la
distancia entre los puntajes crudos y su media del grupo.
– VARIACIÓN ENTRE GRUPOS: La distancia entre las medias de los grupos.
La lógica del análisis de varianza
• Dichas variaciones se pueden relacionar con la prueba de la razón t, así:
• Este análisis de varianza produce una razón F, cuyo numerador indica la variación entre los grupos, y cuyo denominador representa la variación dentro de los grupos.
difXX
t
21 Variación entre grupos
Variación dentro de los grupos
La sumas de cuadrados
• Este concepto se empleó al obtener la desviación estándar, cuando se elevaron al cuadrado las desviaciones de la media de una distribución. Dicho procedimiento eliminaba de manera matemática sólida, los signos negativos que pudieran existir.
• Existen distintas sumas de cuadrados:– SCTotal: Suma de cuadrados total.– SCent: Suma de cuadrados entre grupos.– SCdentro: Suma de cuadrados dentro de los grupos.
La suma de cuadrados dentro de los grupos (SCdentro)
• Por fórmula:
• Donde: • X=Un puntaje de desviación (X-X)• APLICANDO LA FÓRMULA PARA LOS
SIGUIENTES DATOS:• X1= 1,2,1,2• X2= 1,3,2,2
24
23
22
21 XXXXSCdentro
La suma de cuadrados dentro de los grupos (SCdentro)
CONSERVADORES (N=4) MODERADOS (N=4)
X1 X=X-X X2 X2 X=X-X X2
1 -0.50 0.25 1 -1.00 1
2 0.50 0.25 3 1.00 1
1 -0.50 0.25 2 0 0
2 0.50 0.25 2 0 0
61 X
5.146 X
00.121 X 82 X
0.248 X
00.222 X
La suma de cuadrados dentro de los grupos (SCdentro)
LIBERALES (N=4) RADICALES (N=4)
X3 X=X-X X2 X4 X=X-X X2
1 -0.75 0.56 3 1.25 1.56
2 0.25 0.06 2 0.25 0.06
2 -0.25 0.06 1 -0.75 0.56
2 0.25 0.06 1 -0.75 0.56
71 X
75.147 X
74.023 X 72 X
75.147 X
74.224 X
24
23
22
21 XXXXSCdentro
74.274.000.200.1 SCdentro
48.6SCdentro
La suma de cuadrados entre los grupos (SCent)
NSCent totalXX 2)(
• La suma de cuadrados entre los grupos representa la suma de las desviaciones de cada media muestral de la media total elevadas al cuadrado.
• Por fórmula:• Donde:
X=cualquier media muestralXtotal= la media total (la media de los puntajes crudos de
la totalidad de las muestras combinadas)N=el número de puntajes de cualquier muestraSCent=la suma de cuadrados entre los grupos.
La suma de cuadrados entre los grupos (SCent)
• SCent= (1.50-1.75)2 4 + (2.0-1.75) 2 4 +(1.75-1.75)2 4 + (1.75-1.75) 2 4
• SCent= (-0.25)2 4 + (0.25) 2 4 + (0)2 4 + (0) 2 4• SCent= (0.06)4 + (0.06)4 + (0)4 + (0)4• SCent= 0.24+ 0.24• SCent= 0.48
La suma total de cuadrados (SCtotal)
• La suma total de cuadrados es igual a la combinación de sus componentes dentro y entre los grupos.
• Por fórmula:• SCTotal= SCent + SCdentro• SCTotal= 0.48 + 6.48• SCTotal= 6.96
La suma total de cuadrados (SCtotal)
• También se puede hallar con la fórmula:
• Donde:• X=un puntaje crudo en cualquier muestra.• Xtotal= la media total (la media de todos los
puntajes crudos de todas las muestras combinadas).• SCTotal=la suma total de cuadrados.• Se suman todas las desviaciones al cuadrado con
respecto de la media total. Ver pág. 71.
2)( totalXXSCtotal
Cómo calcular las suma de cuadrados
• Los procedimientos anteriores son en extremos tardados y difíciles, por ello existen fórmulas más simples para calcular las sumas de cuadrados.
• Donde:• N total=el número total de puntajes de todas
las muestras combinadas.
totalN
XtotaltotalXSCtotal
.
)( 22
Cómo calcular las suma de cuadrados
CONSERVADORES (N=4) MODERADOS (N=4)
X1 X2 X2 X2
1 1 1 1
2 4 3 9
1 1 2 4
2 4 2 4
61 X
5.146 X
82 X
0.248 X
1822 X102
1 X
Cómo calcular las suma de cuadrados (SCtotal)
LIBERALES (N=4) RADICALES (N=4)
X3 X2 X4 X2
1 1 3 9
2 4 2 4
2 4 1 1
2 4 1 1
71 X
75.147 X
1323 X 72 X
75.147 X
1524 X
4444)7786(
)15131810(2
SCtotal
16)28(
)56(2
SCtotal
16784
)56( SCtotal 4956 SCtotal 7SCtotal
totalN
XtotaltotalXSCtotal
.
)( 22
La suma de cuadrados entre los grupos (SCent)
Ntotal
Xtotal
N
XSCent
22 )()(
• En nuestro caso:
• Donde:= A la sumatoria de los puntajes de cada muestra al cuadrado.
= A la sumatoria de todos los puntajes al cuadrado.
• N=el número total de puntajes en cualquier muestra.• N total= el número total de puntajes en todas las muestras
combinadas.
2)( X
2)( Xtotal
La suma de cuadrados entre los grupos (SCent)
Ntotal
Xtotal
N
XSCent
22 )()(
• Sustituyendo:
16
)28(
4
)7(
4
)7(
4
)8(
4
)6( 22222
SCent
16784
449
449
464
436 SCent
4925.1225.12169 SCent
495.49 SCent
50.0SCent
La suma de cuadrados dentro los grupos (SCdentro)
SCentSCdentroSCtotal
• Se puede calcular por simple despeje:
SCentSCtotalSCdentro
50.000.7 SCdentro
50.6SCdentro
La suma de cuadrados dentro los grupos (SCdentro)
N
XXSCdentro
22 )()(
• Solo para verificar en busca de errores:
4)7(
154)7(
134)8(
184)6(
102222
SCdentro
449
15449
13464
18436
10SCdentro
25.121525.12131618910 SCdentro
75.275.021 SCdentro
50.6SCdentro
La media cuadrática
• La suma de cuadrados tiende a crecer conforme aumenta N, por lo cual, dichas medidas no se pueden considerar “puras”. Por ello, se requiere un medio de control que evite esto.
• Para eso existe la “media cuadrática”. Por fórmula:
• Donde: =la media cuadrática entre los grupos.SCent = la suma de cuadrados entre los grupos.glent =los grados de libertad entre los grupos.
glent
SCentCent
Cent
La media cuadrática
Y también: Donde:
= la media cuadrática dentro de los grupos.
SCdentro = la suma de cuadrados dentro de los grupos.gldentro = los grados de libertad dentro de los grupos.
gldentroSCdentro
Cdentro
Cdentro
La media cuadrática
• Pero primero hay que obtener los grados de libertad apropiados:
• Para la media cuadrática entre los grupos:glent= K-1
Donde: K= el número de muestras.Para encontrar la media cuadrática dentro de los grupos.
gldentro= N total – KDonde: N total= el número total de puntajes en todas las muestras combinadas.K= el número de muestras.
La media cuadrática
• Sustituyendo con los datos anteriores:glent= K-1glent= 4-1glent=3
Para encontrar la media cuadrática dentro de los grupos.
gldentro= N total – Kgldentro= 16-4gldentro= 12
La media cuadrática
• Ahora solo falta obtener las medias cuadráticas:
glent
SCentCent
350.0Cent
17.0Cent
gldentroSCdentro
Cdentro
1250.6Cdentro
54.0Cdentro
Razón o cociente F
• El análisis de varianza produce una razón f que sirve para comparar la variación entre los grupos y dentro de los grupos.
• Por fórmula:
• Para los datos vistos:
• Ahora estamos listos para rechazar o para aceptar la hipótesis nula. (Con la tabla D).
Cdentro
SCentF
54.017.0F 31.0F
Razón o cociente F
• La tabla D se interpreta, para el numerador (glent: grados de libertad entre) se indican en la parte superior de la tabla; el denominador (gldentro) se indican al lado izquierdo.
• Para nuestro caso:– glent =3– gldentro =12
• Así se encuentra un valor de: 3.49.
Razón o cociente F
• Así que la razón F de la tabla fue de 3.49. • Y la razón F calculada fue de 0.31• Por lo tanto la razón F calculada, debe ser igual o
mayor que la de la tabla para rechazar la hipótesis nula; sin embargo, en este caso como fue de solo 0.31, debemos aceptar que no hay diferencias significativas entre los grupos y se acepta la hipótesis nula.
• PARA EL EJEMPLO COMPLETO. (Ver. Págs. 77-80).
Comparación múltiple de medias
• Con el fin de averiguar dónde se encuentran exactamente las diferencias significativas entre los grupos, cuando F obtenida, es igual o mayor que la F de la tabla, se emplea una nueva prueba, a saber: la DSH (Honestly significant difference: diferencia honestamente significartiva) de Turkey.
Comparación múltiple de medias
• Por fórmula:• Donde:
qa = un valor de la tabla a un nivel de confianza dado para el número máximo de medias que se estén comparando.
= la media cuadrática dentro de los grupos.
n= el número de entrevistados en cada grupo (debe ser el mismo).
nCdentro
qaDSH
Cdentro
Comparación múltiple de medias
• Paso 3: Encontrar la DSH.
• Paso 4: Comparar la DSH con la tabla de las diferencias entre medias.
nCdentro
qaDSH
537.43
77.3DSH
537.43
77.3DSH
67.877.3DSH
)94.2(77.3DSH
08.11DSH
Comparación múltiple de medias
• Para que se le considere estadísticamente significativa, cualquier diferencia entre medias debe ser igual o mayor que la DSH.
• Por lo tanto se concluye las diferencias entre X1 y X3; X2 y X3, son estadísticamente significativas;
• No así entre X1 y X2, que solo es de 11.0, menor que 11,08 obtenido en el paso 3.
Comparación múltiple de medias
• En tu equipo, analicen el ejemplo y resuelvan un ejercicio asociado (número 5 ó 7).
• REALICEN LOS PROBLEMAS DE LAS PÁGINAS: 83-85.