Tema 4. Medidas de asociación
1.- LEO A. GOODMAN2.- WILLIAM HENRY KRUSKAL
El estadístico Chi-cuadrado
SIRVE: Ver si dos variables están o no asociadas
NO SIRVE: no nos dice si es alta o baja la asociadas
TABLAS 2x2
Veamos coeficientes para medir la intensidad en tablas 2x2
1) Coeficiente Phi de Pearson2) Riesgo relativo3) Razón de productos cruzados
B No B Total
A f11 f12 f1.
No A f21 f22 f2.
Total f.1 f.2 n
TABLAS 2x2
1) Coeficiente Phi de Pearson
Se define el coeficiente Phi, de la forma siguiente:
B No B Total
A f11 f12 f1.
No A f21 f22 f2.
Total f.1 f.2 n
2121
2211222112
exp ....
)(/
ffff
ffffn
TABLAS 2x2
1) Coeficiente Phi de Pearson
B No B Total
A f11 f12 f1.
No A f21 f22 f2.
Total f.1 f.2 n
11 Toma valores en el intervalo:
Interpretación:
Valor 0: se obtiene cuando hay independencia.
Valor 1: se obtiene cuando la dependencia es directa y perfecta,
Valor -1: se obtiene cuando la dependencia es inversa y perfecta,
TABLAS 2x2
1) Coeficiente Phi de Pearson
Para realizar un estudio de observación de conductas de interacción en niños en situación de juego se ha entrenado a dos observadores en la utilización de un sistema de registro de conductas. Los dos observadores codifican con el mismo sistema de categorías, requiriéndose que lo utilicen con un mismo criterio. Para evaluar el nivel de acuerdo entre los observadores y constatar si el entrenamiento recibido ha sido adecuado, se pide a ambos observadores que clasifiquen las conductas observadas en un vídeo de prueba. Los resultados fueron los siguientes:
EJEMPLO
TABLAS 2x2
1) Coeficiente Phi de Pearson
EJEMPLO
Observador A
Observador B Total
A B
A 100 10 110
B 20 60 80
Total 120 70 190
Frecuencias esperadas
A B
A (110x120)/190=69,474 (110x70)/190=40,53
B (80x120)/190=50,526 (80x70)/190=29,47
TABLAS 2x2
1) Coeficiente Phi de Pearson
EJEMPLO
47,8647,29
)47,2960(
53,40
)53,4010(
526,50
)53,5020(
474,69
)47,69100()( 222222exp
i j ij
ijij
e
ef
Calculamos el coeficiente Phi de Pearson:
675,0190/47,86/2exp n
TABLAS 2x2
1) Coeficiente Phi de Pearson
EJEMPLO
Interpretación
Signo positivo Dependencia directa
Vemos que el valor es moderado-alto
La mayoría de los que tienen un resultado A por el observador A, también obtienen un resultado A por el
observador B
TABLAS 2x2
2) Riesgo relativo
B No B Total
A f11 f12 f1.
No A f21 f22 f2.
Total f.1 f.2 n
Se define el riesgo relativo por columnas, de la forma siguiente:
Se define el riesgo relativo por filas, de la forma siguiente:
121.
2.11
2.12
1.11
/
/
)/(
)/(
ff
ff
ff
ff
BAP
BAPRRcolumnas
.121
.211
.221
.111
/
/
)/(
)/(
ff
ff
ff
ff
ABP
ABPRR filas
TABLAS 2x2
2) Riesgo relativo
B No B Total
A f11 f12 f1.
No A f21 f22 f2.
Total f.1 f.2 n
Toma valores en el intervalo:
Interpretación:
RR0
El RR = 1, informa que no hay asociación entre las variables.
El RR > 1, nos dice que existe asociación positiva.
El 0 < RR < 1, indica que existe una asociación negativa.
TABLAS 2x2
2) Riesgo relativo
EJEMPLO (Continuación)
Observador A
Observador B Total
A B
A 100 10 110
B 20 60 80
Total 120 70 190
Calculamos el riesgo relativo por columnas:
Calculamos el riesgo relativo por filas:
8333,512010
70100
70/10
120/100
)_/_(
)_/_(
x
x
BObBAObAP
AObBAObAPRRcolumnas
6364,311020
80100
80/20
110/100
)_/_(
)_/_(
x
x
BObAAObBP
AObAAObBPRR filas
TABLAS 2x2
2) Riesgo relativo
EJEMPLO (Continuación)
Interpretación
El RR > 1, nos dice que existe asociación positiva
Es 5,8333 veces más fácil tener un valor A por el observador A cuando se tiene un valor A por el observador B que si se tiene un valor B por el observador B.
Es 3,6364 veces más fácil tener un valor A por el observador B cuando se tiene un valor A por el observador A que si se tiene un valor B por el observador A.
TABLAS 2x2
3) Razón de productos cruzados
B No B Total
A f11 f12 f1.
No A f21 f22 f2.
Total f.1 f.2 n
Se define la razón de productos cruzados, de la forma siguiente:
2212
2111
2112
2211
/
/
ff
ff
ff
ffRC
Toma valores en el intervalo: RC0
TABLAS 2x2
3) Razón de productos cruzados
B No B Total
A f11 f12 f1.
No A f21 f22 f2.
Total f.1 f.2 n
Interpretación:
La RC = 1, hay la misma razón de casos que aparece A y no A, cuando está B, que cuando no está presente B.
La RC < 1, la razón entre los casos que aparecen A y no A es menor cuando está presente B.
La RC > 1, la razón entre los casos que aparecen A y no A es mayor cuando está presente B.
TABLAS 2x2
3) Razón de productos cruzados
EJEMPLO (Continuación)
Observador A
Observador B Total
A B
A 100 10 110
B 20 60 80
Total 120 70 190
Calculamos la razón de productos cruzados:
30200
6000
2010
60100
2112
2211 x
x
ff
ffRC
TABLAS 2x2
3) Razón de productos cruzados
EJEMPLO (Continuación)
Interpretación
RC>1, la razón entre los resultados A y B del observador A es superior cuando el sujeto tiene un valor A por el observador B que cuando tiene un valor B.
Es decir, hay una dependencia directa
TABLAS rxc
Veamos coeficientes para medir la intensidad en tablas rxc
1) Coeficiente de contingencia de Pearson2) V de Cramer3) Lambda de Goodman y Kruskal
Tablas con mayor número de columnas y/ó filas.
TABLAS rxc
1) Coeficiente de contingencia de Pearson
Se define el coeficiente de contingencia de Pearson, de la forma siguiente:
El valor máximo es:
}1,1{1
}1,1{
crMin
crMinCMax
)/( 2exp
2exp nC
TABLAS rxc
1) Coeficiente de contingencia de Pearson
Interpretación:
Toma valores en el intervalo:}1,1{1
}1,1{0
crMin
crMinC
C=0, indica independencia absoluta
C=Max(C), indica dependencia perfecta
TABLAS rxc
1) Coeficiente de contingencia de Pearson
Para analizar si el estado civil no era una variable relevante a la hora de explicar las actitudes abortistas, se ha encuestado a 500 sujetos obteniendo los resultados que aparecen en la tabla siguiente.
EJEMPLO
ActitudAbortista
ActitudAntiabortista
Total
Solteros 120 30 150
Casados 50 200 250
Divorciados 30 70 100
Total 200 300 500
TABLAS rxc
1) Coeficiente de contingencia de Pearson
Calculamos las frecuencias esperadas
EJEMPLO
Calculamos el valor Chi-cuadrado:
83,145)( 2
2exp
i j ij
ijij
e
ef
Calculamos el valor C:
475,0)/( 2exp
2exp nC
Calculamos el valor máximo de C:
7071,0}1,1{1
}1,1{
crMin
crMinCMax
TABLAS rxc
2) V de Cramer
Se define el valor V de Cramer, de la forma siguiente:
El valor p es:
p = Min {número de filas, número de columnas}
)1(/2exp pnV
TABLAS rxc
2) V de Cramer
Interpretación:
Toma valores en el intervalo: 10 V
V=0, indica independencia absoluta
V=1, indica dependencia perfecta
TABLAS rxc
2) V de Cramer
EJEMPLO (Continuación)
ActitudAbortista
ActitudAntiabortista
Total
Solteros 120 30 150
Casados 50 200 250
Divorciados 30 70 100
Total 200 300 500
Calculamos el valor V de Cramer:
54,0)12(500/83,145)1(/2exp xpnV
TABLAS rxc
2) V de Cramer
EJEMPLO (Continuación)
Interpretación
Es decir, hay una dependencia directa no muy alta
54,0)12(500/83,145)1(/2exp xpnV
TABLAS rxc
3) Lambda de Goodman y Kruskal
Se define el valor Lambda, de la forma siguiente:
¡¡¡ LOCURA MATEMÁTICA!!!
max
max
fn
ffmj
Toma valores en el intervalo: 10
TABLAS rxc
3) Lambda de Goodman y Kruskal
EJEMPLO (Continuación)
ActitudAbortista
ActitudAntiabortista
Total
Solteros 120 30 150
Casados 50 200 250
Divorciados 30 70 100
Total n
máximo120 200 250
28,0250500
250)200120(
max
max
fn
ffmj
TABLAS rxc
EJEMPLO (Continuación)
Interpretación
Es el 28% de error que se ve reducido al predecir el valor de la variable dependiente X, conocido el valor de la
variable independiente Y
3) Lambda de Goodman y Kruskal
28,0250500
250)200120(
max
max
fn
ffmj
RESUMEN
- Medidas para tablas 2x2- Coeficiente Phi de Pearson
- Riesgo Relativo- por filas
- por columnas
- Razón de productos cruzados
1/1 2exp n
2112
22110ff
ffRC
121.
2.110ff
ffRRcolumnas
.121
.2110ff
ffRR filas
RESUMEN
-Medidas para tablas rxc- Coeficiente de contingencia de Pearson
- V de Cramer
- Lambda de Goodman y Kruskal
1max
max0
fn
ffmj
1)1),((/0 2exp crMinnV
1,11
1,1)/(0 2
exp2exp
crMin
crMinnC
GRACIAS POR LA ATENCIÓN