Tema 4. Medidas de asociación

Tema 4. Medidas de asociación

1.- LEO A. GOODMAN2.- WILLIAM HENRY KRUSKAL

El estadístico Chi-cuadrado

SIRVE: Ver si dos variables están o no asociadas

NO SIRVE: no nos dice si es alta o baja la asociadas

TABLAS 2x2

Veamos coeficientes para medir la intensidad en tablas 2x2

1) Coeficiente Phi de Pearson2) Riesgo relativo3) Razón de productos cruzados

B No B Total

A f11 f12 f1.

No A f21 f22 f2.

Total f.1 f.2 n

TABLAS 2x2

1) Coeficiente Phi de Pearson

Se define el coeficiente Phi, de la forma siguiente:

B No B Total

A f11 f12 f1.

No A f21 f22 f2.

Total f.1 f.2 n

2121

2211222112

exp ....

)(/

ffff

ffffn

TABLAS 2x2


B No B Total

A f11 f12 f1.

No A f21 f22 f2.

Total f.1 f.2 n

11 Toma valores en el intervalo:

Interpretación:

Valor 0: se obtiene cuando hay independencia.

Valor 1: se obtiene cuando la dependencia es directa y perfecta,

Valor -1: se obtiene cuando la dependencia es inversa y perfecta,

TABLAS 2x2


Para realizar un estudio de observación de conductas de interacción en niños en situación de juego se ha entrenado a dos observadores en la utilización de un sistema de registro de conductas. Los dos observadores codifican con el mismo sistema de categorías, requiriéndose que lo utilicen con un mismo criterio. Para evaluar el nivel de acuerdo entre los observadores y constatar si el entrenamiento recibido ha sido adecuado, se pide a ambos observadores que clasifiquen las conductas observadas en un vídeo de prueba. Los resultados fueron los siguientes:

EJEMPLO

TABLAS 2x2


EJEMPLO

Observador A

Observador B Total

A B

A 100 10 110

B 20 60 80

Total 120 70 190

Frecuencias esperadas

A B

A (110x120)/190=69,474 (110x70)/190=40,53

B (80x120)/190=50,526 (80x70)/190=29,47

TABLAS 2x2


EJEMPLO

47,8647,29

)47,2960(

53,40

)53,4010(

526,50

)53,5020(

474,69

)47,69100()( 222222exp

i j ij

ijij

e

ef

Calculamos el coeficiente Phi de Pearson:

675,0190/47,86/2exp n

TABLAS 2x2


EJEMPLO

Interpretación

Signo positivo Dependencia directa

Vemos que el valor es moderado-alto

La mayoría de los que tienen un resultado A por el observador A, también obtienen un resultado A por el

observador B

TABLAS 2x2

2) Riesgo relativo

B No B Total

A f11 f12 f1.

No A f21 f22 f2.

Total f.1 f.2 n

Se define el riesgo relativo por columnas, de la forma siguiente:

Se define el riesgo relativo por filas, de la forma siguiente:

121.

2.11

2.12

1.11

/

/

)/(

)/(

ff

ff

ff

ff

BAP

BAPRRcolumnas

.121

.211

.221

.111

/

/

)/(

)/(

ff

ff

ff

ff

ABP

ABPRR filas

TABLAS 2x2

2) Riesgo relativo

B No B Total

A f11 f12 f1.

No A f21 f22 f2.

Total f.1 f.2 n

Toma valores en el intervalo:

Interpretación:

RR0

El RR = 1, informa que no hay asociación entre las variables.

El RR > 1, nos dice que existe asociación positiva.

El 0 < RR < 1, indica que existe una asociación negativa.

TABLAS 2x2

2) Riesgo relativo

EJEMPLO (Continuación)

Observador A

Observador B Total

A B

A 100 10 110

B 20 60 80

Total 120 70 190

Calculamos el riesgo relativo por columnas:

Calculamos el riesgo relativo por filas:

8333,512010

70100

70/10

120/100

)_/_(

)_/_(

x

x

BObBAObAP

AObBAObAPRRcolumnas

6364,311020

80100

80/20

110/100

)_/_(

)_/_(

x

x

BObAAObBP

AObAAObBPRR filas

TABLAS 2x2

2) Riesgo relativo


Interpretación

El RR > 1, nos dice que existe asociación positiva

Es 5,8333 veces más fácil tener un valor A por el observador A cuando se tiene un valor A por el observador B que si se tiene un valor B por el observador B.

Es 3,6364 veces más fácil tener un valor A por el observador B cuando se tiene un valor A por el observador A que si se tiene un valor B por el observador A.

TABLAS 2x2

3) Razón de productos cruzados

B No B Total

A f11 f12 f1.

No A f21 f22 f2.

Total f.1 f.2 n

Se define la razón de productos cruzados, de la forma siguiente:

2212

2111

2112

2211

/

/

ff

ff

ff

ffRC

Toma valores en el intervalo: RC0

TABLAS 2x2


B No B Total

A f11 f12 f1.

No A f21 f22 f2.

Total f.1 f.2 n

Interpretación:

La RC = 1, hay la misma razón de casos que aparece A y no A, cuando está B, que cuando no está presente B.

La RC < 1, la razón entre los casos que aparecen A y no A es menor cuando está presente B.

La RC > 1, la razón entre los casos que aparecen A y no A es mayor cuando está presente B.

TABLAS 2x2



Observador A

Observador B Total

A B

A 100 10 110

B 20 60 80

Total 120 70 190

Calculamos la razón de productos cruzados:

30200

6000

2010

60100

2112

2211 x

x

ff

ffRC

TABLAS 2x2



Interpretación

RC>1, la razón entre los resultados A y B del observador A es superior cuando el sujeto tiene un valor A por el observador B que cuando tiene un valor B.

Es decir, hay una dependencia directa

TABLAS rxc

Veamos coeficientes para medir la intensidad en tablas rxc

1) Coeficiente de contingencia de Pearson2) V de Cramer3) Lambda de Goodman y Kruskal

Tablas con mayor número de columnas y/ó filas.

TABLAS rxc

1) Coeficiente de contingencia de Pearson

Se define el coeficiente de contingencia de Pearson, de la forma siguiente:

El valor máximo es:

}1,1{1

}1,1{

crMin

crMinCMax

)/( 2exp

2exp nC

TABLAS rxc


Interpretación:

Toma valores en el intervalo:}1,1{1

}1,1{0

crMin

crMinC

C=0, indica independencia absoluta

C=Max(C), indica dependencia perfecta

TABLAS rxc


Para analizar si el estado civil no era una variable relevante a la hora de explicar las actitudes abortistas, se ha encuestado a 500 sujetos obteniendo los resultados que aparecen en la tabla siguiente.

EJEMPLO

ActitudAbortista

ActitudAntiabortista

Total

Solteros 120 30 150

Casados 50 200 250

Divorciados 30 70 100

Total 200 300 500

TABLAS rxc


Calculamos las frecuencias esperadas

EJEMPLO

Calculamos el valor Chi-cuadrado:

83,145)( 2

2exp

i j ij

ijij

e

ef

Calculamos el valor C:

475,0)/( 2exp

2exp nC

Calculamos el valor máximo de C:

7071,0}1,1{1

}1,1{

crMin

crMinCMax

TABLAS rxc

2) V de Cramer

Se define el valor V de Cramer, de la forma siguiente:

El valor p es:

p = Min {número de filas, número de columnas}

)1(/2exp pnV

TABLAS rxc

2) V de Cramer

Interpretación:

Toma valores en el intervalo: 10 V

V=0, indica independencia absoluta

V=1, indica dependencia perfecta

TABLAS rxc

2) V de Cramer


ActitudAbortista


Total

Solteros 120 30 150

Casados 50 200 250


Total 200 300 500

Calculamos el valor V de Cramer:

54,0)12(500/83,145)1(/2exp xpnV

TABLAS rxc

2) V de Cramer


Interpretación

Es decir, hay una dependencia directa no muy alta

54,0)12(500/83,145)1(/2exp xpnV

TABLAS rxc

3) Lambda de Goodman y Kruskal

Se define el valor Lambda, de la forma siguiente:

¡¡¡ LOCURA MATEMÁTICA!!!

max

max

fn

ffmj

Toma valores en el intervalo: 10

TABLAS rxc



ActitudAbortista


Total

Solteros 120 30 150

Casados 50 200 250


Total n

máximo120 200 250

28,0250500

250)200120(

max

max

fn

ffmj

TABLAS rxc


Interpretación

Es el 28% de error que se ve reducido al predecir el valor de la variable dependiente X, conocido el valor de la

variable independiente Y


28,0250500

250)200120(

max

max

fn

ffmj

RESUMEN

- Medidas para tablas 2x2- Coeficiente Phi de Pearson

- Riesgo Relativo- por filas

- por columnas

- Razón de productos cruzados

1/1 2exp n

2112

22110ff

ffRC

121.

2.110ff

ffRRcolumnas

.121

.2110ff

ffRR filas

RESUMEN

-Medidas para tablas rxc- Coeficiente de contingencia de Pearson

- V de Cramer

- Lambda de Goodman y Kruskal

1max

max0

fn

ffmj

1)1),((/0 2exp crMinnV

1,11

1,1)/(0 2

exp2exp

crMin

crMinnC

GRACIAS POR LA ATENCIÓN

Date post:	22-Jan-2016
Category:	Documents
Upload:	melia
View:	83 times
Download:	2 times

Tema 4. Medidas de asociación

Documents