+ All Categories

Tema6

Date post: 23-Dec-2015
Category:
Upload: grupoacantun
View: 213 times
Download: 0 times
Share this document with a friend
Description:
Apuntes de II de Psicologia
44
11/11/2014 1 6. Estimación de la fiabilidad 1. Introducción 2. Condiciones de paralelismo. 3. Coeficiente de fiabilidad: interpretación. 4. Procedimientos de estimación de la fiabilidad (incluyendo alfa y variantes) 5. Fiabilidad de un compuesto 6. Factores que afectan a la fiabilidad 7. Error típico de medida y aplicaciones: estimación de puntuaciones verdaderas y contrastes de puntuaciones observadas 8. Limitaciones y aspectos críticos 2 1. Introducción • La fiabilidad se refiere a la precision o consistencia de las medidas •X = V + E •E = X – V • El error reduce la fiabilidad o “replicabilidad” de las medidas obtenidas mediante tests • La fiabilidad es la proporción de varianza obsevada atribuible a la puntuación VERDADERAS (r 2 XV ) • Cómo podemos estimar esta correlación si las puntuaciones verdaderas no son obervables? PARALELISMO
Transcript

11/11/2014

1

6. Estimación de la fiabilidad

1. Introducción2. Condiciones de paralelismo.

3. Coeficiente de fiabilidad: interpretación.

4. Procedimientos de estimación de la fiabilidad (incluyendo alfa y variantes)

5. Fiabilidad de un compuesto

6. Factores que afectan a la fiabilidad

7. Error típico de medida y aplicaciones: estimación de puntuaciones verdaderas y contrastes de puntuaciones observadas

8. Limitaciones y aspectos críticos

2

1. Introducción

• La fiabilidad se refiere a la precision o consistencia de las medidas

•X = V + E•E = X – V

• El error reduce la fiabilidad o “replicabilidad” de las medidas obtenidas mediante tests

• La fiabilidad es la proporción de varianza obsevada atribuible a la puntuación VERDADERAS (r2

XV)

• Cómo podemos estimar esta correlación si las puntuaciones verdaderas no son obervables? PARALELISMO

11/11/2014

2

2

2. Condiciones de paralelismo y consecuencias

Dos conjuntos de puntuaciones, X y X’, son medidas paralelas si:

1. Tienen la misma puntuación verdadera:X = V + E; X’ = V + E’

2. Tienen la misma varianza error:

Las relaciones entre medidas paralelas permiten calcular índices entre variables no observables

2Se = Se’2

3

1. Si las puntuaciones verdaderas no cambian: misma media

E(X) = E(X’)

2'x

2x s=s

E(X) = E(V + E) = E(V) + E(E) = E(V)E(X’) = E(V + E’) = E(V) + E(E’) = E(V)

Y los tests son paralelos

Si las puntuaciones verdaderas no cambian: misma variabilidad 2.

Será lo que verifiquemos para determinar si 2 formas de un test son paralelas (procedims. estadísticos)

11/11/2014

3

3. Se puede demostrar que si calculamos la correlación entre dos tests paralelos, obtenemos la proporción buscada

Habíamos visto que

Linealmente indeps. r = 0E1E2

Iguales si son paralelas4

5

luego 'xx2x

2v rs=s

y

2X

2V

'xxrs

s=Sabemos que

2x

2v ssY por consiguiente

2X

2E

s

s= 1-

4. Estimación de la varianza error:

5. Correlación con un criterio:

11/11/2014

4

6

3. Coeficiente de fiabilidad: interpretación

• Puntuación verdadera en el rasgo: NO OBSERVABLE. Puede ser inferida, NUNCA CALCULADA.

• ERROR ESTÁNDAR o error típico de medida: desviación típica de los errores de medida.

• ÍNDICE DE FIABILIDAD:

1r0 'xx <>

• COEFICIENTE DE FIABILIDAD:

Proporción de var. observada atribuible a la var. verdadera en el rasgo. Cuanto más cercano a 1 más fiable será el test

Concepto de fiabilidad

- Es análogo a precisión.

- Se define como la variación relativa de lapuntuación verdadera con respecto a lapuntuación observada, calculada a través de larazón entre las respectivas varianzas.

- La clave es el error. ¿Por qué se comete?

7

11/11/2014

5

Ejemplo: 2 formas paralelas de un test de inteligencia aplicadas a diferentes personas

¿Cuál de los dos tests es más fiable?

8

La varianza de error que afecta a las mediciones es pequeña

Un test es fiable si:

Cuantificamos el error

• Consecuencias:

• A partir de la definición de Medidas Paralelas:

Valor desconocido!

'xx2x

2v rs=s

Pero su tamaño depende de s2x 9

11/11/2014

6

La correlación entre observadas y verdaderas (rXV) es alta

Un test es fiable si:

Ejemplo: Tests de inteligencia aplicados a diferentes personas

¿Cuál de los tres tests es más fiable?

a = correlación perfectab = pequeño errorc = mayor error (mayor discrepancia entre X y V)

Test c

Test b

Test a

10

La correlación entre observadas y verdaderas (rXV) es alta

Un test es fiable si:

En ese caso, la proporción de varianza de X atribuible a V es alta.Sólo estimable mediante formas paralelas…

rXX’= 1

X

X’

3

3

6

6

Test de fiabilidad perfecta, sin error

[0, 1] Más fácil de interpretar

11

11/11/2014

7

Ejemplo:

Instrumento 1 Instrumento 2

¿Qué instrumento es más fiable?

(X1 y X1' ) (X2 y X2

' )

¿Son directamente comparables? ¿Siempre?12

Otro ejemplo:

Instrumento 1 Instrumento 2

¿Qué instrumento es más fiable?

(X1 y X1' ) (X2 y X2

' )

¿Son directamente comparables? ¿Siempre?13

11/11/2014

8

14

Coeficiente de Fiabilidad:

• Estimador de una propiedad deseable de todo test

• Sirve para estimar la precisión de las medidas que ofrece un test

• Permite realizar comparaciones entre instrumentos para saber cuál es más fiable (dos tests aplicados a la misma muestra)

16

4. Procedimientos de estimación de la fiabilidad

Formas paralelas Equivalencia de las formas

2 tests, 1 aplicación (o 2)

Test-retest 1 test, 2 aplicacionesEstabilidad temporal

Consistencia

Interna 1 test, 1 aplicación* Método dos mitades* Cronbach (tema 9)

11/11/2014

9

17

1) FIABILIDAD COMO EQUIVALENCIA: FORMAS PARALELASCorrelación lineal entre 2 series de puntuaciones en 2 formas paralelas de un test

Cuando se aplica en un solo tiempo: Fatiga

tt1

Forma A Forma B

XA XBr

Implica crear formas paralelas del test -con similar dificultad (media) y variabilidad- y calcular la correlación entre las formas. Es COMPLICADO Y LABORIOSO

Fiabilidad como equivalencia de medidas (si hay dos ti: también

fiabilidad como estabilidad)

18

t

test

MITAD 1 MITAD 2

r

t1

Dada la dificultad de crear formas paralelas, una alternativa:

dividir el test en dos partes paralelas

Indica consistencia entre las formas (por ello también se considera indicador de consistencia interna)

11/11/2014

10

19

Subdividimos el test en 2 partes y las correlacionamos. Tras esto hemos de tener en cuenta que el test es de longitud doble a las mitades evaluadas

CORRECCIÓN DE SPEARMAN-BROWN

PARA TEST DE LONGITUD DOBLE AB

AB'xx r1

r2r

+=

rAB es el coeficiente de correlación entre ambas partes

¿Cómo formar las mitades? * Primera mitad/segunda? * Aleatoriamente?* Pares/impares?

20

2) FIABILIDAD COMO ESTABILIDAD: TEST-RETESTimplica pasar el test en dos momentos diferentes y calcular la correlación entre las puntuaciones obtenidas en los dos momentos

Inadecuado cuando intervienen factores como aprendizaje, cambios madurativos, etc.

El lapso temporal elegido cobra una gran importancia

Fiabilidad como estabilidad t

test

t1

test

t2Xt1 Xt2

r

11/11/2014

11

3) FIABILIDAD COMO CONSISTENCIA INTERNA

Dos mitades no paralelas:

21

Fórmula de RulonEs la varianza de las diferencias entre las puntuaciones de la parte 1 y la parte 2

Es la varianza de la puntuaciones observadas totales

Fórmula de Guttman-FlanaganSon las varianzas de las puntuaciones observadas en cada parte

Dos mitades y Cronbach

Dos mitades paralelas: correlación entre formas y Spearman-Brown

Problemas comunes a todas las aproximaciones: Dificultad del cumplimiento de paralelismo

Cronbach no requiere paralelismo21

• Independientemente de la fórmula, los valores dependen de cómo se forman las mitades: Posibilidad

-Hacer todas las posibles mitades-Calcular el promedio de las correlaciones implicadas-Eso es alfa de Cronbach

Formas paralelas Problemas!

Test-retest Problemas!

Consistencia

Interna 1 test, 1 aplicaciónProblemas!

11/11/2014

12

23

Alternativas al concepto de paralelismo

• Surgen de la dificultad del cumplimiento de las condiciones de paralelismo originales:

x = v + e

x' = v' + e'

+ fuerte Equivalencia + débil

Los ítems miden lo mismo con la misma precisión

Los ítems miden lo mismo pero NO con la misma precisión

3) FIABILIDAD COMO CONSISTENCIA INTERNA

24

Dos mitades y Cronbach

n: numero de ítems del test

s2x: varianza del test total

s2i: varianza de un ítem (i= 1, 2, ...N)

expresa la proporción de varianza común entre los ítems que hay en la varianza total

Alpha de Cronbach

11/11/2014

13

4

Los coeficientes de Kuder-Richardson

Casos particulares del coeficiente alfa para ítems de respuesta dicotómica

KR-20

KR-21

(para ítems de igual dificultad)

p= proporción aciertosq= proporción errores

26

Suj 1 2 3 1 2 3 4 5 6 1 2 3

1 4 6 1 0 1 1 0 1 1 1 1 1

2 5 4 1 1 1 0 1 0 1 1 1 1

3 3 4 1 0 0 1 0 1 0 1 0 1

4 6 8 3 1 0 1 1 0 1 1 1 1

5 4 4 1 0 1 1 0 1 0 1 1 1

6 8 8 5 1 0 1 1 1 0 0 0 0

7 4 3 0 1 0 1 0 0 0 0 1 0

8 2 1 0 1 0 0 0 1 0 1 1 1

9 5 4 2 1 1 0 1 1 1 1 1 1

10 9 8 6 1 1 1 1 1 1 1 1 1

Tt 50 50 20 7 5 7 5 7 5 8 8 8

Test A Test B Test C

11/11/2014

14

27

• Subtest A: alfa

• Subtest B: KR20

• Subtest C: KR21

7

– Estos métodos (los de consistencia interna) están basadosen las covarianzas (correlaciones) entre los ítems, que forman el test

• Un test no proporciona una única medida, X:

– La puntuación total, X, es el promedio de las puntuacionesen cada uno de los ítems

– Pero cada ítem proporciona una puntuación diferente, una medida diferente del mismo rasgo,

– Entonces una única aplicación de un único test ofrece muchas medidas “paralelas” sobre las que estimar la fiabilidad del test

– No es necesario crear formas paralelas del test,

ni aplicarlo dos veces, ni dividirlo en dos mitades

11/11/2014

15

8

Interpretación general de Alfa de Cronbach:

expresa la proporción de varianza común entre los ítems quehay en la varianza total

• Indica la consistencia interna de los elementos del test

• Un test es fiable si todos sus elementos ofrecen medidas consistentes de cada sujeto

• Valores entre 0-1

• Alfa estima la fiabilidad de un test a partir de los ítems que lo componen

• Pero también puede emplearse cuando el test se divide en otros componentes, como subtests

30

• Otros coeficientes sobreestiman la fiabilidad, si no se cumplen los supuestosde paralalismo

Alfa como cota inferior de la fiabilidad

11/11/2014

16

31

Otros coeficientes

• Coeficiente beta

32

Otros coeficientes

• Coeficientes derivados del Análisis Factorial

h: Comunalidad

: 1er valor propio o eigenvalue del factor que más varianza explica

11/11/2014

17

10

5 Fiabilidad en tests compuestos y puntuaciones diferencia

Calcular un coeficiente que reúna los subtests que componen una batería

Si se ponderan los subtests

TESTS COMPUESTOS

34

En el ejemplo:

Si se pondera el subtest A al doble y el subtest C a un tercio:

--

- -)

11/11/2014

18

12

5. Fiabilidad en tests compuestos y puntuaciones diferencia

Utilizadas para evaluar la precisión de puntuaciones tomadas en momentos diferentes para evaluar la eficacia de programas o intervenciones

PUNTUACIONES DIFERENCIA

36

6.1. Longitud del test

Aumentar la longitud de un test implica aumentar

su fiabilidad(siempre que los

nuevos elementos que se añadan sean paralelos)

6. Factores que afectan al coeficiente de fiabilidad

11/11/2014

19

37

• A medida que el test es más largo es másfiable:

Volvemos a aplicar el test

• Error: 1 sobre 3: 33% 3 sobre 100: 3%

Puntuación del sujeto: 2

Puntuación del sujeto: 3

Puntuación sujeto: 67

Puntuación sujeto: 70

Test de 3 ítems Test de 100 ítems

38

• Caso general:

rcc’ = fiabilidad tras modificar longitud del testrxx’ = fiabilidad del test con longitud originalK= longitud final/longitud inicial

Fórmulas de Spearman-Brown (1910) para estimar la fiabilidad de un test si se modifica su longitud

• Caso de longitud doble:( = fórmula dos mitades)

11/11/2014

20

39

Nº de ítemsrequerido para alcanzar una

determinada fiabilidad:

Pero no podemos alargar la longitud hasta el infinito

Fiabilidad

Longitud

40

El cambio en la longitud de un test afectará también a sus varianzas:

Longitud doble Longitud k

Varianzaobservada

Varianzaverdadera

Varianzaerror

11/11/2014

21

41

long. inicial = 40

¿Cuál sería la fiabilidad del test si duplicamos su longitud?

long. final = 80

Al duplicar la longitud del test con elementos paralelos, el coeficiente de fiabilidad aumenta de 0,80 a 0,89

Ejemplo: Aplicamos un test de ansiedad de 40 ítems a 500 estudiantes

k = 2

42

Al aumentar la longitud del test a 100 ítems (añadiendo 60 ítems paralelos), el coeficiente de fiabilidad

aumenta de 0,80 a 0,91

¿Cuál sería la fiabilidad del test si aumentamos su longitud a 100 ítems?

long. inicial = 40 long. final = 100

Ejemplo: Aplicamos un test de ansiedad de 40 ítems a 500 estudiantes

k = 2.5

11/11/2014

22

43

1ong. inicial = 40 1ong. final = ?

Debemos añadir 50 ítems para que el coeficiente de fiabilidad aumente de 0,80 a 0,90

¿Cuántos ítems deberíamos añadir para aumentar el coeficiente de fiabilidad del test a 0,90?

=> 90 ítems

Ejemplo: Aplicamos un test de ansiedad de 40 ítems a 500 estudiantes

k = ¿?

44

• Ejemplo:

• Sabemos que la varianza error en un test es 9 y la varianza observada, 100.

• Se aplica el mismo test a otra muestra, en la que la varianza observada es 16.

Proporción de varianza erroren la primera muestra

Proporción de varianza erroren la segunda muestra

9/100=

9%

9/16=

56%

6.2. Variabilidad de la muestra

11/11/2014

23

45

Ejemplo: Elaboramos test para medir actitud hacia Eutanasia

Medidas en Asociación a favor Eutanasia

(2 formas paralelas)

X X’

145181294

146181185

(0)(+1)(0)(-1)(-1)(+1)

Medidas personas con opiniones diversas

(2 formas paralelas)

Instrumento con fiabilidad deficiente Instrumento fiable

rxx '= 0.99¿?

20 = aceptación total

1 = rechazo absoluto de la Eutanasia

X X’

201718192019

201818181920

(0)(+1)(0)(-1)(-1)(+1)

rxx '= 0.67

45

46

• Para un mismo test aplicado en 2 muestras diferentes (1 y 2), el coeficiente de fiabilidad únicamente presentará el mismo valor si las dos muestras tienen la misma variabilidad

• Si la variabilidad es diferente en las dos muestras, el coeficiente de fiabilidad para un mismo test será mayor en la muestra más heterogénea (la que tenga más variabilidad)

11/11/2014

24

47

La varianza de las puntuaciones observadas en un grupo de sujetos(2

x) se descompone en la siguiente suma:

S2x = S2

v + S2e

S2x diferencias individuales que el test detecta

S2v diferencias que realmente existen entre los sujetos

- son una característica de los sujetos que componen cada grupo

- por lo que cambian de un grupo de sujetos a otro

S2e diferencias/distorsiones que añade el test por efecto del error

- son una característica del test - por lo que no cambian de un grupo a otro

Veámoslo

- Pero el impacto NETO de esas distorsiones cambia según el grupo (homogeneidad, tamaño...)

El coeficiente de fiabilidad depende de la proporción en que las diferencias que detecta el test (S2

x) se deben a las diferencias que realmente existen entre los sujetos (S2

v )

S2e = 2 y S2

x = 20 S2e = 2 y S2

x = 4

• Un test no tiene un único coeficiente de fiabilidad, su fiabilidad cambia con el grupo de sujetos al que se aplica:

Muestra A Muestra B

Cuanto mayores son las diferencias que realmente existen entre los sujetos (S2

v ), menos se notan las distorsiones que introduce el error y mayor es la fiabilidad

Cuando estas diferencias (S2v ) sean pequeñas el efecto es el contrario,

por lo que hemos de descartar ese test a favor de otro test más sensible, más capaz de detectarlas

48

11/11/2014

25

49

• Para interpretar la comparación del coeficiente de fiabilidad de dos tests es necesario tener en cuenta la variabilidad de las muestras en que fueron estimados

• Esta fórmula permite calcular cuál sería la fiabilidad de un test para una variabilidad muestral determinada

50

Test 2 (X2 y X2’)Ejemplo 4:Test 1

¿Qué instrumento es más fiable?

Para garantizar la comparación deberíamos estimar los coeficientes de fiabilidad en igualdad de condiciones de

variabilidad!!

¿Cuál sería la fiabilidad del Test 2 en una muestra con s2x = 8?

Ojo!! Los subíndices hacen referencia a:(1) los valores del test en la muestra original (varianza =3)(2) los valores del test si la variabilidad hubiera

sido distinta (varianza=8)

11/11/2014

26

51

Test 1 Test 2Test 2 (si varianza=8)

52

• Recordemos que se asume que el error típico de medida se mantiene constante independientemente de la variabilidad de la muestra

Sx2

(heterogenea) r xx '

Sx2

(homogenea) rxx '

Se asume la homocedasticidad del error de medida

• El coeficiente de fiabilidad de un test depende de la variabilidad de la muestra en la que es calculado

Se cte. (homoscedasticidad)

Sx2

Sx2

(heterogenea)

(homogenea)

Críticas!

11/11/2014

27

53

La fiabilidad, en el contexto de la TCT, no puede ser considerada una propiedad intrínseca del test

Tendencia actual: considerar la fiabilidad como una propiedad de las puntuaciones obtenidas con el test, y no como una característica

intrínseca al test. Diferentes autores señalan que hablar de "la fiabilidad del test", o

decir que "el test es fiable", representan expresiones incorrectas. Es más adecuado utilizar la expresión: "la fiabilidad de las puntuaciones

obtenidas con el test“.

Reciente recomendación de la APA: que los autores informen de la fiabilidad presentada por los datos analizados incluso cuando el objetivo de la investigación no sea de naturaleza psicométrica.

Lamentablemente ésta no parece ser una práctica habitual.

6. Factores que influyen en el coeficiente de fiabilidad: Conclusiones

6. Estimación de la fiabilidad

1. Introducción

2. Condiciones de paralelismo.

3. Coeficiente de fiabilidad: interpretación.

4. Procedimientos de estimación de la fiabilidad (incluyendo alfa y variantes)

5. Fiabilidad de un compuesto

6. Factores que afectan a la fiabilidad

7. Error típico de medida y aplicaciones: estimación de puntuaciones verdaderas y contrastes de puntuaciones observadas

8. Limitaciones y aspectos críticos

11/11/2014

28

55

¿Cómo podemos obtener una estimación de V?

Estimación de las puntuaciones

Estimación puntual X como indicador de V

(pero no sabemos cuánto error cometemos)

Estimación por intervalo

Estimación puntual mediante ecuación de regresión Tienen en

cuenta el error de medida

2

11/11/2014

29

Estimación y predicción de la puntuación verdadera a partir de las puntuaciones empíricas mediante ecuación de regresión

• ESTIMACION PUNTUAL: Como la relación es lineal, se suele emplear una ecuación de regresión lineal

Y’= A + BX

A: Valor esperado en Y cuando X=0

B: Cambio esperado en Y cuando X aumenta una unidad

Y’

Ren

dim

ient

o (Y

)

Inteligencia (X)

A

3

X

V

V’=A+BX Sabiendo que

4

11/11/2014

30

EJEMPLO. En una muestra en que la media muestral en un test de rendimiento ha sido 40 y la fiabilidad del test ha sido 0.87, ¿Qué puntuación verdadera estimaríamos a un niño que en el test ha tenido una puntuación de 60?

5

• X=V+E• Sabemos que la distribución del error e normal, con

media 0 y DT e

Estimación mediante intervalo de confianza

6

Dado que la distribución del error es normal (0, e), podemos utilizar las propiedades de este tipo de distribución para construir intervalos de confianza alrededor de X que contengan a V con una probabilidad fijada de antemano ….

11/11/2014

31

61

Distribución normalClave: existe una relación exacta entre la desviación () respecto de la media y el

porcentaje de casos....

-2 +2-1 +1-3 +3

95,44%68,26%

99,72%

% casos

62

Sea cual sea el valor de y de , la relación se mantiene.

Ej 1: CI: =100, =15

10055 70 85 115 130 145-2 +2-1 +1-3 +3

95,44%68,26%

99,72%

11/11/2014

32

63

10055 70 85 115 130 145-2 +2-1 +1-3 +3

95,44%68,26%

99,72%

¿Cómo hemos pasado de z (puntuación típica) a x (puntuación directa)?

x= (z·)+ y a la inversa z= (x-)/

zx

64

Con el error de medida es lo mismo:Ej 2: Error de medida del test: =0, =0.5

-2 +20

-1 +1-3 +3

95,44%68,26%

99,72%

-1.5 -1 -0.5 0.5 1 1.5

11/11/2014

33

65

Estas relaciones son las que usamos para construir intervalos de confianza para V.

Veámoslo…

-2 +20

-1 +1-3 +3

95,44%68,26%

-1.5 -1 -0.5 0.5 1 1.5

66

11/11/2014

34

67

68

¿ ?

99%

Datos: X = 17 Error: e = 0,5Nivel de confianza 1- =0.99; nivel de riesgo = 0,01

1. Establecer el nivel de confianza:

1- = 0,99

y el de riesgo: y el de riesgo:

11/11/2014

35

69

7070

-1.29

99%

3. Destipificar esas puntuaciones z: x= (z·)+

1.29

11/11/2014

36

71

0.99

4. Construir el intervalo

<V<

<e<

72

0.99

5. interpretar el intervalo

En este test, en el 99% de los casos el error oscilará entre -1.29 y 1.29 alrededor de la puntuación observada de interés.

11/11/2014

37

73

74

Aplicamos una prueba eliminatoria a un grupo de alumnos. La prueba sepuntúa de 0 a 10, y para eliminarla hay que obtener 5 o mas. Un alumnoobtiene un 4. Se queja de que puede estar injustamente evaluado porefecto del error de la prueba (e = 0,25). ¿Qué valor puede corresponder asu puntuación verdadera, con una confianza del 90%? ¿y del 95%? ¿y del99%?

¿Y si el error típico de la prueba es mayor, de 1.5? ¿qué pasa ahora?¿qué conclusiones sugiere la comparación de estos resultados?

Ejercicio

¿Y qué pasa en el caso contrario, si el sujeto tiene una puntuaciónobservada muy alta, digamos 9,5? ¿Qué valor puede corresponder a supuntuación verdadera, con una confianza del 99%?¿Qué conclusión sugiere este resultado?

11/11/2014

38

75

1º) Establecer el nivel de confianza (1-) deseado: 0.95 ó 0.99

2º) Determinar las puntuaciones típicas que delimita ese intervalo de probabilidad

0,95

0,025 0,025

0,99

z = -2,58

3º) Determinar las cantidades de error que delimita ese intervalo de probabilidad

4º) Obtener los límites de confianza:

= 0.01 Z0.005 = -2,58

Ejercicio: e = 0,25

= 0.05 Z0.025 = -1,96

emax = 0.49 emax = 0.64

Z0.975 = 1,96Z0.995 = 2,58

0.05

Z/2=0.025

Z/2=0.005

0,95

0,025 0,025

Emàx

0,99

0,0050,005

z = -1,96 z = 2,58Emàx

19

Contraste de diferencias entre puntuaciones

En muchas ocasiones nos interesa comparar

Las puntuaciones de distintossujetos en el mismo test

Las puntuaciones de un sujetoen el mismo test en

distintas aplicaciones

Las puntuaciones del mismosujeto en test distintos

Diferenciasinterindividuales

Diferenciasintraindividuales

11/11/2014

39

20

Contraste de diferencias interindividuales

Realizamos el contraste de hipótesis:

Utilizando el estadístico de contraste:

21

EJEMPLO

En el Standford-Binet a los 12 años la media es 100 yla Sx 16. En un grupo de esta edad se ha encontradorxx’=0,93. Una niña obtiene Xi=120 y otra Xj=110.

a) ¿Se puede afirmar con una seguridad del 99% quela primera es superior a la segunda?

b) ¿Qué puntuación tendría que tener otra niña paraafirmar que su CI es superior al de la primera con un99% de seguridad?

11/11/2014

40

22

No se puede afirmar que la primera es superior a la segunda

H0: XiXjH1=Xi>Xj

confianza: Z unilateral: 2,33

Xi=120Xj= 110Sx=16

rxx’=0,93

-3 3Ze

P= =0,01

23

b) Para ello Ze>Zc

2,33=d/Sd

2,33=d/5,99

d=13,93

X=120+13,93=133,93

Xi=120Xj= 110Sx=16

rxx’=0,93

11/11/2014

41

24

A) MISMO TEST O TESTS PARALELOS

Contraste de diferencias interindividuales

Comparamos al mismo individuo

25

Un niño con dificultades psicomotoras obtiene en un test diseñado para tal efecto 80 puntos. Sabemos que

la media de dicho test es 100, Sx=15 y rxx’=0,95. Tras un tratamiento, volvemos a aplicar el test y

obtiene 90 puntos. ¿Puede afirmarse con un nivel de confianza del 99% que ha habido una mejoría

significativa?

EJEMPLO

11/11/2014

42

26

No puede afirmarse a este nivel de confianza que ha habido una mejoría significativa

X1=80X2= 90Sx=15

rxx’=0,95

-3 3Ze

P= =0,01

27

Si no conocemos rx1x2:

B) DOS TESTS NO NECESARIAMENTE PARALELOSQUE MIDEN EL MISMO RASGO

11/11/2014

43

85

– Sencillez, claridad y flexibilidad.– Escasa complicación matemática– Escaso requerimiento de cálculo

8. Limitaciones y aspectos críticos

El modelo clásico de la TCT tiene algunas ventajas…

86

1. Limitaciones relacionadas con la asignación de puntuaciones: No hay un modelo de medida

Pero también tiene limitaciones

2. Limitaciones relacionadas con el componente de error: Homoscedasticidad poco plausible: Se asume que a todas las personas las medimos con la misma cantidad de errorIndependencia del error entre aplicaciones de un mismo test: imposible de demostrar.No diferencia diferentes fuentes de error, se asume que las diferentes fuentes de error sistemático se controlan mediante la constancia y la aleatorización, pero no siempre es así.

11/11/2014

44

87

3. Limitaciones relacionadas con la puntuación verdadera: Se desconoce su relación con la puntuación en el rasgo, no se puede interpretar directamente (V= f(R,C)). Ejemplo de la densidad: masa y volumen

Limitaciones del MCL

4. Limitaciones relacionadas con la puntuación observada: No se pueden interpretar directamente, es necesario el uso de baremos, y la información que proporcionan es, generalmente, ordinal.

5. Limitaciones relacionadas con la fiabilidad del test: Cambia en función de diferentes factores, hay que volver a calcularla cuando cualquiera de ellos cambia: homogeneidad*

88

¿Qué valor debe adoptar el coeficiente de fiabilidad?

• No se pueden establecer puntos de corte generales

• Depende del uso que se haga del test

• En la práctica se siguen las recomendaciones de Nunally:

• > 0,70 aceptable en investigación

• 0,90 cuando se utilizan para tomar decisiones sobre las personas

• Deseable: 0,95


Recommended