Date post: | 23-Dec-2015 |
Category: |
Documents |
Upload: | grupoacantun |
View: | 213 times |
Download: | 0 times |
11/11/2014
1
6. Estimación de la fiabilidad
1. Introducción2. Condiciones de paralelismo.
3. Coeficiente de fiabilidad: interpretación.
4. Procedimientos de estimación de la fiabilidad (incluyendo alfa y variantes)
5. Fiabilidad de un compuesto
6. Factores que afectan a la fiabilidad
7. Error típico de medida y aplicaciones: estimación de puntuaciones verdaderas y contrastes de puntuaciones observadas
8. Limitaciones y aspectos críticos
2
1. Introducción
• La fiabilidad se refiere a la precision o consistencia de las medidas
•X = V + E•E = X – V
• El error reduce la fiabilidad o “replicabilidad” de las medidas obtenidas mediante tests
• La fiabilidad es la proporción de varianza obsevada atribuible a la puntuación VERDADERAS (r2
XV)
• Cómo podemos estimar esta correlación si las puntuaciones verdaderas no son obervables? PARALELISMO
11/11/2014
2
2
2. Condiciones de paralelismo y consecuencias
Dos conjuntos de puntuaciones, X y X’, son medidas paralelas si:
1. Tienen la misma puntuación verdadera:X = V + E; X’ = V + E’
2. Tienen la misma varianza error:
Las relaciones entre medidas paralelas permiten calcular índices entre variables no observables
2Se = Se’2
3
1. Si las puntuaciones verdaderas no cambian: misma media
E(X) = E(X’)
2'x
2x s=s
E(X) = E(V + E) = E(V) + E(E) = E(V)E(X’) = E(V + E’) = E(V) + E(E’) = E(V)
Y los tests son paralelos
Si las puntuaciones verdaderas no cambian: misma variabilidad 2.
Será lo que verifiquemos para determinar si 2 formas de un test son paralelas (procedims. estadísticos)
11/11/2014
3
3. Se puede demostrar que si calculamos la correlación entre dos tests paralelos, obtenemos la proporción buscada
Habíamos visto que
Linealmente indeps. r = 0E1E2
Iguales si son paralelas4
5
luego 'xx2x
2v rs=s
y
2X
2V
'xxrs
s=Sabemos que
2x
2v ssY por consiguiente
2X
2E
s
s= 1-
4. Estimación de la varianza error:
5. Correlación con un criterio:
11/11/2014
4
6
3. Coeficiente de fiabilidad: interpretación
• Puntuación verdadera en el rasgo: NO OBSERVABLE. Puede ser inferida, NUNCA CALCULADA.
• ERROR ESTÁNDAR o error típico de medida: desviación típica de los errores de medida.
• ÍNDICE DE FIABILIDAD:
1r0 'xx <>
• COEFICIENTE DE FIABILIDAD:
Proporción de var. observada atribuible a la var. verdadera en el rasgo. Cuanto más cercano a 1 más fiable será el test
Concepto de fiabilidad
- Es análogo a precisión.
- Se define como la variación relativa de lapuntuación verdadera con respecto a lapuntuación observada, calculada a través de larazón entre las respectivas varianzas.
- La clave es el error. ¿Por qué se comete?
7
11/11/2014
5
Ejemplo: 2 formas paralelas de un test de inteligencia aplicadas a diferentes personas
¿Cuál de los dos tests es más fiable?
8
La varianza de error que afecta a las mediciones es pequeña
Un test es fiable si:
Cuantificamos el error
• Consecuencias:
• A partir de la definición de Medidas Paralelas:
Valor desconocido!
'xx2x
2v rs=s
Pero su tamaño depende de s2x 9
11/11/2014
6
La correlación entre observadas y verdaderas (rXV) es alta
Un test es fiable si:
Ejemplo: Tests de inteligencia aplicados a diferentes personas
¿Cuál de los tres tests es más fiable?
a = correlación perfectab = pequeño errorc = mayor error (mayor discrepancia entre X y V)
Test c
Test b
Test a
10
La correlación entre observadas y verdaderas (rXV) es alta
Un test es fiable si:
En ese caso, la proporción de varianza de X atribuible a V es alta.Sólo estimable mediante formas paralelas…
rXX’= 1
X
X’
3
3
6
6
Test de fiabilidad perfecta, sin error
[0, 1] Más fácil de interpretar
11
11/11/2014
7
Ejemplo:
Instrumento 1 Instrumento 2
¿Qué instrumento es más fiable?
(X1 y X1' ) (X2 y X2
' )
¿Son directamente comparables? ¿Siempre?12
Otro ejemplo:
Instrumento 1 Instrumento 2
¿Qué instrumento es más fiable?
(X1 y X1' ) (X2 y X2
' )
¿Son directamente comparables? ¿Siempre?13
11/11/2014
8
14
Coeficiente de Fiabilidad:
• Estimador de una propiedad deseable de todo test
• Sirve para estimar la precisión de las medidas que ofrece un test
• Permite realizar comparaciones entre instrumentos para saber cuál es más fiable (dos tests aplicados a la misma muestra)
16
4. Procedimientos de estimación de la fiabilidad
Formas paralelas Equivalencia de las formas
2 tests, 1 aplicación (o 2)
Test-retest 1 test, 2 aplicacionesEstabilidad temporal
Consistencia
Interna 1 test, 1 aplicación* Método dos mitades* Cronbach (tema 9)
11/11/2014
9
17
1) FIABILIDAD COMO EQUIVALENCIA: FORMAS PARALELASCorrelación lineal entre 2 series de puntuaciones en 2 formas paralelas de un test
Cuando se aplica en un solo tiempo: Fatiga
tt1
Forma A Forma B
XA XBr
Implica crear formas paralelas del test -con similar dificultad (media) y variabilidad- y calcular la correlación entre las formas. Es COMPLICADO Y LABORIOSO
Fiabilidad como equivalencia de medidas (si hay dos ti: también
fiabilidad como estabilidad)
18
t
test
MITAD 1 MITAD 2
r
t1
Dada la dificultad de crear formas paralelas, una alternativa:
dividir el test en dos partes paralelas
Indica consistencia entre las formas (por ello también se considera indicador de consistencia interna)
11/11/2014
10
19
Subdividimos el test en 2 partes y las correlacionamos. Tras esto hemos de tener en cuenta que el test es de longitud doble a las mitades evaluadas
CORRECCIÓN DE SPEARMAN-BROWN
PARA TEST DE LONGITUD DOBLE AB
AB'xx r1
r2r
+=
rAB es el coeficiente de correlación entre ambas partes
¿Cómo formar las mitades? * Primera mitad/segunda? * Aleatoriamente?* Pares/impares?
20
2) FIABILIDAD COMO ESTABILIDAD: TEST-RETESTimplica pasar el test en dos momentos diferentes y calcular la correlación entre las puntuaciones obtenidas en los dos momentos
Inadecuado cuando intervienen factores como aprendizaje, cambios madurativos, etc.
El lapso temporal elegido cobra una gran importancia
Fiabilidad como estabilidad t
test
t1
test
t2Xt1 Xt2
r
11/11/2014
11
3) FIABILIDAD COMO CONSISTENCIA INTERNA
Dos mitades no paralelas:
21
Fórmula de RulonEs la varianza de las diferencias entre las puntuaciones de la parte 1 y la parte 2
Es la varianza de la puntuaciones observadas totales
Fórmula de Guttman-FlanaganSon las varianzas de las puntuaciones observadas en cada parte
Dos mitades y Cronbach
Dos mitades paralelas: correlación entre formas y Spearman-Brown
Problemas comunes a todas las aproximaciones: Dificultad del cumplimiento de paralelismo
Cronbach no requiere paralelismo21
• Independientemente de la fórmula, los valores dependen de cómo se forman las mitades: Posibilidad
-Hacer todas las posibles mitades-Calcular el promedio de las correlaciones implicadas-Eso es alfa de Cronbach
Formas paralelas Problemas!
Test-retest Problemas!
Consistencia
Interna 1 test, 1 aplicaciónProblemas!
11/11/2014
12
23
Alternativas al concepto de paralelismo
• Surgen de la dificultad del cumplimiento de las condiciones de paralelismo originales:
x = v + e
x' = v' + e'
+ fuerte Equivalencia + débil
Los ítems miden lo mismo con la misma precisión
Los ítems miden lo mismo pero NO con la misma precisión
3) FIABILIDAD COMO CONSISTENCIA INTERNA
24
Dos mitades y Cronbach
n: numero de ítems del test
s2x: varianza del test total
s2i: varianza de un ítem (i= 1, 2, ...N)
expresa la proporción de varianza común entre los ítems que hay en la varianza total
Alpha de Cronbach
11/11/2014
13
4
Los coeficientes de Kuder-Richardson
Casos particulares del coeficiente alfa para ítems de respuesta dicotómica
KR-20
KR-21
(para ítems de igual dificultad)
p= proporción aciertosq= proporción errores
26
Suj 1 2 3 1 2 3 4 5 6 1 2 3
1 4 6 1 0 1 1 0 1 1 1 1 1
2 5 4 1 1 1 0 1 0 1 1 1 1
3 3 4 1 0 0 1 0 1 0 1 0 1
4 6 8 3 1 0 1 1 0 1 1 1 1
5 4 4 1 0 1 1 0 1 0 1 1 1
6 8 8 5 1 0 1 1 1 0 0 0 0
7 4 3 0 1 0 1 0 0 0 0 1 0
8 2 1 0 1 0 0 0 1 0 1 1 1
9 5 4 2 1 1 0 1 1 1 1 1 1
10 9 8 6 1 1 1 1 1 1 1 1 1
Tt 50 50 20 7 5 7 5 7 5 8 8 8
Test A Test B Test C
11/11/2014
14
27
• Subtest A: alfa
• Subtest B: KR20
• Subtest C: KR21
7
– Estos métodos (los de consistencia interna) están basadosen las covarianzas (correlaciones) entre los ítems, que forman el test
• Un test no proporciona una única medida, X:
– La puntuación total, X, es el promedio de las puntuacionesen cada uno de los ítems
– Pero cada ítem proporciona una puntuación diferente, una medida diferente del mismo rasgo,
– Entonces una única aplicación de un único test ofrece muchas medidas “paralelas” sobre las que estimar la fiabilidad del test
– No es necesario crear formas paralelas del test,
ni aplicarlo dos veces, ni dividirlo en dos mitades
11/11/2014
15
8
Interpretación general de Alfa de Cronbach:
expresa la proporción de varianza común entre los ítems quehay en la varianza total
• Indica la consistencia interna de los elementos del test
• Un test es fiable si todos sus elementos ofrecen medidas consistentes de cada sujeto
• Valores entre 0-1
• Alfa estima la fiabilidad de un test a partir de los ítems que lo componen
• Pero también puede emplearse cuando el test se divide en otros componentes, como subtests
30
• Otros coeficientes sobreestiman la fiabilidad, si no se cumplen los supuestosde paralalismo
Alfa como cota inferior de la fiabilidad
11/11/2014
16
31
Otros coeficientes
• Coeficiente beta
32
Otros coeficientes
• Coeficientes derivados del Análisis Factorial
h: Comunalidad
: 1er valor propio o eigenvalue del factor que más varianza explica
11/11/2014
17
10
5 Fiabilidad en tests compuestos y puntuaciones diferencia
Calcular un coeficiente que reúna los subtests que componen una batería
Si se ponderan los subtests
TESTS COMPUESTOS
34
En el ejemplo:
Si se pondera el subtest A al doble y el subtest C a un tercio:
--
- -)
11/11/2014
18
12
5. Fiabilidad en tests compuestos y puntuaciones diferencia
Utilizadas para evaluar la precisión de puntuaciones tomadas en momentos diferentes para evaluar la eficacia de programas o intervenciones
PUNTUACIONES DIFERENCIA
36
6.1. Longitud del test
Aumentar la longitud de un test implica aumentar
su fiabilidad(siempre que los
nuevos elementos que se añadan sean paralelos)
6. Factores que afectan al coeficiente de fiabilidad
11/11/2014
19
37
• A medida que el test es más largo es másfiable:
Volvemos a aplicar el test
• Error: 1 sobre 3: 33% 3 sobre 100: 3%
Puntuación del sujeto: 2
Puntuación del sujeto: 3
Puntuación sujeto: 67
Puntuación sujeto: 70
Test de 3 ítems Test de 100 ítems
38
• Caso general:
rcc’ = fiabilidad tras modificar longitud del testrxx’ = fiabilidad del test con longitud originalK= longitud final/longitud inicial
Fórmulas de Spearman-Brown (1910) para estimar la fiabilidad de un test si se modifica su longitud
• Caso de longitud doble:( = fórmula dos mitades)
11/11/2014
20
39
Nº de ítemsrequerido para alcanzar una
determinada fiabilidad:
Pero no podemos alargar la longitud hasta el infinito
Fiabilidad
Longitud
40
El cambio en la longitud de un test afectará también a sus varianzas:
Longitud doble Longitud k
Varianzaobservada
Varianzaverdadera
Varianzaerror
11/11/2014
21
41
long. inicial = 40
¿Cuál sería la fiabilidad del test si duplicamos su longitud?
long. final = 80
Al duplicar la longitud del test con elementos paralelos, el coeficiente de fiabilidad aumenta de 0,80 a 0,89
Ejemplo: Aplicamos un test de ansiedad de 40 ítems a 500 estudiantes
k = 2
42
Al aumentar la longitud del test a 100 ítems (añadiendo 60 ítems paralelos), el coeficiente de fiabilidad
aumenta de 0,80 a 0,91
¿Cuál sería la fiabilidad del test si aumentamos su longitud a 100 ítems?
long. inicial = 40 long. final = 100
Ejemplo: Aplicamos un test de ansiedad de 40 ítems a 500 estudiantes
k = 2.5
11/11/2014
22
43
1ong. inicial = 40 1ong. final = ?
Debemos añadir 50 ítems para que el coeficiente de fiabilidad aumente de 0,80 a 0,90
¿Cuántos ítems deberíamos añadir para aumentar el coeficiente de fiabilidad del test a 0,90?
=> 90 ítems
Ejemplo: Aplicamos un test de ansiedad de 40 ítems a 500 estudiantes
k = ¿?
44
• Ejemplo:
• Sabemos que la varianza error en un test es 9 y la varianza observada, 100.
• Se aplica el mismo test a otra muestra, en la que la varianza observada es 16.
Proporción de varianza erroren la primera muestra
Proporción de varianza erroren la segunda muestra
9/100=
9%
9/16=
56%
6.2. Variabilidad de la muestra
11/11/2014
23
45
Ejemplo: Elaboramos test para medir actitud hacia Eutanasia
Medidas en Asociación a favor Eutanasia
(2 formas paralelas)
X X’
145181294
146181185
(0)(+1)(0)(-1)(-1)(+1)
Medidas personas con opiniones diversas
(2 formas paralelas)
Instrumento con fiabilidad deficiente Instrumento fiable
rxx '= 0.99¿?
20 = aceptación total
1 = rechazo absoluto de la Eutanasia
X X’
201718192019
201818181920
(0)(+1)(0)(-1)(-1)(+1)
rxx '= 0.67
45
46
• Para un mismo test aplicado en 2 muestras diferentes (1 y 2), el coeficiente de fiabilidad únicamente presentará el mismo valor si las dos muestras tienen la misma variabilidad
• Si la variabilidad es diferente en las dos muestras, el coeficiente de fiabilidad para un mismo test será mayor en la muestra más heterogénea (la que tenga más variabilidad)
11/11/2014
24
47
La varianza de las puntuaciones observadas en un grupo de sujetos(2
x) se descompone en la siguiente suma:
S2x = S2
v + S2e
S2x diferencias individuales que el test detecta
S2v diferencias que realmente existen entre los sujetos
- son una característica de los sujetos que componen cada grupo
- por lo que cambian de un grupo de sujetos a otro
S2e diferencias/distorsiones que añade el test por efecto del error
- son una característica del test - por lo que no cambian de un grupo a otro
Veámoslo
- Pero el impacto NETO de esas distorsiones cambia según el grupo (homogeneidad, tamaño...)
El coeficiente de fiabilidad depende de la proporción en que las diferencias que detecta el test (S2
x) se deben a las diferencias que realmente existen entre los sujetos (S2
v )
S2e = 2 y S2
x = 20 S2e = 2 y S2
x = 4
• Un test no tiene un único coeficiente de fiabilidad, su fiabilidad cambia con el grupo de sujetos al que se aplica:
Muestra A Muestra B
Cuanto mayores son las diferencias que realmente existen entre los sujetos (S2
v ), menos se notan las distorsiones que introduce el error y mayor es la fiabilidad
Cuando estas diferencias (S2v ) sean pequeñas el efecto es el contrario,
por lo que hemos de descartar ese test a favor de otro test más sensible, más capaz de detectarlas
48
11/11/2014
25
49
• Para interpretar la comparación del coeficiente de fiabilidad de dos tests es necesario tener en cuenta la variabilidad de las muestras en que fueron estimados
• Esta fórmula permite calcular cuál sería la fiabilidad de un test para una variabilidad muestral determinada
50
Test 2 (X2 y X2’)Ejemplo 4:Test 1
¿Qué instrumento es más fiable?
Para garantizar la comparación deberíamos estimar los coeficientes de fiabilidad en igualdad de condiciones de
variabilidad!!
¿Cuál sería la fiabilidad del Test 2 en una muestra con s2x = 8?
Ojo!! Los subíndices hacen referencia a:(1) los valores del test en la muestra original (varianza =3)(2) los valores del test si la variabilidad hubiera
sido distinta (varianza=8)
11/11/2014
26
51
Test 1 Test 2Test 2 (si varianza=8)
52
• Recordemos que se asume que el error típico de medida se mantiene constante independientemente de la variabilidad de la muestra
Sx2
(heterogenea) r xx '
Sx2
(homogenea) rxx '
Se asume la homocedasticidad del error de medida
• El coeficiente de fiabilidad de un test depende de la variabilidad de la muestra en la que es calculado
Se cte. (homoscedasticidad)
Sx2
Sx2
(heterogenea)
(homogenea)
Críticas!
11/11/2014
27
53
La fiabilidad, en el contexto de la TCT, no puede ser considerada una propiedad intrínseca del test
Tendencia actual: considerar la fiabilidad como una propiedad de las puntuaciones obtenidas con el test, y no como una característica
intrínseca al test. Diferentes autores señalan que hablar de "la fiabilidad del test", o
decir que "el test es fiable", representan expresiones incorrectas. Es más adecuado utilizar la expresión: "la fiabilidad de las puntuaciones
obtenidas con el test“.
Reciente recomendación de la APA: que los autores informen de la fiabilidad presentada por los datos analizados incluso cuando el objetivo de la investigación no sea de naturaleza psicométrica.
Lamentablemente ésta no parece ser una práctica habitual.
6. Factores que influyen en el coeficiente de fiabilidad: Conclusiones
6. Estimación de la fiabilidad
1. Introducción
2. Condiciones de paralelismo.
3. Coeficiente de fiabilidad: interpretación.
4. Procedimientos de estimación de la fiabilidad (incluyendo alfa y variantes)
5. Fiabilidad de un compuesto
6. Factores que afectan a la fiabilidad
7. Error típico de medida y aplicaciones: estimación de puntuaciones verdaderas y contrastes de puntuaciones observadas
8. Limitaciones y aspectos críticos
11/11/2014
28
55
¿Cómo podemos obtener una estimación de V?
Estimación de las puntuaciones
Estimación puntual X como indicador de V
(pero no sabemos cuánto error cometemos)
Estimación por intervalo
Estimación puntual mediante ecuación de regresión Tienen en
cuenta el error de medida
2
11/11/2014
29
Estimación y predicción de la puntuación verdadera a partir de las puntuaciones empíricas mediante ecuación de regresión
• ESTIMACION PUNTUAL: Como la relación es lineal, se suele emplear una ecuación de regresión lineal
Y’= A + BX
A: Valor esperado en Y cuando X=0
B: Cambio esperado en Y cuando X aumenta una unidad
Y’
Ren
dim
ient
o (Y
)
Inteligencia (X)
A
3
X
V
V’=A+BX Sabiendo que
4
11/11/2014
30
EJEMPLO. En una muestra en que la media muestral en un test de rendimiento ha sido 40 y la fiabilidad del test ha sido 0.87, ¿Qué puntuación verdadera estimaríamos a un niño que en el test ha tenido una puntuación de 60?
5
• X=V+E• Sabemos que la distribución del error e normal, con
media 0 y DT e
Estimación mediante intervalo de confianza
6
Dado que la distribución del error es normal (0, e), podemos utilizar las propiedades de este tipo de distribución para construir intervalos de confianza alrededor de X que contengan a V con una probabilidad fijada de antemano ….
11/11/2014
31
61
Distribución normalClave: existe una relación exacta entre la desviación () respecto de la media y el
porcentaje de casos....
-2 +2-1 +1-3 +3
95,44%68,26%
99,72%
% casos
62
Sea cual sea el valor de y de , la relación se mantiene.
Ej 1: CI: =100, =15
10055 70 85 115 130 145-2 +2-1 +1-3 +3
95,44%68,26%
99,72%
11/11/2014
32
63
10055 70 85 115 130 145-2 +2-1 +1-3 +3
95,44%68,26%
99,72%
¿Cómo hemos pasado de z (puntuación típica) a x (puntuación directa)?
x= (z·)+ y a la inversa z= (x-)/
zx
64
Con el error de medida es lo mismo:Ej 2: Error de medida del test: =0, =0.5
-2 +20
-1 +1-3 +3
95,44%68,26%
99,72%
-1.5 -1 -0.5 0.5 1 1.5
11/11/2014
33
65
Estas relaciones son las que usamos para construir intervalos de confianza para V.
Veámoslo…
-2 +20
-1 +1-3 +3
95,44%68,26%
-1.5 -1 -0.5 0.5 1 1.5
66
11/11/2014
34
67
68
¿ ?
99%
Datos: X = 17 Error: e = 0,5Nivel de confianza 1- =0.99; nivel de riesgo = 0,01
1. Establecer el nivel de confianza:
1- = 0,99
y el de riesgo: y el de riesgo:
11/11/2014
36
71
0.99
4. Construir el intervalo
<V<
<e<
72
0.99
5. interpretar el intervalo
En este test, en el 99% de los casos el error oscilará entre -1.29 y 1.29 alrededor de la puntuación observada de interés.
11/11/2014
37
73
74
Aplicamos una prueba eliminatoria a un grupo de alumnos. La prueba sepuntúa de 0 a 10, y para eliminarla hay que obtener 5 o mas. Un alumnoobtiene un 4. Se queja de que puede estar injustamente evaluado porefecto del error de la prueba (e = 0,25). ¿Qué valor puede corresponder asu puntuación verdadera, con una confianza del 90%? ¿y del 95%? ¿y del99%?
¿Y si el error típico de la prueba es mayor, de 1.5? ¿qué pasa ahora?¿qué conclusiones sugiere la comparación de estos resultados?
Ejercicio
¿Y qué pasa en el caso contrario, si el sujeto tiene una puntuaciónobservada muy alta, digamos 9,5? ¿Qué valor puede corresponder a supuntuación verdadera, con una confianza del 99%?¿Qué conclusión sugiere este resultado?
11/11/2014
38
75
1º) Establecer el nivel de confianza (1-) deseado: 0.95 ó 0.99
2º) Determinar las puntuaciones típicas que delimita ese intervalo de probabilidad
0,95
0,025 0,025
0,99
z = -2,58
3º) Determinar las cantidades de error que delimita ese intervalo de probabilidad
4º) Obtener los límites de confianza:
= 0.01 Z0.005 = -2,58
Ejercicio: e = 0,25
= 0.05 Z0.025 = -1,96
emax = 0.49 emax = 0.64
Z0.975 = 1,96Z0.995 = 2,58
0.05
Z/2=0.025
Z/2=0.005
0,95
0,025 0,025
Emàx
0,99
0,0050,005
z = -1,96 z = 2,58Emàx
19
Contraste de diferencias entre puntuaciones
En muchas ocasiones nos interesa comparar
Las puntuaciones de distintossujetos en el mismo test
Las puntuaciones de un sujetoen el mismo test en
distintas aplicaciones
Las puntuaciones del mismosujeto en test distintos
Diferenciasinterindividuales
Diferenciasintraindividuales
11/11/2014
39
20
Contraste de diferencias interindividuales
Realizamos el contraste de hipótesis:
Utilizando el estadístico de contraste:
21
EJEMPLO
En el Standford-Binet a los 12 años la media es 100 yla Sx 16. En un grupo de esta edad se ha encontradorxx’=0,93. Una niña obtiene Xi=120 y otra Xj=110.
a) ¿Se puede afirmar con una seguridad del 99% quela primera es superior a la segunda?
b) ¿Qué puntuación tendría que tener otra niña paraafirmar que su CI es superior al de la primera con un99% de seguridad?
11/11/2014
40
22
No se puede afirmar que la primera es superior a la segunda
H0: XiXjH1=Xi>Xj
confianza: Z unilateral: 2,33
Xi=120Xj= 110Sx=16
rxx’=0,93
-3 3Ze
P= =0,01
23
b) Para ello Ze>Zc
2,33=d/Sd
2,33=d/5,99
d=13,93
X=120+13,93=133,93
Xi=120Xj= 110Sx=16
rxx’=0,93
11/11/2014
41
24
A) MISMO TEST O TESTS PARALELOS
Contraste de diferencias interindividuales
Comparamos al mismo individuo
25
Un niño con dificultades psicomotoras obtiene en un test diseñado para tal efecto 80 puntos. Sabemos que
la media de dicho test es 100, Sx=15 y rxx’=0,95. Tras un tratamiento, volvemos a aplicar el test y
obtiene 90 puntos. ¿Puede afirmarse con un nivel de confianza del 99% que ha habido una mejoría
significativa?
EJEMPLO
11/11/2014
42
26
No puede afirmarse a este nivel de confianza que ha habido una mejoría significativa
X1=80X2= 90Sx=15
rxx’=0,95
-3 3Ze
P= =0,01
27
Si no conocemos rx1x2:
B) DOS TESTS NO NECESARIAMENTE PARALELOSQUE MIDEN EL MISMO RASGO
11/11/2014
43
85
– Sencillez, claridad y flexibilidad.– Escasa complicación matemática– Escaso requerimiento de cálculo
8. Limitaciones y aspectos críticos
El modelo clásico de la TCT tiene algunas ventajas…
86
1. Limitaciones relacionadas con la asignación de puntuaciones: No hay un modelo de medida
Pero también tiene limitaciones
2. Limitaciones relacionadas con el componente de error: Homoscedasticidad poco plausible: Se asume que a todas las personas las medimos con la misma cantidad de errorIndependencia del error entre aplicaciones de un mismo test: imposible de demostrar.No diferencia diferentes fuentes de error, se asume que las diferentes fuentes de error sistemático se controlan mediante la constancia y la aleatorización, pero no siempre es así.
11/11/2014
44
87
3. Limitaciones relacionadas con la puntuación verdadera: Se desconoce su relación con la puntuación en el rasgo, no se puede interpretar directamente (V= f(R,C)). Ejemplo de la densidad: masa y volumen
Limitaciones del MCL
4. Limitaciones relacionadas con la puntuación observada: No se pueden interpretar directamente, es necesario el uso de baremos, y la información que proporcionan es, generalmente, ordinal.
5. Limitaciones relacionadas con la fiabilidad del test: Cambia en función de diferentes factores, hay que volver a calcularla cuando cualquiera de ellos cambia: homogeneidad*
88
¿Qué valor debe adoptar el coeficiente de fiabilidad?
• No se pueden establecer puntos de corte generales
• Depende del uso que se haga del test
• En la práctica se siguen las recomendaciones de Nunally:
• > 0,70 aceptable en investigación
• 0,90 cuando se utilizan para tomar decisiones sobre las personas
• Deseable: 0,95