UNIVERSIDAD NACIONAL AUTÓNOMA
DE MÉXICO
FACULTAD DE ESTUDIOS SUPERIORES IZTACALA
ESCALA LIKERT
VALIDEZ Y CONFIABILIDAD
Escala Likert
López Cureño S.M.
INTRODUCCIÓN
“Todo el que disfruta cree que lo que importa
del árbol es el fruto, cuando en realidad es la semilla.
He aquí la diferencia entre los que creen y los que disfrutan”.
Friedrich Nietzsche
La medición proporciona un lenguaje común para describir las magnitudes a fenómenos, objetos, situaciones, etc.
por ejemplo en el caso de la temperatura, los grados centígrados, en el tiempo los segundos, minutos, años, etc.
Cuando hacemos referencia a los fenómenos que estudia la Psicología como la tolerancia, la adaptación, el apego,
la inteligencia, la satisfacción, la actitud, etc., la medición en Psicología es tan importante como para todas las
ciencias, pues es a través de la medida que la psicología logra el estatus de ciencia, ya que mediante la medición de
los datos se pueden comparar, replicar, establecer modelos matemáticos para su explicación y realizar
investigaciones controladas, en este sentido la psicología hace uso de la psicometría como campo disciplinar y
metodológico cuyo objeto es aportar soluciones al problema de la medición en cualquier proceso de investigación
psicológica, haciendo uso del lenguaje formal de la ciencias matemáticas, cuyos niveles de acción incluyen
contribuciones teóricas y aplicativas a la medición de los fenómenos psicológicos desde el uso de las escalas de
medición hasta la construcción de instrumentos. Este escrito tiene por objeto exponer la medición de las actitudes,
traducidas en disposiciones, posturas o conductas que los individuos adoptamos con respecto a los objetos y
situaciones y uno de los instrumentos de amplio uso que se ha desarrollado para medirlas, específicamente la
escala Likert.
Conceptos básicos y actualizados
El fundamento de la construcción de instrumentos tiene origen en la psicometría, la Psicometría es una de las
ramas disciplinares de la psicología encargada del desarrollo, utilización de los métodos y técnicas de medición, en
todos los ámbitos de la psicología (Muñiz, 1998), la Psicometría es el conjunto de modelos formales en la medición
de variables psicológicas, construcción y uso adecuado de las pruebas y las escalas, de tal modo que se garantice
su confiabilidad, validez y aplicación adecuada, centrándose en las condiciones que permiten llevar a cabo todo
proceso de medición en psicología. En psicología como en otras ciencias la medición cobra gran importancia en la
explicación y descripción de los fenómenos que estudia en este caso el comportamiento humano, para lograrlo se
han buscado respuestas a las problemáticas, partiendo de la cuestión ¿Qué medimos en psicología? El campo
estudio de la psicología es el comportamiento, sin embargo gran parte de los componentes del comportamiento no
se pueden medir directamente, por ejemplificar un físico puede medir la distancia de un recorrido de manera directa
mediante instrumentos de medición, para la psicología: la tristeza, la felicidad, la motivación, las actitudes, etc. no
pueden ser medidas directamente sino a través de sus atributos, esto es las características particulares y
determinadas del comportamiento, en psicología se han utilizado instrumentos que permiten identificar los
indicadores cuantitativos para lograr la medición.
Escala Likert
López Cureño S.M.
En las primeras décadas del siglo pasado la psicología fue reconocida como ciencia capaz de usar paradigmas y
estrategias experimentales que con apoyo de la metodología científica, la cuantificación de las respuestas verbales
dio origen a las escalas de actitud, consideradas como mediciones objetivas de una predicción subyacente para la
acción. La psicología se intereso en demostrar la influencia de las actitudes en algunos problemas relevantes para la
sociedad.
El interés de evaluar las actitudes tiene su fundamento en las funciones que desempeñan en lo cognoscitivo,
utilitario, económico, expresivo y defensivo, estas funciones sirven como una muestra de la personalidad, sirven
como una explicación a la manera en la que nos comportamos frente a los objetos o situaciones, si bien es cierto
que no se pueden observar ni medir directamente nuestros sentimientos, las actitudes pueden ser una manera
indirecta de mirar hacia ellos.
Concepción de las actitudes
Las actitudes como atributos psicológicos han sido un tema tratado por diferentes autores, las actitudes pueden ser
vistas como precursoras de la conducta, cada actitud posee un componente afectivo, otro cognoscitivo y un tercero
conativo. Esto significa que una actitud positiva o negativa contiene una disposición mental para sentir, pensar y
comportarse de cierta manera. Las actitudes se caracterizan por la compatibilidad en respuestas a los objetos
sociales, que se utilizan al determinar qué clase de acción se debe emprender al enfrentar cualquier situación. Se
perciben como sistemas perdurables de las evaluaciones positivas o negativas, sentimientos y técnicas de acción a
favor o en contra de objetos sociales; tales sistemas permiten interpretar y evaluar los acontecimientos que ocurren
alrededor y en el sujeto mismo (Cohen, 2001).
Las actitudes cumplen con distintas funciones que desempeñan en lo cognoscitivo, utilitario, económico, expresivo y
defensivo, funciones que sirven como muestra de la personalidad, la teoría funcionalista ha dado explicación a las
funciones de las actitudes señalando lo siguiente (Villegas 1975):
a) La funcionalidad cognoscitiva: Se ha sostenido que las actitudes podrían desempeñar un papel mediador
entre Estimulo (E) y Respuesta (R), entonces necesariamente forman parte de un sistema que “codifica”,
“selecciona” o “interpreta”, tanto los E como las R. De alguna manera, se ha sostenido que las actitudes
constituirán unidades de una visión totalitaria del mundo en que vivimos. Entonces, la funcionalidad
cognoscitiva se refiere a los contenidos de conocimientos-errados o correctos- con los cuales enfrentamos
la realidad social.
b) Función utilitaria: Se le ha dado también el nombre de adaptativa o instrumental, esta función utilitaria de
las actitudes ha posibilitado la formulación de un análisis mediato-finalista, que señala que aquéllas nos
disponen favorablemente hacia objetos y procedimientos instrumentales para el logro de metas.
La instrumentalidad puede ser prospectiva o retrospectiva, puede depender de los refuerzos obtenidos en
el pasado o de la percepción de la posibilidad de obtener las metas en el futuro.
En muchas ocasiones, cuando se han impuesto modas en relación con objetos de actitud, las personas
asumen esas actitudes pensando en la posibilidad de ser aceptados en ese medio más que en el objeto
mismo.
c) Función económica: consiste en proveer una guía práctica y simplificada de las conductas apropiadas
frente a algunos objetos. Los estereotipos y las creencias que configuran nuestro mundo actitudinal
cumplen esta función: son simplificaciones, con implicaciones unívocas respecto a la acción.
Se ha visto que los seres humanos buscan estructurar sus experiencias, y categorizarlas, de modo que
esto les permita una economía cognoscitiva.
Escala Likert
López Cureño S.M.
d) Función expresiva: Identificada también con el nombre de función autorreguladora. La función expresiva de
las actitudes sería la auto – asertividad, esto es, que tomando o asumiendo actitudes hacia diversos
aspectos de la realidad, las personas se crearían una identidad.
e) Función defensiva: Desde un punto de vista psicoanálitico, también se ha sostenido que nuestras actitudes
se mantienen para ayudarnos a manejar lo que se llama “conflictos interiores”, más que como respuestas a
características de un objeto social, es hacia donde está dirigida la actitud.
Una actitud, como se ha mencionado es una predisposición aprendida para responder positiva o negativamente en
relación a un objeto, situación, institución o persona en particular. En donde para predecir algún comportamiento, es
necesario determinar la actitud de un sujeto hacia una conducta particular. Las actitudes están relacionadas con el
comportamiento que mantenemos en torno a los objetos. Las actitudes tienen diversas propiedades, entre las que
destacan: dirección (positiva o negativa) e intensidad (alta o baja); estas propiedades forman parte de la medición
(Hernández et. al. 2010), además se han identificado tres componentes en las actitudes: afectivo, cognitivo y
conductual
Cognitivo
Para poder estar en condiciones de evaluar un objeto, tenemos antes que disponer de alguna información sobre el
mismo. Tal información recibe el nombre de componente cognoscitivo y se expresa en las creencias y
conocimientos que un sujeto o grupo tiene acerca de un objeto.
El componente cognitivo de una actitud consiste en las percepciones del individuo, sus creencias y estereotipos, es
decir sus ideas sobre el objeto. El término opinión se usa a menudo como substituto de componente cognitivo de
una actitud, especialmente cuando dicha opinión es de importancia con respecto a alguna cuestión o problema.
Afectivo
El componente afectivo consiste en la evaluación de la respuesta emocional, el gustar o no de un objeto o persona.
El componente afectivo se refiere a los sentimiento de la persona con respecto al objeto, el aspecto emocional de la
actitud es a menudo el componente más profundamente enraizado y el más resistente al cambio.
Conductual
El componente conductual de las actitudes sociales consiste en las tendencias a actuar o a reaccionar de un cierto
modo con respecto al objeto o persona.
Se han desarrollado distintos procedimientos e instrumentos para la medición de las actitudes, los instrumentos
más difundidos son las escalas de actitud. Las escalas de actitud son medidas altamente estructuradas que por lo
general se componen de afirmaciones a las cuales el participante selecciona la respuesta, indagan la dirección (a
favor o en contra), intensidad relativa con que se manifiesta la actitud de las personas ante determinado objeto o
situación (Coolican, 2005).
Las escalas se pueden clasificar según la manera en que los indicadores permiten clasificar objetos desde el punto
de vista de los participantes o bien permiten clasificar a los participantes con base en los valores que otorgan a la
Escala Likert
López Cureño S.M.
variable de estudio (Briones, 1998). Los tipos de escala más populares son: el método de escalamiento tipo Likert, la
Escala tipo Thurstone, el diferencial semántico y el análisis de escalograma de Guttman.
En este trabajo haré referencia específicamente a la escala de actitud Likert
Escalas de Actitud Likert
En 1932 Rensis Likert desarrolló la Escala Likert, una técnica que consiste en un conjunto de ítems, presentados en
forma de afirmaciones o juicios que califican al objeto de actitud, ante los cuales se pide la respuesta de los
participantes. Las afirmaciones pueden tener dirección: favorables o positivas y desfavorable o negativa. Y esta
dirección es muy importante para saber cómo se codifican las alternativas de respuesta. Si la afirmación es positiva,
significa que califica favorablemente al objeto de actitud; de este modo, cuanto más de acuerdo con la afirmación
estén los participantes, su actitud será igualmente más favorable. Pero si la afirmación es negativa, significa que
califica desfavorablemente al objeto de actitud (Hernández et. al. 2010).
Se presenta cada afirmación solicitando al participante su respuesta, eligiendo uno de los cinco puntos o categorías
de la escala. A cada punto se le asigna un valor numérico. Así, el participante obtiene una puntuación respecto de la
afirmación que ha elegido y al final su puntuación total, sumando las puntuaciones obtenidas en relación con todas
las afirmaciones (Hernández et. al. 2010).
La medida de la actitud de cada participante, será la medida de los puntajes sumados de los ítems, según la
ponderación asignada. Por ejemplo, un participante puede mostrarse de acuerdo con determinados enunciados
cuyas opciones tienen valores ponderados entre 1 que corresponde a “Muy en desacuerdo” y 5 que corresponde a
“Muy de acuerdo”. El puntaje parcial por ítem y el puntaje total (sumatoria de las puntuaciones parciales): Bajo la
perspectiva de considerar las actitudes como un continuo que va de lo favorable a lo desfavorable, esta técnica,
además de situar a cada individuo en un punto determinado de la escala, toma en cuenta la amplitud y la
consistencia de las respuestas actitudinales.
Las puntuaciones se correlacionan con las puntuaciones del grupo a toda la escala (la suma de las puntuaciones
de todas las afirmaciones), y las afirmaciones, cuyas puntuaciones se correlacionan significativamente con las
puntuaciones de toda la escala, se seleccionan para integrar el instrumento de medición, los ítems se distribuyen
aleatoriamente en la hoja de presentación final para ser administrada a la muestra que se ha elegido.
Al construir una escala Likert se deben considerar los cálculos y procedimientos de confiabilidad y validez de la
escala.
Construcción de la escala Likert
La escala Likert ha sido diseñada para medir actitudes; predisposiciones individuales a actuar en cierta manera en
contextos sociales específicos. Desde el punto de vista aritmético, la escala de Likert es una escala sumatoria, ya
que la puntuación o la medida de cada persona en la actitud de que se trate, se obtiene mediante la suma de
respuestas a los ítems (Briones, 1998). Los pasos principales en la construcción de una escala Likert son los
siguientes:
Definición nominal de la actitud o variable que se va a medir.
Escala Likert
López Cureño S.M.
Construcción de una serie de afirmaciones relevantes a la actitud que se quiere medir, redactando la mayor
cantidad de ítems que conformaran el banco de ítems. Este paso se conoce también con el término de
“operacionalización de la variable”.
Se produce un número igual de afirmaciones favorables y desfavorables acerca del objeto actitudinal. Estas
afirmaciones son los reactivos de la escala
Determinación de las puntuaciones dadas a las categorías de los ítems. Se utilizan los valores de esta escala
como puntuación de la persona a cada reactivo, de modo que obtenga una calificación de 5 si concuerda de
manera fuerte con un reactivo favorable al objeto actitudinal, pero sí concuerda de manera elevada con un
reactivo desfavorable obtendrá la puntuación de 1
Aplicación de la escala provisoria a una muestra apropiada y cálculo de las puntuaciones escalares individuales.
Análisis de los ítems utilizados para eliminar los inadecuados.
Categorización jerárquica de la escala
Calculo de la confiabilidad y validez de la escala
Para la redacción de ítems o reactivos se sugiere considerar las siguientes características:
a) Los reactivos deben ser debatibles, deben reflejar una opinión, no un hecho.
b) Los reactivos deben ser pertinentes a la variable en estudio.
c) Los reactivos deben ser simples, en lo que se refiere a la construcción gramatical.
d) Cada reactivo debe ser corto, evitando no exceder de 20 palabras por enunciado.
e) Cada reactivo debe expresar una actitud definida hacia un asunto único.
f) Cada reactivo debe ser claro y directo.
g) Cada reactivo debe dar la posibilidad de dar respuesta en toda la gama de intensidad de la actitud medida.
h) Evitar enunciados con dobles negaciones.
Para mostrar los pasos se plantea un breve ejemplo para la construcción de la escala Likert:
Se inicia con los planteamientos
¿Qué se quiere evaluar? (objeto de estudio)
Actitud ante el suicidio en adolescentes
¿Para qué se quiere evaluar? (planteamiento del problema)
Para identificar en que etapa de la adolescencia hay mayor vulnerabilidad o riesgo de cometer un acto suicida,
ofrecer un instrumento confiable y valido que sirva como medio para identificar oportunamente la población en
riesgo.
La muerte de adolescentes en nuestra sociedad ha ido en aumento. Los intentos suicidas y los suicidios
consumados han impactado a sociedades enteras sin embargo, no se ha encontrado una vía para evitarlo o
prevenirlo.
Escala Likert
López Cureño S.M.
Identificar las variables a medir.
¿Qué tengo que observar?
Qué opinan los adolescentes acerca del suicidio. A partir de la revisión bibliográfica acerca del suicidio,
investigaciones y estadísticas recientes del INEGI acerca del suicidio.
Operacionalización de la variable, generación del banco de ítems. .
Se han formulado 100 ítems como banco de los cuales se presentan sólo 27 enunciados o ítems a modo de
ejemplo. El banco será sometido al veredicto de especialistas o jueces, en cuanto a la congruencia que las
afirmaciones tienen con el tema y su redacción.
Se presenta a continuación el instrumento con los reactivos o afirmaciones antes de ser sometido a la
validez de contenido mediante la revisión de los jueces.
El propósito de la siguiente encuesta es conocer tu opinión acerca del suicidio. Por favor contesta de la manera más sincera posible. La información obtenida es totalmente confidencial y para fines
estadísticos.
Antes de contestar, favor de llenar los datos que a continuación se piden:
Gracias por tu valiosa participación.
Edad Sexo
Masculino Femenino
INSTRUCCIONES:
Lee con todo cuidado las oraciones y posteriormente marca con una X la opción que corresponda a tu opinión
Reactivos
Totalmente en desacuerdo
En Desacuerdo
Ni en acuerdo Ni en desacuerdo
De acuerdo
Totalmente de acuerdo
1.El suicidio es una forma cobarde de huir de los problemas.
2.La idea de atentar contra la vida es un indicio de suicidio.
3. Atentar contra tu cuerpo es una forma de suicidio. 4. Si una persona decide suicidarse, no hay nada
que la haga cambiar de opinión.
Ejemplo:
Totalmente en desacuerdo
En Desacuerdo
Ni en acuerdo Ni en desacuerdo
De acuerdo
Totalmente de acuerdo
Los discos de vinil tienen mejor sonido que los discos compactos X
Escala Likert
López Cureño S.M.
5. La gente que se suicida, es gente que no tuvo otra alternativa.
6. Hablar abiertamente acerca del suicidio, provoca que la gente se suicide.
7. La mayoría de la gente que se suicida era alcohólica o drogadicta.
8. Es común que una persona que planea suicidarse tenga actitudes agresivas.
9. La mayoría de la gente que se suicida, estaba deprimida.
10. La mayoría de los suicidios se debieron a falta de atención.
11. La mayoría de la gente que se suicida tenía problemasde tipo laboral.
12. Los hombres están más predispuestos al suicidio. 13. El suicidio es más frecuente en adolescentes. 14. El suicidio es más frecuente en personas
mayoresde 30 años. 15. Los niños y las niñas no se suicidan. 16. Si una persona se suicida, la familia se siente
culpable. 17. Una persona que decide suicidarse, tratará de
ocultar sus sentimientos aparentando ser feliz 18. Decir lo que a uno le molesta puede evitar el
suicidio. 19. Es más fácil que una persona se suicide si
está bajo los efectos de alguna droga. 20. La gente que planea suicidarse, tratará de
hacerlo de una manera llamativa. 21. Una persona que decide suicidarse dejará
alguna nota o le comunicará a alguien su decisión. 22. La mayoría de los suicidios son causados por
problemas familiares. 23. Existe poca información para prevenir el suicidio. 24. La información acerca del suicidio se encuentra
accesible a la gente. 25. Llamar a la policía es una forma de impedir que
una persona se suicide. 26. Hablar y escuchar a la persona puede impedir
que se suicide. 27. Existen consecuencias emocionales después de
un intento de suicidio.
Escala Likert
López Cureño S.M.
Determinación de las puntuaciones dadas a las categorías de los ítems.
Se evaluarán las preguntas del 1 al 5 o bien del 5 al 1. En ítems positivos En ítems negativos
Totalmente desacuerdo 1 5
Desacuerdo 2 4
Ni en acuerdo ni en desacuerdo 3 3
De acuerdo 4 2
Totalmente de acuerdo 5 1
Mientras menos puntaje se obtiene más se tiene la actitud desfavorable o negativa ante el suicidio. Una actitud
desfavorable ante el suicidio podría implicar una posición más realista e imparcial respecto al suicidio y
probablemente una menor posibilidad a considerar el acto suicida en el futuro. En tanto mayor sea puntaje, la actitud
se mostrará como favorable o positiva ante el suicidio.
Validez de contenido del instrumento:
La validez en los instrumentos es un tema que se desarrolla con detalle después de revisar los pasos de la
construcción de la escala Likert, sin embargo en este segmento se menciona el tipo de validez como parte del
ejemplo. El procedimiento que se sigue para obtener la validez del instrumento es la validez de contenido: es decir el
grado en el que un instrumento refleja un dominio específico de lo que se mide, el grado en el que la medición
presenta al concepto medido; como se mencionó anteriormente por medio de 5 jueces en cuanto a dos elementos:
la pertinencia con el tema y la redacción.
Se establecieron los criterios para el análisis de los resultados en cuanto a la pertinencia y la redacción
De 17- 25 se aceptan
De 11 –16 se modifican
De menos de 10 se eliminan
Se pide a los jueces califiquen cada uno de los reactivos con una calificación de 1 a 5 en la relación que tiene cada
reactivo con la pertinencia y del mismo modo con su redacción.
Escala de pertinencia temática:
1= deficiente 2= regular 3= bien 4= muy bien 5= excelente
Escala de claridad en la redacción:
1= deficiente 2= regular 3= bien 4= muy bien 5= excelente
Escala Likert
López Cureño S.M.
Análisis de los ítems en redacción y pertinencia.
Se presenta a los jueces el formato de calificación de los ítems y se analizan los resultados de acuerdo a los
criterios tanto en su pertinencia temática como en la claridad temática, se analizan los resultados, un ejemplo se
presenta en la siguiente tabla:
INSTRUCCIONES:
Estimado experto se le solicita califique por favor cada uno de los reactivos en cuanto a su pertinencia temática A través de la siguiente escala 1= deficiente 2= regular 3= bien 4= muy bien 5= excelente
Reactivos Jueces Total Criterio.
1 El suicidio es una forma cobarde de huir de los problemas 4 4 4 3 4 19 aceptado
2. La idea de atentar contra la vida es un indicio de suicidio. 4 3 4 3 4 18 aceptado
3. Atentar contra tu cuerpo es una forma de suicidio. 3 3 3 3 3 15 Se modifica
4. Si una persona decide suicidarse, no hay nada que la haga cambiar de
opinión
5 4 4 4 5 22 aceptado
5. La gente que se suicida, es gente que no tuvo otra alternativa. 4 5 4 5 5 23 aceptado
6. Hablar abiertamente acerca del suicidio, provoca que la gente se suicide. 3 3 3 4 3 16 Se modifica
7. La mayoría de la gente que se suicida era alcohólica o drogadicta. 5 4 5 3 5 22 aceptado
8. Es común que una persona que planea suicidarse tenga actitudes
agresivas
2 2 3 2 2 10 Se anula
9. La mayoría de la gente que se suicida, estaba deprimida 5 3 5 3 5 21 aceptado
10. La mayoría de los suicidios se debieron a falta de atención. 4 4 4 4 5 21 aceptado
Aplicación Piloto del instrumento y validación de ítems
Con los ítems seleccionados por los jueces se aplica a una muestra piloto el instrumento, para asegurar la
precisión de la escala, seleccionando el 25 % de los sujetos con puntuación más alta y el 25 % con puntuaciones
más baja, y se seleccionan los ítems que discriminan a los sujetos de estos dos grupos, es decir, aquellos con
mayor diferencia de puntuaciones medias entre ambos grupos. Los tres procedimientos más usados son: El Método
de la correlación ítem-escala, el Método de la diferencia absoluta entre los cuartiles extremos y el Método de
Edwards.
En la práctica académica se recomienda por su accesibilidad utilizar el Método de la correlación Ítem – Escala, para
determinar los reactivos que discriminan con mayor fuerza. Este método es conocido en la Teoría Clásica de los
Tests como índice de homogeneidad (IH). Si el ítem analizado mide lo mismo que el resto de ítems, el índice de
homogeneidad será alto, de manera que los participantes que puntúan alto en el ítem, también tenderán a puntuar
alto en la escala, y los sujetos que puntúan bajo en el ítem, tenderán a puntuar bajo en la escala. Si el índice de
Escala Likert
López Cureño S.M.
homogeneidad es bajo o cercano a cero, entonces el ítem analizado no mide lo que mide el resto de la Escala. Los
ítems con un índice de homogeneidad bajo se conocen como ítems indiferenciadores. Suele tomarse como valor de
referencia 0.20. De manera que todos los ítems que presentan con valores inferiores a 0.20 ( son
eliminados del banco de ítems por ser indiferenciadores. Por tanto se deben desarrollan los cálculos para obtener la
correlación entre la puntuación total y la puntuación de cada ítem, seleccionando los ítems con coeficiente superior a
0.20.
Se utiliza la siguiente fórmula:
Donde:
= La correlación ítem-Escala
= Puntuación obtenida en el ítem
= La resta de la puntuación total de la escala menos la puntuación obtenida en el ítem.
Se selecciona el número de ítems para la escala, la literatura recomienda que sean entre 15 y 30. La validez de
contenido sugiere que aproximadamente la mitad de los ítems deben ser positivos es decir expresan una posición
favorable y la otra mitad de ítem negativos esto es expresan una posición desfavorable.
Aplicación del instrumento a la muestra seleccionada
Una vez realizado el análisis y selección de ítems, seleccionado los ítems que presentan con valores superiores
a 0.20. Se redacta el formato del instrumento final con los ítems seleccionados que será aplicado a la muestra de
estudio.
Confiabilidad
Con los resultados de la aplicación de la escala se inicia el procedimiento de confiabilidad de consistencia interna
Alfa de Cronbach mediante la siguiente fórmula:
Los resultados se vacían en una matriz colocando las respuestas que cada uno de los participantes seleccionó en
cada uno de los ítems de acuerdo a la puntuación que se le ha dado a cada ítem.
Escala Likert
López Cureño S.M.
Por ejemplo en el reactivo 1, El participante 1 selecciona la respuesta “totalmente de acuerdo” que corresponde a
una puntuación de 5, de modo que en la matriz se coloca la puntuación de 5 en el recuadro correspondiente de este
modo se llenan tanto las columnas de participantes como las de reactivos, en la matriz de datos, para el cálculo de
confiabilidad Alfa de Crombach se deben sacar los cuadrados de cada una de las puntuaciones, por lo que es
necesario colocar un espacio al lado de las puntuaciones para los cuadrados de las puntuaciones, de acuerdo al
ejemplo donde la puntuación del primer participante es 5 su cuadrado es 25.
Reactivos
Totalmente en desacuerdo
En Desacuerdo
Ni en acuerdo Ni en desacuerdo
De acuerdo
Totalmente de acuerdo
1. La mayoría de la gente que se suicida, estaba deprimida.
X
Una manera de cómo se puede realizar la matriz se presenta en la siguiente tabla:
Puntajes obtenidos en la escala de actitud ante el suicidio en estudiantes de secundaria
Participantes
Reactivos 1 1² 2 2² 3 3² 4 4² 5 5² 6 6² 7 7² 8 8² 9 9² 10 10² ∑ј
∑ј²
1 5 25
2
3
4
5
6
7
8
9
10
X ∑X
X² ∑X²
Escala Likert
López Cureño S.M.
El desarrollo numérico de la confiabilidad no se ha descrito en el ejemplo dado que no ha sido el tema central y
excedería el límite de extensión del presente escrito, en párrafos posteriores se revisa el análisis teórico – práctico
de confiabilidad de las escalas.
Interpretación de las puntuaciones. Una vez que se han obtenido las respuestas de la muestra se deben interpretar las puntuaciones, en el método de
Likert no se pueden hacer interpretaciones directas de actitud, una forma de hacer la interpretación es a través de
las transformaciones de las puntuaciones directas de la escala a puntuaciones típicas (Z). Las puntuaciones Z nos
indican cuantas desviaciones típicas se aleja la puntuación del sujeto de la media del grupo, y en qué sentido, si lo
hace a la izquierda o a la derecha, esta forma de hacer interpretaciones, se pueden utilizar las puntuaciones Z
cuando las puntuaciones de la escala siguen una distribución normal o aproximada a la normal. En el caso en que
las puntuaciones no siguen una distribución aproximada a la normal se pueden calcular medidas de posición como
los cuartiles o los centiles, de este modo se pueden determinar el porcentaje de participantes que queda por debajo
de cada puntuación de la escala.
Validez en los instrumentos de Escala
Un instrumento de medición es válido si hace aquello para lo que fue concebido; la validez de una prueba concierne
a lo que ésta mide, su eficacia y lo que podemos inferir de los puntajes obtenidos en la prueba (Aragón, 2011). Para
Kaplan y Saccuzzo (2006) validez es la concordancia entre la puntuación y medida de una prueba y la cualidad que
se cree que está midiendo.
El estudio de la validez de un instrumento se refiere básicamente a validar los datos proporcionados por el
instrumento: El grado de adecuación, significación y utilidad de las inferencias específicas que pueden derivarse a
partir de las puntuaciones de las pruebas. La validez de un instrumento tiene que ver con preguntas como: ¿qué
miden los puntajes de la prueba? y ¿qué predicen dichas puntuaciones? (Aragón, 2011).
Cuando se revisa la validez de un instrumento, se debe responder a las siguientes cuestiones:
¿Qué tan representativo es el comportamiento elegido como muestra del universo que se intenta
representar?
¿Qué significado tiene el comportamiento con respecto a los atributos del individuo que son de interés
para la medición?
¿Hasta dónde se puede predecir el rendimiento del sujeto o su aprendizaje en un programa de
entrenamiento (o hasta dónde se puede anticipar su nivel de desempeño en el trabajo), a partir de su
ejecución en la prueba?
Estos tres tipos de preguntas corresponden a lo que en la literatura especializada se ha denominado
respectivamente como validez de contenido, validez de constructo y validez predictiva. A continuación se presenta
una descripción de cada una de ellas, así como sus respectivos procedimientos para estimar los diferentes índices
de validez (Aragón, 2011).
Validez de contenido
Escala Likert
López Cureño S.M.
A través de la validez de contenido se trata de determinar hasta dónde los ítems de una prueba son representativos
del dominio o universo de contenido de la propiedad que se desea medir. Esta definición, aunque bien en teoría,
presenta dificultades prácticas, ya que es imposible extraer muestras aleatorias de reactivos de un universo de
contenido, puesto que este existe sólo conceptual o teóricamente.
Algunos autores han tratado de resolver el problema, de la validez de contenido, generando grandes cantidades de
ítems de un dominio determinado, para luego obtener muestras representativas de dicho universo, a fin de integrar
un instrumento; sin embargo, en la opinión de autores como Kerlinger (2002), la validez de contenido de tales
conjuntos, independientemente de qué tan grandes y tan “buenos” sean los reactivos, es siempre dudosa y, por
tanto, cuestionable. ¿Cómo lograr, entonces, una estimación de la validez de contenido de una prueba?
A diferencia de otros tipos de validez, la de contenido no puede ser expresada cuantitativamente, a través de un
índice o coeficiente; la validez de contenido, por lo general, se estima de manera cualitativa. El procedimiento más
comúnmente empleado para determinar este tipo de validez, es el que se conoce con el nombre de “jueceo”, en el
que se procede de la siguiente manera:
1. Se seleccionan jueces o expertos, para evaluar los ítems del instrumento, en términos de la relevancia o
congruencia de los reactivos con el universo de contenido, la claridad en la redacción y la tendenciosidad o sesgo en
la formulación de los ítems.
2. Cada experto recibe suficiente información escrita acerca de: (a) el propósito de la prueba; (b) conceptualización
del universo de contenido.
3. Cada juez recibe un instrumento de validación. Dicho instrumento normalmente contiene las siguientes categorías
de información por cada ítem: congruencia ítem-dominio, claridad, tendenciosidad y observaciones.
4. Se recogen y analizan los instrumentos de validación y se toman las decisiones siguientes: (a) los ítems donde
hay un 100 por ciento de coincidencia favorable entre los jueces (los ítems son congruentes, están escritos
claramente y no son tendenciosos) quedan incluido en el instrumento; (b) los ítems donde hay un 100 por ciento de
coincidencia desfavorable entre los jueces, quedan excluidos del instrumento; y (c) los ítems donde sólo hay
coincidencia parcial entre los jueces deben ser revisados, reformulados, si es necesario, y nuevamente validados.
(Aiken, 2003)
Validez de constructo.
La validez de constructo intenta responder la pregunta ¿hasta dónde un instrumento mide realmente un determinado
rasgo latente o una característica de las personas y con cuánta eficiencia lo hace? En consecuencia, es necesario
mostrar evidencia de que, efectivamente, el instrumento mide el rasgo o constructo que pretende medir.
Validez de criterio.
La validez predictiva o de criterio de un instrumento busca determinar hasta dónde podemos anticipar el desempeño
futuro de una persona en una actividad determinada, a partir de su ejecución actual en dicho instrumento; por
ejemplo, se podría estudiar, hasta dónde la Prueba de Aptitud predice el éxito académico de los estudiantes en los
primeros semestres universitarios. En consecuencia, la validez predictiva, también llamada validez de criterio
externo o validez empírica, se estudia comparando los puntajes de un instrumento (variable independiente) con una
o más variables externas (variables dependientes) denominadas variables criterio. Se asume que tales criterios,
Escala Likert
López Cureño S.M.
indicadores del desempeño futuro, están teórica y lógicamente relacionados con el rasgo representado en el
instrumento bajo estudio. Esta comparación entre los puntajes de la variable en estudio y los de la variable de
criterio se expresan a través de un coeficiente de correlación, que se interpreta como un índice de validez. Es
importante destacar que la validez predictiva suele estar asociada con problemas y resultados prácticos; es decir, el
interés no es tanto en lo que está detrás del desempeño en la prueba, sino más bien en ayudar a resolver problemas
prácticos y tomar decisiones. Muchos de estos problemas y toma de decisiones están relacionados con la
evaluación, selección y asignación de personas para diferentes actividades como el estudio, el trabajo, el deporte,
etc. (Aiken, 2003).
Confiabilidad en instrumentos de Escala likert
La concepción de confiabilidad en términos estrictos, establece la ausencia del error de medición, en un sentido
amplio se refiere a la exactitud con que un instrumento mide un objeto, en los atributos psicológicos estos conceptos
son inoperables, por lo que se emplea el concepto de confiabilidad en términos de estabilidad y consistencia interna
(Aragon 2011).
El método de consistencia interna es el método de confiabilidad empleado en las escalas de actitud Likert a través
del Coeficiente Alfa de Cronbach propuesto por Lee J. Cronbach en 1951, (Cohen, y Swerdlik, 2001).
Para determinar el coeficiente alfa Cronbach se calcula la correlación de cada reactivo o ítem con cada uno de los
ítems, resultando una gran cantidad de coeficientes de correlación. El valor de alfa es el promedio de todos los
coeficientes de correlación (Cozby, 2005). Visto desde otra perspectiva, el coeficiente Cronbach puede considerarse
como la media de todas las correlaciones de división por mitades posibles (Cohen y Swerdlik, 2001).
Alfa de Cronbach es un índice de consistencia interna que toma valores entre 0 y 1 y que sirve para comprobar si el
instrumento que se está evaluando recopila información defectuosa y por tanto nos llevaría a conclusiones
equivocadas o si se trata de un instrumento confiable que hace mediciones estables y consistentes. Es un
coeficiente de correlación al cuadrado que, a grandes rasgos, mide la homogeneidad de las preguntas promediando
todas las correlaciones entre todos los ítems para ver que, efectivamente, se parecen.
Su valor máximo es 1, cuanto más se aproxime a 1 mayor es el nivel de confiabilidad. En general, los programas
internacionales de pruebas consideran aceptables valores de Alfa mayores a 0.8.
Procedimiento numérico para el cálculo del coeficiente Alfa de Cronbach
Como se mencionó es un coeficiente de correlación al cuadrado que mide la homogeneidad de las preguntas
promediando todas las correlaciones entre todos los ítems para ver mostrar que, efectivamente, miden el mismo
atributo o son consistentes. Se utiliza cuando tenemos instrumentos con varias opciones de respuesta, por ejemplo
en escalas tipo likert, donde los sujetos eligen entre una serie su respuesta, 1) totalmente de acuerdo 2) de
acuerdo 3) indeciso 4) en desacuerdo 5) totalmente en desacuerdo.
La fórmula a desarrollar para obtener el coeficiente de confiabilidad Alfa de Cronbach es:
Escala Likert
López Cureño S.M.
Donde:
Símbolo para representar el Coeficiente de Alfa de Cronbach
: Es el número de ítems
= Es la sumatoria de Varianzas (Sj²) de los Ítems
= Es la varianza (S²) de la suma de los Ítems
CONCLUSIONES
A lo largo del escrito se ha mostrado la importancia de la asignatura para el desarrollo de habilidades que serán de
gran utilidad en el desempeño laboral del psicólogo en todas sus áreas, desde la aplicación de los principios éticos,
la construcción de instrumentos, hasta el desarrollo de proyectos de investigación. Específicamente la construcción
de instrumentos es una herramienta que permite al psicólogo la evaluación de situaciones de riesgo y prevención de
problemáticas psicológicas en el contexto real. El interés en la medición de las actitudes entendidas como juicios en
relación a un objeto, persona o situación, ha permitido analizar fenómenos psicológicos en los diferentes ámbitos de
la psicología, son muchos los ejemplos que se pueden citar de los instrumentos que se utilizan ya en las áreas,
clínica, educativa, organizacional, de educación especial, etc. algunos de ellos se mencionan en el texto. En las
investigaciones actuales se siguen desarrollando instrumentos como respuesta a los fenómenos que van surgiendo
por los acelerados cambios en las dinámicas sociales, pues las familias, las jornadas de trabajo, la educación, las
relaciones personales se transforman en un devenir constante, situaciones que no se vivían en otros tiempos, ahora
son parte de las nuevas generaciones.
En relación a los cambios constantes se sugiere adecuar los contenidos referentes a la construcción y aplicación de
los instrumentos involucrando la tecnología, pues se están incorporando software en las organizaciones para
evaluar a los candidatos en recursos humanos a través de links con portales a distancia como una modalidad de
aplicación así mismo se incorporan en la investigación permitiendo la aplicación de instrumentos a poblaciones en
distintos lugares tanto nacionales como internacionales.
REFERENCIAS BIBLIOGRÁFICAS
Aiken, L. (2003): Test psicológicos y evaluación. México: Pearson.
Anastasi, A. (1990). Test Psicologicos. España: Aguilar.
Aragón, B. L. (2011). Evaluación Psicológica. Historia, fundamentos teórico-conceptuales y psicometría. México: El
Manual Moderno.
Barbero M., Vila E., Holgado F. (2010) Psicometría. Madrid. Sanz y Torres
Briones, G. (1998). Métodos y técnicas de investigación para las ciencias sociales. México. Trillas
Brown, Frederick G. (1980). Principios de la Medición en Psicología y Educación. México: El Manual Moderno.
Escala Likert
López Cureño S.M.
Cajigas, N., Kahan, M., Luzardo, M., Najson, S., Ugo, M. C. y Zamalvide, G (2004). Validación de la Escala de
Agresión entre pares (Bulliyng) en una muestra montevideana de adolescentes de ciclo básico. VII
Jornadas de Psicología Universitaria, Facultad de Psicología, Universidad de la República Montevideo,
Uruguay.
Cohen, Ronald y Swerdlick, Mark. (2001). Pruebas y Evaluación Psicológicas. Introducción a las Pruebas y a la
Medición. McGraw Hill. México.
Coolican, H. (2005). Métodos de investigación y estadística en psicología. México. El manual Moderno.
Cozby, Paul C. (2005) Métodos de Investigación del Comportamiento. McGraw Hill. México.
Festinger y Katz (1982). Los métodos de la investigación en las ciencias sociales. Buenos Aires. Paidos.
Goode, W., Hatt, P.K. (1970). Métodos de investigación social. México: Trillas.
Hernández, S., Fernández, C. y Baptista, L. (2010). Metodología de la investigación. México. McGRAW Hill.
Kaplan, R. M. y Saccuzzo, P. D. (2006): Pruebas psicológicas: principios, aplicaciones y temas. México: Thomson.
Kerlinger, Fred y Lee, Howard. (2002). Investigación del Comportamiento. Métodos de Investigación en Ciencias
Sociales. Mexico: McGraw Hill.
Landero R. y González, M. (2006) Estadística con SPSS y metodología de la investigación. México. Trillas
Nunnally, Jum C. y Bernstein, Ira H. (1995). Teoría Psicométrica. México: McGraw Hill.
Plutchik, R. (1975). Fundamentos de la investigación experimental. México.
Rojas, S. (2002). Guía para realizar investigaciones sociales. México. UNAM
Tamayo, T. (1994). El proceso de la investigación científica. Fundamentos de investigación con manual de
evaluación de proyectos. México. Trillas.
Thorndike, R. L. (1996). Psicometría aplicada. México D.F., México: Limusa.