PISA ESPAÑA 2.003
Estudio sobre el rendimiento escolar en matemáticas
Mètodes estadístics aplicats a les ciències polítiq ues i de l’Administració.
Ariadna Martín, David Pardina i Pablo Simón.
- 2 -
ÍNDICE
INTRODUCCIÓN. Pág. 3
EL DISEÑO DE INVESTIGACIÓN. Pág. 6
CONSTRUCCIÓN DE LA VARIABLE DEPENDIENTE PRINCIPAL. Pág. 10
CONSTRUCCIÓN DE LAS VARIABLES INDEPENDIENTES. Pág. 13
DESCRIPTIVOS Y JUSTIFICACIÓN DE INDEPENDIENTES. Pág. 17
CONTRASTANDO LA HIPÓTESIS 1. Pág. 24
ANÁLISIS DE CONLOMERADOS – CLUSTER ANALISIS. Pág. 26
REGRESIÓN LINEAL MÚLTIPLE. Pág. 32
MODELO DE REGRESIÓN II: CORRECIONES Y MEJORAS. Pág. 43
CONCLUSIONES. Pág. 49
ANEXO. Pág. 55
- 3 -
INTRODUCCIÓN
El trabajo que hemos realizado tiene como finalidad investigar cómo se
ve afectado el rendimiento en matemáticas de los alumnos de secundaria a raíz
de un de un conjunto de variables que, con más detenimiento, pasaremos a
explicar en el siguiente punto. Para ello, contamos con una base de datos del
informe PISA1 del 2003 que muestra los resultados obtenidos por este estudio
para el caso español. En relación al citado Informe, señalar que es una
encuesta realizada por la OCDE a partir de someter a 275.000 estudiantes de
15 años al mismo examen de seis horas y media de duración en 41 países
diferentes (30 socios de la OCDE y 11 asociados, como Brasil, Rusia o Túnez)-
Los citados estudiantes han sido seleccionados por muestreo aleatorio y todos
los directivos de los centros donde se llevan a cabo los exámenes están
obligados a rellenar un cuestionario sobre su escuela.
A partir de varios recortes de prensa que hemos podido recuperar2 y que
son relativos a los resultados obtenidos por el citado informe para España,
podemos determinar que el rendimiento en matemáticas es una variable clave
dentro del rendimiento final del alumno. Tal y como recoge uno de estos
artículos 3 , la situación en general es bastante negativa: “Un 26% de los
estudiantes de 15 años de los países desarrollados son incapaces de hallar
solución a problemas matemáticos básicos vinculados a asuntos cotidianos,
según se desprende del último informe del Programa para la Evaluación
Internacional de los Alumnos (PISA) que promueve la Organización para la
Cooperación y el Desarrollo Económicos (OCDE).” Sin embargo, y como
continúa el artículo, para el caso español los datos son aún más alarmantes,
mientras que Finlandia es quien encabeza la tabla de países cuyos alumnos
obtienen mejores resultados en la materia, España se sitúa en las últimas
posiciones: ocupa el puesto 23° entre los 29 posibl es.
1 Organismo de la OCDE para educación. 2 Para más información, ver en el anexo la parte referida a “recortes de prensa”. 3 Recorte de prensa del diario El Periódico, para más información consultar en el anexo.
- 4 -
A parte de estos datos, y como señala otro de nuestros artículos
seleccionados4, “(…) en la mayoría de los países, los chicos obtienen mejores
calificaciones que las chicas, aunque aquí las diferencias entre unos y otras no
son tan pronunciadas como en lectura y comprensión de textos. La OCDE ha
constatado también que las jóvenes muestran menos interés por las
matemáticas que los chicos, tienen menos confianza y sufren mayor ansiedad
en las clases de esta materia, lo que, dicen los expertos, debería generar una
reflexión entre los educadores sobre el diferente nivel de motivación que
inculcan en ellos y en ellas”.
Todos estos datos no han hecho otra cosa que poner en entredicho la
labor del Gobierno en materia educativa durante estos últimos años. Según el
director general adjunto para la Educación de la OCDE, Bernard Hugonnier, el
informe PISA no hace sino evidenciar que el sistema educativo español "no es
muy eficaz", puesto que no hay una correspondencia entre la inversión
educativa, que se sitúa cerca de la media de los integrantes de la OCDE, y los
resultados obtenidos.
A pesar de ello, no todos los artículos son tan pesimistas acerca de los
resultados del informe para el caso español. Así, y como señala el artículo X
escrito en El País, “(…) España, sin estar entre los mejores, ofrece una cierta
equidad, es decir, los resultados no dependen excesivamente de la extracción
socioeconómica de los alumnos, y las diferencias entre los mejores y los
peores no es tan elevada como en otros países, como Turquía, Hungría o
Japón. A destacar también por parte de los quinceañeros españoles su actitud
positiva hacia la escuela. De los 40 países estudiados, los españoles ocupan el
12º lugar en cuanto a actitud positiva hacia su centro de estudios y el 7º en
sensación de pertenencia”.
Por otro lado, hay quien se muestra escéptico acerca de los propios
resultados suscitados por el informe, llegándolos a poner en tela de juicio, tal y
como hace Julio Carabaña en su artículo en El País con fecha 06/03/2006. En
éste, el citado autor señala la cantidad de errores ocasionados por los informes
4 Ved anexo, recorte recogido de la página web
- 5 -
PISA en general, resaltando entre ellos la creencia que generan éstos a la hora
de evidenciar que estos estudios realizados por la OCDE para comparar los
conocimientos de los alumnos de 15 años en diversos países y regiones,
demuestran que nuestro sistema educativo es un desastre, o por lo menos que
los alumnos españoles aprenden poco y que estamos a la cola de Europa. Tal
y como señala el propio autor, “(…) éste es un error propio de quien no haya
leído o sabido leer los datos, pues la más somera inspección intelectual de los
mismos pone de manifiesto que los países desarrollados de la OCDE (todos
menos México y Turquía) tienen resultados muy cercanos a la media de 500.
Los alumnos españoles alcanzaron los 492 puntos en lectura en el estudio del
año 2000, y han alcanzado los 485 en Matemáticas en el año 2003”.
Finalmente, y a partir de buena parte de la información obtenida acerca
de estos artículos, nuestro estudio pretende corroborar o bien desmentir
algunas de las afirmaciones realizadas en éstos.
- 6 -
EL DISEÑO DE INVESTIGACIÓN
Como ya hemos avanzado anteriormente, en el estudio que
presentamos a continuación nos centraremos en el análisis de la capacidad en
matemáticas en los centros escolares españoles. Para ello, como ya hemos
explicado, utilizaremos como fuente de datos principal el estudio PISA 2003
centrada en los casos de alumnos españoles. Con el objeto de tratar nuestra
variable dependiente principal, hemos tenido que operar a través de la creación
de un factor, hecho que más adelante describiremos con detalle. En nuestro
estudio lo que queremos es demostrar cómo una serie de variables
independientes principales, controladas a su vez por otras, tienen carácter
significativo para explicar la variación en nuestra dependiente.
En primer lugar, enumeraremos y describiremos de manera somera las
variables empleadas:
Variable dependiente:
• La capacidad en matemáticas: Calculado sobre la base de un factor
extraído entre 25 preguntas que evalúan las aptitudes en matemáticas
de los alumnos españoles.
Variables independientes:
• Género: En función de si es alumno/a podría darse que hubiera
rendimiento en matemáticas diverso. De hecho, estudios demuestran
que las mujeres tienen mayor rendimiento en capacidad lectora y menor
en matemáticas que los hombres.
• Rendimiento en ciencias: Calculado sobre la base de un factor extraído
de cinco preguntas que avalúan las aptitudes en ciencias naturales del
alumno.
• Rendimiento en resolución de problemas: Calculado sobre la base de un
factor extraído de cinco preguntas que avalúan las aptitudes en
resolución de problemas del alumno.
- 7 -
• Comunidad Autónoma: Entidad sub-estatal en la que nace el alumno.
Esta variable presentaba 4 categorías (Cataluña, País Vasco, Castilla y
León y Otras regiones). Se han categorizado en 3 dicotómicas para
tomar a Cataluña como referencia:
o Nacido o no en el País Vasco.
o Nacido o no en Castilla y León.
o Nacido o no en otra regiones.
• Carácter público/ privado del centro: En función de su régimen en uno u
otro sentido.
• Minutos de matemáticas por semana: Variable que refiere al número de
minutos de matemáticas que le son impartidos al alumno por semana.
• Índice de Desarrollo Socioeconómico del alumno: Índice construido por
la OCDE sobre elementos como: el nivel de estudios de los padres, la
ocupación de los padres, elementos materiales en casa (libros,
ordenadores, etc.), además del posible origen inmigrante y la lengua
materna del alumno.
Las hipótesis principales que pretendemos falsar so n las siguientes:
H1: Existe una relación entre la capacidad en matemáticas de los alumnos
españoles y los minutos en tiempo lectivo que dedican a tal materia.
En este sentido, queremos demostrar que tal hipótesis no puede ser
aceptada , demostrando el hecho, que en un principio parece contra-intuitivo,
de que no existe relación entre estas dos variables.
En un principio nos valdremos de la correlación para demostrar que no
hay relación, acompañada de un gráfico de dispersión para testarlo
visualmente.
H2: La Comunidad Autónoma del individuo es un elemento significativo para
determinar el nivel de capacidad en matemáticas del alumno.
En este caso, mostraremos como la Comunidad Autónoma es un actor
político significativo para condicionar el rendimiento escolar del alumno en
general, centrándonos nosotros en matemáticas en particular. En primer lugar
- 8 -
haremos una aproximación descriptiva a como se distribuyen los alumnos en
función de su categoría de rendimiento empleado el conglomerado de K-
medias. A continuación, presentaremos para demostrar tal hipótesis
regresiones múltiples con dummies de las CCAA y controlando por distintas
independientes como género, el rendimiento en otras materias (ciencias y
resolución de problemas), carácter público-privado del centro e Índice de
Estatus Socioeconómico.
H3: El género del alumno es una variable que está relacionada con el
rendimiento esperado en matemáticas
A continuación, demostraremos como el género es una variable
relacionada con el rendimiento en matemáticas. Diversos estudios apuntan a
que el rendimiento esperado en matemáticas será inferior para las mujeres
respecto de los hombres. Nuestro análisis pasa por aproximarse a la
descripción de la variable para seguidamente comparar el género en la tabla
contingencia cruzada con la categórica de K-means. Por último, la incluimos
dentro de un modelo de regresión múltiple para controlar por otras variables
como son dummies de las CCAA, el rendimiento en otras materias (ciencias y
resolución de problemas), carácter público-privado del centro e Índice de
Estatus Socioeconómico.
H4: El carácter público o privado del centro esta relacionado con el rendimiento
en matemáticas esperado.
La última hipótesis que falsaremos es como el carácter del centro
importa para prever el rendimiento en matemáticas del alumno. De entrada, lo
intuitivo es que, dada la mala situación de la escuela pública, los centros
privados tengan alumnos con mejores resultados. Sin embargo, estamos
convencidos que ha medida controlemos por otras variables (Por ejemplo,
Índice de Status), no podremos aceptarla. Mostraremos de entrada la
fisionomía de la variable, lo contrastaremos con tablas de contingencia de la
categórica obtenida con el K-means y por último, y más importante, entrará en
nuestra regresión múltiple como independiente para controlarla con otras
intervinientes.
- 9 -
Cabe puntualizar algo de fundamental para centrar nuestro estudio. En
primer lugar, que los datos empíricos requieren siempre del sustento de una
teoría. Es decir, que debe haber un marco conceptual potente detrás de un
análisis empírico para refinar la información que se extrae. Y en segundo, que
para que exista causalidad entre dos variables, debe darse siempre un
mecanismo causal. Es decir, no es suficiente con la observación descriptiva de
que dos variables, por ejemplo, covarían en el mismo sentido. Además, para
que haya causalidad, se debe explicar por qué razón lo hacen. Y por esto, el
papel de la teoría vuelve a ser fundamental.
Respecto de las herramientas estadísticas que hemos empleado han
sido principalmente tres. Hemos empleado factores con el objeto de generar
índices de rendimiento. Lo hemos hecho para construir nuestra variable
dependiente principal y los de rendimiento en ciencias y resolución de
problemas. Después hemos recurrido a la construcción de conglomerados K-
medias para poder disponer de una variable categórica de rendimiento que
hemos cruzado en tablas de contingencia con las otras categóricas de nuestro
estudio. Por último, hemos empleado la regresión lineal múltiple con el
rendimiento en matemáticas como nuestra variable dependiente y el resto de
variables como independientes y controlándose entre sí.
- 10 -
CONSTRUCCIÓN DE LA VARIABLE DEPENDIENTE PRINCIPAL
El primer obstáculo metodológico que hemos encontrado en el momento
de operar con la base de datos ha sido el de determinar nuestra variable
dependiente principal. Ante la imposibilidad de utilizar las variables ofrecidas en
la misma base de datos que proporcionaran la nota obtenida por el alumno (en
nota numérica, dicotómica i porcentaje), puesto que estaban disponibles para
otros países pero no para España, hemos optado por operar con un índice
sintético de la capacidad del alumno en la asignatura de matemáticas.
Para ello hemos hecho un análisis de factores que nos ha proporcionado
una variable artificial en base a otras preexistentes ya elaboradas por PISA que
ayudan a dar un valor a la capacitación del alumno en la asignatura de
matemáticas según su solvencia en el momento de responder a preguntas
propias de esa asignatura. Más aún, lo realmente positivo desde la perspectiva
de la exploración de la base de datos es que esta nueva variable es ordinal por
lo que nos permitirá usar métodos estadísticos como la regresión, más allá de
lo que se hubiera podido hacer con una variable de tipo categórico.
Antes de detallar el procedimiento para crear la variable es necesario
especificar las preguntas que han servido de base para el índice que será
nuestra variable dependiente, de manera que no haya dudas sobre aquello que
explica el modelo estadístico que proponemos en el presente trabajo.
Disponíamos en la base de datos de PISA de distintas variables recogidas bajo
la común denominación de plausible value in maths, que según lo que la propia
organización informa, son indicadores numéricos complejos extraídos a partir
de las respuestas de los alumnos a distintos problemas matemáticos basados
en situaciones de la vida real.
En dichas preguntas se pedía a los estudiantes que identificaran las
características de un problema que debía ser resuelto pensando en términos
matemáticos. En el caso concreto del cuestionario PISA 2003, se sometió a los
alumnos a preguntas sobre cuatro ámbitos distintos del pensamiento
matemático: espacio y forma, cambio y relaciones, cantidad e incertidumbre.
- 11 -
El ámbito de espacio y forma hace referencia a conocimientos
geométricos, espaciales y de propiedades de los objetos. Cambio y relaciones,
en cambio, se refiere a relaciones entre variables incluyendo covariaciones en
peso y medida o resolución de ecuaciones. Por otro lado, los problemas sobre
cantidades se basan más en la resolución de problemas sobre relaciones y
patrones de comportamiento habiendo sido dadas unas determinadas
cantidades numéricas. Por último, el ámbito de incertidumbre se refiere a las
habilidades del alumno en relación con las disciplinas de probabilidad y
estadística.
Asimismo es necesario, para la construcción de un factor, demostrar que
existe correlación entre las variables que lo componen. A tal efecto, mostramos
en el anexo la tabla de correlaciones entre las variables.
Una vez establecida claramente la definición conceptual de las variables
que sintetizaremos, podemos pasar a la descripción del proceso de agrupación
de las mismas. Así pues, hemos recogido todas las variables relativas a la
probable capacitación del alumno en matemáticas (un compendio de 25 que
incluyen todos los ámbitos ya mencionados, variables todas ellas elaboradas
por PISA que sintetizan los resultados de cada alumno en las pruebas
referentes a matemáticas) y hemos hecho un análisis factorial mediante el
método de extracción de máxima verosimilitud.
Puesto que la técnica del análisis factorial permite obtener tantos
factores como sea necesario pero la capacidad explicativa de los factores
últimos sería mínima ya que la máxima capacidad explicativa corresponde al
primero y así sucesivamente, hemos decidido reducir los que pedimos a uno
solo para que sea una variable dependiente más manejable en nuestro modelo.
La puntuación factorial se ha hecho mediante el método de regresión y se ha
guardado como variable el nuevo factor para poder operar con el como variable
dependiente.
De todo ello ha resultado una variable nueva: las 25 variables originales se han
reducido a un único factor. Puesto que con este único factor explicamos hasta
un 0’939 en el mejor de los casos y un 0’887 en el peor, la petición de cualquier
- 12 -
otro factor es totalmente prescindible. El gráfico de sedimentación que se
observa explica el comportamiento predictor del factor.
Matriz factorial a
,938
,938
,938
,938
,938
,872
,874
,874
,872
,878
,919
,920
,922
,919
,920
,907
,910
,907
,908
,907
,912
,914
,914
,914
,914
Matemàtiques 1
Matemàtiques 2
Matemàtiques 3
Matemàtiques 4
Matemàtiques 5
Geometria 1
Geometria 2
Geometria 3
Geometria 4
Geometria 5
Relacions 1
Relacions 2
Relacions 3
Relacions 4
Relacions 5
Incertesa 1
Incertesa 2
Incertesa 3
Incertesa 4
Incertesa 5
Quantitat 1
Quantitat 2
Quantitat 3
Quantitat 4
Quantitat 5
1
Factor
Método de extracción: Máxima verosimilitud.
1 factores extraídos. Requeridas 6 iteraciones.a.
Matriz de coeficientes para el cálculode las puntuaciones factoriales
,060
,060
,060
,060
,060
,028
,029
,028
,028
,029
,046
,046
,047
,045
,046
,040
,040
,039
,040
,039
,042
,042
,043
,043
,043
Matemàtiques 1
Matemàtiques 2
Matemàtiques 3
Matemàtiques 4
Matemàtiques 5
Geometria 1
Geometria 2
Geometria 3
Geometria 4
Geometria 5
Relacions 1
Relacions 2
Relacions 3
Relacions 4
Relacions 5
Incertesa 1
Incertesa 2
Incertesa 3
Incertesa 4
Incertesa 5
Quantitat 1
Quantitat 2
Quantitat 3
Quantitat 4
Quantitat 5
1
Factor
Método de extracción: Máxima verosimilitud. Método de puntuaciones factoriales: Regresión.
Por todo lo referido, creemos que el factor 1 dispone de las
características necesarias para ser nuestra variable dependiente principal y
operar con garantías de fiabilidad. Además queda demostrado que tiene gran
capacidad explicativa y sintética de la capacitación de los alumnos en
matemáticas.
- 13 -
CONSTRUCCIÓN DE LAS VARIABLES INDEPENDIENTES
Aunque ya hemos enumerado previamente las variable independientes
que conforman nuestro modelo, se hace necesaria una explicación detallada
del proceso de su creación, ya que algunas de ellas no podían ser utilizadas en
una regresión lineal multivariante si se introdujeran tal como figuran
inicialmente en la base de datos y la técnica más potente que utilizaremos para
definir nuestro modelo de acuerdo con las hipótesis que hemos aventurado es,
precisamente, la regresión lineal múltiple.
Aunque para algunas de las variables no ha sido necesaria ninguna
modificación sino que se han podido utilizar tal como las ha proporcionado
PISA, aún así haremos una explicitación de su composición y de las
reformulaciones que haya habido para que la lectura de resultados que
expondremos a lo largo del presente trabajo sea más simple.
Por lo que se refiere a la variable género, se ha categorizado con un 1 a
los hombres y con un 2 a las mujeres. Tal como se ha apuntado antes, se ha
recogido tal variable como control para contrastar nuestras hipótesis puesto
que se cree que las mujeres obtienen mejores resultados en pruebas de
capacidad lectora y los hombres rinden mejor en asignaturas matemáticas.
Sobre la variable Comunidad Autónoma ha habido que hacer
conversiones a variables dicotómicas por cada una de las subregiones
proporcionadas por el estudio. Al filtrar sólo los casos relativos a España
obteníamos cuatro lugares de pertenencia de los centros educativos: País
Vasco, Castilla y León, Cataluña y resto de regiones.
Así pues, se ha convertido la variable País Vasco en dicotómica
(teniendo el origen en esta comunidad el valor 1 y las otras el valor 0) y
también las variables Castilla y León y otras regiones. Cataluña actúa como
variable de referencia y por ello no ha sido recodificada. De esta forma se
ordena de tres formas distintas la pertenencia o no a las comunidades
analizadas.
- 14 -
La última variable dicotómica que hemos empleado en el estudio ha sido
la de la naturaleza del centro educativo al cual pertenecen los individuos que
componen la muestra, de manera que un 1 indica que éste es público y un 2
que es privado o concertado. Como ya se ha expuesto en el planteamiento de
las hipótesis de trabajo, la intención es la de demostrar que esta naturaleza del
centro no tiene influencia en el rendimiento académico en matemáticas si se
controla por otros factores como el índice socioeconómico y cultural.
Precisamente por lo que se refiere a la variable que controla el nivel
socioeconómico y cultural del entorno de los encuestados, no ha sido necesaria
ningún tipo de operación de transformación puesto que PISA compone un
índice en forma de factor que controla las posesiones materiales y culturales en
los hogares de los alumnos. El índice se compone a través de sus respuestas a
preguntas sobre la posesión de un lugar de estudio propio, un ordenador para
realizar las tareas en casa, internet, libros, televisor, teléfono, coche, etc.
Puesto que su codificación es lineal porque se compone como un factor, no ha
sido necesaria ninguna transformación.
Sobre los minutos de instrucción en matemáticas semanales tampoco ha
sido necesario hacer transformaciones puesto que es una ratio simple que
tiene en consideración los minutos totales de esa asignatura en cómputo
semanal según alumno. Tal como ya se ha expuesto, consideramos en
nuestras hipótesis que esa variable no será significativa una vez se haya
controlado por otras variables.
Las dos variables que si han debido ser modificadas para poder operar
con ellas, han sido las que se refieren al rendimiento del alumno en ciencias y
al rendimiento en resolución de problemas. Para ello, igual que para nuestra
variable dependiente principal, ha sido preciso hacer un análisis factorial, la
variable primera resultante del cual ha sido utilizada como variable continua
que describe la capacitación del alumno en estos dos ámbitos.
Aún así, es necesario mostrar una tabla de correlaciones previa de las
variables a partir de las cuales van a construirse sendos factores para
demostrar que están correlacionadas entre sí. Adjuntamos aquí la tabla que
- 15 -
demuestra esta afirmación para las variables que componen el factor
rendimiento en ciencias.
Correlaciones
1 ,796** ,797** ,799** ,795**
,000 ,000 ,000 ,000
10791 10791 10791 10791 10791
,796** 1 ,791** ,793** ,793**
,000 ,000 ,000 ,000
10791 10791 10791 10791 10791
,797** ,791** 1 ,793** ,792**
,000 ,000 ,000 ,000
10791 10791 10791 10791 10791
,799** ,793** ,793** 1 ,792**
,000 ,000 ,000 ,000
10791 10791 10791 10791 10791
,795** ,793** ,792** ,792** 1
,000 ,000 ,000 ,000
10791 10791 10791 10791 10791
Correlación de Pearson
Sig. (bilateral)
N
Correlación de Pearson
Sig. (bilateral)
N
Correlación de Pearson
Sig. (bilateral)
N
Correlación de Pearson
Sig. (bilateral)
N
Correlación de Pearson
Sig. (bilateral)
N
Ciències 1
Ciències 2
Ciències 3
Ciències 4
Ciències 5
Ciències 1 Ciències 2 Ciències 3 Ciències 4 Ciències 5
La correlación es significativa al nivel 0,01 (bilateral).**.
A continuación se muestra la misma tabla de correlaciones de las
variables que componen el factor que determina la capacidad de resolución de
problemas del alumno.
Correlaciones
1 ,825** ,831** ,824** ,828**
,000 ,000 ,000 ,000
10791 10791 10791 10791 10791
,825** 1 ,829** ,827** ,828**
,000 ,000 ,000 ,000
10791 10791 10791 10791 10791
,831** ,829** 1 ,830** ,829**
,000 ,000 ,000 ,000
10791 10791 10791 10791 10791
,824** ,827** ,830** 1 ,825**
,000 ,000 ,000 ,000
10791 10791 10791 10791 10791
,828** ,828** ,829** ,825** 1
,000 ,000 ,000 ,000
10791 10791 10791 10791 10791
Correlación de Pearson
Sig. (bilateral)
N
Correlación de Pearson
Sig. (bilateral)
N
Correlación de Pearson
Sig. (bilateral)
N
Correlación de Pearson
Sig. (bilateral)
N
Correlación de Pearson
Sig. (bilateral)
N
Problemes 1
Problemes 2
Problemes 3
Problemes 4
Problemes 5
Problemes 1 Problemes 2 Problemes 3 Problemes 4 Problemes 5
La correlación es significativa al nivel 0,01 (bilateral).**.
Tal como se ha hecho con las 25 variables que componen nuestra
variable dependiente principal, el rendimiento del alumno en matemáticas, se
han usado cinco variables distintas que controlan las respuestas
proporcionadas por los alumnos en preguntas sobre el área de las ciencias y
cinco más por lo que se refiere a la capacidad de resolución de problemas de
ese mismo alumno.
Para crear los factores, igual que se ha hecho con el rendimiento en
matemáticas, se ha usado el método de extracción de la máxima verosimilitud y
- 16 -
se ha considerado suficiente el uso del primer factor solamente por su gran
capacidad explicativa. Vemos en la tabla mostrada a continuación que para el
factor de ciencias, una sola variable explica hasta el 0’895 de los resultados y
un 0’89 mínimo. Los resultados son parecidos para la resolución de problemas,
siendo el 0’913 el valor máximo explicado y el 0’908 el mínimo, por lo que no es
necesario usar un segundo factor. Vemos a continuación los gráficos de
sedimentación respectivos de sendas variables independientes, como ya se
han mostrado para la capacidad en matemáticas.
Matriz factorial(a)
Factor
1 Plausible value in science ,895
Plausible value in science ,890
Plausible value in science ,890
Plausible value in science ,891
Plausible value in science ,890
Método de extracción: Máxima verosimilitud. a 1 factores extraídos. Requeridas 3 iteraciones. Prueba de la bondad de ajuste
Chi-cuadrado gl Sig.
2,276 5 ,810
Matriz factorial(a)
Factor
1 Plausible value in problem solving ,909
Plausible value in problem solving ,909
Plausible value in problem solving ,913
Plausible value in problem solving ,908
Plausible value in problem solving ,909
Método de extracción: Máxima verosimilitud. a 1 factores extraídos. Requeridas 3 iteraciones. Prueba de la bondad de ajuste
Chi-cuadrado gl Sig.
4,305 5 ,506
- 17 -
DESCRIPTIVOS Y JUSTIFICACIÓN DE INDEPENDIENTES
En este apartado nos centraremos en el análisis de las variables que
hemos seleccionado para nuestro estudio, sobretodo, desde dos perspectivas.
Por una parte, queremos demostrar que la variable dependiente principal
cumple con los requisitos fundamentales para la posterior regresión múltiple,
como es la linealidad de la relación entre las variables y el comportamiento
normal de la misma. Por otro lado, queremos también mostrar algunos
estadísticos descriptivos cara a exponer la fisonomía de las variables
independientes y una justificación estadística de su selección a través de los
mismos. Finalmente, hablaremos sobre una variable que ha sido excluida del
análisis.
Descriptivos, normalidad y linealidad:
Un primer elemento a contrastar es el comportamiento normal de
nuestra variable dependiente principal. Para ello, fijémonos en el histograma de
frecuencias sobre el factor de rendimiento en matemáticas:
Lo primero a destacar es como la variable en cuestión presenta una
distribución normal, pese a que en los valores centrales haya algunos picos
que rompen ligeramente la simetría. En todo caso, la distribución es claramente
unimodal, sin asimetrías relevantes en ningún sentido. La distribución de la
variable se realiza entre los valores 4 y -4. La razón para ello es la particular
- 18 -
naturaleza de “rendimiento en matemáticas”, que es un factor, y que se
caracteriza por estar centrada en el 0. El valor medio del factor es de -4,15, con
una desviación típica de 0,99. Como también hemos puesto anteriormente de
relieve, el número de casos es considerablemente elevado, siendo de 10.791
para toda la muestra de alumnos españoles.
Por otro lado, en lo referente al elemento territorial que trataremos en
nuestro análisis, mostrar la distribución de los casos puede ser relevante para
observar la representatividad de la muestra:
Adjudicated sub-region
3900 36,1 36,1 36,1
1490 13,8 13,8 49,9
1516 14,0 14,0 64,0
3885 36,0 36,0 100,0
10791 100,0 100,0
Spain: Other regions
Spain: Castilia y Leon
Spain: Catalonia
Spain: Basque Country
Total
VálidosFrecuencia Porcentaje
Porcentajeválido
Porcentajeacumulado
Como podemos observar, los casos poseen una distribución que no
obedece a criterios claros de proporcionalidad con la población. En este sentido,
por ejemplo, el País Vasco, con 2 millones de habitantes posee el mismo
número de casos que otras regiones, que, detraídos Cataluña, Castilla y la
propia Euskadi, son alrededor de 30 millones de habitantes. Aún cuando la
población escolarizada del País Vasco fuera muy superior a la de otras
comunidades, difícilmente recortaría el diferencial con “otras regiones”, que por
fuerza tendría más.
Debe tenerse esta situación presente como previo a nuestro estudio el
hecho de que tomaremos a Cataluña como categoría de referencia. De esta
manera, hemos considerado la inclusión de la variable territorial como relevante
para predecir el rendimiento en matemáticas, pero siempre partiendo de que,
en un principio, parece que el estudio PISA posee un sesgo en la elaboración
de la muestra. Más adelante, nos informamos a través de artículos
relacionados con el tema y descubrimos que han sido las propias CCAA las
que han decidido, facultativamente, presentarse como sub-región dentro del
estudio (Véase Anexo).
- 19 -
Si pasamos a centrarnos en el género, diversos estudios plantean el que
las mujeres presentan peores resultados en matemáticas y mejores en
comprensión lectora respecto de los hombres. Este hecho, argumentan,
vendría dado no por la menor capacidad de éstas, sino por su menor
motivación hacia las matemáticas. Con posterioridad, otros artículos
periodísticos han planteado que desde el año 2000, esta diferencia estadística
significativa desaparece.
Respecto de la composición de la muestra, el 51,4% son mujeres y el
48,6% hombres. Si analizamos la distribución del rendimiento en matemáticas
por género a través de un diagrama de cajas, podemos ver que a simple vista
se presentan diferencias entre ambos. Como apreciamos más abajo, la media
en rendimiento en matemáticas es superior en las mujeres respecto de los
hombres, si bien es claramente apreciable como la dispersión en la distribución
del rendimiento de los varones es superior a la de las mujeres.
Del mismo modo, si nos centramos en un histograma con la distribución
de frecuencias, podemos apreciar dos cosas. La primera es que el
comportamiento de las mujeres es ligeramente más normalizado que el de los
varones. Y por otro lado, que los varones presentan una cierta asimetría hacia
valores más elevados que no las mujeres. Estas intuiciones que visualizamos
a través de los gráficos deberán ser contrastadas más adelante a través del
modelo de regresión múltiple, controlando por otras variables independientes.
- 20 -
Otra de las variables que vamos a tratar es el carácter público o privado
del centro, a través de una variable dicotómica que el mismo estudio recoge.
En un principio, los estudios argumentan que esta variable por sí misma puede
ser predictora de las variaciones en el rendimiento escolar, si bien cuando es
controlada por otras variables, pierde tal poder. Analizaremos más adelante en
el modelo de regresión lineal múltiple su interacción con otras variables y su
presunta significación. Respecto de la fisonomía de la variable, tan sólo citar
que el 48% de los alumnos de nuestra encuesta van a un colegio privado frente
al 52% que van a uno público.
Otras dos de las variables que hemos construido en nuestro estudio son
los factores que recogen el rendimiento de los alumnos en resolución de
problemas y de ciencias. Construidas desde preguntas vinculadas a la
competencia de los alumnos en dichas materias, los factores en cuestión
pueden ser muy relevantes para la predicción de la variación de nuestra
dependiente si partimos del supuesto de que asumimos estas materias están
correlacionadas entre sí, algo que más adelante falsaremos. Es relevante que
nos fijemos en si los factores mantienen una relación de carácter lineal con el
rendimiento en matemáticas. Si nos fijamos los gráficos de dispersión:
- 21 -
La relación lineal entre las variables parece clara, positiva y directa, lo
cual permite su correcta utilización dentro del modelo general de regresión
múltiple. Además, confirmamos el comportamiento normal de estas variables.
Siguiendo con la descripción de las variables a utilizar, otra de las
variables independientes que está a nuestro alcance para su análisis, e incluida
en la base de datos PISA, es el Índice de Estatus Socioeconómico y Cultural,
cuya base teórica ya ha sido explicada anteriormente. En este sentido, parece
relevante su inclusión dentro del modelo general, si bien previamente conviene
mostrar una somera descripción de la misma. Con unos valores que para los
alumnos españoles están comprendidos entre -3,7 y 2,3, presenta una media
aritmética de -0,19, con una desviación típica de 0,98. Como vemos más abajo,
su distribución es normal, con algunas irregularidades a la derecha y si
comprobamos su relación lineal con la variable dependiente principal,
contrastamos claramente como está presente.
- 22 -
De esta manera, presentamos un compendio de descriptivos y gráficos
de dispersión sobre las variables sobre todo para hacer una breve radiografía
estadística de las mismas, asegurar el comportamiento normal de las que
corresponda y asegurar que se presente una relación lineal entre nuestra
dependiente principal y las variables continuas presentes en el estudio.
Correlaciones:
Una vez contrastados los elementos anteriores, plantearemos un
seguido de correlaciones entre las variables presentadas para rechazar la
hipótesis nula de que existiera independencia entre éstas. Las correlaciones
presentadas son las de Pearson, con valores comprendidos entre 1 y -1.
Mediante el signo, sabemos el sentido de la correlación (directo o inverso)
mientras que, gracias a lo próximo que esté a 1 o -1, sabemos la intensidad de
la misma.
Correlaciones
,379** ,894** ,819**
,000 ,000 ,000
10687 10791 10791
Correlación de Pearson
Sig. (bilateral)
N
REGR factor score'provable value in maths'
Index ofSocio-
Economic andCulturalStatus
Factor paralas variables
problemsolving
Factor paralas varaiblesde science
La correlación es significativa al nivel 0,01 (bilateral).**.
Si nos fijamos en los resultados obtenidos, podemos confirmar algunas
de las intuiciones que ya planteábamos. En el caso de las variables continuas
analizadas, observamos que se presentan correlaciones muy intensas y
positivas para los factores (problem solving de 0,894 y science de 0,819) así
como moderada para el Índice de Estatus, con 0,379. En cualquier caso, está
claro el carácter significativo de las variables, con p-valores del 0,00, pudiendo
rechazar la hipótesis nula y aceptando que se presenta relación entre éstas.
Si reparamos en nuestras variables dicotómicas, las relaciones son más
débiles que en las anteriores, pero en todo caso siempre significativas. Género,
Castilla y León y País Vasco poseen correlaciones positivas, aunque débiles,
- 23 -
sin superar el 0,1, mientras que otras regiones y público/ privado presentan una
correlación algo más intensa y negativa (-0,108 y -0,187 respectivamente)
Correlaciones
,080** ,053** ,187** -,108** ,046**
,000 ,000 ,000 ,000 ,000
10791 10790 10536 10791 10791
Correlación de Pearson
Sig. (bilateral)
N
REGR factor score'provable value in maths'
País Bascdicotòmica Sex Q3
Public orprivate Q3
Otrasregiones
Castilla yLeón
La correlación es significativa al nivel 0,01 (bilateral).**.
Una vez llegados a este punto, apuntar que será en el modelo de
regresión múltiple cuando podemos sostener conclusiones de mayor relieve
que no ahora, ya que será necesario el controlar a las independientes entre sí
para garantizar que las conclusiones que se extraigan sean estadísticamente
consistentes.
- 24 -
CONTRASTANDO LA HIPÓTESIS 1
H1: Existe una relación entre la capacidad en matemáticas de los alumnos
españoles y los minutos en tiempo lectivo que dedican a tal materia.
H0: No existe una relación entre la capacidad en matemáticas de los alumnos
españoles y los minutos en tiempo lectivo que dedican a tal materia.
Tal y como se establece en uno de los artículos que hemos utilizado
para inspirar el estudio que presentamos, Francesc Pedró5, plantea que no
existe una relación lineal entre el volumen de horas de enseñanza que reciben
los alumnos y los rendimientos escolares que estos obtienen. En este sentido,
hemos querido contrastar su afirmación por lo referente a los rendimientos en
matemáticas. Nuestra intuición inicial es que, efectivamente, no habrá una
relación lineal, dado que el autor ha debido construir un índice de rendimiento
global tomando también el matemático. Por ello, en primer lugar, hemos
solicitado al programa que nos muestre un gráfico de dispersión entre nuestra
variable dependiente y los minutos lectivos por semana en matemáticos del
alumno analizado. El resultado obtenido es el siguiente:
5 Para más detalle, consultar el artículo de este autor publicado en La Vanguardia en el anexo.
- 25 -
Como se puede apreciar, no hay presente una relación lineal entre las
variables estudiadas. Además, es posible realizar un cálculo de correlación
bivariada entre ambas variables para complementar nuestra visualización
gráfica. Los resultados que obtenemos son:
Correlaciones
,014
,143
10545
Correlación de Pearson
Sig. (bilateral)
N
REGR factor score'provable value in maths'
Minutesof Mathsper week
Como podemos apreciar, el coeficiente de correlación de Pearson nos
da considerablemente bajo, además de obtener un resultado del p-valor de
0,147, que es superior a 0,05, de modo que concluimos que los minutos
lectivos dedicados por semana a las matemáticas no tienen impacto sobre el
rendimiento en matemáticas de los alumnos españoles.
Por esta razón, podemos concluir que más horas de clase de
matemáticas no implica necesariamente un mejor rendimiento en matemáticas.
Por consiguiente, no puedo rechazar la hipótesis nula.
- 26 -
ANÁLISIS DE CONGLOMERADOS - CLUSTER ANALISIS
A partir de esta técnica estadística buscaremos la generación de
conglomerados de los casos que son objeto de estudio en nuestra base de
datos, es decir, de la muestra de alumnos seleccionada por el estudio PISA en
España. La finalidad de esta técnica es de carácter descriptivo. A través del
análisis de conglomerados buscamos generar agrupación de casos con la
máxima homogeneidad posible dentro del mismo grupo y la máxima
heterogeneidad posible entre los grupos. La técnica que hemos decidido utilizar,
por imperativo material, es la de K-medias.
K-medias:
Esta técnica de conglomerados se basa en denominado criterio de
Ward. . En cada grupo tengo presente un centro y desde este punto, existe una
dispersión entre los diferentes casos que lo componen. La idea es generar
unos grupos en los que la dispersión dentro del grupo sea la menor posible
mientras que la distancia entre los grupos sea máxima. Para nuestro estudio
hemos decidido construir un conglomerado del rendimiento en matemáticas de
los alumnos españoles en tres grupos distintos: los de rendimiento alto, los
intermedios y los de rendimiento bajo. El número máximo de interacciones
incluidas es de 10. Por otra parte, una vez obtenido el conglomerado de k-
medias, disponemos de de una variable categórica que podemos comparar en
tablas de contingencia con algunas de las variables independientes de nuestro
modelo con finalidad descriptiva.
Respecto de la construcción del conglomerado de pertenencia hemos
obtenido los siguientes centros finales de los conglomerados:
Centros de los conglomerados finales
1,08994 -1,36364 -,11587REGR factor score'provable value in maths'
1 2 3
Conglomerado
- 27 -
Esto nos muestra en que posición se han situado los diferentes
conglomerados respecto de nuestra variable factor de rendimiento en
matemáticas. En estas circunstancias, el centro del primer conglomerado se
sitúa agrupando a los valores más altos (1,08) Por otro lado, el segundo
conglomerado tiene su centro en los niveles más bajos de los tres grupos en
términos de rendimiento (-1,36) mientras que el tercero se sitúa con un centro
final entre los otros dos conglomerados (-011). Estos centros finales se han
conseguido a partir de 10 interacciones que han generado variaciones en los
centros iniciales hasta que cumplían la condición expuesta al inicio, máxima
distancia entre grupos, mínima dispersión dentro del grupo. Así, queda
configurado el primer conglomerado como el que recoge a los casos con mayor
rendimiento, el segundo con los que recogen a los de menor y el tercero con
los de resultados intermedios.
Si nos fijamos en cual es la frecuencia de casos que se sitúa en cada
conglomerado:
K-means en 3 categoricas
3536 32,8 32,8 32,8
2415 22,4 22,4 55,1
4840 44,9 44,9 100,0
10791 100,0 100,0
Rendimiento alto
Rendimiento bajo
Rendimiento intermedio
Total
VálidosFrecuencia Porcentaje
Porcentajeválido
Porcentajeacumulado
Vemos que sobre el total de alumnos españoles, el porcentaje de la
muestra con rendimiento alto en matemáticas es de 32,8%, los que lo tienen
bajo son el 22,4% y los que poseen unos resultados intermedios son el 44,9%.
Lo interesante será a continuación tratar de analizar donde se sitúan estos
individuos, es decir, sobre la base de tablas de contingencias, cuales son las
características de las tres categorías creadas.
- 28 -
Comparativa territorial:
Anteriormente hemos hablado sobre que una de nuestras hipótesis era
la existencia de relación entre la Comunidad Autónoma del alumno y su
rendimiento esperado en matemáticas. Para ello, en el apartado anterior,
hemos empleado la regresión lineal múltiple. Además de este análisis,
podemos recurrir a cruzar en una tabla de contingencia nuestra categórica de
rendimiento en matemáticas y la Comunidad Autónoma donde se ubica el
centro escolar. A los resultados, además de la frecuencia, les solicitaremos el
porcentaje de fila, el residuo tipificado para ver la desviación respecto del
resultado esperado y un estadístico de significación Chi2
Si observamos la tabla:
Tabla de contingencia K-means en 3 categoricas * Ad judicated sub-region
1104 543 478 1411 3536
31,2% 15,4% 13,5% 39,9% 100,0%
-4,9 2,5 -,8 3,9
1057 276 357 725 2415
43,8% 11,4% 14,8% 30,0% 100,0%
6,2 -3,1 1,0 -4,9
1739 671 681 1749 4840
35,9% 13,9% 14,1% 36,1% 100,0%
-,2 ,1 ,0 ,2
3900 1490 1516 3885 10791
36,1% 13,8% 14,0% 36,0% 100,0%
Recuento
% de K-means en 3categoricas
Residuos tipificados
Recuento
% de K-means en 3categoricas
Residuos tipificados
Recuento
% de K-means en 3categoricas
Residuos tipificados
Recuento
% de K-means en 3categoricas
Rendimiento alto
Rendimiento bajo
Rendimiento intermedio
K-means en 3categoricas
Total
Spain: Otherregions
Spain:Castilia y
LeonSpain:
Catalonia
Spain:BasqueCountry
Adjudicated sub-region
Total
Sobre esta tabla, comentar varias cosas. Primera, que la distribución de
los alumnos de rendimiento alto por comunidad autónoma es superior a lo
esperado en el caso del País Vasco (Residuo tipificado de 3,9) y en Castilla y
León (2,5) mientras que en el “otras regiones” los resultados son bastante más
bajos de los esperados (-4,9) Sobre los alumnos de rendimiento bajo, la
situación es la inversa. Los alumnos con peores resultados se sitúan en “otras
regiones” y levemente en Cataluña (1 de residuo tipificado, no es un nivel
significativo) mientras que hay menos de los esperados en Castilla y muchos
menos en País Vasco.
- 29 -
Sobre los alumnos de rendimiento intermedio, en casi todos los casos se
ajustan a lo esperado, si caso reproduciendo levemente la dinámica que se da
entre los alumnos con mejores rendimiento en matemáticas. Por último, el
resultado en términos del estadístico Chi2 es significativo, algo que de
momento se mueve en la misma dirección que la hipótesis planteada sobre la
incidencia del la Comunidad Autónoma de origen en el rendimiento en
matemáticas.
Rendimiento por género:
De igual manera a como hemos realizado con el caso de la variable
territorial, el género hemos demostrado que es un elemento significativo para
prever el rendimiento en matemáticas del alumno. A fin de reforzar esta
conclusión, y además, de describir la composición de la variable, hemos
realizado una tabla de contingencia en línea con lo anterior, complementada
con el estadístico Chi2 obteniendo el siguiente resultado:
Tabla de contingencia K-means en 3 categoricas * Se x Q3
1636 1899 3535
46,3% 53,7% 100,0%
-4,3 4,4
1255 1160 2415
52,0% 48,0% 100,0%
,4 -,4
2656 2184 4840
54,9% 45,1% 100,0%
3,4 -3,5
5547 5243 10790
51,4% 48,6% 100,0%
Recuento
% de K-means en 3categoricas
Residuos tipificados
Recuento
% de K-means en 3categoricas
Residuos tipificados
Recuento
% de K-means en 3categoricas
Residuos tipificados
Recuento
% de K-means en 3categoricas
Rendimiento alto
Rendimiento bajo
Rendimiento intermedio
K-means en 3categoricas
Total
Female Male
Sex Q3
Total
Se pueden observar varios puntos interesantes. Sobre losa alumnos de
rendimiento en matemáticas elevado, vemos como los varones poseen mayor
proporción que las mujeres, dado el residuo tipificado de 4,4 en los varones y -
4,3 en las féminas. Esto va en línea con los resultados obtenidos en el modelo
anterior.
- 30 -
Si nos fijamos en aquellos alumnos con un resultado peor en
matemáticas, reparamos en que la situación se invierte, habiendo más alumnas
con problemas en matemáticas que alumnos, aunque no a niveles significativos.
Pero algo verdaderamente interesante es lo que ocurre con los estudiantes de
rendimiento en matemáticas intermedio. En este caso, los varones tienen
menos casos con rendimiento intermedio de lo que les correspondería (-3,5 de
residuo tipificado) y a la inversa con la mujeres (3,4).
Esto nos muestra que hay más mujeres con rendimiento intermedio en
matemáticas que hombres, pese a que estos últimos tengan mayor rendimiento
medio. Esto pone de relieve lo que ya apreciamos en el apartado de
descriptivos, a saber; las mujeres, aun con rendimiento medio menor, también
presentan menor dispersión en el mismo que los hombres. El estadístico Chi2,
como era de prever, nos da un p-valor de 0,00, luego significativo a un nivel del
5%.
Comparativa por centro privado / público:
Por último, nos centraremos en la tabla de contingencia en la que se
cruza nuestra categórica de conglomerados generada a través de la técnica de
K-medias cruzada con la variable de centro público/ privado. Fijándonos en los
resultados:
Tabla de contingencia K-means en 3 categoricas * Pu blic or private Q3
1432 2037 3469
41,3% 58,7% 100,0%
-8,8 9,1
1517 815 2332
65,1% 34,9% 100,0%
8,7 -9,1
2533 2202 4735
53,5% 46,5% 100,0%
1,4 -1,5
5482 5054 10536
52,0% 48,0% 100,0%
Recuento
% de K-means en 3categoricas
Residuos tipificados
Recuento
% de K-means en 3categoricas
Residuos tipificados
Recuento
% de K-means en 3categoricas
Residuos tipificados
Recuento
% de K-means en 3categoricas
Rendimiento alto
Rendimiento bajo
Rendimiento intermedio
K-means en 3categoricas
Total
Public Private
Public or private Q3
Total
- 31 -
Ante los resultados de la tabla, si reparamos en los alumnos con
rendimiento alto, podemos apreciar como aquellos que van a escuelas privadas
tienen un residuo tipificado de 9,1. Ello implica que hay más alumnos con
rendimiento altos en las escuelas privadas que no en las públicas. Sobre los de
rendimiento bajo, la situación es justamente la inversa, actuando prácticamente
como un espejo invertido; los de peores resultados van en mayor medida a la
pública que no la privada. Respecto de los de rendimiento intermedio, y aunque
no con gran importancia, si es cierto que se concentran más en la escuela
pública (residuo de 1,4) que no en la privada (-1,5) Por último, el Chi2 es
significativo con un p-valor de 0,00. Ahora bien, téngase presente que esta
variable, una vez la controlamos con otras independientes, tenemos previsto
que pierda cualquier poder predictor del rendimiento en matemáticas.
- 32 -
REGRESIÓN LINEAL MÚLTIPLE
Una vez hemos tratado con detenimiento los procesos de construcción
de los factores, la fisonomía y descripción de las variables, y la construcción de
conglomerado de K-medias, pasamos a la parte más analítica de nuestro
estudio. Sustantivamente, con la regresión lineal múltiple buscaremos el
controlar de nuestras diferentes variables independientes entre sí para falsar
nuestras hipótesis principales, una vez descartada la linealidad de “los minutos
dedicados a matemáticas” y el rendimiento en matemáticas. Nuestras hipótesis
principales son ahora:
H1: La Comunidad Autónoma del individuo es un elemento significativo para
determinar el nivel de capacidad en matemáticas del alumno.
H2: El género del alumno es una variable que está relacionada con el
rendimiento esperado en matemáticas
H3: El carácter público o privado del centro esta relacionado con el rendimiento
en matemáticas esperado.
Para falsar las hipótesis presentadas, partimos del instrumento de la
regresión lineal múltiple en un modelo incremental en cuatro bloques. Las
condiciones iniciales para hacer una regresión múltiple son una variable
dependiente continua que tiene una distribución normal y una o más variables
explicativas continuas o dicotómicas (en el caso de variables categóricas se
pueden hacer dummies). Nuestra variable dependiente, “El rendimiento en
matemáticas” cumple sin problemas con estas condiciones. Una vez asegurado
esto, ya hemos demostrado que nuestras variables categóricas están
dicotomizadas y que las continuas mantienen una relación de linealidad con la
dependiente. A partir de aquí, pasamos a introducir las diferentes
independientes en el modelo de regresión lineal múltiple por bloques que
explicamos a continuación:
- 33 -
1. En el primer bloque controlaremos por CCAA. Esto lo realizamos para
tener en cuenta el nivel distinto que puede haber en desarrollo
sociocultural entre diversos territorios (El País Vasco es más rico y
urbano que, por ejemplo, Castilla y León). Introducimos en el modelo las
dicotómicas del País Vasco, de Castilla y de otras regiones, para tomar
como referencia Cataluña.
2. En el segundo bloque introduciremos elementos referentes a
características del alumno y del centro. Para ello, introduciremos tanto el
género como el carácter del centro (público o privado).
3. En el tercer bloque, incluimos la presentación de los factores referentes
al rendimiento del alumno en ciencias y resolución de problemas.
4. En el último bloque, el índice de estatus socioeconómico y cultural del
alumno.
El modelo:
Resumen del modelo
,113a ,013 ,013 ,98549197
,216b ,047 ,046 ,96855915
,894c ,800 ,800 ,44355678
,895d ,802 ,802 ,44179049
Modelo1
2
3
4
R R cuadradoR cuadradocorregida
Error típ. de laestimación
Variables predictoras: (Constante), Castilla y León, Otrasregiones, País Basc dicotòmica
a.
Variables predictoras: (Constante), Castilla y León, Otrasregiones, País Basc dicotòmica, Sex Q3, Public or private Q3
b.
Variables predictoras: (Constante), Castilla y León, Otrasregiones, País Basc dicotòmica, Sex Q3, Public or private Q3,FACTOR 1 para ciencias, FACTOR 1 para problem solving
c.
Variables predictoras: (Constante), Castilla y León, Otrasregiones, País Basc dicotòmica, Sex Q3, Public or privateQ3, FACTOR 1 para ciencias, FACTOR 1 para problemsolving, Index of Socio-Economic and Cultural Status
d.
Como podemos apreciar, obtenemos unos valores de R2 que se van
incrementando en la medida en la que introducimos nuevas capas en nuestro
análisis. El estadístico R2 nos muestra el porcentaje de variación de la variable
dependiente (rendimiento en matemáticas) que explico a través de las variables
- 34 -
independientes. Como se aprecia arriba, en la primera capa explico un 1% de
la variación, en la segunda entorno a un 5% y en la tercera y cuarta en torno a
un 80% de nuestra variable dependiente.
En la tabla de significación de la ANOVA sobre las capas de nuestro modelo,
reparamos principalmente en dos elementos:
1. Que en todos los casos, nuestro modelo presentan un p-valor inferior a
0,05, lo que nos permite asumir que las variables independientes son
significativas
2. Que si nos fijamos en el estadístico F, su valor es creciente a medida
introducimos capas, elevándose en gran medida con nuestras variables
sobre el rendimiento en otras materias y descendiendo cuando
insertamos el Índice Socioeconómico.
A continuación, si descomponemos el análisis por bloques:
Bloque 1:
Coeficientes a
-,018 ,025 -,702 ,483
,124 ,030 ,060 4,134 ,000 ,439 2,280
-,125 ,030 -,060 -4,161 ,000 ,438 2,281
,132 ,036 ,046 3,668 ,000 ,585 1,709
(Constante)
País Basc dicotòmica
Otras regiones
Castilla y León
Modelo1
B Error típ.
Coeficientes noestandarizados
Beta
Coeficientesestandarizad
os
t Sig. Tolerancia FIV
Estadísticos decolinealidad
Variable dependiente: REGR factor score 'provable value in maths'a.
Ecuación:
Valor estimado = -0,018 + 0,124 (País Vasco dic.) – 0,125 (otras regiones dic.) + 0,132 (Castilla dic .)
(0,025) (0,03) (0,03) (0,036)
-0,70 4,134 -4,161 3,668
Como comprobamos en el modelo en su conjunto, los valores t son
superiores a +/- 3 y esto quiere decir que las variables en cuestión son
significativas. Debe considerarse que tenemos como alumnos de referencia a
- 35 -
los de Cataluña, con lo que el valor estimado de rendimiento en matemáticas
es para los alumnos catalanes.
El test de los estadísticos de colinealidad obtenidos nos aseguran que
no se presentan problemas de este tipo, dado que el valor de Tolerancia no es
inferior a 0,01 ni el FIV entre 5 o 10 en ninguna de nuestras variables.
Bloque 2:
Coeficientes a
-,710 ,047 -15,042 ,000
,066 ,030 ,032 2,246 ,025 ,440 2,273
-,085 ,030 -,041 -2,857 ,004 ,447 2,235
,157 ,035 ,055 4,423 ,000 ,587 1,705
,117 ,019 ,059 6,210 ,000 ,999 1,001
,355 ,019 ,179 18,286 ,000 ,950 1,052
(Constante)
País Basc dicotòmica
Otras regiones
Castilla y León
Sex Q3
Public or private Q3
Modelo1
B Error típ.
Coeficientes noestandarizados
Beta
Coeficientesestandarizad
os
t Sig. Tolerancia FIV
Estadísticos decolinealidad
Variable dependiente: REGR factor score 'provable value in maths'a.
Ecuación:
Valor est. = -0,710 + 0,066 (País Vasco dic.) – 0, 085 (otras regiones dic.) + 0,157 (Castilla dic.) + 0,117 (genero)
(0,047) (0,030) (0,030) (0,035) (0,019)
-15,042 2,246 -2,857 4,423 6,210
- 0,355 (público/ privado)
(0,019)
18,286
A pesar de que los t-valores de este modelo no son todos superior a +/-
3, como es el caso de las variables “País Vasco” (2,246) y el de “otras
regiones” (-2,857), las demás variables sí tienen valores superiores con lo que
los coeficientes de regresión son inferiores a 0.05, y por lo tanto significativos y
aceptables a un intervalo de confianza del 95%. Algunas modificaciones
interesantes a destacar respecto del modelo anterior son como las variables
dummies “Otras regiones” y “País Vasco” han perdido en significación, pasando
a un p-valor de 0,04 y 0,025 respectivamente. En todo caso, y como ya hemos
dicho, todas las variables son significativas a un nivel de significación inferior al
5%.
- 36 -
Al mismo tiempo, los errores típicos oscilan entre el 0,035 de la variable
“Castilla y León” y el 0,019 de las variables “género” y “público / privado”. El
peso relativo de las variables del modelo, mostrado a través de los coeficientes
estandarizados beta se reparte con homogeneidad entre todas ellas salvo en la
dicotómica público / privado, pasando de la oscilación general a una del -0,179.
Esto hace que la variable dicotómica “público / privado” sea la que más
importancia relativa tenga en el modelo para explicar las variaciones en
términos de rendimiento en matemáticas del alumnado.
Respecto de los estadísticos para testar la colinealidad, las nuevas
variables no presentan ningún problema ni en términos de tolerancia ni de FIV,
alejándose del valor crítico. Incluso la introducción de las nuevas variables
supone una reducción en dichos estadísticos para las del anterior modelo, las
dummies por CCAA. Los valores de los estadísticos de colinealidad en FIV
oscilan entre el 2,273 de la dummy “País Vasco” y la 1,001 de la variable
“género”. Descartamos en todo caso la multicolinealidad.
Bloque 3:
Coeficientes a
-,298 ,022 -13,717 ,000
,149 ,014 ,072 10,907 ,000 ,433 2,309
,039 ,014 ,018 2,828 ,005 ,446 2,242
,059 ,016 ,021 3,647 ,000 ,585 1,711
,140 ,009 ,071 16,157 ,000 ,994 1,007
,011 ,009 ,005 1,175 ,240 ,915 1,092
,560 ,007 ,560 81,652 ,000 ,403 2,479
,390 ,007 ,384 56,169 ,000 ,406 2,465
(Constante)
País Basc dicotòmica
Otras regiones
Castilla y León
Sex Q3
Public or private Q3
FACTOR 1 para problemsolving
FACTOR 1 para ciencias
Modelo1
B Error típ.
Coeficientes noestandarizados
Beta
Coeficientesestandarizad
os
t Sig. Tolerancia FIV
Estadísticos decolinealidad
Variable dependiente: REGR factor score 'provable value in maths'a.
Ecuación:
Valor est. = -0,298 + 0,149 (País Vasco dic.) – 0, 039 (otras regiones dic.) + 0,059 (Castilla dic.) + 0,14 (genero)
(0,022) (0,014) (0,014) (0,016) (0,009)
-13,717 10,907 2,828 3,647 16,157
+ 0,011 (público/ privado) + 0,560 (Factor res. Pro b.) + 0,390 (Factor ciencias)
(0,009) (0,007) (0,007)
- 37 -
1,175 81,652 56,169
La introducción de los factores construidos sobre el rendimiento en
ciencias y en resolución de problemas genera importantes variaciones al
modelo. En primer lugar, como ya explicamos antes, provoca un incremento
notable en la R2, es decir, el porcentaje de variación explicada de la variable
dependiente. Por otra parte, implica cambios respecto de la significación de
nuestras variables.
Los valores |T| han sufrido variaciones muy relevantes respecto de dos
variables: “Otras regiones” ha pasado de un t de -2,857 a uno de 2,828,
(cambia el signo) debajo del valor crítico que permitiría rechazarla, si bien su p-
valor permite considerarla significativa a un nivel del 5%. Sin embargo, más
claro es el caso de la dicotómica “público / privado”, que tan relevante era en el
modelo anterior, pasa a un valor t de 1,175, lo que demuestra que no es
significativo el que la escuela sea pública o privada para predecir el rendimiento
en matemáticas del alumno.
Si reparamos en la importancia relativa de las variables independientes,
el rendimiento en resolución de problemas es el más relevante, con un Beta
0,56, seguida por la variable recién introducida de rendimiento en ciencias con
un Beta de 0,384. Respecto de la colinealidad, en general permanecen
constantes las variables anteriores, pero las nuevas introducidas presentan
unos valores mucho mas elevados como son el FIV de 2,479 de rendimiento en
resolución de problemas y 2,224 en el de rendimiento en ciencias.
Del mismo modo, las dummies de “Otras regiones” y “País Vasco” han
incrementado su FIV a en torno a un 2,3. En todo caso, como permanecen aún
lejos del 5 (valor crítico), no consideramos que haya problemas respecto la
colinealidad de las variables.
- 38 -
Bloque 4:
Coeficientes a
-,267 ,022 -12,136 ,000
,148 ,014 ,072 10,902 ,000 ,435 2,300
,044 ,014 ,021 3,268 ,001 ,446 2,240
,062 ,016 ,022 3,850 ,000 ,586 1,707
,138 ,009 ,070 15,927 ,000 ,993 1,007
-,005 ,009 -,002 -,499 ,618 ,884 1,131
,556 ,007 ,555 80,721 ,000 ,402 2,488
,379 ,007 ,372 53,704 ,000 ,395 2,529
,045 ,005 ,044 9,194 ,000 ,819 1,221
(Constante)
País Basc dicotòmica
Otras regiones
Castilla y León
Sex Q3
Public or private Q3
FACTOR 1 para problemsolving
FACTOR 1 para ciencias
Index of Socio-Economicand Cultural Status
Modelo1
B Error típ.
Coeficientes noestandarizados
Beta
Coeficientesestandarizad
os
t Sig. Tolerancia FIV
Estadísticos decolinealidad
Variable dependiente: REGR factor score 'provable value in maths'a.
Ecuación:
Valor est. = -0,267 + 0,148 (País Vasco dic.) – 0, 044 (otras regiones dic.) + 0,062 (Castilla dic.) + 0,138 (genero)
(0,22) (0,014) (0,014) (0,016) (0,009)
-12,136 10,902 3,268 3,850 15,927
- 0,005 (público/ privado) + 0,556 (res. Prob.) + 0 ,379 (ciencias) + 0,045 (IDSC)
(0,009) (0,007) (0,007) (0,005)
-0,499 80,721 53,704 9,194
Esta es la composición del modelo final consideradas todas las variables
de control. Como ya se ha explicado, el R2 de este modelo es
considerablemente elevado. Sin embargo, ha habido determinadas variaciones,
sobretodo respecto de la significación de las variables que deben ser
comentadas. En general, todas son significativas con unos p-valor próximos al
0,00, con la excepción la independiente referida al carácter del centro “público
o privado”.
Respecto de la dicotómica de “Otras regiones”, el p-valor que alcanza es
de 0,001, con un |t| 3,268. Controlando por el Índice Socioeconómico y cultural,
parece que esta variable recupera plenamente su poder predictor. Pero más
importante es el caso de la dicotómica “público/ privado”. En el modelo anterior
habíamos contrastado como la variable tenía niveles de significación muy bajos
- 39 -
(p-valor de 0,24 y un estadístico de contraste |t| de 1,175) luego que había
perdido su poder para predecir la variación en la variable dependiente.
En este nuevo modelo, controlando por el Índice socioeconómico
obtenemos un p-valor de 0,618 y un |t| de -0,499. Como vemos, el control por
el Índice de Estatus ha implicado que la variable independiente del carácter del
centro todavía pierda más significación dentro de nuestra regresión lineal,
debiendo rechazar cualquier relación con el rendimiento en matemáticas.
Centrándonos en la importancia relativa de cada variable dentro del
modelo, los Beta estandarizados siguen siendo muy elevados en “problem
solving” con un 0,555, seguido por “science” con un 0,372. El resto de
coeficientes oscilan entre el 0,072 del “País Vasco dicotómica” y el -0,002 de la
variable “público / privado“. Respecto del diagnóstico de colinealidad, los dos
factores son los que presentan un mayor riesgo, con FIV de 2,488 en “problem
solving” y 2,529 de “science”, seguidos por las dummies de “Otras regiones” y
“País Vasco”, y con estadísticos de tolerancia a valores del 0,402 y 0.395
respectivamente, lo que les mantiene alejados del valor crítico de la
multicolinealidad, en 0,05.
Comentario sobre los gráficos de residuos p-plot:
Uno de los outputs tradicionales de los modelos de regresión lineal múltiple son
los gráficos de residuos estandarizados sobre el valor pronosticado.
Comentaremos someramente este gráfico para el modelo en su conjunto,
pasando al ANEXO los gráficos de regresión parcial. Este gráfico es
relevante por aportarnos información sobre la existencia de homocedasticidad.
Como concepto, esta se refiere a que haya un comportamiento de los residuos
que no delimite la existencia de alguna estructura determinada y que pueda
quedar fuera de nuestro modelo de análisis lineal. Observando el gráfico de
residuos estandarizados sobre el valor pronosticado:
- 40 -
Tal y como podemos observar en nuestro gráfico, no podemos
considerar que haya heterocedasticidad, es decir, que nuestro modelo
planteado no queda invalidado por la existencia de algún tipo de estructura
reconocible distinta a nuestro modelo lineal. Solo podemos ver ruido blanco.
Aún así, es interesante reparar en la existencia de determinados residuos que
se desvían del conjunto y que parece que se comportan como outlayers. Sin
embargo, ante el tamaño tan grande de la muestra que estamos manejando
(Algo más de 10.000 casos) no parece razonable dotarles de demasiada
significación a una docena de puntos que se alejan de la pauta general.
Respecto del gráfico de probabilidad normal, podemos contrastar la
bondad del ajuste en la medida en la que la evolución de la probabilidad
acumulada observada es coincidente con la esperada. Esto nos da un margen
de seguridad al modelo de regresión que hemos construido desde la
perspectiva de un comportamiento normal.
- 41 -
Conclusión sobre el modelo de regresión lineal:
A continuación presentamos una serie de conclusiones sustantivas que
se derivan de nuestro análisis anterior. En primer lugar, nuestra variable
dependiente es el rendimiento en matemáticas, luego el objeto de nuestra
regresión lineal múltiple es establecer las independientes que pueden predecir
el rendimiento en matemáticas que obtendrá el alumno. Una vez claro este
punto, hemos ido introduciendo capas en el modelo.
Nuestra primera capa ha estado compuesta por tres dicotómicas
derivadas de la variable “subnatio” para que el alumno sea del País Vasco, de
Castilla y León de otras regiones, y tomando como categoría de referencia el
alumno catalán. Hemos podido ver como el ser catalán afecta levemente en
negativo a los resultados en matemáticas, (Constante -0,016) y mientras que el
alumno vasco y castellano mejora en sus resultado (ambos con b de alrededor
de 0,13) el ser de “otras regiones” implica una caída en los resultados previstos
de -0,116 respecto de la constante.
En el segundo bloque, hemos introducido como control las variable de
género y “público/ privado”. Como vemos, la constante cae más, luego también
las previsiones de resultados si eres catalán. Por otra parte, se atenúa la
mejora si eres alumno vasco (b de 0,071) así como la caída si eres de “otras
regiones” (b de -0,085) El género pasa a ser una variable relevante en el
modelo, con un incremento superior de la nota esperada en los hombres (valor
2 en la recodificación) y todavía más importante se vuelve el ir a un centro
público o privado, con un b de 0,356.
Esto concuerda con las previsiones que teníamos en nuestro análisis de
tablas de contingencias realizado con la técnica K-medias. Además, con un
Beta de 18,252 es la variable con mayor peso relativo en el modelo.
En nuestro tercer bloque hemos controlado por dos factores, uno
referente al rendimiento previsto en resolución de problemas y otro en ciencias.
Ahora la constante sufre una mejora respecto de la anterior, luego el ser
catalán supone una previsión aunque negativa, mejor que antes. Ahora el País
Vasco ha recuperado todo su efecto positivo que antes hay perdido mientras
- 42 -
que “otras regiones” y “Castilla y León” pasan a ser ambas favorables en la
previsión de buen rendimiento en matemáticas para el alumno.
Los varones han mejorado levemente su previsión de rendimiento en
matemáticas favorable respecto de las mujeres. ¿Y que ha pasado con el
carácter público o privado del centro? Pues que se nos sale del modelo y
pierde significación. Por su parte, el factor sobre resolución de problemas
supone que la previsión de notas sea notablemente superior ( b de 0,562) así
como el de rendimiento en ciencias (b de 0,39) Además, ya vimos como
suponían no solo un incremento notable en el R2 sino que también tenían un
gran peso dentro del modelo en sus Betas de 81,446 y de 55,837
respectivamente.
En nuestro último bloque introdujimos como variable de control el Índice
de Estatus Socioeconómico y cultural. La constante de catalán se ha reducido
igualmente controlada por la nueva variable, mientras que las dummies sobre
el carácter regional del alumno han permanecido aproximadamente constantes,
así como el género. Si ahora reparamos en el carácter del centro público/
privado, todavía se aleja más de los estadísticos críticos de significación y hace
que la podamos rechazar con mayor seguridad. Esto termina reforzando una
de nuestra hipótesis, que es que el carácter público o privado del centro
termina por no importar para prever el rendimiento en matemáticas. Respecto
de nuestros factores, han reducido levemente su capacidad para prever unos
rendimientos en matemáticas elevados mientras que los valores del Índice de
Estatus terminan predisponiendo a unos rendimientos superiores con un b de
0,045
- 43 -
MODELO DE REGRESIÓN II: CORRECCIONES Y MEJORAS Como hemos visto anteriormente, las conclusiones del modelo de
regresión tenían un peso específico importante tanto por su poder explicativo
de la variable dependiente (Un R2 del 80%) como por su coincidencia con las
hipótesis planteadas en un inicio. Sin embargo, sus conclusiones pueden ser
metodológicamente criticables. La razón para ello es la inclusión de los dos
factores de rendimiento como variables de control en el modelo. Pese a que los
indicadores de colinealidad no lo apuntaban, estas variables, como son a su
vez de rendimiento del alumnado, pueden recoger a la propia dependiente
principal (el rendimiento en matemáticas).
Así, estaríamos controlando a nuestra dependiente por una parte de sí
misma y generando una disfunción grave. Con el objeto de tratar de corregir
este problema, adoptamos dos medidas diferentes. Por un lado, repetimos el
modelo de regresión lineal múltiple sin incluir a los factores. Por el otro,
construimos un nuevo índice, esta vez de rendimiento escolar en su conjunto, y
excluyendo a los factores, repetimos el modelo.
Excluyendo a los factores:
En primer lugar, lo que apreciamos es un descenso altamente
significativo de nuestra R2 explicada, que se coloca en torno a un 15 %. Como
ya vimos, los factores eran los que generaban el incremento hasta el 80%. De
otro lado, por lo que se refiere a la significación del modelo en su conjunto, la
tabla ANOVA demuestra con claridad como resulta ser estadísticamente
significativo, con un F de 325,173 y un p-valor del 0,00. Pero los resultados
más importantes son los que generamos a través de la variación de la propia
ecuación del modelo de regresión lineal. La exclusión de los factores ha
generado unos efectos insospechados.
Resumen del modelo b
,397a ,158 ,157 ,91045973Modelo1
R R cuadradoR cuadradocorregida
Error típ. de laestimación
Variables predictoras: (Constante), Índex socioeconòmic icultural, Castella-Lleó, Gènere, Publico o privado, Altresregions, Euskadi
a.
Variable dependiente: Factor 1: Rendiment enmatemàtiques
b.
- 44 -
Coeficientes a
-,032 ,036 -,868 ,385
,074 ,028 ,036 2,658 ,008 ,442 2,265
-,029 ,028 -,014 -1,024 ,306 ,447 2,237
,163 ,033 ,057 4,886 ,000 ,588 1,701
,113 ,018 ,057 6,335 ,000 ,999 1,001
-,191 ,019 -,096 -10,117 ,000 ,896 1,116
,349 ,009 ,345 37,071 ,000 ,931 1,074
(Constante)
Euskadi
Altres regions
Castella-Lleó
Gènere
Publico o privado
Índex socioeconòmic icultural
Modelo1
B Error típ.
Coeficientes noestandarizados
Beta
Coeficientesestandarizad
os
t Sig. Tolerancia FIV
Estadísticos decolinealidad
Variable dependiente: Factor 1: Rendiment en matemàtiquesa.
Ecuación: Valor est. = -0,032 + 0,074 (Euskadi) – 0,029 (Alt res regions) + 0,163 (Castella-Lleó ) + 0,113 (Gène re) -
(0,036) (0,028) (0,028) (0,033) (0,018)
-0’868 2,658 -1,024 4,886 6,335
- 0,191 (Público o privado) + 0’349 (Índex socioeco nòmic i cultural)
(0,019) (0’009)
-10,117 37’071
Lo que se debe destacar de este modelo son dos cosas principalmente.
La primera es el hecho de la variación que ha habido en el signo de la b de la
variable “carácter del centro”. Anteriormente, habíamos visto como a medida
introducíamos el bloque dos, con el carácter del centro, el que fuera privado
generaba unos resultados esperados en matemáticas mejores que si era
público. Pues bien, si excluimos los factores del modelo, henos aquí que lo
esperado es justo lo contrario, es decir, que los alumnos de centros privados
tienen un rendimiento esperado en matemáticas menor que la de los
centros públicos.
La segunda variación más interesante a destacar es como cambia la
significación de dos variables. Por un lado, la variable otras regiones es
excluida del modelo, con un p-valor de 0,3, con lo que deja de ser
estadísticamente significativo. Por el otro lado, nos encontramos con que el
carácter del centro “público/ privado” recupera su significación. Es decir, que
“otras regiones” se nos sale del modelo mientras que el carácter del centro
vuelve a entrar. Otro apunte accesorio es que la constante deja de ser
significativa en el modelo.
- 45 -
Por lo que refiere al resto de los signos de las b, estas permanecen en el
mismo sentido que nuestro modelo inicial, a la par que debeos destacar la Beta
elevada del Índice de Estatus Socioeconómico y Cultural, que tiene un peso
específico de relevancia en el modelo. (Beta de 0,345) Si nos fijamos en los
estadísticos de colinealidad, en un principio no hay señales que evidencien
algún problema en este sentido, pues permanecen lejos del valor crítico en PIV
de 5.
Si nos fijamos en los gráficos de p-normal, la distribución del histograma
de la variable y como se comportan los residuos, podemos contrastar
claramente como se mantienen las hipótesis fundamentales de normalidad y
homoscedasticidad. De hecho, parece que todavía se ajustan más que en el
caso del modelo anterior en el que incluimos a los factores. Los gráficos de p-
normal y el histograma están en el anexo, así como los de regresión parcial,
pero aquí podemos ver lo que hemos mencionado sobre la distribución de los
residuos.
Cambiando la dependiente: el rendimiento general:
Otra de las posibles modificaciones para perfeccionar el modelo que era
posible aplicar era el construir un nuevo factor con el cual recogiéramos el
efecto de nuestros índices en rendimiento en matemáticas, ciencias y
resolución de problemas de manera conjunta, a fin de ver en que medida
podíamos generalizar las conclusiones de nuestro estudio al rendimiento
esperado del alumno. Para hacer esto, construimos un factor con la técnica de
- 46 -
máxima verosimilitud. Pues bien, si nos fijamos en primer lugar en las
comunalidades:
Matriz factorial a
,954
,851
,898
Factor 1: Rendiment enmatemàtiques
FACTOR 1 per a ciències
FACTOR 1 ressolucióproblemes
1
Factor
Método de extracción: Máxima verosimilitud.
1 factores extraídos. Requeridas 4 iteraciones.a.
Podemos contrastar con claridad como la extracción final de nuestro
factor sobre los índices de rendimiento oscilan entre al 0,95 del rendimiento en
matemáticas y el 0,85 de ciencias. En todo caso, dado lo importante del
porcentaje explicado, parece claro que la extracción de un solo factor es
suficiente. Algo similar es lo que podemos contrastar a través del gráfico de
sedimentación que presentamos, que evidencia el poder explicativo del índice
sobre las variables que hemos introducido.
Tras la construcción de este factor subyace la idea de comprobar si se
pude ajustar al modelo que hemos realizado antes. Evidentemente, los factores
quedan excluidos de las variables de control, dado que ya están presentes en
modelo a través del índice que hemos construido con los mismos, además de
nuestra dependiente principal. El modelo de regresión lineal múltiple se
mantiene por lo tanto como en el anterior caso y con la participación de las
mismas variables.
- 47 -
Por lo que refiere a l R2 del modelo, podemos ver como se sitúa en un
16,3 % de capacidad explicativa de la variable dependiente. Por otra parte, la
Tabla ANOVA pone de manifiesto como nuestro modelo es significativo, con un
p-valor del 0,00 y con un F de 339,343
Resumen del modelo b
,404a ,163 ,163 ,88417759Modelo1
R R cuadradoR cuadradocorregida
Error típ. de laestimación
Variables predictoras: (Constante), Índex socioeconòmic icultural, Castella-Lleó, Gènere, Publico o privado, Altresregions, Euskadi
a.
Variable dependiente: Rendiment total de l´alumneb.
Lo más destacado de nuevo se sitúa en las variaciones que apreciamos
en nuestro modelo al introducir la nueva dependiente:
Coeficientes a
,095 ,035 2,704 ,007
,009 ,027 ,005 ,344 ,731 ,442 2,265
-,051 ,027 -,025 -1,881 ,060 ,447 2,237
,144 ,032 ,052 4,438 ,000 ,588 1,701
,055 ,017 ,029 3,188 ,001 ,999 1,001
-,204 ,018 -,106 -11,167 ,000 ,896 1,116
,350 ,009 ,355 38,197 ,000 ,931 1,074
(Constante)
Euskadi
Altres regions
Castella-Lleó
Gènere
Publico o privado
Índex socioeconòmic icultural
Modelo1
B Error típ.
Coeficientes noestandarizados
Beta
Coeficientesestandarizad
os
t Sig. Tolerancia FIV
Estadísticos decolinealidad
Variable dependiente: Rendiment total de l´alumnea.
Ecuación:
Valor est. = -0,095 + 0,009 (Euskadi) – 0,051 (Alt res regions) + 0,144 (Castella-Lleó ) + 0,055 (Gène re) -
(0,035) (0,027) (0,027) (0,032) (0,017)
2,704 0,344 -1,881 4,438 3,188
- 0,204 (Público o privado) + 0’350 (Índex socioeco nòmic i cultural)
(0,018) (0’009)
-11,167 38’197
Como vemos, respecto de las regiones, el signo del b se maniene igual
que en el caso de nuestro modelo anterior. Si caso, destacar como Castilla y
León se mantiene con uno relevante (0,144) mientras que Euskadi ha
disminuido (0,009) en el valor de los coeficientes de regresión parcial. Por lo
referente al género, sufre algo de descenso respecto del anterior mientras que
público/ privado mantiene la tendencia de más nota esperada en los colegios
- 48 -
públicos. El Índice de Status Sociocultural tiene el coeficiente de regresión
más importante. Los Beta nos muestran como este último es el que tiene un
peso relativo superior comparado respecto de las otras variables, siendo del
0,335.
En términos de significación estadística, destacar que en nuestro modelo
con la dependiente del rendimiento global se percibe que Euskadi se sale con
un p-valor de 0,731 mientras que “otras regiones” vuelve a entrar.
Aparentemente, Euskadi como dicotómica varía en su poder explicativo si nos
centramos solo en matemáticas o si evaluamos globalmente al alumno.
Respecto de la tolerancia y de los estadísticos de colinealidad, no hay que
destacar problemas de importancia.
Si nos fijamos en los gráficos, podemos ver como el comportamiento de
los residuos obedece a la premisa de homoscedasticidad y que los gráficos de
histogramas y de probabilidad normal nos confirma la normalidad y linealidad
de la distribución.
- 49 -
CONCLUSIONES
En este último apartado haremos un sumario de las conclusiones que
podemos extraer de nuestro estudio, sobretodo comparándolas con nuestras
hipótesis principales y planteando las limitaciones del estudio y sus posibles
nuevas líneas de continuidad. A través del estudio hemos tratado de falsar
cuatro hipótesis principales, y hemos podido comprobar como, dado su
planteamiento, no las podemos aceptar todas, si bien han confirmado algunas
de las intuiciones con las que iniciamos nuestro estudio.
Por lo que refiere a la primera hipótesis, habíamos considerado como el
tiempo (medido en minutos) de clase que tiene los alumnos españoles no es un
elemento que entre en relación con su rendimiento esperado en matemáticas.
Como hemos podido ver, esta primera variable independiente no tenía un
comportamiento lineal respecto de nuestra dependiente principal, y a través de
la correlación hemos confirmado el que no existe una relación estadísticamente
significativa entre ambas. Por ello, confirmamos ante los datos presentes el que
un mayor tiempo lectivo dedicado a matemáticas por parte de los
alumnos españoles no implica que necesariamente sus rendimientos
esperados vayan a ser superiores.
Otra de las hipótesis que perfilamos en su momento ha sido el que la
región de origen del alumno era un elemento que entraba en relación con el
rendimiento en matemáticas esperado para el alumno. De entrada, planteamos
una tabla de contingencia entre la categórica creada a partir del rendimiento en
matemáticas y las diferentes regiones para comprobar como, efectivamente, la
distribución era distinta en función de la CCAA y además, como avaló el Chi2,
estadísticamente significativa. Comprobamos como, en el ranking de regiones,
el País Vasco era la mejor, seguida por Castilla y León, Cataluña y finalmente,
“otras regiones”. Para falsar de forma efectiva la hipótesis, construimos el
modelo de regresión múltiple con variable “dummies” de las regiones, tomando
a Cataluña como categoría de referencia.
Al final, cuando controlábamos por todas las demás independientes,
comprobábamos como el ser alumno en Euskadi favorecía unos buenos
- 50 -
resultados en matemáticas, seguido por el ser castellano, de otras regiones y
acabando como peor el ser catalán.
Al efectuar la corrección a nuestro modelo de regresión original,
excluyendo los dos factores de rendimiento obteníamos que el ser del País
Vasco y de Castilla eran aún significativos en el modelo, obteniendo en ambas
regiones un rendimiento superior al esperado. Asimismo, al efectuar la
regresión para el nuevo factor de rendimiento global, creado para contrastar los
efectos de estas variables obteníamos que el ser de Euskadi perdía toda la
significatividad, siendo las categorías “otras regiones” y “Castilla León” las que
tenían unos estadísticos significativos, siendo sólo para Castilla León positivo el
sentido de la regresión y negativo para la categoría de otras regiones.
Visto esto, queda para posteriores estudios que se fijen exclusivamente
en la Comunidad Autónoma como factor determinante del rendimiento el ver
cuales son exactamente las variables que interaccionan con nuestro global de
independientes haciendo variar los resultados. Ello no ha sido posible en
nuestro estudio debido al carácter correctivo de esta última variación y al hecho
de que disponemos de una categorización de regiones (la que nos proporciona
PISA mediante la base de datos) demasiado genérica y que no permite
suficiente especificidad en la corrección. Sin embargo, hay algo que queda
plenamente confirmado en nuestro estudio a pesar de las alteraciones y es el
hecho de que la CCAA importa para el rendimiento en matemáticas
esperado en el alumno español .
La tercera de nuestras hipótesis es que el género del alumno tiene
relación con el rendimiento esperado del alumno en matemáticas. Con nuestra
variable categórica de rendimiento, comprobamos como parecía que los
hombres tenían una predisposición a situarse en los grupos con mejor
rendimiento respecto de las mujeres. Además, comprobamos que era
significativo. Para su mejor comprobación, recurrimos al modelo de regresión
múltiple, controlada por la región, y con posterioridad mantenida en el modelo
con otras independientes.
El resultado fue, aun controlando por diversas variables, que los varones
tenían una tendencia mayor a obtener resultados mejores en matemáticas
- 51 -
respecto de las mujeres. Por ello, la conclusión fue que el género esta
relacionado con los rendimientos esperados en matem áticas, esperando
unos mejores resultados entre los alumnos respecto de las alumnas.
La última de nuestras hipótesis fue el comprobar si el carácter del centro,
público o privado, era relevante para determinar el rendimiento en matemáticas
previsto para el alumno. Desde la perspectiva de nuestra categórica de
rendimiento, mostramos como existía una distribución clara de alumnos con
rendimientos más elevados a favor de los centros privados frente a los públicos,
que además, resultó ser estadísticamente significativo. Tras ello, planteamos
su inclusión en el modelo de regresión múltiple que estábamos manejando para
comprobar como su propia significación en el modelo iba variando a medida la
controlábamos por otras independientes.
Si considerábamos exclusivamente el género y la región como control, el
carácter del centro era altamente significativo en el sentido antes apuntado. Sin
embargo, en el momento en el que incluimos el control por parte de los
rendimientos en ciencias y resolución d problemas, dejó de ser significativo. En
el modelo final, cuando además introducíamos el Índice Socioeconómico y
Cultural, pasaba a excluirse del modelo con más fuerza aún.
El hecho es que, a pesar de lo relatado, en la realización de la
corrección a nuestro modelo suprimiendo el bloque 3 (obviando los dos
factores construidos que podían interaccionar y estar demasiado relacionados
con nuestra variable principal) y en el modelo de regresión usando como
dependiente el factor de rendimiento global hemos podido observar la
tendencia totalmente inversa .
Es decir, a medida que controlamos por el índice socioeconómico, tanto
si tratamos con el rendimiento en matemáticas como con el rendimiento
conjunto en ciencias, matemáticas y resolución de problemas, el carácter del
centro se torna significativo pero apuntando a lo contrario a lo que se veía
cuando no era controlado por la variable índice socioeconómico: el carácter
del centro está relacionado con el rendimiento esco lar esperado, siendo
previsibles mejores resultados para alumnos de cent ros públicos que
para los de centros privados.
- 52 -
En este estudio, a pesar de las conclusiones que hemos podido extraer
con cierto rigor metodológico, hemos tenido que afrontar muy diversas
dificultades. En primer lugar, tuvimos problemas para poder tratar la propia
base de datos de PISA. Dado que en un principio pensamos en emplear como
dependiente la “nota en matemáticas”, nuestras dificultades fueron muy
grandes por estar perdidos tales datos. Así, solo hasta que conocimos de la
tecnología del Factor para la construcción de índices pudimos avanzar en el
estudio, construyéndolos para nuestra dependiente principal y las
independientes de rendimiento en otras materias.
Tras superar este escollo, nos encontramos con un segundo elemento
que podía ser distorsionador de una de nuestras hipótesis. Este fue el hecho de
que la muestra fuera desigual entre regiones, como ya hemos explicado antes,
habiendo la misma muestra para el País Vasco que para la variable otras
regiones, que recogía todos los alumnos presentados en CCAA distintas de
Euskadi, Cataluña o Castilla y León.
Esto podía suponer un sesgo en función de cual hubiera sido el criterio
de selección de los centros, ya que podrían haberse ofrecido aquellos que
tuvieran mejores resultados. Por ello debimos buscar información
suplementaria sobre cual había sido el criterio de selección de los centros.
Garantizando el que se habían seleccionado a través de un sistema aleatorio
simple, nos aseguramos de que no habría problemas de sesgo en la muestra.
Es probable que en posteriores oleadas se sumen más Comunidades
Autónomas y gracias a ello se pueda hacer una comparativa real entre estas.
La nuestra ha sido ciertamente de trazo grueso, ya que tan solo teníamos 4
categorías y precisamente “Otras regiones” suponía los resultados obtenidos
en diversos centros de toda España, que podían ser muy dispares entre sí y no
ajustados a una demarcación regional determinada.
Por otra parte, hemos visto como el género era algo determinante en los
resultados en matemáticas, siendo más favorable para los hombres que para
las mujeres. Este hecho, varios académicos han valorado que estaría
relacionado no con una peor capacidad de las mujeres sino con una menor
predisposición. Pues bien, una posible línea de investigación podría plantearse
- 53 -
tratando de valorar si el control a través de variables motivacionales podría
descontar este efecto, y así podríamos falsar el que las alumnas están menos
motivadas para las matemáticas que los hombres. De demostrarse, sería
interesante el preguntarse por qué se da este hecho.
En nuestro estudio hemos valorado a los alumnos en su conjunto. Sin
embargo, es evidente que ello demuestra limitaciones dado que un elemento
importante a tener en cuneta sería el nivel educativo en el que se encuentra el
estudiante. Hemos omitido cualquier referencia al curso académico en el que
se encuentra el alumno. De esta manera, podría analizarse si las hipótesis que
hemos planteado anteriormente se mantienen si comparamos por diferentes
niveles de estudios. Y de variar por esta razón, podría de nuevo ser interesante
buscar una explicación a este hecho.
Y, finalmente, el propio estudio podría ampliarse al análisis de si las
hipótesis que han sido planteadas para el caso de los alumnos españoles
pueden ser generalizables a otros países. En este sentido, se podría tratar de
mostrar si el caso español es una anomalía, es la tónica general y si existen
variaciones, en qué sentido se producen estas.
- 54 -
Queremos, por último, agradecer a Albert Satorra que nos proporcionara la
base de datos, su ayuda en el tratamiento de los datos y sus sugerencias y
ayuda en el diseño del modelo.
- 55 -
ANEXO LA VANGUARDIA: Francesc Pedró 28/01/07
- 56 -
TRIBUNA: JULIO CARABAÑA
El 'Informe PISA', mala guía para la LOE
El PAÍS: JULIO CARABAÑA 06/03/2006
Corren varios errores sobre los informes PISA. El más común es creer que estos estudios realizados por la OCDE para comparar los conocimientos de los alumnos de 15 años en diversos países y regiones demuestran que nuestro sistema educativo es un desastre, o por lo menos que los alumnos españoles aprenden poco y que estamos a la cola de Europa. Es un error propio de quien no haya leído o sabido leer los datos, pues la más somera inspección intelectual de los mismos pone de manifiesto que los países desarrollados de la OCDE (todos menos México y Turquía) tienen resultados muy cercanos a la media de 500. Los alumnos españoles alcanzaron los 492 puntos en lectura en el estudio del año 2000, y han alcanzado los 485 en Matemáticas en el año 2003. Si alguien tiene estas diferencias por grandes o alarmantes debería estar dispuesto a alarmarse mucho más comparando los resultados regionales. El País Vasco, Cataluña y Castilla León han obtenido en el estudio de 2003 medias superiores a 500, 15 o 20 puntos por encima de la media española, lo que sitúa con seguridad a otras regiones 15 puntos por debajo de la media; Andalucía, por ejemplo, se ha quedado en torno a los 470 puntos.
Otro error muy común es creer que los informes PISA identifican las causas de las diferencias
entre los países. No es así, en buena parte por la dificultad de explicar diferencias tan
pequeñas. Cuando, por ejemplo, los informes representan gráficamente la relación entre gasto
por alumno y aprendizaje, lo que se ve es una línea ligeramente ascendente. Pero un examen
más atento permite ver de inmediato que la pendiente se debe a un par de países (México
sobre todo) y que sin esos países la línea es más bien horizontal, lo que significa que no hay
relación entre gasto educativo y aprendizaje de los alumnos. Es un resultado particularmente
duro para la OCDE, una organización basada en la creencia de que invertir en enseñanza es
rentable, pero es un resultado innegable. Tampoco las políticas educativas explican gran cosa.
Tras el primer estudio del año 2000, los bajos resultados de Alemania parecían sugerir que los
sistemas comprensivos eran mejores que los segregados, pero en el informe de 2003 no ha
quedado ni rastro de esa relación. Además, hay enormes diferencias entre regiones de un
mismo país, aun cuando sus estructuras son semejantes y muchas veces también sus políticas.
Ya hemos mencionado las que se dan en España. En Italia hay diferencias de 100 puntos entre
el Norte y el Sur, en Bélgica los valones quedan a 100 puntos de los flamencos, en Alemania
los alumnos de Baviera aventajan unos 60 puntos a los de Bremen.
Un tercer error muy común es que los informes PISA son una guía para la política. Se trata de
un error a medias, porque los informes PISA son una guía negativa para las políticas, pero no
una guía positiva. No son una guía positiva en el sentido de que no apoyan ningún curso de
acción determinado, pese a los piadosos esfuerzos de sus autores e intérpretes por apuntalar
con sus datos ciertas corrientes pedagógicas. En rigor, lo más que se deriva de los datos PISA
es un refuerzo a la teoría de la indiferencia (o contingencia) de las organizaciones educativas.
Todas funcionan razonablemente bien, y no hay evidencia de que una sea mejor que otra. Los
datos PISA proporcionan también un fuerte refuerzo a la teoría de la futilidad de las reformas
que afectan a la didáctica, la organización o los currícula. Con todos los modelos educativos se
consigue igualmente que los alumnos aprendan (siempre que se sitúen en países
desarrollados).
- 57 -
Como guía para la política los datos PISA tienen en cambio gran utilidad negativa porque
desacreditan prácticamente por igual todas los dogmas, teorías e ideologías que se disputan
actualmente el campo de la pedagogía. Tomemos un ejemplo que nos es particularmente caro,
las teorías constructivistas del aprendizaje que tuvieron la suerte de convertirse en doctrina
oficial con la LOGSE. Mediante sucesivos decretos, órdenes y materiales, a los profesores se
les prescribió no solamente lo que tenían que enseñar, sino cómo tenían que enseñarlo, a
saber, siguiendo las directrices pedagógicas de una escuela particular entre cuyos más
reputados representantes se cuentan Ausubel y Coll. Pues bien, aunque no se puede decir que
PISA sea un test exacto de estas teorías, sí que proporciona evidencia indirecta poco favorable,
no ya a su eficacia práctica, sino incluso a su consistencia teórica. PISA encuentra que la
memorización es tan buena estrategia de aprendizaje como la elaboración, que el aprendizaje
competitivo es complementario y no rival del cooperativo y que la motivación declarada de los
alumnos apenas se relaciona con el aprendizaje, entre otros hallazgos demoledores para los
dogmas pedagógicos más corrientes.
A mucha gente no le gustan las relaciones estadísticas y prefiere aprender de los buenos
ejemplos, como Finlandia. ¿A qué se deben sus buenos resultados? Los finlandeses han sido
los primeros sorprendidos por su éxito, y están todavía intentando explicárselos. Procurando no
resultar arrogantes, han difundido la especie de que la muy alta consideración en que tienen a
los maestros llama para la enseñanza a los mejores titulados universitarios, sin necesidad de
pagarles mucho. No sé si la receta es buena, pero seguro que es difícil. Ahí es nada elevar el
prestigio social de una profesión en que se gana poco. No dicen los fineses que sea cuestión
de gastar más. Ellos gastan unos 16.000 dólares por alumno entre preescolar y el final de la
Enseñanza Secundaria Obligatoria, España 14.000, y sus profesores ganan un 10% menos
que los españoles (OCDE, Panorama de la Educación 2005, Santillana, Madrid). Otras
presuntas lecciones del ejemplo finés, como el predominio de la escuela pública o considerar la
institución escolar como una comunidad de aprendizaje, no soportan el más ligero examen.
En fin, ni por la vía de la estadística ni por la del ejemplo, se pueden tomar los informes PISA
como inspiración para la legislación, y no es justo tachar de incompetente al gobierno, o a los
legisladores, por no copiar un modelo inexistente o seguir una guía que no lleva a ningún sitio.
Reproche que, además, revela una idea equivocada de para qué sirven las leyes. Las leyes, en
particular las educativas, sirven para resolver conflictos políticos, como los derivados de la
enseñanza de la religión, de la elección de centro, de las condiciones de los conciertos o de las
materias del currículo. A eso, con mayor o menor acierto, es a lo que se aplica la ley ahora en
trámite. Las leyes de educación no sirven ni deben usarse para prescribir a los profesores
ninguna forma de didáctica, ni a los centros detalles de su organización, ni a la gente si debe
constituir comunidades de aprendizaje. Felizmente, la LOE se centra en las cuestiones políticas
y deja más autonomía a los centros y a los profesores en materias de organización escolar y
didáctica, dando marcha atrás en las exageraciones que, por su intervencionismo excesivo,
hicieron tan impopular a la LOGSE. En este sentido, como en muchos otros, la ley que ahora
se tramita supone un gran avance sobre la anterior Ley de Educación del PSOE.
- 58 -
Todos los artículos de prensa que se mostrarán a continuación han sido obtenidos de la fuente: http://www.stecyl.es/prensa/041207_ag_informe_PISA_2003.htm#El_26% Los alumnos españoles, a la cola de la OCDE en mate máticas, ciencia y lectura
• Más del 20% de los estudiantes de 15 años 'suspende ' en las grandes materias analizadas
Ni en matemáticas ni en ciencia ni en lectura. Los alumnos españoles de 15 años (secundaria obligatoria) no logran alcanzar la media de conocimientos de los países desarrollados. Su nivel se sitúa entre los peores, hasta el punto de que más de un 20% ni siquiera es capaz de superar ejercicios básicos en dichas materias. Tampoco corre mejor suerte el nivel de excelencia, uno de los más bajos de Europa. Así lo demuestra el Informe PISA 2003, que, mediante 275.000 pruebas directas a estudiantes realizadas en los propios centros, compara los resultados educativos de los países de la OCDE. A la cabeza de la clasificación se sitúan, con diferencia, Corea del Sur, Japón y Finlandia.
Bruselas, 7 dic
De mal en peor. Los resultados del segundo gran informe trienal de la OCDE sobre el nivel educativo de los estudiantes de secundaria (15 años) sitúa a España en el furgón de cola y con tendencia a empeorar, con un 23% y un 21% de estudiantes incapaces de alcanzar el nivel básico en matemáticas y lectura, respectivamente, y, además, con exiguos porcentajes de nivel de excelencia. Con un pobre gasto per cápita en educación, por debajo de la media de la OCDE (organización que integra a los 30 países más desarrollados), España ofrece, en contrapartida, una cierta igualdad de oportunidades y una actitud positiva de los chavales hacia la escuela. El Informe PISA (Programa Internacional de Evaluación de Estudiantes, en sus siglas inglesas), que la OCDE (Organización para la Cooperación y el Desarrollo Económico) inauguró en 2000 con resultados publicados un año más tarde, ofrece la fotografía más completa y comparativa de los niveles educativos de los jóvenes de un total de 41 países (29 de la organización, pues los datos del Reino Unido no se aportan por considerarlos insuficientemente representativos, y 11 asociados). Es una fotografía fiel basada en los resultados de una
serie de tests idénticos a los que se someten cada tres años más de 250.000 estudiantes. Centrado esta vez en el conocimiento de las matemáticas (el primero se dedicó a la lectura), el resultado de España sigue siendo mediocre y con tendencia a empeorar. Si en 2000 el 20% de los chavales no alcanzaba el nivel mínimo en matemáticas, ese porcentaje se elevó el año pasado al 23%. En el caso español llama, además, poderosamente la atención el escaso nivel de excelencia: sólo el 1% de los estudiantes obtiene la mejor calificación, siendo la media de la OCDE el 4%. En lectura ocurre algo similar. El 21% de los quinceañeros españoles no alcanza siquiera el nivel básico de lectura y compresión de textos escritos y ha perdido posiciones a nivel general respecto al año 2000. Entre los 29 países de la OCDE se sitúa en el lugar 22º y entre los 40
- 59 -
analizados está en el 27º. En ciencias, se ha perdido algo también en tres años, aunque la OCDE estima que tal pérdida es irrelevante estadísticamente. Frente a la idea de que en tres años es difícil lograr variaciones importantes, el director de la División de Indicadores y Análisis Educativos de la OCDE, Andreas Schleicher, señala el avance de Polonia, que de los últimos puestos en 2000 ha pasado a colocarse en la media de la OCDE, muy por delante de España, gracias a la reforma educativa acometida por el Gobierno en 1999, tendente a recuperar sobre todo a los peores alumnos. Finlandia, vuelve a situarse a la cabeza en todas las materias. "Es llamativo comprobar que, lejos de acomodarse", explica Schleicher, "en Finlandia hay una gran receptividad a escuchar los consejos y observar las buenas prácticas de los demás para mejorar sus resultados". Tras Finlandia se sitúan, junto a Japón y Corea, un buen puñado de países europeos, lo que promete un mejor futuro para Europa frente a la gran potencia estadounidense, que está perdiendo terreno en resultados educativos. Así como en lectura destacan las chicas frente a los chicos, en matemáticas, en una menor proporción, obtienen mejores resultados los chicos, aunque en ambos casos parece deberse más a las motivaciones y el contexto en el que se enseñan ambas materias que a la capacidad de unos y otros. Así, los mejores resultados por países no indican una mayor inteligencia de unos sobre otros, sino que el sistema educativo de unos es capaz de desarrollar mejor que otros el potencial de sus alumnos. En términos generales y, por tanto, con excepciones, la escuela privada prepara mejor a sus alumnos que la pública y los sistemas menos rígidos de enseñanza, la descentralización, la autonomía de los centros y una preparación no competitiva son factores que suelen lograr los mejores resultados. Sin estar entre los mejores, España ofrece una cierta equidad, es decir, los resultados no dependen excesivamente de la extracción socioeconómica de los alumnos, y las diferencias entre los mejores y los peores no es tan elevada como en otros países, como Turquía, Hungría o Japón. A destacar también por parte de los quinceañeros españoles su actitud positiva hacia la escuela. De los 40 países estudiados, los españoles ocupan el 12º lugar en cuanto a actitud positiva hacia su centro de estudios y el 7º en sensación de pertenencia. EDUCACIÓN-INFORME PISA 2003
El Gobierno promoverá un acuerdo con las CCAA para aumentar el gasto educativo
• El gasto educativo en España, en relación con el PI B por habitante, está por debajo de la media de la OCDE
Madrid, 7 dic
El secretario general de Educación Alejandro Tiana, dijo hoy que el Estado quiere promover un acuerdo con las CCAA para incrementar de forma corresponsable el gasto en esta materia, aunque advirtió que mejorar los resultados educativos depende, además, de factores como el profesorado y los centros. "Si solamente una parte de las administraciones hacen este esfuerzo y otras no lo hacen, es muy probable que el conjunto del país no pueda subir en la medida que debe", dijo al presentar los datos de España en el informe Pisa 2003, sobre resultados de estudiantes de 15 años en matemáticas y otras materias. Reafirmó el compromiso "claro" del Ministerio de Educación y Ciencia (MEC), como responsable del 6 por ciento del gasto, de hacer un esfuerzo "mayor" a través de un "acuerdo de corresponsabilidad", si bien reconoció que el Estado no puede imponer a las CCAA, responsables del 94 por ciento, cómo y cuánto gastar. El presupuesto español está por debajo de la media de la OCDE en el indicador principal de esfuerzo educativo o gasto en relación con el PIB por habitante, así como en lo que es el gasto educativo por estudiante, precisó.
- 60 -
En las pruebas, en 29 países de la OCDE y once asociados, participaron 10.761 estudiantes españoles de 383 centros; Castilla y León, Cataluña y País Vasco aumentaron su muestra para disponer de resultados propios. El estudio, según Tiana, no se ocupa tanto del currículo formativo de los alumnos como de las destrezas y competencias básicas útiles en la vida adulta, y tienen en cuenta factores que influyen en los resultados. España ocupa el lugar 26 de 40 en matemáticas (por detrás de las tres Comunidades citadas, que no forman parte del ránking), aunque mejora en geometría y álgebra sobre el informe de 2000, y empeora algo en lectura. Por niveles de rendimiento matemático, de 1 a 6, la mayoría (27 por ciento) de los estudiantes españoles se sitúa en el 3, así como el 24 por ciento de la media de la OCDE. Escasamente tiene alumnos en el nivel 5 (7 por ciento frente al 11 de la OCDE) y en el 6 (1 por ciento frente al 4 de la OCDE), donde se debe mejorar, según Tiana. Por debajo de 1, hay un 8 por ciento, "inaceptable", y ligeramente inferior a la media. Como datos significativos de España, los alumnos y, sobre todo las alumnas, presentan un considerable grado de ansiedad en matemáticas y, al igual que en los demás países, esta materia suscita menor interés que la lectura. También es uno de los lugares en que los alumnos valoran más el centro escolar. El informe indica que la puntuación obtenida en matemáticas es acorde con el nivel de riqueza del país (485 puntos y entre 20.000 y 30.000 dólares per cápita), y ligeramente superior a lo esperado de un país de su nivel socioeconómico y cultural. Tiana destacó la "buena tasa de equidad" según origen del alumnado, aunque el desafío sigue siendo mantenerla y mejorar el de resultados. Por géneros, las chicas presentan mejores resultado s en comprensión lectora y los chicos en matemáticas. Los resultados más altos en los centros privados se deben al tipo de alumnado que reciben, según nivel socio-económico y cultural, por lo que se concluye que las características individuales influyen más que el centro. A la vista de los datos, Tiana entendió que la situación de España es "muy mejorable", aunque tampoco quiso ser pesimista. Sin olvidar los avances en las últimas décadas, que atribuyó a "todos", indicó que España ocupa el puesto 27 de la OCDE en el nivel educativo de la población adulta, que corresponde en muchos casos a los padres de los estudiantes de quince años. Dijo que, en comparación con los niveles económicos y socio-culturales, España se encontraría en el nivel que le corresponde, pero "muy lejos" de donde las autoridades educativas querrían. "Si queremos converger con los países de la UE, tenemos que estar por encima de la media", apostilló. Entre las "asignaturas pendientes", apuntó la de seguir mejorando la formación del profesorado, que el mismo se vea reconocido e implicado en su tarea, la cuestión de cómo organizar los centros docentes y su autonomía y cómo diagnosticar y tratar las dificultades educativas desde el momento en que se plantean.
- 61 -
275.000 escolares sometidos a un examen de seis hor as y media
Para elaborar el Informe PISA 2003 presentado ayer, la OCDE ha sometido a 275.000 estudiantes de 15 años al mismo examen de seis horas y media de duración en 41 países diferentes (30 socios de la OCDE y 11 asociados, como Brasil, Rusia o Túnez). La mayoría de estos países participaron en la primera evaluación PISA 2000, centrada, sobre todo, en el nivel de lectura. A los chavales se les selecciona por muestreo aleatorio y, además, los directores de los centros donde se llevan a cabo los exámenes rellenan un cuestionario sobre su escuela. Dado que este informe se centra fundamentalmente en el nivel de conocimiento de las matemáticas (aunque también analiza la comprensión lectora, la cultura científica y la resolución de problemas), el test se ha dividido en cuatro grandes apartados: cantidades, el espacio y sus formas, variaciones (y relaciones) e incertidumbre (porcentajes, sobre todo). Se ha pedido a los alumnos que resolvieran problemas matemáticos, como calcular cuánto dinero le sobra a un viajero tras haber pasado tres meses en el extranjero al cambiar su moneda con un tipo de cambio más favorable al final que al principio. Otro ejemplo: sabiendo a cuánto asciende la totalidad de las exportaciones de un país y el porcentaje que corresponde a cada producto, calcular a cuánto ascienden las exportaciones de un producto determinado. Los estudiantes han realizado además un cuestionario sobre su medio, hábitos de aprendizaje, percepción sobre la enseñanza, grado de compromiso y motivación. PISA 2006 se centrará en el conocimiento científico y PISA 2009 volverá a analizar el nivel de lectura. MATEMÁTICAS
El 23% ni siquiera alcanza el nivel mínimo
Las matemáticas generan poco entusiasmo entre los adolescentes; sin duda menos que la lectura. Así lo constata el Informe PISA 2003, que ha sometido a 275.000 estudiantes a un examen tipo test de dos horas y media. Aproximadamente la mitad de los estudiantes de quince años de la OCDE aseguran estar
interesados en la lectura, mientras que sólo el 38% dicen disfrutar de la misma motivación hacia las matemáticas. Menos de una tercera parte revisa lo estudiado en matemáticas. De hecho, dice el nuevo Informe PISA, menos de la mitad de los estudiantes de España, Bélgica, Finlandia, Francia, Corea y otros dicen tener interés por las cosas que aprenden en esta asignatura. En España, si en 2000 el 20% de los chavales no alcanzaba el nivel mínimo en matemáticas, ese porcentaje se ha elevado en el Pisa 2003 al 23% -el 14,9% están en el nivel 1 de conocimientos (de los seis que hay) y el 8,1% incluso por debajo-. Sin embargo, el 75% de los chavales considera que aprender matemáticas es algo bueno que les ayudará a labrarse mejor un futuro, a desarrollar mejor un trabajo cuando sean adultos. Hong-Kong, Finlandia, Corea y Holanda encabezan el grupo de países en los que sus jóvenes han obtenido las mejores cualificaciones en matemáticas. México, Indonesia, Túnez y Brasil
- 62 -
están en la cola. España se coloca entre el puesto 22 y 24 de la OCDE (dependiendo de los resultados obtenidos en las cuatro pruebas de matemáticas a los que han sido sometidos los jóvenes) y entre el 25 y 28 si se incluyen a los once socios de la OCDE contabilizados en este estudio. El interés de los alumnos por las matemáticas no guarda una relación directa con los resultados obtenidos. De hecho, la relación es inversa en muchas ocasiones. Los que menos dicen divertirse con las matemáticas viven en Japón, Luxemburgo o Finlandia. Sin embargo, los que muestran un mayor interés y aseguran entretenerse con esta materia son los estudiantes de Túnez, Indonesia, México, Brasil o Turquía, que obtienen, por el contrario, los más humildes resultados. La ansiedad que producen las matemáticas en los chavales sí parece tener una mayor correlación con los resultados obtenidos. La regla, que sufre numerosas excepciones, sería: a menor ansiedad, mejores resultados. Así, los alumnos que parecen sufrir una menor ansiedad por esta asignatura son los suecos, daneses y holandeses. La mayor ansiedad se registra en Túnez, Brasil, Tailandia y México, pero también, inmediatamente después, entre los alumnos asiáticos de Japón y Corea. En España, el nivel de ansiedad es también elevado (en 13 lugar de un total de 40). En la mayoría de los países, los chicos obtienen mejores calificaciones que las chicas, aunque aquí las diferencias entre unos y otras no son tan pronunciadas como en lectura y comprensión de textos. La OCDE ha constatado también que las jóvenes muestran menos interés por las matemáticas que los chicos, tienen menos confianza y sufren mayor ansiedad en las clases de esta materia, lo que, dicen los expertos, debería generar una reflexión entre los educadores sobre el diferente nivel de motivación que inculcan en ellos y en ellas. Las Diferencias.-LAS CLAVES DEL ÉXITO
¿Qué diferencia a España de Finlandia, Hong Kong y Corea del Sur, que logran los mejores resultados en el estudio, además de gastar más en educación? EL PROFESORADO Según el coordinador del proyecto en España , Ramón Pajares, los profesores de estos países son más valorados y gozan de un mayor respaldo social. «Hay que revisar las funciones que desempeñan los docentes, sobre todo su formación», propuso el secretario general Alejandro Tiana. LOS ALUMNOS En Japón y Corea, cuyos alumnos siempre copan los primeros puestos en cualquier materia, las clases particulares son obligatorias desde la más temprana edad, con lo que se aumenta el tiempo de escolaridad y se corrigen deficiencias formativas «Existe una enorme presión social para que los alumnos se esfuercen y obtengan buenos resultados. Incluso llegan al suicidio», subraya Pajares. LA EDUCACIÓN INFANTIL Los alumnos con escolarización más temprana obtienen los mejores resultados. El coordinador español subraya que en países donde no hay dispersión ni segregación de alumnos se diagnostican y abordan los problemas mejor desde el momento en que se plantean. LA LECTURA En Finlandia y otros países protestantes, según Tiana, los padres se ocupan desde hace siglos de que sus hijos sepan leer correctamente los textos religiosos desde niños. «En la enseñanza primaria y secundaria de Japón y Corea se prima la interpretación de todo tipo de textos, no sólo literarios», destaca Pajares.
- 63 -
EXAMEN A LA SECUNDARIA.- EL PAÍS - Sociedad - 08-12-2004
Educación vincula a la "situación cultural y económ ica" el mal resultado en secundaria
El Ministerio de Educación sostuvo ayer que los malos resultados obtenidos por los alumnos de secundaria españoles en el Informe PISA son "más o menos los que le corresponderían" a un país como España dada "la situación económica y cultural de su población". Educación, con todo, consideró que las bajas calificaciones (que sitúan a España a la cola de los países desarrollados en matemáticas, ciencia y lectura) son "muy mejorables" y se reafirmó en su compromiso de "aumentar el dinero que se dedica a educación", así como de promover esa misma iniciativa entre las comunidades. La valoración del Ministerio de Educación no quiere ser " ni negra, ni rosa". El secretario general de Educación, Alejandro Tiana, recordó que el nivel educativo de la población adulta española se sitúa en los últimos puestos entre los 30 países de la OCDE, "algo parecido a lo que ocurre con los años de escolaridad". Sin embargo, fundó sus esperanzas, en que "esta situación está cambiando rápidamente, por lo que no hay que desperdiciar lo ya conseguido entre todos". Con datos de 2002, el 58% de los españoles no cursó el bachillerato y sólo un 17% tenía esos estudios o algunos equivalentes. Tiana afirmó que "los resultados obtenidos superan ligeramente a los esperados en un país con el nivel socioeconómico y cultural de España". Las pobres calificaciones que sacan los alumnos tendrían su cara amable, a juicio del Ministerio, en "la buena tasa de equidad" que se consigue", lo que indicaría que los resultados "no dependen tanto de la situación de origen de los estudiantes". El ministerio coincide con las opiniones del estudio PISA donde "el gasto educativo es condición necesaria pero no suficiente" para alcanzar el éxito; pero reconoce que la "tarea pendiente es aumentar el dinero que se dedica a educación". En la actualidad España destina 5.385 dólares por alumno mientras que la media de la OCDE es de 6.821. "La ministra [María Jesús San Segundo, que no estuvo en la rueda de prensa] "ya ha expresado su compromiso de que habrá una memoria económica con el coste de aplicación de la ley", afirmó Tiana. Un esfuerzo, añadió, que "también deben hacer las comunidades autónomas, responsables del 93% del gasto educativo". Añadió que se "promoverá un un acuerdo para que entre todos se incremente el gasto en educación". "Aspirar a más" Tiana lamentó que un 8% de los alumnos no pasen del nivel más bajo de todos los considerados en estas pruebas y que haya pocos chicos en los niveles de excelencia. "Debemos aspirar a más". Lo que más complace en el ministerio es que las recomendaciones de la OCDE "coinciden con muchas de las propuestas" que recoge el documento presentado por Educación para debatir los próximos cambios educativos. Citó Tiana la atención especial a la educación infantil, la necesidad de diagnosticar y abordar los problemas cuando surgen, la preocupación por los alumnos de menor rendimiento, la autonomía de los centros y la formación del profesorado, entre otras. Los datos que ahora menciona el informe PISA se recogieron en los institutos en 2003, pero Tiana no quiso mirar atrás. "No nos importa cuándo se tomaron los datos, no queremos sacar otra conclusión que no sea para mejorar". La secretaria de Política Social y de Bienestar del PP, Sandra Moneo, sí miró hacia atrás, hasta 1990, año en que se aprobó la LOGSE. Relacionó los resultados de los alumnos con el "fracaso" de esta ley. Esto "confirma la necesidad de llevar a cabo una reforma en profundidad" y es la evidencia de que la reforma del PP "no fue un capricho".
- 64 -
GRÁFICOS Y TABLAS
Regresión lineal múltiple: Regresión lineal múltiple con variable dependiente “rendimiento en matemáticas”
Variables introducidas/eliminadas b
Índexsocioeconòmic i cultural,Castella-Lleó, Gènere,Publico oprivado,Altresregions,Euskadi
a
. Introducir
Modelo1
Variablesintroducidas
Variableseliminadas Método
Todas las variables solicitadas introducidasa.
Variable dependiente: Factor 1: Rendimenten matemàtiques
b.
Resumen del modelo b
,397a ,158 ,157 ,91045973Modelo1
R R cuadradoR cuadradocorregida
Error típ. de laestimación
Variables predictoras: (Constante), Índex socioeconòmic icultural, Castella-Lleó, Gènere, Publico o privado, Altresregions, Euskadi
a.
Variable dependiente: Factor 1: Rendiment enmatemàtiques
b.
ANOVAb
1617,289 6 269,548 325,173 ,000a
8642,496 10426 ,829
10259,786 10432
Regresión
Residual
Total
Modelo1
Suma decuadrados gl
Mediacuadrática F Sig.
Variables predictoras: (Constante), Índex socioeconòmic i cultural, Castella-Lleó,Gènere, Publico o privado, Altres regions, Euskadi
a.
Variable dependiente: Factor 1: Rendiment en matemàtiquesb.
Coeficientes a
-,032 ,036 -,868 ,385
,074 ,028 ,036 2,658 ,008 ,442 2,265
-,029 ,028 -,014 -1,024 ,306 ,447 2,237
,163 ,033 ,057 4,886 ,000 ,588 1,701
,113 ,018 ,057 6,335 ,000 ,999 1,001
-,191 ,019 -,096 -10,117 ,000 ,896 1,116
,349 ,009 ,345 37,071 ,000 ,931 1,074
(Constante)
Euskadi
Altres regions
Castella-Lleó
Gènere
Publico o privado
Índex socioeconòmic icultural
Modelo1
B Error típ.
Coeficientes noestandarizados
Beta
Coeficientesestandarizad
os
t Sig. Tolerancia FIV
Estadísticos decolinealidad
Variable dependiente: Factor 1: Rendiment en matemàtiquesa.
- 65 -
Diagnósticos de colinealidad a
3,501 1,000 ,00 ,01 ,01 ,01 ,01 ,02 ,01
1,118 1,770 ,00 ,10 ,05 ,00 ,00 ,01 ,26
1,003 1,869 ,00 ,02 ,03 ,41 ,00 ,00 ,00
,856 2,022 ,00 ,05 ,08 ,00 ,00 ,00 ,63
,358 3,127 ,01 ,00 ,07 ,05 ,01 ,92 ,09
,123 5,337 ,01 ,56 ,53 ,36 ,35 ,01 ,00
,041 9,277 ,98 ,26 ,23 ,17 ,63 ,03 ,00
Dimensión1
2
3
4
5
6
7
Modelo1
AutovalorIndice decondición (Constante) Euskadi Altres regions Castella-Lleó Gènere
Publico oprivado
Índexsocioeconòmic i cultural
Proporciones de la varianza
Variable dependiente: Factor 1: Rendiment en matemàtiquesa.
Estadísticos sobre los residuos a
-1,33010 1,0901618 ,0095522 ,39374050 10433
-3,402 2,744 ,000 1,000 10433
,018 ,040 ,023 ,004 10433
-1,32900 1,0900228 ,0095520 ,39373472 10433
-3,82528 3,132190 ,00000000 ,91019786 10433
-4,201 3,440 ,000 1,000 10433
-4,202 3,441 ,000 1,000 10433
-3,82693 3,133594 ,00000016 ,91081043 10433
-4,206 3,443 ,000 1,000 10433
3,270 19,381 5,999 2,321 10433
,000 ,003 ,000 ,000 10433
,000 ,002 ,001 ,000 10433
Valor pronosticado
Valor pronosticado tip.
Error típico del valorpronosticado
Valor pronosticadocorregido
Residuo bruto
Residuo tip.
Residuo estud.
Residuo eliminado
Residuo eliminado estud.
Dist. de Mahalanobis
Distancia de Cook
Valor de influenciacentrado
Mínimo Máximo MediaDesviación
típ. N
Variable dependiente: Factor 1: Rendiment en matemàtiquesa.
- 66 -
Gráficos de regresión parciales:
- 67 -
**Como podemos apreciar en los tres gráficos anteriores, la distribución de los casos se reparte en tres grupos bien diferenciados cuando en realidad debería repartirse en dos. Cabe recordar que estas variables son dummies y por lo tanto la distribución en grupos debería ser en dos grupos: los pertenecientes a aquella determinada región y por otro lado, los no pertenecientes. A pesar de ello, como ya hemos dicho, los distintos gráficos muestran un grupo de más. Sin embargo, y como podemos apreciar a través de las tablas de frecuencias de abajo, vemos como todo es normal y por consiguiente, la distribución anterior no viene dada por ningún error que hayamos podido generar nosotros en el tratamiento de los datos.
Adjudicated sub-region
3900 36,1 36,1 36,1
1490 13,8 13,8 49,9
1516 14,0 14,0 64,0
3885 36,0 36,0 100,0
10791 100,0 100,0
Spain: Other regions
Spain: Castilia y Leon
Spain: Catalonia
Spain: Basque Country
Total
VálidosFrecuencia Porcentaje
Porcentajeválido
Porcentajeacumulado
- 68 -
Otras regiones
6891 63,9 63,9 63,9
3900 36,1 36,1 100,0
10791 100,0 100,0
Cataluña, Castillao País Vasco
Otras regiones
Total
VálidosFrecuencia Porcentaje
Porcentajeválido
Porcentajeacumulado
Castilla y León
9301 86,2 86,2 86,2
1490 13,8 13,8 100,0
10791 100,0 100,0
Otras regiones
Castilla y León
Total
VálidosFrecuencia Porcentaje
Porcentajeválido
Porcentajeacumulado
País Basc dicotòmica
6906 64,0 64,0 64,0
3885 36,0 36,0 100,0
10791 100,0 100,0
fora d'Euskadi
Euskadi
Total
VálidosFrecuencia Porcentaje
Porcentajeválido
Porcentajeacumulado
- 69 -
Construcción factor “rendimiento global”:
Comunalidades
,793 ,910
,677 ,725
,747 ,806
Factor 1: Rendiment enmatemàtiques
FACTOR 1 per a ciències
FACTOR 1 ressolucióproblemes
Inicial Extracción
Método de extracción: Máxima verosimilitud.
Varianza total explicada
2,622 87,406 87,406 2,440 81,343 81,343
,242 8,066 95,473
,136 4,527 100,000
Factor1
2
3
Total% de lavarianza % acumulado Total
% de lavarianza % acumulado
Autovalores inicialesSumas de las saturaciones al cuadrado
de la extracción
Método de extracción: Máxima verosimilitud.
- 70 -
Matriz factorial a
,954
,851
,898
Factor 1: Rendiment enmatemàtiques
FACTOR 1 per a ciències
FACTOR 1 ressolucióproblemes
1
Factor
Método de extracción: Máxima verosimilitud.
1 factores extraídos. Requeridas 4 iteraciones.a.
Regresión lineal múltiple con variable dependiente “rendimiento global”:
Variables introducidas/eliminadas b
Índexsocioeconòmic i cultural,Castella-Lleó, Gènere,Publico oprivado,Altresregions,Euskadi
a
. Introducir
Modelo1
Variablesintroducidas
Variableseliminadas Método
Todas las variables solicitadas introducidasa.
Variable dependiente: Rendiment total de l´alumneb.
Resumen del modelo b
,404a ,163 ,163 ,88417759Modelo1
R R cuadradoR cuadradocorregida
Error típ. de laestimación
Variables predictoras: (Constante), Índex socioeconòmic icultural, Castella-Lleó, Gènere, Publico o privado, Altresregions, Euskadi
a.
Variable dependiente: Rendiment total de l´alumneb.
ANOVAb
1591,727 6 265,288 339,343 ,000a
8150,734 10426 ,782
9742,461 10432
Regresión
Residual
Total
Modelo1
Suma decuadrados gl
Mediacuadrática F Sig.
Variables predictoras: (Constante), Índex socioeconòmic i cultural, Castella-Lleó,Gènere, Publico o privado, Altres regions, Euskadi
a.
Variable dependiente: Rendiment total de l´alumneb.
- 71 -
Coeficientes a
,095 ,035 2,704 ,007
,009 ,027 ,005 ,344 ,731 ,442 2,265
-,051 ,027 -,025 -1,881 ,060 ,447 2,237
,144 ,032 ,052 4,438 ,000 ,588 1,701
,055 ,017 ,029 3,188 ,001 ,999 1,001
-,204 ,018 -,106 -11,167 ,000 ,896 1,116
,350 ,009 ,355 38,197 ,000 ,931 1,074
(Constante)
Euskadi
Altres regions
Castella-Lleó
Gènere
Publico o privado
Índex socioeconòmic icultural
Modelo1
B Error típ.
Coeficientes noestandarizados
Beta
Coeficientesestandarizad
os
t Sig. Tolerancia FIV
Estadísticos decolinealidad
Variable dependiente: Rendiment total de l´alumnea.
Diagnósticos de colinealidad a
3,501 1,000 ,00 ,01 ,01 ,01 ,01 ,02 ,01
1,118 1,770 ,00 ,10 ,05 ,00 ,00 ,01 ,26
1,003 1,869 ,00 ,02 ,03 ,41 ,00 ,00 ,00
,856 2,022 ,00 ,05 ,08 ,00 ,00 ,00 ,63
,358 3,127 ,01 ,00 ,07 ,05 ,01 ,92 ,09
,123 5,337 ,01 ,56 ,53 ,36 ,35 ,01 ,00
,041 9,277 ,98 ,26 ,23 ,17 ,63 ,03 ,00
Dimensión1
2
3
4
5
6
7
Modelo1
AutovalorIndice decondición (Constante) Euskadi Altres regions Castella-Lleó Gènere
Publico oprivado
Índexsocioeconòmic i cultural
Proporciones de la varianza
Variable dependiente: Rendiment total de l´alumnea.
Estadísticos sobre los residuos a
-1,35582 1,0827148 ,0093536 ,39061645 10433
-3,495 2,748 ,000 1,000 10433
,018 ,039 ,023 ,004 10433
-1,35475 1,0826334 ,0093533 ,39061170 10433
-4,10487 2,980707 ,00000000 ,88392328 10433
-4,643 3,371 ,000 1,000 10433
-4,645 3,373 ,000 1,000 10433
-4,10840 2,983379 ,00000035 ,88451856 10433
-4,649 3,374 ,000 1,000 10433
3,270 19,381 5,999 2,321 10433
,000 ,003 ,000 ,000 10433
,000 ,002 ,001 ,000 10433
Valor pronosticado
Valor pronosticado tip.
Error típico del valorpronosticado
Valor pronosticadocorregido
Residuo bruto
Residuo tip.
Residuo estud.
Residuo eliminado
Residuo eliminado estud.
Dist. de Mahalanobis
Distancia de Cook
Valor de influenciacentrado
Mínimo Máximo MediaDesviación
típ. N
Variable dependiente: Rendiment total de l´alumnea.
- 72 -
Gráficos regresión parciales:
- 73 -
- 74 -
- 75 -
SINTAXIS
Factor variable “rendimiento en matemáticas”, “reso lución de problemas” y “ciencias”: **Análisis factor “rendimiento en matemáticas” FACTOR /VARIABLES pv1math pv2math pv3math pv4math pv5math pv1math1 pv2math1 pv3math1 pv4math1 pv5math1 pv1math2 pv2math2 pv3math2 pv4math2 pv5math2 pv1math3 pv2math3 pv3math3 pv4math3 pv5math3 pv1math4 pv2math4 pv3math4 pv4math4 pv5math4 /MISSING LISTWISE /ANALYSIS pv1math pv2math pv3math pv4math pv5math pv1math1 pv2math1 pv3math1 pv4math1 pv5math1 pv1math2 pv2math2 pv3math2 pv4math2 pv5math2 pv1math3 pv2math3 pv3math3 pv4math3 pv5math3 pv1math4 pv2math4 pv3math4 pv4math4 pv5math4 /PRINT INITIAL EXTRACTION /PLOT EIGEN /CRITERIA FACTORS(2) ITERATE(25) /EXTRACTION ML /ROTATION NOROTATE /SAVE REG(ALL) . **Análisis factor “ciencias” FACTOR /VARIABLES pv1scie pv2scie pv3scie pv4scie pv5scie /MISSING LISTWISE /ANALYSIS pv1scie pv2scie pv3scie pv4scie pv5scie /PRINT INITIAL EXTRACTION /PLOT EIGEN /CRITERIA FACTORS(1) ITERATE(25) /EXTRACTION ML /ROTATION NOROTATE /SAVE REG(ALL) . **Análisis factor “resolución de problemas” FACTOR /VARIABLES pv1prob pv2prob pv3prob pv4prob pv5prob /MISSING LISTWISE /ANALYSIS pv1prob pv2prob pv3prob pv4prob pv5prob /PRINT INITIAL EXTRACTION /PLOT EIGEN /CRITERIA FACTORS(1) ITERATE(25) /EXTRACTION ML /ROTATION NOROTATE /SAVE REG(ALL) .
Descriptivos y justificación independientes: **Histograma variable “rendimiento en matemáticas” VARIABLES=FAC1_mates /FORMAT=NOTABLE /HISTOGRAM NORMAL /ORDER= ANALYSIS .
- 76 -
**Frecuencias variable “sub-región” FREQUENCIES VARIABLES=subnatio /ORDER= ANALYSIS . EXAMINE VARIABLES=FAC1_mates BY sex /PLOT=BOXPLOT/STATISTICS=NONE/NOTOTAL. **Histograma variable “rendimiento en matemáticas” con variable “género” GRAPH /HISTOGRAM(NORMAL)=FAC1_mates /PANEL ROWVAR=sex ROWOP=CROSS . **Gráfico de dispersión variable “ciencias” con la variable “rendimiento en matemáticas” GRAPH /SCATTERPLOT(BIVAR)=FAC1_1SCIE WITH FAC1_mates /MISSING=LISTWISE . **Gráfico de dispersión de la variable “resolución de problemas” con la variable “rendimiento en matemáticas” GRAPH /SCATTERPLOT(BIVAR)=FAC1_1PROB WITH FAC1_mates /MISSING=LISTWISE . **Gráfico de dispersion de la variable “índice socioeconómico y cultural” y la variable “rendimiento en matemáticas” GRAPH /SCATTERPLOT(BIVAR)=escs WITH FAC1_mates /MISSING=LISTWISE . **Correlación de la variable “rendimiento en matemáticas” con las variables “índice socioeconómico y cultural”, “resolución de problemas” y “ciencias” CORRELATIONS /VARIABLES=FAC1_mates with escs FAC1_1PROB FAC1_1SCIE /PRINT=TWOTAIL NOSIG /MISSING=PAIRWISE . **Correlación de la variable “rendimiento en matemáticas” con las variables “país vasco”, “género”, “público / privado”, “otras regiones” y “castilla” CORRELATIONS /VARIABLES=FAC1_mates with Euskadi sex sc03q01 otraregion castilla /PRINT=TWOTAIL NOSIG /MISSING=PAIRWISE .
Contrastando hipótesis 1: **Gráfico de dispersion de la variable “rendimiento en matemáticas” con la variable “mínutos de matemáticas” GRAPH /SCATTERPLOT(BIVAR)=mmins WITH FAC1_mates
- 77 -
/MISSING=LISTWISE . **Correlación de la variable “rendimiento en matemáticas” con la variable “minutos de matemáticas” CORRELATIONS /VARIABLES=FAC1_mates with mmins /PRINT=TWOTAIL NOSIG /MISSING=PAIRWISE .
Cluster análisis: **Creación del conglomerado de k-medias QUICK CLUSTER FAC1_mates /MISSING=LISTWISE /CRITERIA= CLUSTER(3) MXITER(10) CONVERGE(0) /METHOD=KMEANS(NOUPDATE) /SAVE CLUSTER DISTANCE /PRINT INITIAL. **Tabla de frecuencias de la variable “k-means en 3 categorías” FREQUENCIES VARIABLES=QCL_5 /ORDER= ANALYSIS . **Tabla de contingencia entre la variable “k-means en 3 categorías” y la variable “sub-región” CROSSTABS /TABLES=QCL_5 BY subnatio /FORMAT= AVALUE TABLES /CELLS= COUNT ROW SRESID /COUNT ROUND CELL . **Tabla de contingencia entre la variable “k-means en 3 categorías” y la variable “género” CROSSTABS /TABLES=QCL_5 BY sex /FORMAT= AVALUE TABLES /CELLS= COUNT ROW SRESID /COUNT ROUND CELL . **Tabla de contingencia entre la variable “k-means en 3 categorías” y la variable “público / privado” CROSSTABS /TABLES=QCL_5 BY sc03q01 /FORMAT= AVALUE TABLES /CELLS= COUNT ROW SRESID /COUNT ROUND CELL .
- 78 -
Regresión múltiple: **Regresión lineal múltiple por capas. La variable dependiente es nuestro factor “rendimiento en matemáticas”. En la primera capa hemos introducido las variables “país vasco”, “otras regiones” y “castilla”. En la capa dos hemos introducido las variables “género” y “público y privado”. Por último, en tercera capa está la variable “índice socioeconómico y cultural”. REGRESSION /MISSING LISTWISE /STATISTICS COEFF OUTS R ANOVA COLLIN TOL /CRITERIA=PIN(.05) POUT(.10) /NOORIGIN /DEPENDENT FAC1_mates /METHOD=ENTER Euskadi otraregion castilla st03q01 publico escs /PARTIALPLOT ALL /SCATTERPLOT=(*ZRESID ,*ADJPRED ) /RESIDUALS HIST(ZRESID) NORM(ZRESID) . **Factor del “rendimiento global” (“rendimiento en matemáticas” + “rendimiento en ciencias” + “rendimiento en resolución de problemas”) FACTOR /VARIABLES FAC1_mates factor1_ciencias factor1_problem /MISSING LISTWISE /ANALYSIS FAC1_mates factor1_ciencias factor1_problem /PRINT INITIAL EXTRACTION /PLOT EIGEN /CRITERIA MINEIGEN(1) ITERATE(25) /EXTRACTION ML /ROTATION NOROTATE /SAVE REG(ALL) . **Regresión lineal múltiple por capas. La variable dependiente es nuestro factor “rendimiento global”. En la primera capa hemos introducido las variables “país vasco”, “otras regiones” y “castilla”. En la capa dos hemos introducido las variables “género” y “público y privado”. Por último, en tercera capa está la variable “índice socioeconómico y cultural”. REGRESSION /MISSING LISTWISE /STATISTICS COEFF OUTS R ANOVA COLLIN TOL /CRITERIA=PIN(.05) POUT(.10) /NOORIGIN /DEPENDENT FAC1_1 /METHOD=ENTER Euskadi otraregion castilla st03q01 publico escs /PARTIALPLOT ALL /SCATTERPLOT=(*ZRESID ,*ADJPRED ) /RESIDUALS HIST(ZRESID) NORM(ZRESID) .