UNIVERSIDAD DE SALAMANCA
Departamento de Estadística
Máster en Análisis Avanzado de Datos Multivariantes
Trabajo Fin de Máster
ANÁLISIS MULTIVARIANTE DE LA
POBREZA Y LA EXCLUSIÓN SOCIAL
EN ESPAÑA
AUTORA: SILVIA GASTÓN GUIU
TUTORA: MARÍA PURIFICACIÓN VICENTE GALINDO
2016
Dpto. de Estadística
Universidad de Salamanca
MARÍA PURIFICACIÓN VICENTE GALINDO
Profesora Contratada Doctora del Departamento de Estadística de la Universidad de
Salamanca
CERTIFICA que D./D.ª Silvia Gastón Guiu ha realizado en la Universidad de
Salamanca, bajo su dirección, el trabajo que para optar título de Máster en Análisis
Avanzado de Datos Multivariantes presenta con el título Análisis multivariante de la
pobreza y la exclusión social en España, autorizando expresamente su lectura y
defensa.
Y para que conste, firma el presente certificado en Salamanca a 14 de julio de 2016.
María Purificación Vicente Galindo
Análisis multivariante de la pobreza y la
exclusión social en España
Dpto. de Estadística Universidad de Salamanca
Trabajo para optar al título de Máster en
Análisis Avanzado de Datos Multivariantes
por la Universidad de Salamanca.
Presenta:
Silvia Gastón Guiu
Salamanca, 2016
AGRADECIMIENTOS
A mi familia por ser mi sustento cada día.
A la Doctora María Purificación Vicente Galindo por su ayuda tanto profesional como
personal, y apoyo como tutora del trabajo, por guiarme en este proyecto y siempre
confiar en mí, sin sus ánimos y sus consejos este proyecto no habría podido
realizarse.
A Diana Donají del Callejo Canal por su gran ayuda, conocimiento y tiempo dedicado.
Gracias por enseñarme que la casa no se construye por el tejado.
A los miembros del Departamento de Estadística por haberme transmitido una
pequeña parte de sus conocimientos y así poder seguir avanzando en mi futuro
profesional.
A mis compañeros, ahora amigos, que han puesto sonrisas incluso en los días más
grises.
A M. por apoyarme y no dejar que me derrumbe.
RESUMEN
En el presente trabajo se muestran los resultados del análisis de la pobreza y de la
exclusión social en España a partir de los datos proporcionadas por el INE en la
Encuesta de Condiciones de Vida del 2014.
Generalmente, la literatura enfocada al análisis de la pobreza se basa, únicamente, en
la cuantificación del porcentaje de pobres a partir de la introducción de los umbrales de
pobreza, los cuales funcionan como una línea que delimita dos estados; ser pobre o
no pobre. Sin embargo, en un intento de superación de la mera cuantificación y de
suma a las investigaciones que tratan de dejar atrás lo anteriormente descrito, se
introduce el término de exclusión.
La introducción de este concepto permite conocer las circunstancias desfavorables en
las condiciones de vida básicas que, de algún modo, son compartidas y asumidas por
los individuos de una determinada población.
Es por ello que, el análisis conjunto de ambos conceptos permite ampliar la mirada
sobre la generación y origen de las desigualdades sociales que impiden una vida
cohesionada.
Dicho esto, se ha realizado la medición de la pobreza desde el enfoque objetivo de la
pobreza relativa y para la exclusión social, desde el enfoque multidimensional, se
presentan distintas dimensiones de análisis seleccionadas a partir del consenso
científico, que con la ayuda de distintas técnicas estadísticas multivariantes se han
podido obtener los perfiles, a partir de la asociación de diferentes categorías, que
describen diferentes situaciones de desigualdad y una comparación, en términos de
desigualdades, entre las distintas Comunidades Autónomas de España.
Palabras clave: Exclusión social, pobreza, análisis discriminante, HOMALS, HJ Biplot
ÍNDICE
1. INTRODUCCIÓN ......................................................................................... 1
1.1Marco teórico ............................................................................................. 2
1.1.1Orígenes del concepto ......................................................................... 2
1.1.2 ¿Qué se entiende por exclusión social? ............................................. 3
1.1.3 El concepto de pobreza y la medición de la pobreza relativa ............. 5
1.1.4 La noción de vulnerabilidad ................................................................ 7
1.1.5 Dimensiones de análisis ..................................................................... 8
2. OBJETIVOS ............................................................................................... 11
3. MATERIAL Y MÉTODOS .......................................................................... 12
3.1 Aspectos generales de la ECV................................................................ 12
3.2 Estructura de la encuesta ....................................................................... 14
3.3 Base de datos ......................................................................................... 14
3.4 Métodos estadísticos .............................................................................. 27
3.4.1 Análisis discriminante ....................................................................... 27
3.4.2 Análisis de la homogeneidad ............................................................ 31
3.4.3 Métodos Biplot .................................................................................. 34
4. RESULTADOS .......................................................................................... 37
4.1 Análisis descriptivos ................................................................................ 37
4.2 Resultados análisis discriminantes ......................................................... 43
4.3 Resultados HOMALS .............................................................................. 61
4.4 Resultados HJ Biplot ............................................................................... 80
5. DISCUSIÓN ............................................................................................... 83
6. CONCLUSIONES ...................................................................................... 85
7. BIBLIOGRAFÍA .......................................................................................... 88
ÍNDICE DE TABLAS
Tabla 1. Autovalores Análisis Discriminante de Pobreza ............................................ 44
Tabla 2. Lambda de Wilks. Análisis Discriminante pobreza ........................................ 46
Tabla 3. Coeficientes. Análisis discriminante pobreza ................................................. 47
Tabla 4. Matriz estructura Análisis Discriminante pobreza .......................................... 48
Tabla 5. Tabla de centroides AD pobreza ................................................................... 49
Tabla 6. Clasificación AD pobreza .............................................................................. 49
Tabla 7. Medias de los grupos en las variables cuantitativas. ..................................... 51
Tabla 8. Autovalores. Análisis discriminante CC.AA. y porcentaje de pobreza ........... 52
Tabla 9. Lambda de Wilks. AD CC.AA. y porcentaje de pobreza ................................ 54
Tabla 10. Coeficientes de las funciones discriminantes .............................................. 55
Tabla 11. Matriz estructura. AD CC.AA y porcentaje pobreza ..................................... 56
Tabla 12. Centroides. AD CC.AA y porcentaje pobreza .............................................. 57
Tabla 13. Clasificación AD CCAA y porcentaje pobreza ............................................. 58
Tabla 14. Resumen del modelo Análisis de la Homogeneidad .................................... 62
Tabla 15. Cuantificaciones dimensiones de la exclusión social y pobreza .................. 65
Tabla 16. Medidas de discriminación .......................................................................... 66
Tabla 17. Resumen del II modelo HOMALS. .............................................................. 69
Tabla 18. Cuantificaciones .......................................................................................... 71
Tabla 19. Medidas de discriminación de Pobreza y variables sociodemográficas ....... 72
Tabla 20. Resumen del modelo III HOMALS .............................................................. 75
Tabla 21. Cuentificaciones .......................................................................................... 76
Tabla 22. Medidas de discriminación Sexo y dimensiones de la exclusión social ....... 77
ÍNDICE DE GRÁFICOS
Gráfico 1. Análisis descriptivo: Edad ........................................................................... 37
Gráfico 2. Análisis descriptivo: Estado civil ................................................................. 38
Gráfico 3. Análisisd descriptivo: Pobreza relativa ........................................................ 39
Gráfico 4. Análisis descriptivo: Situación laboral ......................................................... 40
Gráfico 5. Análisis descriptivo: Nivel educativo ........................................................... 41
Gráfico 6. Análisis descriptivo: Estado de salud .......................................................... 41
Gráfico 7. Funciones discriminantes canónicas (Pobreza) .......................................... 50
Gráfico 8. Funciones discriminantes canónicas Comunidades Autónomas y
porcentaje pobreza ..................................................................................................... 58
Gráfico 9. Medidas de discriminación análisis I HOMALS ........................................... 67
Gráfico 10. Categorías conjuntas. Pobreza y dimensiones de la exclusión social ....... 68
Gráfico 11. Medidas de discriminación. Análisis II HOMALS ....................................... 73
Gráfico 12. Categorías conjuntas. Sociodemográficas y pobreza ............................... 74
Gráfico 13. Medidad de discriminación análisis III HOMALS ....................................... 78
Gráfico 14. Categorías conjuntas. Sexo y dimensiones de exclusión social. ............... 79
Gráfico 15. HJ Biplot. Comunidades Autónomas y dimensiones de la exclusión
social (ejes 1-2) .......................................................................................................... 80
ÍNDICE DE ILUSTRACIONES
Ilustración 1. Mapa de España según porcentaje de pobreza (CC.AA.) ...................... 59
Ilustración 2. Mapa de España según umbrales de pobreza ....................................... 61
1
1. INTRODUCCIÓN
Hace tan solo algunas décadas que la investigación social sitúa su interés teórico y
analítico en la exclusión social. No es porque se trate de una cuestión baladí, sino
porque existían otros recursos explicativos que lograban explicar un todo. Se podría
aquí aludir a la pobreza y, es que este concepto albergaba en sí mismo todo tipo de
explicaciones y mecanismos para lograr explicar todo tipo de desigualdades.
Bien, hoy esto ha cambiado y la exclusión social ha pasado de no ser considerada a
situarse en cada vez más investigaciones. Debido a ese cambio y al protagonismo que
encarna este concepto en la época actual se viene enfatizando que sea el estudio de
ésta la que recoja todo aquello que anteriormente hacía la pobreza. Es decir, que sea
capaz de albergar todas las formas de desigualdad que truncan la consecución de las
condiciones de vida aceptadas y extendidas en una población determinada. (Maciá et
al., 2009) (Laparra et al,. 2007). Por tanto, se espera que este concepto de respuesta
a las nuevas formas de desigualdad social (Subirats, Gomà, & Brugué, 2005a),
No se trata de una lucha de conceptos en la que sólo puede sobrevivir y permanecer
uno de ellos, sino que se ha de buscar la forma de integrarlos para llegar a una
explicación más amplia.
Por tanto, se adopta la medición de la pobreza en términos relativos para conocer la
desigualdad propiciada por la distribución de los ingresos y, se escogen una serie de
dimensiones, consensuadas en términos generales por la comunidad científica, para
explicar las desigualdades cuyo origen no se sitúa detrás de un prisma puramente
económico. El estudio conjunto, pero diferenciado, enriquece el análisis porque
permite detectar diversas situaciones de pobreza y de exclusión. Por ejemplo,
situaciones de empobrecimiento pero no exclusión y viceversa. Permitiendo identificar
un estado, pobreza, con un proceso, exclusión social (Ortiz, 2015) que se producen en
las sociedades actuales y postindustriales (Marco, 2000)
Ambos fenómenos se analizarán a partir de los microdatos de la Encuesta de
Condiciones de Vida del año 2014 elaborada por el INE por ser la máxima fuente de
datos para el análisis de dicha temática a nivel nacional.
2
La realización del presente trabajo viene justificada por la consideración e interés por
demostrar que la desigualdad no solo se traduce o viene dada por una distribución
desigual de los ingresos, sino que también puede expresarse por un conjunto de
desventajas que no quedan reflejadas en la medición de variables monetarias con el
fin de conseguir una explicación e identificación global sobre ambos.
1.1 Marco teórico
1.1.1 Orígenes del concepto
El concepto de exclusión social comenzó a emplearse en Francia en la década de los
años 70. En concreto, su origen se le atribuye a R. Lenoir, Secretario de Estado de
Acción Social del gobierno de Chirac. En ese momento, la administración francesa
inició una serie de estudios para conocer el porcentaje de población excluida existente
en el país, con el objetivo de elaborar e implementar políticas específicas que
permitieran la inclusión de ese conjunto de personas y/o colectivos (Maciá et al.,
2009). Es a partir de este momento cuando el término salta a la esfera de la opinión
pública y cristaliza en el ámbito académico hasta que, finalmente, la Unión Europea lo
adoptó como nuevo eje de política social para superar las insuficiencias de la
pobreza.(Subirats, 2004)
El concepto fue recogido en la Comunidad Europea en el año 1989 con el fin de luchar
contra la exclusión social y la pobreza en el III Programa Europeo de Lucha contra la
Pobreza. (Fernández, 2011) cristalizándose, de este modo, la preocupación por la
erradicación de la exclusión social y la pobreza en las instituciones Europeas.
Actualmente, la Comisión Europea ha recogido en su agenda política, laboral y social
la lucha contra estos dos fenómenos mediante una estrategia llamada: Estrategia
2020.
Dicha estrategia ha hecho que los gobiernos europeos hayan confluido para marcarse
el objetivo de sacar de la pobreza y de la exclusión social a 20.000.000 de personas
en los próximos diez años. (Comisión Europea, 2011).
3
1.1.2 ¿Qué se entiende por exclusión social?
Así pues, se está ante un concepto joven, amplio y complejo siendo complicado
encontrar un marco teórico fuerte y una única definición consensuada por la
comunidad científica social. La suma de esas características hace que, en ocasiones,
su uso sea ambiguo e indistinto como sinónimo de conceptos clásicos como pobreza,
marginación y desigualdad (Marco, 2000) lo que conduce, a veces, a perder la noción
verdadera de lo que se está hablando.
En la producción de estudios sobre el concepto se puede apreciar la división en dos
formas de elaboración: Unos trabajan en la conceptualización del fenómeno y otros en
hacer de él algo operativo con el fin de dotarlo de utilidad para la detección de
situaciones de exclusión. (Raya, 2007)
En el panorama científico social español, era utilizado de manera esporádica debido a
que hasta hace poco tiempo no quedaba recogido en los diccionarios de esta área de
conocimiento (Marco, 2000), hasta haberse ganado un espacio en el que no están
claras las fronteras de sus dimensiones ni de los indicadores relevantes que miden el
fenómeno, pues no todos los autores conceden la misma importancia a las
dimensiones que quedan afectadas.(Maciá et al., 2009) Se trata, entonces, de un
fenómeno reciente sobre el que, actualmente, las Ciencias Sociales, en general, y la
Sociología en particular, están en pleno proceso de construcción y reconstrucción de
marcos teóricos y analíticos. Prueba contundente de que sea un concepto en
construcción es la aplicación del mismo a diferentes realidades sociales y la existencia
de una producción de definiciones infinitas. (Raya, 2007)
Sin embargo, sí existe consenso en caracterizar a la exclusión social como un
fenómeno de carácter multidimensional, procesual y causal. Multidimensional y causal
porque hace referencia a un conjunto de situaciones de desventajas y privaciones, ya
que no es un único factor lo que lleva a un individuo o colectivos a la exclusión, sino la
interacción entre varios factores. De manera que cuantos más factores y desventajas
acumulados mayor será el riesgo de exclusión. (Castel, 2004) imposibilitando el
acceso a todo tipo de recursos que favorecen el bienestar social (Subirats, Obradors,
García, & Canal, 2010). Y procesual porque no hace referencia a un estado final de los
individuos sino a un proceso que transcurre desde la integración, vulnerabilidad hasta
llegar a la exclusión (Maciá et al., 2009) (Raya, 2007).
De este modo, no ha de entenderse como un concepto que gira en torno a un
dualismo entre integración social y exclusión social, sino que se trata de un transcurso
4
en el tiempo que puede llevar desde la integración social plena, a la precariedad, de
ahí derivar a la vulnerabilidad (de la que con posterioridad se hablará) y, finalmente, a
la exclusión.
“Proceso de alejamiento progresivo de una situación de integración social en el
que pueden distinguirse diversos estadios en función de la intensidad: desde la
precariedad o vulnerabilidad más leve hasta las situaciones de exclusión más
graves” (García et al., 2008: 185)
Una de las definiciones que muestran el carácter multidimensional que se pueden
encontrar en la literatura es:
“La exclusión social no se explica con arreglo a una sola causa, ni tampoco sus
desventajas vienen solas: se presenta en cambio como un fenómeno
poliédrico, formado por la articulación de un cúmulo de circunstancias
desfavorables, a menudo fuertemente interrelacionadas.” (Subirats, Gomà, &
Brugué, 2005:13)
También se puede observar la definición de Sen, recogida por Macià et al., que dice
así:
“La exclusión social va más allá de la mera privación económica, es el
resultado de la combinación de una serie de factores procedentes de los
diferentes contextos en los que se producen los procesos de desarrollo e
integración de los seres humanos “(2009: 22)
Por lo tanto, tomando las palabras de Maciá, este concepto surge para hacer
referencia a un conjunto de situaciones que afectan a individuos o grupos, que se
alejan de la concepción clásica pobreza, ya que estas situaciones no sólo tienen que
ver con la privación o la desventaja en relación a los recursos económicos sino que da
respuesta a situaciones de desventaja no necesariamente de origen económico
(2010). A menudo exclusión social y pobreza han sido sinónimos, pero, aquí, son
concebidas como conceptos que se complementan y que incluso pueden, en
determinadas ocasiones, influirse o no, pues no toda persona pobre es excluida y
viceversa.
Una vez que se ha intentado el acercamiento y esclarecer la complejidad del concepto
es necesario contraponerlo con su opuesto con el fin de obtener un conocimiento más
claro del mismo. Por ello, no es posible hablar de exclusión sin considerar qué se
5
entiende por inclusión social: “Proceso dinámico y multifactorial que posibilita a las
personas participar del nivel mínimo de bienestar que es consistente con el desarrollo
alcanzado en un determinado país”. (Ottone et al., 2007:15)
1.1.3 El concepto de pobreza y la medición de la pobreza relativa
Como se ha dicho con anterioridad, en este trabajo, se va a estudiar la pobreza y la
exclusión social complementariamente con el fin de poder caracterizar mejor los
procesos de exclusión. La pobreza, también es un concepto complejo en el que
influyen multitud de factores y que puede ser estudiada desde diferentes
perspectivas.(INE, 2004)
A diferencia de lo que ocurre con el concepto anterior, la medición de la pobreza está
respaldada por un marco teórico y empírico fuerte, lo cual provoca que su medición se
ajuste a ciertos requisitos. (Larrañaga, 2007) No obstante, éste tampoco está exento
de complejidad pues en él intervienen muchos factores y puede ser estudiado desde
diferentes enfoques con el fin de ajustarlo a los objetivos fijados por el investigador.
La medición de la pobreza depende de la información utilizada, pues puede ser
subjetiva u objetiva, según los baremos utilizados, pobreza absoluta o pobreza
relativa, y, por último, depende de la temporalidad adoptada en el estudio dando como
producto el análisis de la pobreza transversal o la pobreza persistente.
Para el estudio de la pobreza desde una perspectiva subjetiva se ha de utilizar la
información de opinión de los informantes sobre su autopercepción de la situación y
capacidad económica. Sin embargo, desde la visión objetiva se empleará la
información derivada de variables observables y medibles (INE, 2004)
Dentro del estudio de la pobreza desde la objetividad hay dos formas de medirla; de
forma absoluta o relativa.
La pobreza absoluta identifica las situaciones de los individuos en las que las
necesidades básicas no están cubiertas a través de la medición del coste que supone
la adquisición de una cesta de productos esenciales para los individuos. Si bien,
carece de interés y de uso en los países desarrollados a diferencia de lo que ocurre en
países menos desarrollados en los que esta medida goza de una gran aceptación por
parte de los investigadores. Además es una medida sensible a los aumentos en la
coyuntura económica, ya que si dicha coyuntura protagoniza un aumento en los
niveles de renta el porcentaje de pobres disminuye.
6
En cuanto a la medición de la pobreza relativa se enfoca en detectar las situaciones de
desventaja económica, mediante la medición de las desigualdades en la distribución
de los ingresos. Así pues, distingue entre la población pobre de la población no pobre,
lo cual depende del grado de desarrollo de la sociedad analizada sin dejar opción a
trasladarla a otra sociedad. El grado de desarrollo permite la caracterización de los dos
tipos de población siendo diferente en cada país.
La pobreza relativa arroja como resultado el porcentaje de personas que poseen
buenas condiciones monetarias y el porcentaje de los que poseen malas condiciones
monetarias en relación a las características de su país. Si bien, con esta medida no se
puede obtener la situación sobre las condiciones de las personas pobres, sino que
obtenemos un resultado de la situación meramente económico.
Para ello, es necesario comentar de qué manera se mide y la importancia de la
adopción de ciertos requisitos.
La línea o umbral de la pobreza relativa se calcula a partir de la variable económica
seleccionada dividida por el número de miembros de cada hogar para obtener el
ingreso per cápita, como tradicionalmente se ha realizado, o dividida por unidades de
consumo, como se hace en los estudios de pobreza de la Unión Europea.
Utilizando las unidades de consumo se tienen en cuenta las economías de escala y la
existencia de unidades equivalentes en el hogar calculándose en base a una escala de
equivalencia, la cual determina qué parte del ingreso corresponde a cada miembro de
manera que se obtiene un ingreso medio por individuo de una forma coherente. Hay
varias escalas de equivalencia igualmente válidas, como por ejemplo, la escala de
Oxford, escala paramétrica y la escala de dos parámetros. Sin embargo en Europa, la
escala de equivalencia más utilizada es la de la OCDE modificada de 2008, la cual ha
sido aplicada en el presente estudio.
Por economía de escala, los expertos, aluden al tamaño del hogar y a que éste no
tiene por qué tener relación directa con un aumento en los ingresos totales del hogar y,
por lo tanto, a una mejora económica. Y por unidad de consumo (u.c) permite
diferenciar las pautas de consumo y necesidades de adultos y niños, es decir, permite
obtener el ingreso equivalente mediante la composición de edad. (Vidal, 2006), (Lasso,
2003) y (Ray, 2002)
Una vez que se han realizado los cálculos pertinentes se obtendrá la pobreza relativa
equivalente a cada unidad de consumo y se calculará la mediana de los valores
obtenidos en los cálculos anteriores. Esto quiere decir que se van a identificar como
7
pobres aquellos que queden por debajo de la media o mediana (Pérez, García, Trujillo,
& Espinosa, 2009) o dicho de otro modo, se declarará como pobre aquellos individuos
que se encuentren en una situación clara de desventaja económica respecto al resto
de individuos de su entorno. (INE, 2004) También, cuando se tiene el resultado de la
mediana se suelen aplicar porcentajes para generar diferentes umbrales de pobreza
que en el caso de la producción europea se fija en el sesenta por ciento de la
mediana. Dicho resultado se convertirá en la línea que separa a la población pobre de
la no pobre.
1.1.4 La noción de vulnerabilidad
Como ya se ha comentado, la exclusión es un fenómeno procesual que exige de la
noción del tiempo para transcurrir, de manera que se hace necesario la introducción
de otro concepto clave en el desarrollo del presente trabajo. Puesto que, a menudo, es
difícil encontrar situaciones de exclusión social grave en base a las fuentes de
información disponibles para su estudio y que permitirá un mejor acercamiento,
detección y caracterización de la situación de los individuos de la muestra.
El concepto al que se está aludiendo aquí es el de vulnerabilidad, la cual es entendida
como: (Perona & Rocchi, 2000) Todo conjunto de situaciones intermedias que
conllevan al riesgo de padecer la exclusión en un futuro, ya sea cercano o lejano. La
vulnerabilidad se puede expresar de dos maneras: Los vulnerados, los cuales estarían
en situación de pobreza y presentarían dificultades en cuanto al desarrollo pleno de
sus condiciones de vida y, por otro lado, los vulnerables que serían aquellos que
experimentarían una fragilidad en sus condiciones de vida en un futuro. Se relaciona la
vulnerabilidad con las condiciones de vida porque ésta también es un fenómeno
multidimensional y complejo que afecta y debilita los aspectos más básicos de la vida
en relación al equipamiento y provisión de bienes del hogar, a la inserción en el mundo
laboral, a los niveles de educación alcanzados, al acceso a los servicios públicos y a la
participación de la sociedad.
La vulnerabilidad hace que los individuos, hogares o colectivos queden expuestos a
alteraciones en sus niveles de vida ante determinados cambios que provocan la
situación de privación, eso sí, privación en menor medida que la experimentada en la
exclusión social.
8
1.1.5 Dimensiones de análisis
Ésta será la noción de pobreza relativa y la definición de exclusión que se toma como
referencia en este estudio. A continuación, para completar su comprensión, se van a
enumerar y explicar las siguientes dimensiones para analizar, atendiendo al consenso
de las mismas por parte de los expertos y adecuadas a la información extraíble de la
Encuesta de Condiciones de Vida elaborada por el INE, para analizarla. Estas
dimensiones se corresponden a “esos ejes transversales en los que construye la
inserción y la inclusión social -educación, salud, vivienda y trabajo” (Boira et al.,
2006:132), entre otras.
La reflexión en torno a la introducción de otras dimensiones responde a la necesidad
de estudiar el bienestar de las condiciones de vida de los individuos desde la
perspectiva económica y desde otras dimensiones independientes a ésta, las cuales
aluden a factores de exclusión social. Si dichas dimensiones se obviaran se estaría
cometiendo un sesgo en la medición del objetivo del presente análisis. Además, la
consideración de éstas proporcionan un enriquecimiento al análisis y una visión
completa puesto que a partir de las mismas se podrá hablar de qué parte de la
población española tiene problemas económicos (en términos de desigualdad
económica) junto a otros problemas de otra índole, o si sólo tiene problemas
económicos o sólo posee problemas de otra naturaleza.
“La decisión de las siguientes dimensiones hacen referencia a dimensiones de la vida
de las personas que sean constitutivas básicas de su bienestar en las que si se
aprecian carencias o privaciones provocan serias amenazas en las condiciones y
calidad de vida de los individuos.” (Larrañaga, 2007:9)
Dimensión económica: La dimensión principal para el estudio de la pobreza relativa
de la población objeto de estudio. Mediante la medición de la pobreza relativa se va a
poder determinar qué parte de la población es pobre, cuántos están en riesgo de
pobreza y qué individuos está por encima de la media de ingresos y, por tanto, gozan
de una situación económica lejos de la pobreza.
Dimensión laboral: La participación en el ámbito laboral es considerado como uno de
los principales factores de inclusión social, ya que permite la integración social, el
acceso a los recursos del Estado de Bienestar no universalizados… El contar con un
empleo remunerado, generalmente, permite procurarse unas condiciones de vida
dignas. (Pérez et al., 2009)
9
Dimensión educativa: El nivel educativo alcanzado está relacionado con la posición
social. Puesto que a ciertos niveles de educación obtenidos permite la adquisición de
competencias profesionales y personales que posibilitan la integración social. Además,
el nivel de estudios, generalmente, está ligado con la ocupación laboral desempeñada
en el futuro y con los beneficios económicos derivados de ésta. Esta dimensión no
solo contribuye a unos mejores, en principio, beneficios económicos, sino que
contribuye al conocimiento y valoración del propio individuo. A menudo la educación y
el nivel educativo alcanzado son asociados con el bienestar de las personas. Por ello,
parafraseando a Larrañaga, es necesario introducir la variable que permita rescatar la
información sobre las competencias académicas adquiridas de los individuos que sean
el objeto de estudio del análisis. (2007)
Dimensión salud: Gozar de un buen estado de salud está directamente relacionado
con el bienestar de las personas. Por tanto, un problema de salud puede provocar
limitaciones para desarrollar actividades diarias que deriven en un alejamiento de la
vida social. Y la garantía de acceso a la cobertura médica provoca la eliminación de
desigualdad de oportunidades en su acceso. De no suceder de este modo se estaría
ante un problema que derivaría en procesos de exclusión social. (Poza, 2008)
Dimensión vivienda: La vivienda es el lugar básico de bienestar de los individuos.
Por tanto, la tenencia de malas condiciones de la vivienda pueden actuar como
desencadenantes de situaciones de exclusión dificultando la integración social.
Además, la manutención de la misma puede llevar a un nivel de endeudamiento
posicionando a los individuos en situaciones de riesgo de exclusión social y de
pobreza.
Dimensión del entorno: Esta dimensión permite conocer las condiciones del entorno
donde está situada la vivienda de los individuos de la muestra. Ésta trata de ahondar
en problemas de delincuencia, contaminación, suciedad y ruidos. El cúmulo de este
conjunto de problemáticas podría influir en las condiciones de vida de los individuos y
en las oportunidades de gozar de una vida integrada.
Dimensión carencia material: Esta dimensión es la que va a permitir conocer qué
parte de la población española posee tenencia material de aquellos objetos y bienes
que son considerados, en el contexto actual, como básicos y de uso cotidiano y que
parte de la población no.
10
La estructura del presente trabajo se corresponde a los siguientes apartados:
Introducción: En este capítulo se recoge una pequeña introducción y un marco
teórico para la contextualización de los dos conceptos clave en este trabajo, pobreza y
exclusión social.
Material y métodos: En esta sección del trabajo se exponen los datos utilizados, las
variables empleadas para la medición del fenómeno y la fuente de datos utilizada.
Además se explican las técnicas estadísticas multivariantes utilizadas.
Resultados: Se presentan los resultados obtenidos de la aplicación de diferentes
técnicas estadísticas. En este caso, se presentan los resultados descriptivos, del
Análisis Discriminante, de HOMALS y HJ Biplot.
Discusión: En este capítulo se trata de contraponer y comparar los resultados
obtenidos con los resultados de otros estudios y/o análisis con el fin de crear una
visión global sobre el estado de la investigación.
Conclusiones: En el último capítulo se exponen las conclusiones derivadas de los
análisis realizados de manera detallada con la intención de responder a los objetivos
marcados en el trabajo.
11
2. OBJETIVOS
Objetivo general
Analizar mediante técnicas multivariantes estadísticas el estado de la pobreza y de la
exclusión social en la muestra de la encuesta a partir de las dimensiones propuestas
en el marco teórico.
Objetivos específicos:
-Realizar un análisis territorial a nivel autonómico con el fin de crear grupos en relación
a las similaridades encontradas en las diferentes dimensiones que miden la exclusión
social y en relación a la pobreza relativa para conocer en qué situación se encuentran
los diferentes territorios del mapa nacional.
- Detectar y caracterizar los grupos más vulnerables a la exclusión social en relación a
las variables seleccionadas con el fin de poder conocer qué colectivos son los que
más riesgo poseen.
12
3. MATERIAL Y MÉTODOS
Para analizar el objeto de estudio del presente trabajo se ha hecho uso de la Encuesta
de Condiciones de Vida (ECV), elaborada y publicada por el INE en el año 2014,
puesto que ésta permite medir los dos fenómenos a los que se alude.
El apartado de metodología se divide en varios subapartados en los que se va a
exponer los aspectos generales y la estructura de la encuesta. Así como la
construcción de la base de datos con la que se ha trabajado y las variables
seleccionadas para el estudio. Todo ello se explicará a partir de la información
obtenida en el informe metodológico de la ECV (INE, 2013), en el cuestionario de la
encuesta y otros documentos de trabajo (INE, 2004) proporcionados por el Instituto
Nacional de Estadística. Así como del informe metodológico estandarizado disponible
en la página web del Instituto. (INE, 2016)
3.1 Aspectos generales de la ECV
La ECV es la encuesta predecesora de la PHOGUE (1994-2001) que fue puesta en
marcha en el año 2004 hasta la actualidad con periodicidad anual. Además esta
encuesta pertenece al conjunto de operaciones estadísticas armonizadas para la
Unión Europea respaldada por el Reglamento (CE) Nº 1177/2003 del Parlamento
Europeo y del Consejo del 16 de Junio de 2003 relativo a las estadísticas comunitarias
sobre la renta y las condiciones de vida.
El principal objetivo que persigue esta encuesta es disponer de una fuente de datos
comparables acerca de las condiciones de vida, de la distribución de ingresos, de la
pobreza y de la exclusión social. Los datos pueden encontrarse medidos de forma
transversal y longitudinal, pero en ambos casos permiten la comparación a escala
nacional y europea, ya que sigue las recomendaciones y reglamentos comunitarios
que regulan la European Survey on Income and Living Conditions (EU-SILC) de
Eurostat establecidas para todos los países miembros.
Como unidad de muestreo toma la definición censal de vivienda familiar,
considerándose como unidad primaria de muestreo la sección censal y, como última,
la vivienda familiar principal. Por tanto, se incluyen todos los hogares privados
13
residentes en las viviendas familiares principales seleccionadas recogiéndose la
información mediante entrevistas personales.
En cuanto a las unidades de análisis hay dos. Por un lado, los hogares privados y por
otro lado, los individuos miembros de dichos hogares, puesto que todas las edades
forman parte de la población objetivo, pero sólo los mayores de 16 años pueden
responder al cuestionario.
El tipo de muestreo es de diseño de panel rotante en el que la forman 4 submuestras
independientes formando un panel de 4 años de duración renovándose la muestra,
cada año, en uno de los paneles. La elección de cada una de las submuestras se basa
en un muestreo de diseño bietápico con estratificación de las unidades de las
secciones censales (1ª etapa).
En cada Comunidad Autónoma las unidades de la 1ª etapa se agrupan en estratos
según el tamaño del municipio al que pertenece la sección proporcionándose una
muestra independiente a cada una que se representativa. De esta manera, la ECV
también proporciona datos de desagregación autonómica.
En cuanto al criterio temporal de las preguntas en la encuesta se ha de reseñar que
hay diferentes periodos temporales de referencia según las preguntas realizadas:
-Año anterior a la realización de la encuesta: A este periodo van referidas
aquellas preguntas relacionadas con los ingresos y rentas. Si la encuesta está
realizada en el año 2014 estas preguntas vienen referidas al año 2013.
-Momento actual: Criterio temporal utilizado en preguntas relacionadas con la
actividad laboral, por ejemplo.
-Periodo biográfico: Recoge información biográfica de los individuos, la cual es
diferente para cada persona.
-Semana de referencia: Semana inmediatamente anterior a la entrevista.
-Otros tiempos: Hacer referencia, entre otros, a los últimos 12 meses, las
últimas 4 semanas… Como puede darse el caso en las preguntas sobre la
situación de salud de los individuos o en el caso de retraso de pagos.
14
3.2 Estructura de la encuesta
En este caso se trabajará con la ECV del año 2014 que fue publicada en el año 2015.
El tamaño muestral de la encuesta es de 11966 hogares y 31623 individuos y, su
cuestionario recoge un total de 421 preguntas, incluyéndose en esta cifra las llamadas
variables “FLAGS”. Por variables “FLASG” se entiende como variables de control que
acompañan a las preguntas y que indican si los individuos han respondido o no lo han
hecho.
A su vez, las preguntas están distribuidas en cuatro ficheros. Dos de ellos referidos a
hogares y los otros dos a personas:
-Fichero D, en el que se encuentran preguntas referidas a los datos básicos de
los hogares colaboradores e información para identificar el hogar, localizarlo
geográficamente, el grado de urbanización de la zona, el año de la encuesta y
los factores de ponderación.
-Fichero R, donde se recoge la información básica de la persona, tanto de
adultos como de menores de edad proporcionando información para su
identificación en relación a la pertenencia a su hogar, información
demográfica…
-Fichero H, donde se encuentran los datos detallados del hogar a cerca de la
vivienda, renta, datos básicos del hogar, carencia material y otras variables
complementarias.
-Fichero P, el cual recoge un conjunto de datos, de forma detallada, sobre los
adultos. Como por ejemplo, información sobre aspectos educacionales,
preguntas sobre el estado de salud, aspectos laborales, renta y, por último, una
serie de preguntas que permiten evaluar la carencia material objetiva.
3.3 Base de datos
Para la elaboración de la base de datos, en un primer momento, se seleccionó un total
de 55 preguntas. Si bien tras una exhaustiva revisión de las mismas se procedió a la
eliminación de alguna de ellas y a la creación de nuevas variables a partir de las
originales, las cuales serán explicadas con posterioridad.
15
La base de datos está formada por un total de 26531 casos, individuos de 16 años en
adelante, y, finalmente, por 23 variables tomadas de los 4 ficheros de datos. Se
decidió trabajar con los 4 ficheros de datos simultáneamente mediante la fusión de los
ficheros con información de los hogares y de los individuos. Dicha decisión fue tomada
porque la unidad de análisis son los individuos, pero se quería rescatar información
relevante de los hogares para extraer el máximo rendimiento de la ECV.
Para realizar la fusión e imputar datos de los hogares a cada individuo las variables
utilizadas fueron: DB030 renombrada en la base de datos como “IDH” y RB030
renombrada como “IDI”, lo cual alude al identificador del hogar e identificador del
individuo, respectivamente.
El identificador del hogar proporciona un número a cada uno de ellos y el identificador
de los individuos se compone por un primer dígito que corresponde al identificador del
hogar seguido por dos dígitos que numeran a los individuos. Por tanto, proporciona un
número a cada individuo en relación a su pertenencia a un hogar.
Las variables que integran la base de datos se han seleccionado con el interés de
analizar y explicar cada una de las dimensiones que se expusieron en el marco teórico
además de un conjunto de variables sociodemográficas e identificativas de los
individuos:
Sexo (PB150/SEXO):
1 Varón
2 Mujer
Región (DB040/ CC.AA.): Renombrada en la base de datos como “CC.AA.” siendo
recodificada las 19 categorías pertenecientes a cada comunidad según las normas
ISO08 de identificación en base a dos letras (GA, AS, CB, PV, NC, RI, AR, MD, CL,
CM, EX, CT, VC, IB, AN, MC, CE, ML y CN).
A demás, a partir de la variable CC.AA y de la variable Pobreza relativa (PobRelativa)
se ha generado una nueva variable específicamente para el análisis discriminante:
REGCat: Se han creado cinco grupos a partir del cálculo de la línea de pobreza
por Comunidad Autónoma, la cual es el punto de corte que separa a la
población considerada pobre de la considerada no pobre, y de la tasa de
16
pobreza. Para dicho cálculo se ha utilizado el criterio del 60% de la mediana de
los ingresos por unidad de consumo de cada CC.AA en relación al umbral
nacional (8163,6 € por unidad de consumo) y en base a los resultados
proporcionados se han agrupado en 5 grupos diferentes.
El cálculo es: 𝐻 =𝑞
𝑛
Donde:
H: es la tasa de pobreza
Q: es el número de población pobre.
N: Población total
El primer grupo (% pobres bajo) recoge todas aquellas Comunidades
Autónomas cuyo porcentaje de población pobre es más pequeño.
Navarra: 8,42% población pobre.
País Vasco: 11,67% población pobre.
Madrid: 12,70% población pobre.
El segundo grupo (% pobres medio-bajo) está compuesto por las siguientes
Comunidades Autónomas:
Cataluña: 13,92% población pobre.
Aragón: 14,04% población pobre.
Asturias: 14,53% población pobre.
Islas Baleares: 14,86% población pobre.
El tercer grupo con un porcentaje de población pobre medio están:
La Rioja: 16,39% población pobre.
Galicia: 16,45% población pobre.
Cantabria: 18,99% población pobre.
Castilla y León: 19,35% población pobre.
17
El cuarto grupo se ha creado a partir de porcentajes medio-altos de población
pobre:
Comunidad Valenciana: 22,74% población pobre.
Melilla: 26, 81% población pobre.
Islas Canarias: 27,58% población pobre.
Castilla- La Mancha: 29,01% población pobre.
Y por último, el quinto grupo son aquellas regiones con mayores porcentajes de
pobreza hallados:
Andalucía: 33,22% población pobre.
Extremadura: 34,32% población pobre.
Murcia: 36,43% población pobre.
Ceuta: 38,73% población pobre.
Grado de urbanización (DB100/URBAN):
1 Zona muy poblada
2 Zona media
3 Zona poco poblada
Estado civil (PB190/EDOCIVIL):
1 Soltero
2 Casado
3 Separado
4 Viudo
5 Divorciado
18
Edad: Esta variable se construyó a partir de la variable original “Año de nacimiento”,
cuyo código en el cuestionario de la encuesta es: PB140 y RB080.
Edad categórica (EDADCATEG): Se recodificó la variable anterior en grupos
de edades proporcionándose 6 categorías:
1) De 16 años a 25 años.
2) De 26 años a 35 años.
3) De 36 años a 45 años.
4) De 46 años a 55 años.
5) De 56 años a 65 años.
6) De 66 años en adelante.
Renta disponible del hogar (HHY020/RENHOG): “Renta disponible total del hogar en
el año anterior al de la encuesta”
Renta (RENTA); “Renta neta monetaria del individuo en el año anterior a la encuesta”:
Esta variable se construyó a partir de la suma de 8 variables (PY010N, Py050N,
PY090N, PY100N, PY110N, PY120N, PY130N, PY140N), las cuales aluden a ingresos
pero de diferentes fuentes.
Renta categórica (RentaHR): 6 categorías:
1 Menos hasta 8000€
2 De 8000€ a 14000€
3 De 14000€ a 20000€
4 De 20000€ a 33000€
5 De 33000€ a 45000€
6 De 45000€ y más
19
Ingresos mínimos (HS130/INGMIN): “Ingresos mínimos para llegar a final de mes”
Variable sujeta a la situación de cada hogar y a lo que cada individuo considere llegar
a final de mes. Por ello, esta variable también puede ayudar en el estudio de la
pobreza y de la distribución de los ingresos, ya que proporciona la información de con
cuánto dinero pueden los individuos vivir en un mes contando todos los gastos y
pagos.
Pobreza relativa (PobRelativa): Para la medición de la pobreza relativa el primer
ejercicio de reflexión gira en torno a la elección de la variable monetaria. Lo más
recurrente es, o bien utilizar la variable que represente el gasto total del hogar, o bien
la renta total disponible del hogar.
En este caso se ha elegido como variable monetaria la renta total disponible del hogar,
la cual refleja la capacidad económica del hogar, porque se ha decidido seguir los
estándares europeos en la producción estadística sobre pobreza y exclusión social.
Últimamente en los análisis de pobreza relativa como unidad de consumo está
primando el individuo en vez del hogar como tradicionalmente había sido, este cambio
viene dado por la consideración de que son las personas las que se ven afectadas por
el fenómeno, pero no se debe olvidar que las situaciones personales dependen
estrechamente de la renta del hogar y no únicamente de los ingresos personales.
Para solventar dicho problema, generalmente, se ha calculado el ingreso per cápita,
que no es más que el cociente entre la renta total disponible del hogar entre el número
de miembros que componen un hogar. Sin embargo, en la estadística oficial de la
Unión Europea se ha apostado por otro tipo de cálculo que da como producto el
ingreso por unidad de consumo o ingreso equivalente. Este último tipo de ingreso es
más recomendable porque tiene en cuenta factores como la economía de escala y la
existencia de unidades de consumo equivalentes en el hogar, como se ha explicado
en el marco teórico.
Por todo ello, esta variable ha sido creada a partir de la renta total del hogar y de la
variable unidad de consumo.
La unidad de consumo se calcula a partir de la siguiente fórmula que corresponde a la
escala modificada de la OCDE, la cual es utilizada por EUROSTAT:
1 + (𝑎 − 1) ∗ 0,5 + 𝑏 ∗ 0,3
20
Donde al primer adulto se le proporciona un peso de 1, a los siguientes adultos un
peso de 0,5 y a los menores de 14 años de 0,3. Por lo que, 𝑎 es el número de adultos
total que integran un hogar y 𝑏 es el número de niños menores de 14 años miembros
de un hogar.
Por tanto, la renta total del hogar se divide por la unidad de consumo obtenida de la
fórmula anterior para cada hogar y se obtiene el ingreso por unidad de consumo o
equivalente a cada uno de los miembros.
En cuanto a la fijación de la línea o umbral de pobreza, generalmente, se aplica en el
60% de la mediana de la distribución de los ingresos por unidad de consumo. Lo que
quiere decir que, aquellos que queden por debajo del 60% serán considerados como
pobres y aquellos que queden por encima como no pobres. Si bien se pueden aplicar
más umbrales, como por ejemplo, el 40%, 50% e incluso el 20% y 25%, según el
grado en que se desee caracterizar a la población pobre.
Ya se ha explicado cómo se ha elaborado la variable de pobreza relativa numérica y a
continuación se explicará cómo se ha creado la variable pobreza relativa categórica.
Pobreza Relativa Categórica (POBRELHR): Para la construcción de esta
variable se ha tomado como referencia la elaboración de umbrales de pobreza
relativa en el trabajo.
Se parte del cálculo de la mediana de la variable numérica “Pobreza relativa”
dando como resultado 13606 euros por unidad de consumo.
Si se aplica el criterio del 60% de la mediana el cálculo sería: 13606*0,6=
8163,6. Esta cifra indica dónde se encuentra el punto de corte entre los
individuos considerados como pobres y los considerados como no pobres.
En base a dichos cálculos se han establecido tres grupos:
1 No pobres: Esta categoría incluye a aquellos que se encuentran por encima
de la mediana nacional (> 13606).
2 Vulnerables: Aquellos que su renta por unidad de consumo se sitúa entre la
mediana y el umbral o línea de pobreza (entre 13606 y 8163,6).
3 Pobres: En esta categoría se agrupan aquellos individuos cuya renta es
inferior al umbral de pobreza (<8163,6 euros por unidad de consumo).
21
En la literatura se pueden encontrar muchos otros criterios porcentuales para
obtener nuevos umbrales o líneas de corte entre la población con el fin de
obtener una clasificación más exacta. Por ejemplo, calculando el 40%, 20% de
la mediana, como realizan en el trabajo “Condiciones de vida en Aragón”
(Pérez et al., 2009). En este caso, se calculó tomando como referencia dicho
trabajo, 6 grupos iniciales que quedaron descartados por la obtención de pocos
individuos en alguna de las categorías y por no presentar demasiadas
diferencias respecto a sus categorías más cercanas.
Situación laboral (PL031/SITLAB): “Situación en relación con la actividad definida
por el interesado”
1 Asalariados
2 Trabajadores por cuenta propia
3 Parado
4 Estudiante
5 Jubilado, retirado anticipado o ha cerrado un negocio
6 Incapacitado permanente para trabajar
7 Labores del hogar, cuidado de niños u otras personas
8 Otra clase de inactividad
No se usa la codificación original, ya que se han fusionado 4 categorías que aludían a
asalariados y trabajadores por cuenta propia. Así como se eliminó una categoría
“Servicio militar obligatorio” por no haber ningún individuo en la muestra en dicha
situación.
Ocupación (PL051/OCUPACIÓN): “Ocupación del empleo principal actual o del
último empleo principal”.
La variable original está codificada en base a la clasificación internacional ISCO08 a
dos dígitos. Sin embargo, la variable con la que se ha trabajado en el presente análisis
ha sido recodificada según la misma clasificación, pero en una versión más reducida
(un dígito). Si bien, a pesar de haber elaborado una codificación más generalizada no
se ha perdido de vista todas las profesiones que engloba cada grupo.
22
1 Directores y gerentes
2 Profesionales científicos e intelectuales
3 Técnicos y profesionales de nivel medio
4 Personal de apoyo administrativo
5 Servicios y vendedores en comercios y mercados
6 Agricultores y trabajadores agropecuarios, forestales y pesqueros
7 Oficiales, operarios y artesanos mecánicos
8 Operadores de instalaciones y máquinas y ensambladores
9 Ocupaciones elementales
10 Ocupaciones militares
Tipo de contrato (PL140/TIPOCONTRATO):
1 Contrato fijo de duración indefinida
2 Contrato temporal de duración determinada
Un contrato es considerado como temporal de duración determinada cuando el fin del
contrato está determinado por condiciones objetivas como la expiración de un plazo o
realización de una tarea, la realización de un periodo de prácticas o formación o
sustitución de la parte de trabajo no desarrollada por los prejubilados. De no ser así,
se estaría hablando de contratos de duración indefinida.
Estado de salud (PH010/Salud): “Estado general de salud” sigue la siguiente
clasificación, la cual tiene en cuenta las diferentes dimensiones de la salud, física o
mental, y queda a criterio del informante. Por lo que es una variable de carácter
subjetivo:
1 Buen estado de salud
2 Regular estado de salud
3 Mal estado de salud
23
Condiciones de la vivienda (CONDVIVIEND): En esta dimensión se investiga si la
vivienda posee instalaciones básicas y si sufre algún problema de deterioro que haga
de la vivienda un lugar en malas condiciones y carente de aspectos básicos que hoy
en día son considerados de necesidad básica. Esta nueva variable está formada por
tres variables
-HH040: “¿Tiene la vivienda problemas de goteras, humedades en paredes,
suelos, techos o cimientos, o podredumbre en suelos. Marcos de ventanas o
puertas?
-HH081: “¿Dispone la vivienda de ducha/bañera? Se considera que una
vivienda dispone de bañera/ducha cuando el hogar cuenta con una instalación
fija de la misma en el interior de la vivienda.
-HH091: “¿Dispone de inodoro con agua corriente en el interior de la vivienda?
Se dispone cuando el hogar cuenta con una instalación fija dotada de agua
corriente en el interior de la misma y adecuada para evacuar residuos
humanos.
La primera variable está codificada como 1 (Sí) y 2 (No) y las otras dos como 1 (Sí,
para uso exclusivo), 2 (Sí, para uso compartido con otras viviendas) y 3 (No). Así
pues, el primer paso fue recodificar las variables HH081 y HH091 como Sí (1),
incluyéndose aquí 1 y 2 de la codificación original, y No (2). Una vez realizado el
primer paso se sumaron las presencias de las tres variables dando como producto 4
categorías. Si bien nótese que, en la primera variable la respuesta objetiva sería 2
(No), mientras que en las otras dos sería 1 (Sí). De este modo, las categorías creadas
aluden a las siguientes realidades producto de la suma:
Muy buenas condiciones: 2 en HH040 y 1 en HH081 y en HH091.
Buenas condiciones: 1 en HH040.
Malas condiciones 2 en HH040 y 2 en bañera o en inodoro
Muy malas condiciones 1 en HH040 y 2 en el resto de variables.
Posteriormente, Muy buenas y buenas condiciones se fusionó en la categoría “Buenas
condiciones de vida (1)” y malas con muy malas condiciones de vida (2)”
24
Relaciones sociales (RELSOC): Formada por dos variables
-PD050: “¿Se reúne con amigos/familiares para comer o tomar algo al menos
una vez al mes?
-PD060: “¿Participa regularmente en actividades de ocio, deportes,
conciertos…?
Ambas variables están codificadas como: Sí (1), No, porque no puede permitírselo (2)
y No, por otras razones (3).
Por tanto, el primer paso fue recodificar las categorías originales 2 y 3 en una sola (2).
De esta manera pasaría a ser: Sí (1) y No (2).
El segundo paso fue recodificar, nuevamente, en 0 (ausencia) y 1 (presencia) para
poder sumar los valores de las variables y crear categorías. En este caso 2 categorías
atendiendo al número de presencias y ausencias registradas (Buenas relaciones
sociales y malas relaciones sociales).
Entorno (ENTORNO): Se estudia si el entorno físico y social es favorable o no.
Construida a partir de 4 variables:
-HS160: “¿Tiene la vivienda escasez de luz natural?”
-HS170: “¿Tiene la vivienda problemas de ruidos producidos por vecinos o
procedentes del exterior?
-HS180: “¿Tiene la vivienda problemas de contaminación, suciedad, u otros
problemas medioambientales en la zona producidos por industria o el tráfico?
-HS190: “¿Tiene la vivienda problemas de delincuencia o vandalismo en la
zona?”
Originalmente en el cuestionario todas ellas están codificadas como: Sí (1) y No (2),
pero para crear la nueva variable “entorno” se recodificó en binario (Sí (1) y No (0)).
Una vez realizado este paso se procedió a la suma de las variables y se crearon 2
categorías que responden a:
1 Condiciones de entorno buenas (0 presencias o 1 presencia)
2 Condiciones de entorno malas (de 2 presencias a 4 presencias)
25
Carencia material (CARENCIAMAT): Esta variable estudia la dimensión de carencia
material y está construida inspirada en el indicador AROPE analizado en los
resultados y publicaciones del INE. Si bien, se diferencia en que en esta variable se ha
construido integrando más variables que en dicho indicador que se consideraban
importantes. Construida a partir de 13 variables:
-HH050: “¿Puede el hogar permitirse mantener la vivienda con una temperatura
adecuada durante los meses de invierno?” (*1)
-HS040: “¿Puede el hogar permitirse ir de vacaciones fuera de casa, al menos
una semana al año? (*0,2)
-HS050: “¿Puede el hogar permitirse una comida de carne, pollo o pescado (o
equivalentes vegetarianos) al menos cada dos días?” (*1)
-HS060: “¿Tiene el hogar capacidad para afrontar gastos imprevistos? (*0,7)
-HS070: “¿Tiene el hogar teléfono (incluido móvil)?” (*0,5)
-HS080: “¿Tiene el hogar televisión en color?” (*0,2)
-HS090: “¿Tiene el hogar ordenador?” (*0,2)
-HS100: “¿Tiene el hogar lavadora? (*0,5)
-HS110: “¿Tiene el hogar coche?” (*0,5)
-PD020: “¿Sustituye las ropas estropeadas por otras nuevas? (*1)
-PD030: “¿Tiene dos pares de zapatos o un par adecuado para cualquier
época del año?” (*1).
-PD070: “¿Gasta una pequeña cantidad de dinero en usted mismo a la
semana? (*0,2)
-PD080: “¿Dispone de conexión a internet para uso personal en el hogar?
(*0,2)
En este caso el primer paso fue proporcionar y aplicar a cada una de las 13 variables
una ponderación según la importancia de poseer o no dicha lista de bienes, cabe
señalar que la ponderación está seleccionada de manera subjetiva. Los bienes
considerados como más importantes son ponderados multiplicados por 1, luego por
0,7, por 0,5 y, los menos importantes, por 0,2.
26
Sabido esto, el valor máximo que se puede alcanzar es de 7,2, lo cual equivaldría a
una situación excelente en la que no se carecería de ninguno de los bienes de la lista.
Por ello, los individuos podrán tomar valores dentro de la escala que va desde 0 hasta
7,2.
Para poder aplicar dichas ponderaciones, primeramente, se recodificaron todas las
variables en 0 (ausencia) y 1 (presencia). Por lo que, en algunos casos se pasó de Sí
(1) a presencia (1) y No (2) a ausencia (0) y, en otros casos se pasó de Sí (1) a
presencia (1), No, porque no puede permitírselo (2) y No, por otros motivos (3) a
ausencia (0). Una vez que se tuvieron las variables en escala de medición binaria se
multiplicaron por la ponderación elegida pasando de tener una variable vinaria a una
variable numérica (cuantitativa).
Carencia material Categórica (CarMatHR): A partir de la variable numérica
explicada arriba se creó otra con tres categorías:
1 No carencia material: <5,9
2 Carencia material intermedia: Entre 5,9 y 6,6
3 Carencia material: Entre 6,6 y 7,2
Educación (PE040/NIVESTUDIOS): En esta variable se considera el máximo nivel de
estudios alcanzado por la persona entrevistada. Por nivel de estudios alcanzados se
entiende aquél nivel máximo en el que se esté en posesión de un título o diploma, o en
su defecto, los casos en los que se haya superado todas las asignaturas y se
encuentre en trámites de pedir el título. Se utiliza la variable original, pero aplicando
cambios en su codificación. Por tanto, la variable empleada en el análisis quedaría
recodificada a partir de la clasificación CNED2014 de la siguiente manera: (INE, 2014)
1 Menos que primaria: En esta categoría se incluyen aquellos con estudios de
primaria incompletos y a analfabetos.
2 Educación primaria: Aquellos individuos con educación primaria
completada.
3 Educación Secundaria: Se clasifican aquí las personas que hayan
cursado como máximo los 9 primeros cursos de educación primaria y
secundaria o que hayan completado dicho nivel de estudios.
27
4 Bachillerato y similares: Por similares se refiere a las enseñanzas de COU
y BUP.
5 FPE: Esta categoría recoge todas aquellas enseñanzas destinadas a la
formación profesional
6 Educación superior: En esta categoría se incluyen todas las titulaciones de
Grado, Diplomaturas, Licenciaturas. Estudios de Máster universitario, estudios
de especialización (MIR, FIR, BIR…) y estudios de Doctorado.
7 NC: Recoge a las personas que decidieron no responder a esta pregunta.
3.4 Métodos estadísticos
3.4.1 Análisis discriminante
El análisis discriminante (AD) o función discriminante es una técnica que analiza la
relación entre una variable dependiente con un conjunto de variables independientes.
La variable dependiente ha de ser no numérica o categórica, mientras que las
independientes han de ser numéricas. Además, la variable dependiente determinará
cuántos grupos se van a comparar dependiendo del número de categorías que
albergue dicha variable. El AD es una técnica que permite describir, predecir y
clasificar, la cual fue desarrollada, en sus inicios, por Ronald Aylmer Fisher en el año
1936 a partir de la publicación de su estudio sobre la clasificación de flores del género
iris publicado con el nombre “The use of multiple measurements in taxonomic
problems”. (Cuadras, 2014)
Los objetivos principales del AD son: (Cea, 2016, p. 10)
1) Comprobar si la agrupación en categorías de los objetos dada es correcta y
si queda caracterizada por las variables que definen a cada grupo pudiendo
observar qué variable discriminante contribuye más al análisis clasificando
correctamente a los individuos en cada grupo.
2) Conocer la combinación de las variables independientes, llamadas en este
contexto función discriminante, que haga máxima la diferenciación entre los
grupos.
28
3) Predecir la probabilidad de pertenencia de un individuo u objeto a los
grupos a partir del conocimiento de los valores que toma en las variables
independientes. En este punto, es necesario conocer qué conjunto de
variables discriminan más a los grupos.
Supuestos del Análisis Discriminante: (Gil, 2009)
1) La variable que define los grupos debe ser categórica, pero las variables
independientes deben ser medidas en escala de intervalo o de razón
2) Es necesario la existencia de 2 grupos o más.
3) Para cada uno de los grupos es necesario que haya 2 o más casos.
4) El número de variables independientes debe ser menor al número de casos
menos 2.
5) Evitar colinealidad entre las variables discriminantes.
6) El número máximo de funciones discriminantes es el mínimo entre el
número de variables y el número de grupos menos 1
7) Las matrices de varianzas-covarianzas de todos los grupos deben ser
iguales.
8) Las variables deben seguir una distribución normal en cada grupo.
9) Eliminar “outliers” para que no distorsionen la clasificación de las
observaciones.
Para la explicación formal del Análisis Discriminante, se ha recurrido a la consulta del
manual de Uriel y Aldás. (Uriel & Aldás, 2005)
Se parte de una matriz de datos multivariantes cuyas filas están divididas en 𝑔 grupos
excluyentes de tamaño 𝑛𝑖(𝑖 = 1,2 … 𝑔) y 𝑝 variables en las columnas.
A partir de 𝑔 muestras aleatorias de 𝑔 grupos de individuos y de los valores en 𝑘
variables (𝑋1, 𝑋2, … , 𝑋𝑘) para cada miembro de cada muestra, se trata de obtener
𝐷1, … , 𝐷𝑚 funciones lineales de 𝑋1, … , 𝑋𝑘.
Por tanto se ha de buscar aquella función discriminante que garantice la máxima
separación entre los grupos, lo cual lleva a la explicación de la Función Discriminante
de Fisher, que se obtiene como una función lineal de 𝐾 variables explicativas de 𝑋:
𝐷𝑖 = 𝑢1𝑋1 + 𝑢2𝑋2 + ⋯ + 𝑢𝑘𝑋𝑘
29
Donde:
𝐷: Es la calificación discriminante
𝑖: Es la puntuación discriminante de la i-ésima observación.
𝑢: Los coeficientes discriminantes calculados de manera que hagan máxima la
separación entre los grupos.
𝑋: Las variables predictivas
Tras el cálculo de la función discriminante se obtiene la matriz, cuya notación es:
𝑑 = 𝑋𝑢 y la variabilidad es:
𝑑′𝑑 = 𝑢′𝑋′𝑋𝑢
Dicha matriz está compuesta por la suma de cuadrados y productos cruzados (SCPC)
total de las variables explicativas.
La matriz SCPC total se puede descomponer así:
𝑋′𝑋 = 𝑇 = 𝐹 + 𝑊
Donde:
𝑇: es la matriz SCPC total
𝐹: es la matriz entre-grupos
𝑊: es la matriz intra-grupos
Una vez obtenidas dichas matrices, se puede obtener a partir de la matriz obtenida por
la función discriminante:
𝐷′𝑑 = 𝑢′𝑇𝑢 = 𝑢′𝐹𝑢 + 𝑢′𝑊𝑢
30
A partir de aquí se busca la obtención del eje discriminante en el que las distribuciones
proyectadas sobre el mismo se separen lo máximo posible entre ellos y, a su vez,
sean lo más compactos posible internamente.
Mediante la maximización de lamda se determina el eje discriminante, de manera que
cuando las distribuciones sean proyectadas en él estén lo más separadas entre sí
(variabilidad entre grupos) y que, a su vez, cada una de las distribuciones esté
compacta y no dispersa (variabilidad intra grupos)
𝑀𝑎𝑥𝑖𝑚𝑖𝑧𝑎𝑐𝑖ó𝑛 𝑑𝑒 λ =𝑢′𝐹𝑢
𝑢′𝑊𝑢
La función discriminante de Fisher, casi siempre, se determina como lineal, ya que
ésta se obtiene mediante la combinación lineal de las variables originales y trata de
aplicar valores a (𝑋1, 𝑋2, … , 𝑋𝑘). Dichos valores son los resultantes de proyectar cada
punto sobre el espacio 𝐾 dimensional de las variables originales sobre el eje
discriminante.
A partir de esto último, se calculan los centroides (medias), que resumen la
información de cada uno de los grupos. Por ejemplo, si se tuvieran dos grupos los
vectores de medias serían:
�̅�g1= �̅�1,1, �̅�2,1,…, �̅�k,1
�̅�g2= �̅�1,2, �̅�2,2,…,�̅� k,2
Una vez obtenidos los centroides se han de introducir en la función discriminante de
Fisher, de tal manera que se obtendría:
�̅�1=u1�̅�1,1+u2�̅�2,1+…..+uK �̅�K1
�̅� 2=u1�̅�1,2+u2�̅�2,2+…..+uK �̅�K2
Lo siguiente es calcular el punto de corte discriminante para poder establecer los
criterios de clasificación, llamado 𝐶, que se calcula como el promedio de �̅�1 y �̅�2:
31
𝐶 =�̅�1 + �̅�2
2
Así pues, el criterio de clasificación de los individuos u objetos sería:
Si 𝐷𝑖 < 𝐶, se clasifica el individuo 𝑖 en el grupo 1
Si 𝐷𝑖 > 𝐶, se clasifica el individuo 𝑖 en el grupo 2
O mediante la resta del valor de 𝐶 a la función discriminante:
𝐷 − 𝐶 = 𝐷𝑖 = 𝑢1𝑋1 + 𝑢2𝑋2 + ⋯ + 𝑢𝑘𝑋𝑘 − 𝐶
De esta manera se obtendría una clasificación de los individuos en dos grupos donde
la heterogeneidad entre ellos y la homogeneidad en sí fuera la máxima posible.
3.4.2 Análisis de la homogeneidad
Los datos categóricos son muy frecuentes en Ciencias Sociales, así como en múltiples
áreas del conocimiento. Sin embargo su análisis es más complicado, en ocasiones, a
través de los procedimientos estadísticos estándar. Sobre todo cuando hay una
existencia de excesivas variables, demasiados valores para cada variable u
observaciones insuficientes.
Para paliar este problema existe un conjunto de técnicas basadas en la aplicación del
procedimiento del escalamiento óptimo, el cual proporciona cuantificaciones numéricas
a las categorías de cada variable. Esto permite utilizar los procedimientos estándar
para obtener una solución con las variables cuantificadas.
32
Dichas técnicas se enmarcan dentro del sistema Gifi, el cual aglutina: (Gifi, 1990)
-Análisis de componentes principales para datos categóricos, llamado CATPCA
(Categorical principal components) o PRINCALS (Nonlinear principal
component analysis).
-Análisis de correspondencias múltiples, también denominado HOMALS
(Homogeneity Analysis by means of Alternatin Least Squares).
-Correlación canónica no lineal, conocido como OVERALS (Nonlinear canonical
correlation analysis)
Todas estas técnicas siguen el algoritmo ALS (Mínimos Cuadrados Alternados) el cual
se usa como modelo general y cuando se persigue el objetivo de analizar las
relaciones multidimensionales en un espacio de dimensión reducida (bidimensional)
del sistema cuantificado en base a un modelo de análisis dado.
Dichas técnicas fueron realizadas e implementadas en el paquete estadístico SPSS de
IBM por el grupo “Data Theory Scaling System Group”, en el que participan diferentes
departamentos de la Universidad de Leiden, Holanda.
HOMALS es uno de los modelos recogidos en el grupo de técnicas que hacen uso del
Escalamiento Óptimo del sistema Gifi (1990), la cual alberga una serie de técnicas
exploratorias de análisis multivariante no lineal. Además, dentro de dicho sistema y de
las técnicas recogidas en éste es el menos restrictivo por trabajar con un conjunto de
variables de naturaleza nominal.
La utilización de la técnica HOMALS viene justificada por la naturaleza de las variables
empleadas y para la consecución de uno de los objetivos marcados en este análisis, el
cual reside en encontrar los perfiles de los individuos en situación de pobreza y de
exclusión social. Por tanto se trata de buscar e interpretar los perfiles en base a las
variables sociodemográficas y de las dimensiones que miden la exclusión social.
Puesto que el objetivo principal de dicha técnica versa sobre la representación de la
estructura de datos multivariantes categóricos para describir las relaciones entre dos o
más variables no numéricas en un espacio de reducida dimensionalidad en el que se
representan las categorías de cada variable y a cada individuo en relación a dichas
categorías.
Así pues, los individuos (objeto de estudio), cuya respuesta sea coincidente en la
misma categoría para la misma variable aparecerán próximos en el grafico proyectado
33
desde el hiperespacio, mientras que si sucede lo contrario aparecerán separadas.
Cada individuo aparecerá, aproximadamente, más junto de las categorías
respondidas.
Este análisis es conocido como Análisis de Correspondencias Múltiples o como
Análisis de Homogeneidad porque se realiza el análisis más adecuado cuando las
variables son homogéneas, es decir, cuando clasifican objetos de las mismas
categorías en los mismos subgrupos.
HOMALS permite cuantificar los datos de las variables categóricas aplicando valores
numéricos a los individuos objeto de estudio y a las categorías de las variables
seleccionadas para describir la relación entre dos o más variables en un espacio de
baja dimensión.
El objetivo es encontrar las cuantificaciones óptimas, lo que se traduce en que se
agrupen categorías semejantes en relación a la similitud entre ellas y que separe al
máximo aquellas que difieran, De esta manera, las categorías dividen los objetos en
subgrupos homogéneos.
El Escalamiento óptimo asigna cuantificaciones numéricas a las categorías de cada
variable permitiendo los procedimientos estándar para obtener una solución con las
variables cuantificadas. Además, se puede especificar el nivel de escalamiento óptimo,
lo que significa el nivel al que se escala y no al nivel al que se miden las variables.
Esta técnica cuantifica a partir de transformaciones de tal forma que se minimice la
pérdida de información que resulta al reducir la dimensionalidad del sistema
cuantificado en base a un modelo de análisis dado.
Dicha cuantificación, en el caso de esta técnica, se obtiene a partir del proceso
iterativo de los Mínimos Cuadrados Alternados para evitar problemas que se suelen
encontrar cuando se lleva a cabo investigaciones a partir de variables categóricas,
como por ejemplo, observaciones insuficientes, elevado número de variables y buena
cantidad de valores en cada variable.
El algoritmo ALS parte de una matriz de datos 𝑋𝑛𝑥𝑝, donde 𝑛 son los individuos (filas) y
𝑝 las variables categóricas (columnas), pero se necesita cuantificar a dichas variables
para poder representar en el plano. Para ello, el primer paso que lleva a cabo versa
sobre la cuantificación de las variables categóricas en análisis calculándose las
puntuaciones de los sujetos y de las variables. A partir de esto, se asignan
puntuaciones mediante el algoritmo ALS para poder representar los objetos en un
espacio p-dimensional reducido.
34
Por tanto, se considerará 𝑍 a la matriz de datos originales que tiene 𝑇 variables
categóricas observadas sobre 𝑁, donde la variable posee 𝑀 categorías.
Sea la matriz 𝑋𝑛𝑥𝑝, la cual contiene las coordenadas de los 𝑁 individuos e 𝑌𝑀𝑥𝑝 que
contiene las 𝑀 categorías. Se llamará 𝑋 a la matriz de cuantificaciones de los objetos y
a 𝑌 como matriz de cuantificaciones de las categorías.
El objetivo del algoritmo es minimizar la función de pérdida simultáneamente respecto
a la matriz 𝑋 e 𝑌, la cual se define como:
𝜎(𝑋, 𝑌) ≡ 𝑚−1 ∑ 𝑆𝑆𝑄 (𝑋 − 𝐺𝑗 𝑌𝑗)
𝑗
Donde:
𝜎(𝑋, 𝑌): Es la función de pérdida en los parámetros X e Y.
𝑀: El número de variables.
𝑆𝑆𝑄: Es la suma de cuadrados
𝑋: Se corresponde a la matriz 𝑛𝑥𝑝 de puntajes de los individuos.
𝐺𝑗: Es la matriz indicadora correspondiente a la j-ésima columna de la matriz 𝐻.
𝑌𝑗: Es la matriz de cuantificaciones de las categorías de la j-ésima variables.
3.4.3 Métodos Biplot
Los métodos Biplot fueron propuestos por Gabriel en “The biplot graphic display of
matrices with application to principal component analysis” en el año 1971 como
representaciones gráficas de datos multivariantes donde podían representarse 3 o
más variables. Estos métodos guardan cierta similitud con el Análisis de Componentes
Principales, pero con la diferenciación de que los métodos Biplot representan
conjuntamente a los individuos y a las variables en un espacio dimensional reducido.
Según Gabriel (1972), un Biplot es una representación gráfica de una matriz de datos
𝑋𝑛𝑥𝑝 mediante marcadores fila (𝑔1, … , 𝑔𝑛) y marcadores columnas (ℎ𝑗, … , ℎ𝑛). De
manera que el producto interno 𝑔𝑗′ℎ𝑗 represente el elemento 𝑥𝑖𝑗 de la matriz de datos
𝑋.
35
Por tanto, lo que se persigue es que la nueva matriz creada en base a marcadores
aproxime lo mejor posible la matriz 𝑋 de partirda en un espacio dimensional reducido
(q<r) mediante la Descompsición en Valores (vectores) Singulares. (DVS):
𝑋 = 𝑈𝐷𝑉′
Donde 𝑈 es la matriz cuyas columnas contienen los vectores propios de 𝑋𝑋′, 𝑉 es la
matriz cuyas columnas contienen los vectores propios de 𝑋𝑋′ y 𝐷 es la matriz diagonal
que contiene a los valores singulares de 𝑋.
Y debe cumplirse que 𝑈′𝑈 = 𝑉′𝑉 = 𝐼, es decir, las columnas de 𝑈 y 𝑉 son
ortonormales:
𝑋 = 𝐺𝐻′ = 𝑈𝐷𝑉′
La tipología propuesta por Gabriel son el JK Biplot y el GH Biplot siendo lo que les
diferencia la factorización y la elección de los marcadores a partir de dicha
factorización:
JK BIPLOT: Preserva la máxima calidad de representación de las filas, pero no
de las columnas donde:
𝐽 = 𝑈𝐷 𝐾 = 𝑉
GH BIPLOT: Consigue la máxima calidad de representación de las columnas,
pero no de las filas:
𝐺 = 𝑈 𝐻 = 𝑉𝐷
En el año 1986, Purificación Galindo propuso una alternativa a los Biplot de Gabriel
llamado HJ Biplot (Galindo, 1986). Éste es una representación gráfica multivariante de
una matriz de datos denotada como 𝑋 con marcadores fila o vectores fila 𝑗1,𝑗2, … , 𝑗𝑛 y
marcadores columna o vectores columna ℎ1, ℎ2, … , ℎ𝑝 de la matriz 𝑋. Dichos
marcadores pueden superponerse en un mismo sistema de referencia sin perder
36
calidad de representación a través de la DVS, como en los modelos anteriores,
obteniéndose marcadores en dimensión reducida.
El HJ Biplot no consigue reproducir los datos originales de la matriz 𝑋(𝑋 ≠ 𝐽𝐻′), pero
consigue la máxima calidad de representación en filas y columnas introduciendo la
matriz diagonal 𝐷 de la siguiente manera:
𝐽 = 𝑈𝐷 𝐻 = 𝑉𝐷
37
4. RESULTADOS
4.1 Análisis descriptivos1
Antes de iniciar los análisis multivariantes, que se presentan con posterioridad, se
realizó un análisis descriptivo de todas las variables que forman la base de datos con
el fin de conocer las características de los individuos que forman la muestra analizada.
Los resultados del análisis descriptivo de las variables se van a presentar dividido por
las mismas dimensiones que se presentaron en el marco teórico y a partir de las que
se organizó la agrupación de las variables en la metodología.
1) DESCRIPTIVOS DE LAS VARIABLES SOCIODEMOGRÁFICAS
La muestra con la que se está trabajando posee un porcentaje de hombres
de 47,8% y de mujeres, ligeramente superior, de 52,2%.
Los rangos de edad (Véase gráfico 1) más numerosos son, en primer lugar,
el de 66 años en adelante (23,3%), de 46 a 55 años con un 19,3%, mientras
que de los grupos de edad que corresponderían a individuos jóvenes son
más restringidos. El intervalo de edad de 16 a 15 años y el de 26 a 35 años
posee un porcentaje de 11,9% y 12,7%, respectivamente.
Gráfico 1. Análisis descriptivo: Edad
Fuente: Elaboración propia a partir de los datos de la ECV 2014.
1 Podrá observarse que en alguno de los análisis descriptivos el total no da 100%, lo cual viene explicado
por la eliminación de los casos perdidos.
38
Además, el 48% de la muestra vive en una zona urbana muy poblada y un
30,1% los que viven en zonas menos pobladas y rurales. Por tanto, hay más
representatividad de las grandes urbes en la muestra.
Gráfico 2. Análisis descriptivo: Estado civil
Fuente: Elaboración propia a partir de los datos de la ECV 2014.
Más de la mitad de los individuos de la muestra está casados en contraposición
a los bajos porcentajes encontrados en las categorías de “divorciados” o
“separados”. (Véase gráfico 2)
2) DESCRIPTIVOS DE LA DIMENSIÓN ECONÓMICA
La media de la renta del hogar es de 30416,81€ al año (2534,73 € al mes),
el salario medio que cobran los individuos de la muestra es de 11339,37 €
al año y la media de ingresos mínimos para llegar a final de mes del
conjunto de casos es de 1904,99€.
39
Gráfico 3. Análisis descriptivo: Pobreza relativa
Fuente: Elaboración propia a partir de los datos de la ECV 2014.
Justamente la mitad de la muestra no puede ser considerada como pobre,
mientras que el porcentaje de la muestra que sí es pobre es de 21,1%. (Véase
gráfico 3)
3) DESCRIPTIVOS DE LA DIMENSIÓN LABORAL
En cuanto a la situación laboral el mayor porcentaje se encuentra en la
categoría de asalariaos con un 33,5%, seguido por la categoría de jubilados
(17,8%), parados (15,8%) y labores del hogar (12,5%). (Véase gráfico 4)
40
Gráfico 4. Análisis descriptivo: Situación laboral
Fuente: Elaboración propia a partir de los datos de la ECV 2014.
La ocupación laboral predominante es la que engloba todas las profesiones
dedicadas al sector servicios y de comercios con un 16,3% frente a un 0,5%
dedicado a ocupaciones militares y un 2,5% dedicado a profesiones que se
engloban dentro de la categoría de directores y gerentes.
En relación al tipo de contrato, cerca de la mitad de los casos que trabajan,
han firmado un contrato de duración indefinida, frente a un 21,7% que
declara poseer un contrato de duración determinada. Cabe mencionar que
en esta variable se registra un alto porcentaje de casos en los que se
prefirió no responder (34,5%).
4) DESCRIPTIVOS DE LA DIMESIÓN DE EDUCACIÓN
En el estudio del nivel académico alcanzado se observa que los mayores
porcentajes se encuentran en el nivel de estudios de educación secundaria,
tanto terminada como incompleta, y el nivel de educación superior. Estas
dos categorías poseen un porcentaje de 38,9% y 25,9 %, respectivamente.
Los menores porcentajes se pueden encontrar en estudios de bachillerato y
similares y en FPE. (Véase gráfico 5)
41
Gráfico 5. Análisis descriptivo: Nivel educativo
Fuente: Elaboración propia a partir de los datos de la ECV 2014.
5) DESCRIPTIVOS DE LA DIMENSIÓN DE SALUD
Mediante el análisis descriptivo de la variable que integran esta dimensión
se podrá conocer a grandes rasgos la situación y el estado de salud de los
individuos de la muestra. (Véase gráfico 6)
Gráfico 6. Análisis descriptivo: Estado de salud
Fuente: Elaboración propia a partir de los datos de la ECV 2014.
42
Más de la mitad consideran que poseen un buen estado de salud (70,5%),
frente a los que consideran que tienen un estado de salud muy malo
(8,9%). Por lo que, en general, la muestra goza de un buen estado de
salud.
6) DESCRIPTIVOS DE LAS DIMENSIÓNES DE LA VIVIENDA Y DEL
ETORNO
En relación a las condiciones de vida, casi la totalidad de la muestra
considera que su vivienda no está en malas condiciones ni padece de
ningún problema (99,9%). Y con las condiciones del entorno ocurre más o
menos lo mismo, aunque aquellos que consideran que su entorno no goza
de las mejores condiciones por diversos problemas son casi un 10% de la
muestra, considerando que su entorno es bueno un 90%.
7) DESCRIPTIVO DE LA DIMENSIÓN DE CARENCIA MATERIAL
Si analizamos la carencia material desde la variable cuantitativa obtenemos
que la media de la muestra es de 6,2 (0 –carencia material- a 7,2 –nada de
carencia material-), por lo que, en general, se goza de poca carencia
material.
Si ahora se analiza desde la variable recodificada como categórica se
obtiene que un 27,5% posee carencia material, un 23,6% carencia
intermedia y un 48,9% nada de carencia material.
8) DESCRIPTIVO DIMENSIÓN RELACIONES SOCIALES
Por último, el porcentaje de la muestra que posee una vida social plena es
del 55,7%, mientras que aquellos que no disfrutan de ello son un 44,3%.
43
4.2 Resultados análisis discriminantes
El primer análisis discriminante se ha utilizado como variable de agrupación
(POBRELHR) con tres grupos definidos:
1 No pobres
2 Vulnerables
3 Pobres
Y como variables independientes se han introducido las variables cuantitativas
económicas de la base de datos: RENTA, RENHOG e INGMIN.
La muestra del análisis es de 26454 casos válidos, los cuales participan en la
derivación de las funciones discriminantes. Los casos que se han excluido sólo lo son
en cuanto a la derivación de dichas funciones, ya que una vez derivadas todos los
casos de la muestra original (26531) participan en la clasificación en los grupos.
Este análisis discriminante se ha elaborado con el fin de comprobar si las variables
independientes introducidas discriminan y diferencian a los grupos propuestos en la
variable de agrupación.
Mediante el visor de SPSS se verificó que las medias aritméticas fueran diferentes en
los tres grupos propuestos. Aunque se detectaron valores altos en las desviaciones
típicas, lo cual tiene su explicación en la existencia de valores extremos en las
variables independientes. Esto es común al tratarse de variables que miden la cuantía
de ingresos o la cuantía de ingresos necesarios para llegar a final de mes
Otro de los requisitos que señala la literatura como necesario para la aplicación del
análisis discriminante es la comprobación de la homocedasticidad mediante la prueba
M de Box sobre la igualdad de las matrices de covarianza.
La M de Box prueba la siguiente hipótesis:
H0: Las matrices de covarianzas en los tres grupos son iguales
H1: Las matrices de covarianzas en los tres grupos son diferentes
En este caso, al obtener un p-valor (0,000) menor a 0,05 rechazamos la hipótesis nula
y, por lo tanto, las matrices de covarianzas en los tres grupos son diferentes.
44
Tabla 1. Autovalores Análisis Discriminante de Pobreza
Fuente: Elaboración propia a partir de los datos de la ECV 2014.
Los autovalores obtenidos están colocados en orden descendente siendo el autovalor
mayor el perteneciente a la función 1 y menor el de la función 2. (Véase tabla 1)
En este caso, el autovalor de la primera función discriminante, combinación lineal de
variables que hacen máxima la diferenciación entre los grupos, es de 2,201 y explica
un 99,8% de la variabilidad de la variable dependiente. El porcentaje de la varianza se
obtiene a través del cociente entre la cifra del autovalor de la primera función y la
suma total de autovalores.
Autovalor de la primera función discriminante= 2,201
Suma total de los autovalores = 2,205
% de la varianza = 2,201/2,205 = 0,998 *100= 99,8%
En cuanto a la segunda función discriminante, compuesta por una combinación de
otras variables discriminantes que ha de ser diferente a la combinación de la primera
función discriminante, se ha obtenido un autovalor de 0,004 y explica un 0,2% de la
variabilidad de la variable dependiente.
Autovalor de la segunda función discriminante= 0,004
Suma total de los autovalores= 2,205
% de la varianza= 0,004/2,205= 0,002 *100= 0,2%
En base a los resultados obtenidos, la primera función discriminante es mucho más
importante en el análisis que la segunda función.
Una vez que se ha descrito la relevancia de las funciones discriminantes se ha de
comentar la importancia de dichas funciones en la diferenciación entre los grupos a
partir de los valores que otorga la correlación canónica. La correlación canónica ha de
45
ser elevada (cercana a 1) para considerar que una función es importante en la
diferenciación de los grupos.
En este caso, la correlación canónica más elevada es la que corresponde a la función
1 con un valor de 0,829, mientras que en la segunda función posee un valor de 0,061.
Por lo tanto, la primera función es más importante en términos de diferenciación entre
los grupos que la segunda función discriminante.
La correlación canónica se obtiene a partir de la raíz cuadrada del autovalor de la
primera función entre el mismo valor sumándole una unidad y multiplicándolo por 100:
𝑟1=√2,201
2,201+1x100 𝑟1 = √
0,004
00,004+1𝑥100
Ahora bien, si se eleva al cuadrado la correlación canónica de la primera función
discriminante se puede conocer el porcentaje explicado de la varianza total de la
variable dependiente:
0,8292=0,75*100= 68,7%
La primera función discriminante explica un 68,7% de la varianza total de la variable
dependiente.
Y la segunda función discriminante:
0,0612= * 100= 0,37%
La segunda función discriminante explica un 0,37% de la varianza total de la variable
dependiente que no ha sido explicada por la primera función discriminante. En vista de
este resultado, se puede considerar que la segunda función discriminante no aporta
demasiado a la explicación de la varianza total no explicada por la primera función.
El total de la varianza total explicada de la variable dependiente por ambas funciones
es:
68,7+0,37= 69,07%
46
Una vez descrito lo anterior se ha de conocer la significación de las funciones
discriminantes precedentes. Para ello, se hará uso de los estadísticos λ de Wilks y χ2.
Comprobando la significación de las funciones permite conocer si las medias
(centroides) de los grupos están separados. (Véase tabla 2)
Tabla 2. Lambda de Wilks. Análisis Discriminante pobreza
Fuente: Elaboración propia a partir de los datos de la ECV 2014.
Se comenzará comentando los valores de λ de Wilks donde el valor de la misma en el
contraste de las funciones 1 a la 2 es de 0,311 y el valor del mismo estadístico para el
contraste de las funciones 2, cuando se elimina la primera función, es de 0.996. El
valor de la primera función es más cercano a 0 y el de la función 2 es muy cercano a
1. Por ello, la primera función posee un mayor poder discriminante que la segunda
función que no posee casi poder discriminante. No obstante, observando el p-valor
asociado al estadístico χ2 es menor a 0,05 (0,000) permite afirmar que las medias de
los grupos están separadas y que ambas funciones discriminantes son importantes
para el análisis, a pesar de que la función 2 posea un valor cercano a 1 en la λ de
Wilks.
El valor de la lambda de Wilks se obtiene de la siguiente manera:
Λ = (1
1 + 2,201) (
1
1 + 0,004) = 0,30
Si da cerca de 0 indica la existencia de una gran diferenciación entre los grupos y,
como se ve en el resultado (0,30) se puede afirmar que los grupos están
diferenciados. Al no haberse obtenido un resultado muy próximo a 0 hay indicios de
47
que pueda haber existencia de solapamiento entre los grupos, como más tarde se
verá.
En el presente análisis discriminante son 3 las variables predictoras que muestran
poder discriminante en la diferenciación de los grupos. Por ello, a continuación, se va a
conocer cuál es la participación de cada variable en las funciones discriminantes.
(Véase tabla 3)
En dicha tabla se observan los coeficientes estandarizados de las funciones
discriminantes, los cuales son similares a la interpretación de los coeficientes beta en
el análisis de regresión.
El valor de dichos coeficientes representa la contribución relativa de la variable a la
función en unidades de desviación típica.
En la primera función discriminante la variable que más contribuye al poder
discriminante es RENHOG (0,804) y, en la segunda función discriminante, la variable
que mayor relevancia posee es INGMIN (0,759) seguida de RENHOG (0,609).
Tabla 3. Coeficientes. Análisis discriminante pobreza
Fuente: Elaboración propia a partir de los datos de la ECV 2014.
Los resultados de los coeficientes en la matriz de estructura tratan de la correlación de
las variables independientes con las funciones discriminantes del análisis. Cuanto más
próxima a ±1 mayor será la relación de la variable con la función discriminante.
48
En la tabla 4, se observa que la variable más correlacionada con la función
discriminante 1 es RENHOG 0,909, seguida de INGMIN con un 0,451 y, por último, la
variable RENTA, cuyo valor es 0,406.
En el caso de la segunda función discriminante la variable más correlacionada con
dicha función es INGMIN con un valor de 0,620 seguida de RENTA con un 0,428.
Tabla 4. Matriz estructura Análisis Discriminante pobreza
Fuente: Elaboración propia a partir de los datos de la ECV 2014.
Si se elevan al cuadrado los coeficientes de la matriz de estructura se obtiene la
proporción de varianza de las variables independientes que es explicada por la función
discriminante.
Por ejemplo, en la primera función:
0,9092= 0,82*100= 82%
Eso significa que el 82% de la varianza de la variable RENHOG es explicada por la
primera función discriminante quedando un 18% de la varianza de la misma variable
que será explicada por la segunda función y así sucesivamente con el resto de
variables.
Con la matriz de centroides se obtiene las medias de los tres grupos para cada función
discriminante. Como se observa las medias son diferentes entre sí, lo que indica que
los centroides de los grupos están separados y discriminados. En el caso de la función
1 se observan que todas las medias son diferentes entre ellas, situación distinta a la
que ocurre en la función 2, donde no hay grandes diferencias entre el grupo 2 y el
grupo 3 (Véase tabla 5)
49
Tabla 5. Tabla de centroides AD pobreza
Fuente: Elaboración propia a partir de los datos de la ECV 2014.
Para finalizar con la descripción de los resultados para este análisis discriminante se
comentarán los datos proporcionados en la tabla de resultados de clasificación.
De acuerdo con los resultados obtenidos, mediante el AD, se corrobora que los grupos
especificados originalmente se mantienen:
Grupo 1: No pobres
Grupo 2: Vulnerables
Grupo 3: Pobres
Con la realización de este análisis discriminante se ha conseguido un 88,5% de casos
correctamente clasificados. (Véase tabla 6)
Tabla 6. Clasificación AD pobreza
Fuente: Elaboración propia a partir de los datos de la ECV 2014.
50
Gráfico 7. Funciones discriminantes canónicas (Pobreza)
Como puede verse en el gráfico (Gráfico 7) se han obtenido 3 grupos donde el color
rojo representa a los casos clasificados en pobreza, es decir, aquellos que se sitúan
por debajo del umbral de pobreza o línea de pobreza de España en mayor o menor
medida. En amarillo se encuentran los casos cuyo umbral de pobreza se sitúa
alrededor del umbral del 60% hasta la mediana de España. Y, por último, en verde
aquellos casos que su distribución de ingresos le sitúan por encima de la mediana de
ingresos a nivel nacional. Los tres grupos quedan, aparentemente, bien delimitados,
siendo más numeroso el grupo de color verde y, en el caso del grupo 2 y 3 se han
obtenido unas regiones mucho más compactas que en el caso del grupo 1 donde se
registran valores más extremos.
Se aprecia cierto solapamiento entre los grupos. Para ello, se ha elaborado una tabla
adicional a las proporcionadas por el AD con las medias de cada grupo, tomando la
variable obtenida fruto del análisis discriminante y cada variable independiente. Como
se puede observar, para la variable INGMIN, los grupos 2 (vulnerables) y 3 (pobres)
presentan medias muy parecidas a diferencia de lo que ocurre con el grupo 1 que se
distingue perfectamente.
En el caso de la variable RENHOG se aprecia una buena diferencia de las medias en
los 3 grupos y, por último, la variable RENTA que, en principio, tampoco debería
51
ocasionar ningún solapamiento debido a que las tres medias de cada grupo están bien
diferenciadas. (Véase tabla 7)
Tabla 7. Medias de los grupos en las variables cuantitativas.
Fuente: Elaboración propia a partir de los datos de la ECV 2014
En este segundo análisis discriminante se ha utilizado como variable de agrupación
(Regporcpob) con cinco grupos definidos:
1 Comunidades autónomas con bajo porcentaje de pobreza.
2 Comunidades autónomas con porcentaje medio-bajo de pobreza.
3 Comunidades autónomas con porcentaje medio de pobreza.
4 Comunidades autónomas con porcentaje medio-alto de pobreza.
5 Comunidades autónomas con porcentaje alto de pobreza.
Y como variables independientes se han introducido las mismas que en el análisis
discriminante anterior: RENTA, RENHOG e INGMIN.
La muestra del análisis es de 26454 casos válidos, los cuales participan en la
derivación de las funciones discriminantes. Los casos que se han excluido sólo lo son
en cuanto a la derivación de dichas funciones, ya que una vez derivadas los casos de
la muestra original (26531) participan en la clasificación en los grupos.
Este análisis discriminante se ha elaborado con el fin de comprobar si las variables
independientes introducidas discriminan y diferencian a los grupos propuestos en la
variable de agrupación.
Dicha comprobación se va a iniciar con la observación del visor de SPSS que
proporciona información sobre las medias y las desviaciones típicas para cada variable
independiente por separado. El requisito que se han de cumplir es que las medias
aritméticas sean diferentes en los cinco grupos propuestos, lo cual se cumple.
52
La comprobación del supuesto de homocedasticidad mediante la prueba M de Box
sobre la igualdad de las matrices de covarianza, muestra en este caso un valor de
0.000, por lo cual se cumple con el supuesto de que las matrices de covarianzas de
los grupos son diferentes.
Tabla 8. Autovalores. Análisis discriminante CC.AA. y porcentaje de pobreza
Fuente: Elaboración propia a partir de los datos de la ECV 2014
Los autovalores obtenidos están colocados en orden descendente siendo el autovalor
mayor el perteneciente a la función 1 y menor el de la función 3. (Véase tabla 8)
En este caso, el autovalor de la primera función discriminante, combinación lineal de
variables que hacen máxima la diferenciación entre los grupos, es de 3,246 y explica
un 87,5% de la variabilidad de la variable dependiente. El porcentaje de la varianza se
obtiene a través del cociente entre la cifra del autovalor de la primera función y la
suma total de autovalores.
Autovalor de la primera función discriminante= 3,246
Suma total de los autovalores = 3,712
% de la varianza = 3,246/3,712 =0,874 *100= 87,4%
En cuanto a la segunda función discriminante, compuesta por una combinación de
otras variables discriminantes que ha de ser diferente a la combinación de la primera
función discriminante, se ha obtenido un autovalor de 0,466 y explica un 12,5% de la
variabilidad de la variable dependiente.
Autovalor de la segunda función discriminante= 0,466
Suma total de los autovalores= 3,712
% de la varianza= 0,466/3,712= 0,125*100= 12,5%
53
En base a los resultados obtenidos, la primera función discriminante es mucho más
importante en el análisis, seguida por la segunda función mientras que la tercera
función discriminante aporta muy poca importancia en el análisis.
Una vez que se ha descrito la relevancia de las funciones discriminantes se ha de
comentar la importancia de dichas funciones en la diferenciación entre los grupos a
partir de los valores que otorga la correlación canónica. La correlación canónica ha de
ser elevada (cercana a 1) para considerar que una función es importante en la
diferenciación de los grupos.
En este caso, la correlación canónica más elevada es la que corresponde a la función
1 con un valor de 0,874, mientras que en la segunda función posee un valor de 0,564 y
la tercera un valor de 0,004. Por lo tanto, la primera función es más importante en
términos de diferenciación entre los grupos que la segunda función discriminante y,
sobre todo, que la tercera.
La correlación canónica se obtiene a partir de la raíz cuadrada del autovalor de la
primera función entre el mismo valor sumándole una unidad y multiplicándolo por 100:
𝑟1=√3,246
3,246+1𝑥100 𝑟1 = √
0,466
0,466+1𝑥100 𝑟1 = √
0,000
0,000+1𝑥100
Ahora bien, si se eleva al cuadrado la correlación canónica de la primera función
discriminante:
0,8742=0,763*100= 76,3%
La primera función discriminante explica un 76,3% de la varianza total de la variable
dependiente.
La segunda función discriminante:
0,5642= 0,318* 100= 31,8%
54
La segunda función discriminante explica un 31,8% de la varianza total de la variable
dependiente que no ha sido explicada por la primera función discriminante.
Y la tercera función discriminante:
0,0042=0,000016*100= 0,0016%
La tercera función discriminante explica un 0,0016% de la varianza total de la variable
dependiente que no ha sido explicada ni por la función 1 ni por la función 2.
Una vez descrito lo anterior se ha de conocer la significación de las funciones
discriminantes precedentes. Para ello, se hará uso de los estadísticos λ de Wilks y χ2.
Comprobando la significación de las funciones permite conocer si las medias
(centroides) de los grupos están separados. (Véase tabla 9)
Tabla 9. Lambda de Wilks. AD CC.AA. y porcentaje de pobreza
Fuente: Elaboración propia a partir de los datos de la ECV 2014
Se comenzará comentando los valores de λ de Wilks donde el valor de la misma en el
contraste de las funciones 1 a la 2 es de 0,161, el valor del mismo estadístico para el
contraste de las funciones 2 a la 3, cuando se elimina la primera función, es de 0.682
y, el de la tercera función toma un valor de 1. El valor de la primera función es más
cercano a 0 que el de la función 2 a la 3 y 3 y, por tanto, la primera función posee
mayor poder discriminante. No obstante, observando el p-valor asociado al estadístico
χ2 es menor a 0,05 (0,000) permitiendo afirmar que las medias de los grupos están
separadas y que ambas funciones discriminantes son importantes para el análisis, a
pesar de que la función 2 posea un valor cercano a 1 en la λ de Wilks.
El valor de la lambda de Wilks se obtiene de la siguiente manera:
Λ = (1
1 + 3,246) (
1
1 + 0,466) (
1
1 + 0) = 0,15
55
Como se observa, el resultado obtenido es cercano a 0, lo cual indica la existencia de
una gran diferenciación entre los grupos y que los centroides están separados.
En el presente análisis discriminante son 3 las variables predictoras que muestran
poder discriminante en la diferenciación de los grupos. Por ello, a continuación, se va a
conocer cuál es la participación de cada variable en las funciones discriminantes.
(Véase tabla 10)
Se observan los coeficientes estandarizados de las funciones discriminantes, los
cuales son similares a la interpretación de los coeficientes beta en el análisis de
regresión.
El valor de dichos coeficientes representa la contribución relativa de la variable a la
función en unidades de desviación típica.
Tabla 10. Coeficientes de las funciones discriminantes CC.AA. y pobreza
Fuente: Elaboración propia a partir de los datos de la ECV 2014
En la primera función discriminante la variable que más contribuye al poder
discriminante es RENHOG (0,665), seguida por INGMIN y RENTA con un valor de
0,589 y 0364, respectivamente. Lo mismo ocurre en la función discriminante 2 aunque
con valores diferentes. Sin embargo, en la tercera función discriminante la variable que
mayor relevancia posee es RENTA (0,962), mientras que RENHOG e INGMIN
proporcionan valores negativos (-0,400 y -0,045, respectivamente).
No obstante, se interpretará también los resultados de los coeficientes en la matriz de
estructura (véase tabla 11) porque éstos no se ven afectados por posibles
interrelaciones de algunas de las variables predictoras. El valor que se obtiene en la
siguiente tabla se trata de la correlación de las variables independientes con las
funciones discriminantes del análisis. Cuanto más próxima a ±1 mayor será la relación
de la variable con la función.
56
En esta tabla se incluyen todas las variables independientes que se han introducido en
un principio sin excluir aquellas no significativas para el análisis. No obstante, este
problema aquí no se ha obtenido, ya que las tres variables independientes
introducidas en el análisis han resultado ser significativas para el análisis.
Tabla 11. Matriz estructura. AD CC.AA y porcentaje pobreza
Fuente: Elaboración propia a partir de los datos de la ECV 2014
En la función discriminante 1 la variable más correlacionada con dicha función es
RENHOG con 0,781, que como se aprecia el valor es cercano a 1. A esta variable le
sigue INGMIN con un 0,599 y, por último, la variable menos correlacionada con la
función es RENTA, cuyo valor es 0,353, el cual se aproxima más a 0 que a 1.
En el caso de la segunda función discriminante la variable más correlacionada con
dicha función es INGMIN con un valor de 0,758. Y, por último, en la tercera función
discriminante, se observa que la variable más correlaciona con la función es la de
RENTA con un valor de 0,914.
Si se elevan al cuadrado los coeficientes de la matriz de estructura se obtiene la
proporción de varianza de las variables independientes que es explicada por la función
discriminante.
Por ejemplo, en la primera función:
0,7812= 0,60*100= 60%
Eso significa que el 60% de la varianza de la variable RENHOG es explicada por la
primera función discriminante quedando un 40% de la varianza de la misma variable
57
explicada por la segunda y tercera función y así sucesivamente con el resto de
variables.
Con la matriz de centroides se obtiene las medias de los tres grupos para cada función
discriminante. Como se observa las medias son diferentes entre sí, lo que indica que
los centroides de los grupos están separados y discriminados. (Véase tabla 12) Si
bien, los resultados obtenidos para la dimensión 3 son más similares que en el caso
de las otras dos funciones restantes.
Tabla 12. Centroides. AD CC.AA y porcentaje pobreza
Fuente: Elaboración propia a partir de los datos de la ECV 2014
Para finalizar con la descripción de los resultados para este análisis discriminante se
comentarán los datos proporcionados en la tabla de resultados de clasificación.
El AD para este análisis concreto ayuda a corroborar que mediante la introducción del
conjunto de variables independientes que se ha seleccionado es posible caracterizar y
discriminar a 4 de los 5 grupos predeterminados por la variable dependiente. Según
los resultados el grupo de Comunidades Autónomas con un porcentaje de población
pobre medio-alto no es posible caracterizarlos como un grupo único y homogéneo,
sino que sus individuos se han recolocado en otros grupos, principalmente en el grupo
de Comunidades Autónomas con un porcentaje alto de población en pobreza.
Además este análisis ha clasificado correctamente un 90,4 de casos originalmente
agrupados. (Véase tabla 13)
58
Tabla 13. Clasificación AD CCAA y porcentaje pobreza
Fuente: Elaboración propia a partir de los datos de la ECV 2014
Gráfico 8. Funciones discriminantes canónicas Comunidades Autónomas y porcentaje pobreza
Fuente: Elaboración propia a partir de los datos de la ECV 2014
Como puede verse en el gráfico 8 se han obtenido 4 grupos donde el color rojo hace
referencia a las Comunidades Autónomas cuyo porcentaje de pobreza es más
elevado, en amarillo las regiones donde el porcentaje de pobreza es medio, el color
azul engloba aquellas CC.AA. con un porcentaje de población declarada como pobre
medio-bajo y en verde las comunidades autónomas cuya porcentaje de pobreza es
más bajo. Los cuatro grupos quedan, aparentemente, bien delimitados, siendo más
numeroso y disperso el grupo de color verde, en comparación con el resto de grupos
dónde las regiones coloreadas en el gráfico son más compactas.
59
La distribución de las Comunidades Autónomas de España según los grupos
establecidos en las categorías de la variable dependiente es la que se puede ver en la
siguiente imagen (véase ilustración1):
Ilustración 1. Mapa de España según porcentaje de pobreza (CC.AA.)
Fuente: Elaboración propia a partir de los datos de la ECV 2014
Porcentaje población pobre bajo
Porcentaje de población pobre medio-bajo
Porcentaje de población pobre intermedio
Porcentaje de población pobre medio-alto
Porcentaje de población pobre alto
Como se ve, el mapa de España se encuentra coloreado en un degradado de tonos
azules dónde el color azul más oscuro alude a la obtención de un porcentaje de
población pobre elevado, y el azul claro está relacionado con aquellas regiones en las
que el porcentaje de población pobre es bajo.
En los resultados del AD, el tono de azul semioscuro que poseen Castilla La-Mancha,
Valencia, Melilla y las Islas Canarias no han sido clasificadas como un grupo
independiente al resto, sino que, en su gran mayoría, han sido clasificados en el grupo
de Andalucía, Extremadura, Ceuta y Murcia (azul oscuro).
60
Por tanto, quedaría evidente la diferenciación entre el norte, con porcentajes de
pobreza bajos, y centro de España frente a sur de España, con porcentajes de
pobreza altos. Esto viene determinado por la existencia de una distribución de
ingresos más elevada en algunas zonas que en otras, pues el cálculo del porcentaje
de pobreza viene dado por el cálculo del umbral de pobreza y ésta es una medida
relativa dependiendo su valor del nivel de renta y de la distribución de los ingresos en
cada población. Por ello, el valor obtenido tras su cálculo puede aumentar o disminuir
en la medida en que los ingresos de las poblaciones sean mayores o menores.
En base a esto último, se puede constatar con la visualización de la Ilustración 2, la
cual muestra un mapa coloreado en base a los umbrales de pobreza o línea de
pobreza de las CC.AA, en relación al umbral nacional.
En color rojo están señaladas aquellas cuyo umbral de pobreza es más bajo que el
umbral nacional, en amarillo referencia a aquellas cuyo umbral está en torno al umbral
nacional y en verde aquellas, cuyo umbral es superior al de España. Con esto se
puede concluir que la distribución de ingreso del color rojo es más baja y desigual que
en el caso del color verde, constatándose de nuevo, la polarización entre norte y sur. 2
2 Es necesario remarcar que un umbral de pobreza más bajo en relación al umbral de referencia, en este caso el
español, no necesariamente conlleva a mayores porcentajes de pobreza. Del mismo modo, umbrales de pobreza más
altos que el nacional no deriva, en todos los casos, en porcentajes bajos de población pobre. Por ejemplo, en el caso
de la Comunidad Valenciana en la figura 2 obtiene un umbral similar al de Castilla y León, pero ésta última posee
menor porcentaje de población pobre que la Comunidad Valenciana. (Véase Figura 1)
61
Ilustración 2. Mapa de España según umbrales de pobreza
Fuente: Elaboración propia a partir de los datos de la ECV 2014
Umbral de pobreza bajo
Umbral de pobreza medio
Umbral de pobreza alto
4.3 Resultados HOMALS
La herramienta estadística multivariante no lineal HOMALS se utiliza con el objetivo de
buscar la asociación de categorías. En este caso en concreto se basa en obtener qué
categorías de las dimensiones que miden la exclusión social se relacionan con las de
pobreza relativa. Con la visualización de dichas asociaciones se puede obtener los
perfiles de las categorías de pobreza relativa respecto las categorías de las
dimensiones y poder observar que características poseen. Por ello, permite conocer
posibles grupos (clusters), con la característica de poseer homogeneidad en su interior
y heterogeneidad respecto al resto.
62
Por ello, cada grupo que forma la pobreza relativa aparecerán tan próximas como sea
posible al conjunto de categorías seleccionadas por los integrantes de cada grupo.
Todas ellas son cualitativas y categóricas, excepto pobreza relativa y carencia material
que han sido recodificadas en categorías con el objetivo de poder introducirlas en el
análisis.
Cada una de las variables representan las dimensiones a estudiar para la exclusión
social y, por tanto, se busca con este análisis observar qué categorías de las variables
(dimensiones) se relacionan con la variable de pobreza relativa. Con todo ello se
pretende conocer la relación existente entre las variables y observar cuáles
contribuyen a establecer patrones o perfiles de la población considerada, en este
estudio, como “no pobre”, “vulnerable” y “pobre”.
Mediante los resultados del modelo se puede conocer en qué momento del proceso de
iteración alcanzó la mínima diferencia entre iteraciones y el nivel de ajuste del modelo
para llegar a la solución última, lo cual ocurrió en la iteración 32, pues el incremento de
varianza explicada dejó de ser significativo.
Tabla 14. Resumen del modelo Análisis de la Homogeneidad
Fuente: Elaboración propia a partir de los datos de la ECV 2014.
En el presente modelo de ACM se va a trabajar en base a dos dimensiones siendo
más importante en el modelo la dimensión 1 con un autovalor de 2,547 que la
dimensión 2 con un autovalor de 1,951. Por tanto, la dimensión 1 al poseer un mayor
autovalor contiene una mayor proporción de información del modelo que la dimensión
2. En cuanto a la inercia, proporción de la varianza explicada por cada dimensión, se
ha obtenido globalmente un 56,2%. Esto significa que un 56,2% de la variabilidad de
los datos es explicada por las variables incluidas en el modelo, mientras que el 31,8%
de la variabilidad de los datos queda explicada por la dimensión 1 y el 24,4% por la
dimensión 2. (Véase tabla 14)
63
A continuación se va a aludir al coeficiente Alfa de Cronbach, el cual mide la fiabilidad
de la escala de medida y está basado en los autovalores promedio. Éste oscila entre el
0 y el 1, de manera que cuanto más se aproxime a 1 mayor será la fiabilidad. En el
presente modelo se ha obtenido un Alfa de Cronbach de 0,635, el cual muestra una
fiabilidad intermedia.
En cuanto a las coordenadas de cada categoría de cada una de las variables para
ambas dimensiones (Véase tabla 15) se podrá conocer la posición de las categorías
en los ejes X (dimensión 1) e Y (dimensión 2). Además de conocer la relación con los
ejes también se puede sustraer información sobre la asociación de las categorías en
relación a las dimensiones según los valores que se proporcionen en las dimensiones.
Una relación fuerte será aquella en la que las categorías se encuentren alejadas del
origen, mientras que si su posición se encuentra cerca del origen no existirá dicha
asociación o ésta será muy débil.
En cuanto a la variable “Carencia material” se observa que las tres categorías (No
carencia, carencia intermedia y carencia) posibles están posicionadas en la dimensión
1, es decir, en el eje X.
En el caso de esta variable, la categorías que mayor relación poseen con su eje
correspondiente es “Carencia” por poseer una puntuación más elevada respecto a las
categorías restantes., luego “No carencia” y, por último, “Carencia intermedia”. Que las
tres categorías de la variable “Carencia material” estén posicionadas en la dimensión
quiere decir que, en el gráfico que con posterioridad se comentará, se encontraran en
torno a dicha dimensión, aunque en el caso de “Carencia” con mayor distancia
respecto al origen por poseer más asociación.
En la variable de las condiciones de la vivienda se observa que, de nuevo, todas las
categorías se posicionan en la dimensión 1, pero las más asociadas a ésta son: Muy
malas (-2,652) y malas (-1,600), mientras que muy buenas (0,123) y buenas (-0,651)
no están tan asociadas.
Las categorías que miden las condiciones del entorno también se posicionan alrededor
de la dimensión 1, pero es la categoría de “malas condiciones del entorno” la que
posee más asociación con ésta. Sin embargo, la categoría de “buenas condiciones del
entorno”, en el mapa dimensional se podrá ver más cercana al origen debido a su
escasa asociación.
64
En cuanto a las categorías de la variable nivel de estudios, aquellas que presentan
mayor relación con la dimensión 1 son: Menos que primaria, primaria y educación
superior, mientras que el resto de categorías guardan mayor relación con la dimensión
2.
En el caso de las categorías de pobreza relativa, las categorías posicionadas en la
dimensión 1 son: “No pobres” (mayor asociación con la dimensión) y “vulnerables” y,
por el contrario, la categoría “pobres” está posicionada en la dimensión 2.
Las categorías de la variable que mide el estado de salud están todas posicionadas en
la dimensión 1 siendo la variable “regular estado de salud” y “mal estado de salud”
aquellas que guardan mayor relación con dicha dimensión.
En la variable sobre la situación laboral se encuentran varias categorías asociadas a la
dimensión 1: Asalariado, trabajador por cuenta propia, incapacitado, labores del hogar
y otras inactividades, mientras que posicionadas y muy asociadas con la dimensión 2
se encuentran: Parado, estudiante y jubilado. De las categorías posicionadas entorno
a la dimensión 1 son: Incapacitados y otras inactividades, mientras que las de la
dimensión 2.
Por último, la variable que categoriza los tipos de contratos laborales se posiciona y
ambas categorías poseen asociación con la dimensión 2.
65
Tabla 15. Cuantificaciones dimensiones de la exclusión social y pobreza
Fuente: Elaboración propia a partir de los datos de la ECV.
66
Con la ayuda de la siguiente tabla (véase tabla 16) se puede conocer qué variables
poseen mayores valores de discriminación en cada dimensión.
Tabla 16. Medidas de discriminación
Fuente: Elaboración propia a partir de los datos de la ECV 2014.
Dicha tabla confirma que, en su gran mayoría, todas las variables están más
relacionadas con la dimensión 1, aunque alguna de ellas con mayor valor en dicha
dimensión, como es el caso de “carencia material” y “nivel de estudios” (0,568 y 0,544,
respectivamente), mientras que otras variables, a pesar de estar más relacionadas con
la dimensión 1 su valor discriminante es menor. En este segundo caso se puede aludir
a “condiciones del entorno” con un 0,021. Mientras que la variable “tipo de contrato”
está más relacionada con la dimensión 2 con un valor de 0,256.
Además, se puede decir que hay una variable que se relaciona con ambas
dimensiones por la obtención de un valor elevado en la media de ambas dimensiones
para una variable. Esto puede aplicarse a la variable “situación laboral”, cuya media es
de 0,599. Si bien, en este caso, a pesar de relacionarse con ambas dimensiones lo
hace en mayor medida con la segunda dimensión (0,737), frente a la dimensión 1 con
un valor de 0,461.
Como puede apreciarse, la variable que menor relación posee con ambas
dimensiones es “entorno” con 0,021 para la primera dimensión y 0,011 para la
segunda. En base a estos resultados con mucha probabilidad esta variable se
encontrará muy cerca del origen sin capacidad de discriminar, tal y como puede
apreciarse en el Gráfico 9. Además de la variable “entorno”, también posee poca,
67
ligeramente mayor que la variable anterior, capacidad de discriminar la variable
“condiciones de la vivienda”.
Gráfico 9. Medidas de discriminación análisis I HOMALS
Fuente: Elaboración propia a partir de los datos de la ECV 2014
Por último se comentará el gráfico de categorías conjuntas obtenido tras la ejecución
del modelo de ACM. (Véase gráfico 10)
Se aprecia que la primera dimensión (eje X) está caracterizada por la variable que
mide el nivel de estudios y la situación laboral, mientras que el eje Y por las variables
que miden las condiciones de la vivienda y la carencia material.
Si se analiza el gráfico a partir de la línea que parte del origen del eje X divide el
gráfico en dos zonas, la zona izquierda y la derecha, observándose como la parte
izquierda queda constituida por las categorías que indican peores condiciones en
varias de las dimensiones, mientras que la parte derecha agrupa a las categorías que,
en su conjunto, hacen que los individuos gocen de una vida cohesionada socialmente.
Sin embargo, si ahora se analiza las regiones resultantes de la partición del gráfico por
la línea que parte del origen del eje Y no se observa un patrón concreto.
68
Dicho esto, se va a llevar a cabo un comentario más exhaustivo que se realizará
mediante la descripción de las categorías más cercanas y por cada uno de los cuatro
cuadrantes del diagrama.
Así pues, el cuadrante 1 está caracterizado por la asociación de las categorías
“vulnerables” con malas y muy malas condiciones de la vivienda, estado de salud malo
y regular, con estudios inferiores a primaria y primarios, jubilados, incapacitados y
otras inactividades.
En el cuadrante dos se puede observar la asociación entre “no pobres” con contrato
fijo, educación superior, situación laboral de asalariados, no se posee carencia
material, gozan de muy buenas condiciones de vida y de un buen entorno.
Gráfico 10. Categorías conjuntas. Pobreza y dimensiones de la exclusión social
Fuente: Elaboración propia a partir de los datos de la ECV 2014
69
En el cuadrante 3 muestra que las categorías asociadas son: Buen estado de salud,
trabajadores por cuenta propia, estudiantes, estudios de FPE y Bachillerato.
Por último, en el cuadrante 4 muestra asociaciones entre la categoría de pobres con
carencia y carencia material intermedia, condiciones malas del entorno, contrato
laboral temporal, estudios de secundaria y con buenas condiciones de la vivienda.
En este segundo análisis de la homogeneidad se busca la asociación entre las
categorías de las variables sociodemográficas y cómo éstas se relacionan con la
variable de pobreza relativa. Con todo ello se pretende conocer la relación existente
entre las variables y observar cuáles contribuyen a establecer patrones o perfiles de la
población considerada.
En este caso, el proceso iterativo se ha detenido en la iteración 28 dónde el
incremento de varianza explicada dejó de ser significativo.
Tabla 17. Resumen del II modelo HOMALS.
Fuente: Elaboración propia a partir de los datos de la ECV (2014)
De nuevo se va a trabajar en base a dos dimensiones siendo más importante en el
modelo la dimensión 1 con un autovalor de 2,284 que la dimensión 2 con un autovalor
de 1,988. Por tanto, la dimensión 1 al tener un mayor autovalor posee una mayor
proporción de información del modelo que la dimensión 2. En cuanto a la inercia,
proporción de la varianza explicada por cada dimensión, se ha obtenido globalmente
un 71,2%. Esto significa que un 71,2% de la variabilidad de los datos es explicada por
las variables incluidas en el modelo, mientras que el 38,1% de la variabilidad de los
datos queda explicada por la dimensión 1 y el 33,1% por la dimensión 2. (Véase tabla
17)
A continuación se va a aludir al coeficiente Alfa de Cronbach, el cual mide la fiabilidad
de la escala de medida y está basado en los autovalores promedio. Éste oscila entre el
70
0 y el 1, de manera que cuanto más se aproxime a 1 mayor será la fiabilidad. En el
presente modelo se ha obtenido un Alfa de Cronbach de 0,638, el cual muestra una
fiabilidad intermedia.
Al comentar las coordenadas de cada categoría de cada una de las variables para
ambas dimensiones (Véase tabla 18) se podrá conocer la posición de las categorías
en los ejes X (dimensión 1) e Y (dimensión 2). Además de conocer la relación con los
ejes también se puede sustraer información sobre la asociación de las categorías en
relación a las dimensiones según los valores que se proporcionen en las dimensiones.
71
Tabla 18. Cuantificaciones
Fuente: Elaboración propia a partir de los datos de la ECV 2014
En cuanto a la variable “sexo” se observa que las dos categorías están posicionadas
en la dimensión 1, es decir, en el eje X. Además ambas categorías poseen,
aproximadamente, el mismo grado de asociación con su dimensión.
En la variable de la edad se observa que las edades de 16 años hasta 35 (categorías
1 y 2) y de 56 hasta 66 y más (categorías 5 y 6) están posicionadas en la dimensión 1,
mientras que las categorías 3 y 4, las cuales aluden a edades adultas están
posicionadas en la dimensión 2.
72
Las categorías sobre el estado civil se posicionan todas en la dimensión 1 excepto
viudos y divorciados. Así como, las categorías de pobreza; no pobre y vulnerable
también se sitúan en la dimensión 1, mientras que pobres en la 2
La variable sobre el estado de salud muestra que todas sus categorías se posicionan
en la dimensión 1 siendo la que más asociada está respecto a ésta es el estado de
salud malo.
Por último, las categorías de la ocupación todas se sitúan en la dimensión 1 menos la
categoría 5 que alude a la ocupación de servicios y comercio. De este grupo de
categorías la más asociada es directores y gerentes y ocupaciones militares.
También se puede conocer qué variables poseen mayores valores de discriminación
en cada dimensión. Mediante la lectura de la tabla 19 y grafico 11.
Tabla 19. Medidas de discriminación de Pobreza y variables sociodemográficas
Fuente: Elaboración propia a partir de los datos de la ECV 2014.
Las variables más relacionadas con la dimensión 1 son: Estado civil, pobreza relativa,
edad y renta. Aunque en el caso de estas dos últimas también se podría considerar
que estarían relacionadas con las dos dimensiones y discriminarían bien en ellas
porque poseen valores en la media elevados, 0,549 y 0,560 respectivamente.
Por el contrario, las variables relacionadas y que discriminan más en la dimensión 2
son: sexo y ocupación.
Además de los comentarios expresados, como puede apreciarse, la variable que
menor relación posee con ambas dimensiones es “sexo” con 0,019 para la primera
dimensión y 0,093 para la segunda.
73
Gráfico 11. Medidas de discriminación. Análisis II HOMALS
Fuente: Elaboración propia a partir de los datos de la ECV 2014
Por último se comentará el gráfico de categorías conjuntas obtenido tras la ejecución
del modelo de ACM. (Véase gráfico 12)
Se empezará el comentario analizando el gráfico a partir de la línea que parte del
origen del eje X divide el gráfico en dos zonas, la zona izquierda y la derecha,
observándose como la parte izquierda queda caracterizada por las categorías que
representan ocupaciones laborales con menor retribución económica que en la parte
derecha (ocupaciones elementales versus directores y gerentes y profesionales
científicos e intelectuales), soltero versus casado y jóvenes (de 16 años a 35 años) a
la izquierda y mayores (de 46 hasta mayores de 66) a la derecha.
Sin embargo, si ahora se analiza las regiones resultantes de la partición del gráfico por
la línea que parte del origen del eje Y se observa en la parte de arriba a las mujeres y
abajo a los hombres.
74
Ahora, como en el caso anterior, se va a analizar el gráfico mediante la descripción de
las categorías más cercanas y por cada uno de los cuatro cuadrantes del diagrama.
El cuadrante 1 está caracterizado por la asociación de las categorías “mujer” con
pobre y vulnerable, ocupaciones elementales y ocupaciones de comercio y servicios.
Las categorías presentan alta asociación, ya que la gran mayoría no presenta grandes
distancias entre sí.
En el cuadrante dos se integran categorías que no guardan excesiva asociación
debido a la distancia existente entre ellas. Las categorías que se sitúan en dicho
espacio son: Viudos, mayores de 66 años y agricultores y trabajadores de la
ganadería, silvicultura…
Gráfico 12. Categorías conjuntas. Sociodemográficas y pobreza
Fuente: Elaboración propia a partir de los datos de la ECV 2014
75
El cuadrante 3 muestra gran asociación entre las categorías de hombre, de 36 a 65
años, no pobre, casado, divorciado y con las categorías de ocupación de directores y
gerentes, ocupaciones militares y profesionales científicos e intelectuales.
Por último, el cuadrante 4 muestra asociaciones entre la categoría de soltero con las
edades de 16 a 35 años y con la ocupación profesional de personal de apoyo
administrativo.
Se finaliza la utilización de esta técnica con la aplicación de HOMALS a las categorías
de la exclusión social junto con el sexo para conocer si las asociaciones
proporcionadas son reseñables y para obtener una visión global de los dos
fenómenos.
En este caso, el proceso iterativo se ha detenido en la iteración 30, pues es en ésta
donde se ha alcanzado la convergencia. También se va a trabajar sobre 2
dimensiones siendo la más importante la primera, ya que su autovalor es 2,719 frente
a 1,743 de la segunda dimensión.
La inercia explicada globalmente alcanza el 49,6%, lo que significa que se explica en
ese porcentaje la variabilidad de los datos en este modelo. Si bien, el 30,2% de
variabilidad es explicada por la dimensión 1 y el 19,4% por la dimensión 2. (Ver tabla
20)
Tabla 20. Resumen del modelo III HOMALS
Fuente: Elaboración propia a partir de los datos de la ECV 2014.
Como se puede apreciar, en este caso el coeficiente Alfa de Cronbach, es
mínimamente más pequeño que el de los anteriores modelos. Aun así, se puede
considerar como una medida de fiabilidad suficiente. (Véase tabla 20)
76
Tabla 21. Cuantificaciones
Fuente: Elaboración propia a partir de los datos de la ECV 2014.
A continuación se va a elaborar un comentario conjunto y global para todas las
categorías según su posicionamiento en una dimensión u otra y su asociación con la
misma. (Véase tabla 21)
En la dimensión 1 se posicionan las categorías siguientes: No carencia, condiciones
malas de la vivienda, todas las categorías del estado de salud, asalariado, trabajador
por cuenta propia, incapacitado, labores del hogar y otras actividades. También se
posicionan en ella las dos categorías de las condiciones del entono, estudios inferiores
a primaria, primaria, FPE y educación superior. Por último, las dos categorías de
relaciones sociales.
77
De este conjunto de categorías las más asociadas a la dimensión 1 son: Condiciones
malas de la vivienda, estado de salud malo, incapacitados y estudios inferiores a los
primarios.
Por el contrario, las posicionadas en la dimensión 2 son: sexo, carencia intermedia y
carencia, las dos categorías sobre el contrato laboral, parado, estudiante, jubilado y
estudios secundarios y de bachillerato. En este caso las más asociadas son:
Estudiante y bachillerato.
Observando la tabla que proporciona las medidas discriminantes se aprecia que las
variables que mayor poder discriminante poseen en la dimensión 1 son: Carencia
material, condiciones del entorno, condiciones de la vivienda, estado de salud y
relaciones sociales. Por el contrario, las variables más discriminantes en la dimensión
2 son: Sexo y tipo de contrato. Además, se puede apreciar que hay dos variables que
discriminan en las dos dimensiones, las cuales poseen altos valores en la media, que
son: Situación laboral y nivel de estudios. (Véase tabla 22 y gráfico 13)
Tabla 22. Medidas de discriminación Sexo y dimensiones de la exclusión social
Fuente: Elaboración propia a partir de los datos de la ECV 2014.
78
Gráfico 13. Medidas de discriminación análisis III HOMALS
Fuente: Elaboración propia a partir de los datos de la ECV 2014
Como en los anteriores casos se va a finalizar la descripción de los resultados de este
modelo HOMALS con el comentario del gráfico de categorías conjuntas. (Véase
gráfico 14)
Se empezará el comentario analizando el gráfico a partir de la línea que parte del
origen del eje X divide el gráfico en dos zonas, la zona izquierda y la derecha,
observándose como la parte izquierda queda caracterizada por las categorías que
representan situaciones de exclusión social, mientras que la parte derecha queda
asociada a todo tipo de categorías que representan una vida integrada.
El cuadrante 1 está caracterizado por la asociación de las categorías de: Incapacitado,
jubilado, mal y regular estado de salud, estudios primarios e inferiores a éste.
En el cuadrante dos se integran las categorías siguientes: Contrato fijo, educación
superior, asalariados, trabajadores por cuenta propia, hombre, no carencia y buenas
relaciones sociales.
79
Gráfico 14. Categorías conjuntas. Sexo y dimensiones de exclusión social.
Fuente: Elaboración propia a partir de los datos de la ECV 2014
El cuadrante 3 es el que menor asociación guardan las categorías, pero está integrado
por buen estado de salud, estudios de FPE y bachillerato y estudiante.
Y, por último, el cuadrante 4 asocia las categorías de malas relaciones sociales, malas
condiciones de la vivienda, carencia total e intermedia, labores del hogar, otras
inactividades, parado, contrato temporal, condiciones del entorno malas y mujer.
80
4.4 Resultados HJ Biplot
Se realiza un HJ Biplot, con la ayuda del programa estadístico MULTBIPLOT (Vicente,
2015), para los datos de las diferentes dimensiones de la exclusión social,
previamente recodificadas para este análisis en 0 y 1 para lograr un sumatorio de las
mismas y poder observar el comportamiento de las Comunidades Autónomas.
Una vez obtenidos los totales de los sumatorios se han dividido por el número de
población de cada Comunidad para evitar distorsiones en los resultados.
Gráfico 15. HJ Biplot. Comunidades Autónomas y dimensiones de la exclusión social (ejes 1-2)
Fuente: Elaboración propia a partir del Software MULTBIPLOT
En el gráfico 15 se representa el plano definido por los dos primeros ejes (eje 1 y eje
2) con los que se consigue explicar el 77,8% de la variabilidad total original con una
calidad de representación de 400, tanto para las filas (Comunidades Autónomas) como
para las variables.
81
En primera instancia se observa que todas las variables quedan bien representadas y
que 15 de las 19 Comunidades Autónomas también. Las que no quedan bien
representadas son: (véase tabla 23) La Rioja, Islas Baleares, Castilla y León y
Cataluña.
Tabla 23.Calidad de representación HJ Biplot
Fuente: Elaboración propia a partir del Software MULTBIPLOT
Lo primero que se distingue es que la variable que menor variabilidad posee, debido a
que la longitud de su vector es el más pequeño, es la que mide las condiciones del
entorno, mientras que en el resto de los vectores tiene una longitud mayor y similar
entre sí. También se puede conocer la covariación entre las variables según los
ángulos que formen dichos vectores respecto al origen. La mayor covariación
encontrada se da entre las variables de condiciones de la vivienda y estado de salud.
Luego, entre condiciones de entorno y laboral y entre carencia material y relaciones
sociales debido a la formación de ángulos pequeños entre ellas. Sin embargo, se
encuentra un ángulo recto entre laboral y carencia material, lo que indica que estas
dos variables son independientes.
82
A grandes rasgos se podría decir que, las variables vivienda, relaciones sociales,
carencia y salud covarían más entre ellas en comparación con entorno y laboral.
En relación a los individuos, se pueden apreciar dos grupos. En la parte derecha
aquellas Comunidades Autónomas que se sitúan en la parte positiva, lo que se puede
traducir en que poseen presencia de buenas condiciones en todas las variables. Y, en
la parte izquierda, un grupo más numeroso de CC.AA. que se sitúan en la parte
negativa, lo cual implica la presencia de malas condiciones en las variables. Sobre
todo en el caso de las Islas Canarias que al proyectar los vectores, obtendrían peores
puntuaciones en la variable laboral y entorno, mientras que, siguiendo el mismo
procedimiento, Ceuta y Melilla se encuentran más gravemente afectadas en las
variables de carencia material y relaciones sociales.
Estos resultados relacionados con el previo conocimiento del porcentaje de pobres en
cada Comunidad se puede decir que aquellas con bajo y bajo-medio porcentaje de
pobres no poseen riesgo de exclusión social. Como por ejemplo, País Vasco, Navarra,
Aragón, Asturias y Madrid. Y por el contrario, aquellas con altos porcentajes de
población han presentado en los resultados condiciones malas en todas las
dimensiones, como es el caso de Andalucía, Extremadura, Murcia y Ceuta.
Sin embargo, se encuentran dos situaciones intermedias en las que, se posee un
porcentaje medio de población pobre y una propensión al riesgo de exclusión, como es
el caso de Galicia y Melilla. Y la situación de porcentaje medio de pobreza pero no
riesgo de exclusión como es el caso de Cantabria.
83
5. DISCUSIÓN
En este apartado se busca la discusión de los resultados obtenidos a lo largo del
trabajo con el fin de compararlos con la literatura.
En primera instancia, se ha realizado un Análisis Discriminante para obtener una
clasificación de los individuos a partir de unos grupos definidos con anterioridad. En
este caso los grupos propuestos fueron mantenidos según los resultados del
discriminante. No obstante, la elección de los grupos para el estudio de la pobreza se
realiza de acuerdo al criterio de la mediana de los ingresos por unidad de consumo. En
este caso se realizó dicho cálculo obteniendo diferentes grupos, pero en alguno de los
grupos que identificaban distintos grados de pobreza resultaron ser grupos muy
reducidos en individuos y muy parecidos en relación a las variables monetarias, por
ello, se prefirió la reelaboración de los grupos con los que luego se contó con la
aprobación de éstos por el modelo de AD.
En cuanto a la aplicación del algoritmo HOMALS existen referencias en temas
similares de su utilización. Aquí se ha llevado a cabo con el fin de comprobar si las
dimensiones o indicadores que se presentaron en el marco teórico ayudan a identificar
y detectar situaciones de riesgo de exclusión social y de pobreza, como también se
muestra en el estudio de Laparra, Zugasti y García. (Laparra, Zugasti, & García, 2014)
En este caso, las que más ayudaban han sido la carencia material, nivel de estudios y
situación laboral.
A la vista de los resultados se han obtenido unos perfiles, que mediante un conjunto
de características es posible caracterizarlo. Los perfiles obtenidos no distan
demasiado de los obtenidos en otros estudios.
El protagonismo que cobran las mujeres en la caracterización del grupo que alude a la
pobreza es clave ya que, tanto la pobreza como la exclusión social son fenómenos
que tienden a la feminización, tal y como puede verse en los resultados y en estudios
elaborados por la Fundación Tomillo o la Fundación Foessa, entre otros estudios.
(Valls & Belzunegui, 2014)
Por último, en cuanto a los resultados obtenidos para las Comunidades Autónomas, se
podría hablar de las diferencias entre el norte y el sur de España. Dónde el norte, con
alguna excepción presenta mejores condiciones en los análisis, mientras que el sur
presenta peores valores y condiciones en los resultados.
84
Estos resultados son concordantes con la gran mayoría de trabajos que realizan una
comparativa por regiones como pueden ser los Documentos de Trabajo de la
Fundación BBVA (Subirats, Gomà, & Brugué, 2005b)
85
6. CONCLUSIONES
1. La utilización del Análisis Discriminante ha servido, en el primer caso, para
corroborar la existencia de los grupos que se habían fijado previos al análisis.
Ya que se obtuvo que, efectivamente, las variables cuantitativas introducidas
en el modelo eran capaces de discriminar y de clasificar a los individuos de la
muestra en los grupos que se habían establecido (no pobre, vulnerable, pobre).
2. El segundo Análisis Discriminante arrojó la información de que las mismas
variables que en el análisis anterior, no eran capaces de discriminar a los
individuos en los grupos de CC.AA. según su porcentaje de pobreza. Se
predefinieron 5 grupos, donde los individuos del grupo 4 (porcentaje de
pobreza medio-alto) fueron clasificados, casi, íntegramente en el grupo 5
(porcentaje de pobreza alto). Por tanto, las Comunidades Autónomas de
Castilla- La Mancha, Islas Canarias y Comunidad Valenciana no presentan
diferencias, en términos de las variables cuantitativas, con Andalucía,
Extremadura, Murcia y Ceuta. La confirmación del Análisis discriminante sobre
la existencia de los grupos permite los posteriores análisis.
3. El Análisis de la Homogeneidad ha permitido caracterizar a la muestra y
conocer los perfiles de cada grupo en relación a la asociación de las categorías
de cada variable implicada en el análisis.
4. Los perfiles de los individuos se han observado con los resultados del Análisis
de la homogeneidad que, los individuos pobres con ingresos por unidad de
consumo por debajo del umbral están asociados al riesgo de exclusión social
debido a graves carencias materiales, donde se incluyen aquellos bienes
materiales básicos para el uso diario y necesarios en la sociedad actual, por
situaciones laborales precarias, como por ejemplo, estar en paro. Además,
aquellos que son pobres y trabajan poseen un contrato temporal, lo cual
implica inestabilidad laboral.
5. Los individuos vulnerables a pesar de poseer una situación económica por
encima del umbral de pobreza están asociados a situaciones de clara
desventaja impidiendo gozar de una vida cohesionada estando asociados a al
riesgo de exclusión social, como en el caso anterior. El perfil de este grupo
86
respecto a las dimensiones a las dimensiones de la exclusión social se basan
en niveles de estudios bajos y situaciones laborales ajenas al mercado laboral,
como por ejemplo, jubilados, labores del hogar o incapacitados. Y, además,
poseen malas condiciones de la vivienda por problemas de goteras o
humedades, entre otros.
6. El perfil de los individuos no pobres alude a diversas situaciones que permiten
gozar de una vida cohesionada. (Estabilidad laboral, nivel de estudios alto,
situación laboral inmersa en el mercado laboral y buenas condiciones, tanto de
salud, como de vivienda y entorno).
7. Las mujeres poseen más riesgo de pobreza y exclusión social que los hombres
según los resultados obtenidos. Pues se asociaba más a las categorías
negativas.
8. La utilización del HJ Biplot ha resultado ser una herramienta muy útil en la
comparación por Comunidades Autónomas en relación a las dimensiones
analizadas a lo largo de todo el trabajo.
9. El HJ Biplot confirma que también existe cierta polarización entre el norte y sur
de España en el riesgo de exclusión social, al igual que ocurre con el de
pobreza.
10. Asturias y Cantabria presentan mayor similaridad en cuanto al no riesgo de
exclusión social, mientras que País Vasco y Navarra presentan más
diferencias. País Vasco presenta mejores condiciones en el ámbito laboral y en
el entorno, mientras que Navarra no posee carencia material y buenas
relaciones sociales.
11. Las Comunidades Autónomas en riesgo de exclusión social que mayor similitud
presentan son: Murcia, Andalucía, Extremadura, Valencia y Galicia. Si bien,
Galicia presenta menor riesgo de exclusión.
12. Ceuta, Melilla y las Islas Canarias presentan mayores riesgos de exclusión
social y pobreza.
13. El estudio de la pobreza y de la exclusión de manera conjunta ha contribuido a
la obtención de una imagen más amplia de la situación de los individuos.
87
14. Los resultados obtenidos enfatizan el dejar atrás el estudio de los fenómenos
clave desde la dualidad “pobreza - no pobreza” o “excluido- incluido”, lo cual
impide el acercamiento a grupos que no sean pobres, pero si excluidos y
viceversa.
88
7. BIBLIOGRAFÍA
Boira, S., Betés, L., Espeleta, N., Esteve, J., García, G., García, C., … Vilas, L. (2006).
Pobreza, precariedad y exclusion social en la ciudadania. Zaragoza: Cáritas
Española.
Recuperado el 20 /04/2016 de:
https://books.google.com/books?id=2271sgPDjLMC&pgis=1
Castel, R. (2004). Encuadre de la exclusión. En S. Karsz (Ed.), La exclusión social:
bordeando sus fronteras. Definiciones y matices (pp. 55-86). Barcelona: Gedisa.
Cea, M. Á. (2016). Análisis discriminante. Madrid: Centro de Investigaciones
Sociológicas.
Comisión Europea. (2011). La Plataforma Europea contra la Pobreza y la Exclusión
Social. Un marco europeo para la cohesión social y territorial. Luxenburgo.
Cuadras, C. (2014). Nuevos métodos de análisis multivariante. Barcelona: CMC.
Fernández, R. (2011). Exclusión social de mujeres presas: Análisis de necesidades y
su percepción del proceso de rehabilitación en el centro penitencirio de Villabona
(Tesis Doctoral). Universidad de Oviedo, Oviedo.
Recuperado el 01/05/2016 de:
http://digibuo.uniovi.es/dspace/bitstream/10651/12893/4/TD_Roxana Fernandez
Galan.pdf
Gabriel, K.R. (1971) The biplot graphic display of matrices with application to principal
component analysis. Biometrika 58(3), 454-467
Galindo, M. P. (1986). Una alternativa de representación simultánea: HJ Biplot.
Questiio, 10(1), 13–23.
García, Á. G., Marín, F. J. G., Laparra, M., Obrador, A., Eransus, B. P., Yruela, M. P.,
… Ubrich, T. (2008). La exclusión social en España: un espacio diverso y
disperso en intensa transformación. Informe Foessa.
89
Gifi, A. (1990). Nonlinear multivariate analysis. New York: John Wiley & Sons.
Gil, J. A. (2009). Metodología cuantitativa en educación. Madrid: UNED.
Instituto Nacional de Estadística. (2004). La pobreza y su medición. Madrid: Instituto
Nacional de Estadística (INE)
Recuperado el 23/04/2016 de: http://www.ine.es/welcome.shtml
Instituto Nacional de Estadística. (2013). Condiciones de Vida. Encuesta de
Condiciones de Vida. Metodología. Madrid: Instituto Nacional de Estadística (INE)
Instituto Nacional de Estadística. (2014). Clasificación Nacional de Educación 2014 (
CNED-2014 ). Madrid: Instituto Nacional de Estadísica (INE)
Instituto Nacional de Estadística. (2016). Informes Metodológicos Estandarizados.
Madrid: Instituto Nacional de Estadística(INE)
Recuperado el 05/06/2016
de:http://www.ine.es/dynt3/metadatos/es/RespuestaDatos.html?oe=30453
Laparra, M., Obradors, A., Pérez, B., Pérez Yruela, M., Renes, V., Sarasa, S., …
Trujillo, M. (2007). Una propuesta de consenso sobre el concepto de exclusión:
implicaciones metodológicas. Revista Española Del Tercer Sector, (5), 15–57.
Laparra, M., Zugasti, N., & García, I. (2014). Reflexiones metodológicas en el análisis
de la exclusión social. Madrid: Fundación Foessa
Larrañaga, O. (2007). La medición de la pobreza en dimensiones distintas al ingreso
(Estudios estadísticos y prospectivos No. 58). Santiago de Chile: CEPAL.
Lasso, F. J. (2003). Economías de escala en los hogares y la pobreza. Revista de
Economía Del Rosario, 6(1), 71–93.
Maciá, M. A., San Luis, C., Espinosa, M. Á., Ochaita, E., Lorenzo, M. J., García, R., …
Noreña, E. (2009). Pobreza y exclusión social de la infancia en España. Madrid:
Ministerio de sanidad y política social centro de publicaciones
90
Marco, M. (2000). Consideraciones en torno al concepto de exclusión social. Acciones
e Investigaciones Sociales, (11), 9–22.
Ortiz, J. C. (2015). El estado de la pobreza. European Antipoverty Network (Vol. 5).
Ottone, E., Sojo, A., Feres, J. C., Hopenhayn, Ma., León, A., Uthoff, A., … Vergara, C.
(2007). Cohesión social: inclusión y sentido de pertenencia en América Latina y el
Caribe, 144. Santiago de Chile: CEPAL
Pérez, M., García, M. I., Trujillo, M., & Espinosa, E. (2009). Condiciones de vida y
pobreza relativa de la población de Aragón. Zaragoza: Consejo Económico y
Social de Aragón.
Recuperado el 24/04/16 de: http://digital.csic.es/handle/10261/71878
Perona, N., & Rocchi, G. (2000). Vulnerabilidad y Exclusión social. Una propuesta
metodológica para el estudio de las condiciones de vida de los hogares. KAIROS,
(8).
Poza, C. (2008). Pobreza multidimensional: El caso específico español a través del
panel de hogares de la Unión Europea (Tesis Doctoral). Universidad Complutense
de Madrid, Madrid.
Ray, D. (2002). Economía del desarrollo. Barcelona: Antoni Bosch.
Raya, E. (2007). Exclusión social: Indicadores para su estudio y aplicación para el
trabajo social. Revista Del Ministerio deTrabajo y Asuntos Sociales, 70(16), 155–
172.
Subirats, J. (dir). (2004). Pobreza y exclusión social. Un análisis de la realidad
española y europea (Informe). Barcelona: La Caixa.
Subirats, J., Gomà, R., & Brugué, J. (2005). Análisis de los factores de exclusión social
(No. 4). Documentos de trabajo (Fundación BBVA). Recuperado de
http://www.fbbva.es/TLFU/dat/DT_2005_04.pdf
Subirats, J., Gomà, R., & Brugué, J. (2005). Riesgos de exclusión social en las
Comunidades Autónomas (No. 5). Documentos de trabajo (Fundación BBVA).
Recuperado de http://www.fbbva.es/TLFU/dat/DT_2005_05.pdf
91
Subirats, J., Obradors, A., García, P., & Canal, R. (2010). Ciudadanía e Inclusión
Social. Barcelona: Fundación Esplai.
Uriel, E., & Aldás, J. (2005). Análisis multivariante aplicado. Madrid: Thomson.
Valls, F., & Belzunegui, Á. (2014). La pobreza en España desde una perspectiva de
género. Madrid: Fundación Foessa
Vicente Villardón, J.L. (2015). MULTBIPLOT: A package for Multivariate Analysis using
Biplots. Departamento de Estadística. Universidad de
Salamanca. (http://biplot.usal.es/ClassicalBiplot/index.html)
Vidal, F. (2006). Exclusión social y Estado de bienestar en España. Barcelona: Icaria.