ANÁLISIS MULTIVARIANTE DE LA POBREZA Y LA … · Tabla 5. Tabla de centroides AD pobreza ... Tabla...

UNIVERSIDAD DE SALAMANCA

Departamento de Estadística

Máster en Análisis Avanzado de Datos Multivariantes

Trabajo Fin de Máster

ANÁLISIS MULTIVARIANTE DE LA

POBREZA Y LA EXCLUSIÓN SOCIAL

EN ESPAÑA

AUTORA: SILVIA GASTÓN GUIU

TUTORA: MARÍA PURIFICACIÓN VICENTE GALINDO

2016

Dpto. de Estadística

Universidad de Salamanca

MARÍA PURIFICACIÓN VICENTE GALINDO

Profesora Contratada Doctora del Departamento de Estadística de la Universidad de

Salamanca

CERTIFICA que D./D.ª Silvia Gastón Guiu ha realizado en la Universidad de

Salamanca, bajo su dirección, el trabajo que para optar título de Máster en Análisis

Avanzado de Datos Multivariantes presenta con el título Análisis multivariante de la

pobreza y la exclusión social en España, autorizando expresamente su lectura y

defensa.

Y para que conste, firma el presente certificado en Salamanca a 14 de julio de 2016.

María Purificación Vicente Galindo

Análisis multivariante de la pobreza y la

exclusión social en España

Dpto. de Estadística Universidad de Salamanca

Trabajo para optar al título de Máster en

Análisis Avanzado de Datos Multivariantes

por la Universidad de Salamanca.

Presenta:

Silvia Gastón Guiu

Salamanca, 2016

AGRADECIMIENTOS

A mi familia por ser mi sustento cada día.

A la Doctora María Purificación Vicente Galindo por su ayuda tanto profesional como

personal, y apoyo como tutora del trabajo, por guiarme en este proyecto y siempre

confiar en mí, sin sus ánimos y sus consejos este proyecto no habría podido

realizarse.

A Diana Donají del Callejo Canal por su gran ayuda, conocimiento y tiempo dedicado.

Gracias por enseñarme que la casa no se construye por el tejado.

A los miembros del Departamento de Estadística por haberme transmitido una

pequeña parte de sus conocimientos y así poder seguir avanzando en mi futuro

profesional.

A mis compañeros, ahora amigos, que han puesto sonrisas incluso en los días más

grises.

A M. por apoyarme y no dejar que me derrumbe.

RESUMEN

En el presente trabajo se muestran los resultados del análisis de la pobreza y de la

exclusión social en España a partir de los datos proporcionadas por el INE en la

Encuesta de Condiciones de Vida del 2014.

Generalmente, la literatura enfocada al análisis de la pobreza se basa, únicamente, en

la cuantificación del porcentaje de pobres a partir de la introducción de los umbrales de

pobreza, los cuales funcionan como una línea que delimita dos estados; ser pobre o

no pobre. Sin embargo, en un intento de superación de la mera cuantificación y de

suma a las investigaciones que tratan de dejar atrás lo anteriormente descrito, se

introduce el término de exclusión.

La introducción de este concepto permite conocer las circunstancias desfavorables en

las condiciones de vida básicas que, de algún modo, son compartidas y asumidas por

los individuos de una determinada población.

Es por ello que, el análisis conjunto de ambos conceptos permite ampliar la mirada

sobre la generación y origen de las desigualdades sociales que impiden una vida

cohesionada.

Dicho esto, se ha realizado la medición de la pobreza desde el enfoque objetivo de la

pobreza relativa y para la exclusión social, desde el enfoque multidimensional, se

presentan distintas dimensiones de análisis seleccionadas a partir del consenso

científico, que con la ayuda de distintas técnicas estadísticas multivariantes se han

podido obtener los perfiles, a partir de la asociación de diferentes categorías, que

describen diferentes situaciones de desigualdad y una comparación, en términos de

desigualdades, entre las distintas Comunidades Autónomas de España.

Palabras clave: Exclusión social, pobreza, análisis discriminante, HOMALS, HJ Biplot

ÍNDICE

1. INTRODUCCIÓN ......................................................................................... 1

1.1Marco teórico ............................................................................................. 2

1.1.1Orígenes del concepto ......................................................................... 2

1.1.2 ¿Qué se entiende por exclusión social? ............................................. 3

1.1.3 El concepto de pobreza y la medición de la pobreza relativa ............. 5

1.1.4 La noción de vulnerabilidad ................................................................ 7

1.1.5 Dimensiones de análisis ..................................................................... 8

2. OBJETIVOS ............................................................................................... 11

3. MATERIAL Y MÉTODOS .......................................................................... 12

3.1 Aspectos generales de la ECV................................................................ 12

3.2 Estructura de la encuesta ....................................................................... 14

3.3 Base de datos ......................................................................................... 14

3.4 Métodos estadísticos .............................................................................. 27

3.4.1 Análisis discriminante ....................................................................... 27

3.4.2 Análisis de la homogeneidad ............................................................ 31

3.4.3 Métodos Biplot .................................................................................. 34

4. RESULTADOS .......................................................................................... 37

4.1 Análisis descriptivos ................................................................................ 37

4.2 Resultados análisis discriminantes ......................................................... 43

4.3 Resultados HOMALS .............................................................................. 61

4.4 Resultados HJ Biplot ............................................................................... 80

5. DISCUSIÓN ............................................................................................... 83

6. CONCLUSIONES ...................................................................................... 85

7. BIBLIOGRAFÍA .......................................................................................... 88

ÍNDICE DE TABLAS

Tabla 1. Autovalores Análisis Discriminante de Pobreza ............................................ 44

Tabla 2. Lambda de Wilks. Análisis Discriminante pobreza ........................................ 46

Tabla 3. Coeficientes. Análisis discriminante pobreza ................................................. 47

Tabla 4. Matriz estructura Análisis Discriminante pobreza .......................................... 48

Tabla 5. Tabla de centroides AD pobreza ................................................................... 49

Tabla 6. Clasificación AD pobreza .............................................................................. 49

Tabla 7. Medias de los grupos en las variables cuantitativas. ..................................... 51

Tabla 8. Autovalores. Análisis discriminante CC.AA. y porcentaje de pobreza ........... 52

Tabla 9. Lambda de Wilks. AD CC.AA. y porcentaje de pobreza ................................ 54

Tabla 10. Coeficientes de las funciones discriminantes .............................................. 55

Tabla 11. Matriz estructura. AD CC.AA y porcentaje pobreza ..................................... 56

Tabla 12. Centroides. AD CC.AA y porcentaje pobreza .............................................. 57

Tabla 13. Clasificación AD CCAA y porcentaje pobreza ............................................. 58

Tabla 14. Resumen del modelo Análisis de la Homogeneidad .................................... 62

Tabla 15. Cuantificaciones dimensiones de la exclusión social y pobreza .................. 65

Tabla 16. Medidas de discriminación .......................................................................... 66

Tabla 17. Resumen del II modelo HOMALS. .............................................................. 69

Tabla 18. Cuantificaciones .......................................................................................... 71

Tabla 19. Medidas de discriminación de Pobreza y variables sociodemográficas ....... 72

Tabla 20. Resumen del modelo III HOMALS .............................................................. 75

Tabla 21. Cuentificaciones .......................................................................................... 76

Tabla 22. Medidas de discriminación Sexo y dimensiones de la exclusión social ....... 77

ÍNDICE DE GRÁFICOS

Gráfico 1. Análisis descriptivo: Edad ........................................................................... 37

Gráfico 2. Análisis descriptivo: Estado civil ................................................................. 38

Gráfico 3. Análisisd descriptivo: Pobreza relativa ........................................................ 39

Gráfico 4. Análisis descriptivo: Situación laboral ......................................................... 40

Gráfico 5. Análisis descriptivo: Nivel educativo ........................................................... 41

Gráfico 6. Análisis descriptivo: Estado de salud .......................................................... 41

Gráfico 7. Funciones discriminantes canónicas (Pobreza) .......................................... 50

Gráfico 8. Funciones discriminantes canónicas Comunidades Autónomas y

porcentaje pobreza ..................................................................................................... 58

Gráfico 9. Medidas de discriminación análisis I HOMALS ........................................... 67

Gráfico 10. Categorías conjuntas. Pobreza y dimensiones de la exclusión social ....... 68

Gráfico 11. Medidas de discriminación. Análisis II HOMALS ....................................... 73

Gráfico 12. Categorías conjuntas. Sociodemográficas y pobreza ............................... 74

Gráfico 13. Medidad de discriminación análisis III HOMALS ....................................... 78

Gráfico 14. Categorías conjuntas. Sexo y dimensiones de exclusión social. ............... 79

Gráfico 15. HJ Biplot. Comunidades Autónomas y dimensiones de la exclusión

social (ejes 1-2) .......................................................................................................... 80

ÍNDICE DE ILUSTRACIONES

Ilustración 1. Mapa de España según porcentaje de pobreza (CC.AA.) ...................... 59

Ilustración 2. Mapa de España según umbrales de pobreza ....................................... 61

1

1. INTRODUCCIÓN

Hace tan solo algunas décadas que la investigación social sitúa su interés teórico y

analítico en la exclusión social. No es porque se trate de una cuestión baladí, sino

porque existían otros recursos explicativos que lograban explicar un todo. Se podría

aquí aludir a la pobreza y, es que este concepto albergaba en sí mismo todo tipo de

explicaciones y mecanismos para lograr explicar todo tipo de desigualdades.

Bien, hoy esto ha cambiado y la exclusión social ha pasado de no ser considerada a

situarse en cada vez más investigaciones. Debido a ese cambio y al protagonismo que

encarna este concepto en la época actual se viene enfatizando que sea el estudio de

ésta la que recoja todo aquello que anteriormente hacía la pobreza. Es decir, que sea

capaz de albergar todas las formas de desigualdad que truncan la consecución de las

condiciones de vida aceptadas y extendidas en una población determinada. (Maciá et

al., 2009) (Laparra et al,. 2007). Por tanto, se espera que este concepto de respuesta

a las nuevas formas de desigualdad social (Subirats, Gomà, & Brugué, 2005a),

No se trata de una lucha de conceptos en la que sólo puede sobrevivir y permanecer

uno de ellos, sino que se ha de buscar la forma de integrarlos para llegar a una

explicación más amplia.

Por tanto, se adopta la medición de la pobreza en términos relativos para conocer la

desigualdad propiciada por la distribución de los ingresos y, se escogen una serie de

dimensiones, consensuadas en términos generales por la comunidad científica, para

explicar las desigualdades cuyo origen no se sitúa detrás de un prisma puramente

económico. El estudio conjunto, pero diferenciado, enriquece el análisis porque

permite detectar diversas situaciones de pobreza y de exclusión. Por ejemplo,

situaciones de empobrecimiento pero no exclusión y viceversa. Permitiendo identificar

un estado, pobreza, con un proceso, exclusión social (Ortiz, 2015) que se producen en

las sociedades actuales y postindustriales (Marco, 2000)

Ambos fenómenos se analizarán a partir de los microdatos de la Encuesta de

Condiciones de Vida del año 2014 elaborada por el INE por ser la máxima fuente de

datos para el análisis de dicha temática a nivel nacional.

2

La realización del presente trabajo viene justificada por la consideración e interés por

demostrar que la desigualdad no solo se traduce o viene dada por una distribución

desigual de los ingresos, sino que también puede expresarse por un conjunto de

desventajas que no quedan reflejadas en la medición de variables monetarias con el

fin de conseguir una explicación e identificación global sobre ambos.

1.1 Marco teórico

1.1.1 Orígenes del concepto

El concepto de exclusión social comenzó a emplearse en Francia en la década de los

años 70. En concreto, su origen se le atribuye a R. Lenoir, Secretario de Estado de

Acción Social del gobierno de Chirac. En ese momento, la administración francesa

inició una serie de estudios para conocer el porcentaje de población excluida existente

en el país, con el objetivo de elaborar e implementar políticas específicas que

permitieran la inclusión de ese conjunto de personas y/o colectivos (Maciá et al.,

2009). Es a partir de este momento cuando el término salta a la esfera de la opinión

pública y cristaliza en el ámbito académico hasta que, finalmente, la Unión Europea lo

adoptó como nuevo eje de política social para superar las insuficiencias de la

pobreza.(Subirats, 2004)

El concepto fue recogido en la Comunidad Europea en el año 1989 con el fin de luchar

contra la exclusión social y la pobreza en el III Programa Europeo de Lucha contra la

Pobreza. (Fernández, 2011) cristalizándose, de este modo, la preocupación por la

erradicación de la exclusión social y la pobreza en las instituciones Europeas.

Actualmente, la Comisión Europea ha recogido en su agenda política, laboral y social

la lucha contra estos dos fenómenos mediante una estrategia llamada: Estrategia

2020.

Dicha estrategia ha hecho que los gobiernos europeos hayan confluido para marcarse

el objetivo de sacar de la pobreza y de la exclusión social a 20.000.000 de personas

en los próximos diez años. (Comisión Europea, 2011).

3

1.1.2 ¿Qué se entiende por exclusión social?

Así pues, se está ante un concepto joven, amplio y complejo siendo complicado

encontrar un marco teórico fuerte y una única definición consensuada por la

comunidad científica social. La suma de esas características hace que, en ocasiones,

su uso sea ambiguo e indistinto como sinónimo de conceptos clásicos como pobreza,

marginación y desigualdad (Marco, 2000) lo que conduce, a veces, a perder la noción

verdadera de lo que se está hablando.

En la producción de estudios sobre el concepto se puede apreciar la división en dos

formas de elaboración: Unos trabajan en la conceptualización del fenómeno y otros en

hacer de él algo operativo con el fin de dotarlo de utilidad para la detección de

situaciones de exclusión. (Raya, 2007)

En el panorama científico social español, era utilizado de manera esporádica debido a

que hasta hace poco tiempo no quedaba recogido en los diccionarios de esta área de

conocimiento (Marco, 2000), hasta haberse ganado un espacio en el que no están

claras las fronteras de sus dimensiones ni de los indicadores relevantes que miden el

fenómeno, pues no todos los autores conceden la misma importancia a las

dimensiones que quedan afectadas.(Maciá et al., 2009) Se trata, entonces, de un

fenómeno reciente sobre el que, actualmente, las Ciencias Sociales, en general, y la

Sociología en particular, están en pleno proceso de construcción y reconstrucción de

marcos teóricos y analíticos. Prueba contundente de que sea un concepto en

construcción es la aplicación del mismo a diferentes realidades sociales y la existencia

de una producción de definiciones infinitas. (Raya, 2007)

Sin embargo, sí existe consenso en caracterizar a la exclusión social como un

fenómeno de carácter multidimensional, procesual y causal. Multidimensional y causal

porque hace referencia a un conjunto de situaciones de desventajas y privaciones, ya

que no es un único factor lo que lleva a un individuo o colectivos a la exclusión, sino la

interacción entre varios factores. De manera que cuantos más factores y desventajas

acumulados mayor será el riesgo de exclusión. (Castel, 2004) imposibilitando el

acceso a todo tipo de recursos que favorecen el bienestar social (Subirats, Obradors,

García, & Canal, 2010). Y procesual porque no hace referencia a un estado final de los

individuos sino a un proceso que transcurre desde la integración, vulnerabilidad hasta

llegar a la exclusión (Maciá et al., 2009) (Raya, 2007).

De este modo, no ha de entenderse como un concepto que gira en torno a un

dualismo entre integración social y exclusión social, sino que se trata de un transcurso

4

en el tiempo que puede llevar desde la integración social plena, a la precariedad, de

ahí derivar a la vulnerabilidad (de la que con posterioridad se hablará) y, finalmente, a

la exclusión.

“Proceso de alejamiento progresivo de una situación de integración social en el

que pueden distinguirse diversos estadios en función de la intensidad: desde la

precariedad o vulnerabilidad más leve hasta las situaciones de exclusión más

graves” (García et al., 2008: 185)

Una de las definiciones que muestran el carácter multidimensional que se pueden

encontrar en la literatura es:

“La exclusión social no se explica con arreglo a una sola causa, ni tampoco sus

desventajas vienen solas: se presenta en cambio como un fenómeno

poliédrico, formado por la articulación de un cúmulo de circunstancias

desfavorables, a menudo fuertemente interrelacionadas.” (Subirats, Gomà, &

Brugué, 2005:13)

También se puede observar la definición de Sen, recogida por Macià et al., que dice

así:

“La exclusión social va más allá de la mera privación económica, es el

resultado de la combinación de una serie de factores procedentes de los

diferentes contextos en los que se producen los procesos de desarrollo e

integración de los seres humanos “(2009: 22)

Por lo tanto, tomando las palabras de Maciá, este concepto surge para hacer

referencia a un conjunto de situaciones que afectan a individuos o grupos, que se

alejan de la concepción clásica pobreza, ya que estas situaciones no sólo tienen que

ver con la privación o la desventaja en relación a los recursos económicos sino que da

respuesta a situaciones de desventaja no necesariamente de origen económico

(2010). A menudo exclusión social y pobreza han sido sinónimos, pero, aquí, son

concebidas como conceptos que se complementan y que incluso pueden, en

determinadas ocasiones, influirse o no, pues no toda persona pobre es excluida y

viceversa.

Una vez que se ha intentado el acercamiento y esclarecer la complejidad del concepto

es necesario contraponerlo con su opuesto con el fin de obtener un conocimiento más

claro del mismo. Por ello, no es posible hablar de exclusión sin considerar qué se

5

entiende por inclusión social: “Proceso dinámico y multifactorial que posibilita a las

personas participar del nivel mínimo de bienestar que es consistente con el desarrollo

alcanzado en un determinado país”. (Ottone et al., 2007:15)

1.1.3 El concepto de pobreza y la medición de la pobreza relativa

Como se ha dicho con anterioridad, en este trabajo, se va a estudiar la pobreza y la

exclusión social complementariamente con el fin de poder caracterizar mejor los

procesos de exclusión. La pobreza, también es un concepto complejo en el que

influyen multitud de factores y que puede ser estudiada desde diferentes

perspectivas.(INE, 2004)

A diferencia de lo que ocurre con el concepto anterior, la medición de la pobreza está

respaldada por un marco teórico y empírico fuerte, lo cual provoca que su medición se

ajuste a ciertos requisitos. (Larrañaga, 2007) No obstante, éste tampoco está exento

de complejidad pues en él intervienen muchos factores y puede ser estudiado desde

diferentes enfoques con el fin de ajustarlo a los objetivos fijados por el investigador.

La medición de la pobreza depende de la información utilizada, pues puede ser

subjetiva u objetiva, según los baremos utilizados, pobreza absoluta o pobreza

relativa, y, por último, depende de la temporalidad adoptada en el estudio dando como

producto el análisis de la pobreza transversal o la pobreza persistente.

Para el estudio de la pobreza desde una perspectiva subjetiva se ha de utilizar la

información de opinión de los informantes sobre su autopercepción de la situación y

capacidad económica. Sin embargo, desde la visión objetiva se empleará la

información derivada de variables observables y medibles (INE, 2004)

Dentro del estudio de la pobreza desde la objetividad hay dos formas de medirla; de

forma absoluta o relativa.

La pobreza absoluta identifica las situaciones de los individuos en las que las

necesidades básicas no están cubiertas a través de la medición del coste que supone

la adquisición de una cesta de productos esenciales para los individuos. Si bien,

carece de interés y de uso en los países desarrollados a diferencia de lo que ocurre en

países menos desarrollados en los que esta medida goza de una gran aceptación por

parte de los investigadores. Además es una medida sensible a los aumentos en la

coyuntura económica, ya que si dicha coyuntura protagoniza un aumento en los

niveles de renta el porcentaje de pobres disminuye.

6

En cuanto a la medición de la pobreza relativa se enfoca en detectar las situaciones de

desventaja económica, mediante la medición de las desigualdades en la distribución

de los ingresos. Así pues, distingue entre la población pobre de la población no pobre,

lo cual depende del grado de desarrollo de la sociedad analizada sin dejar opción a

trasladarla a otra sociedad. El grado de desarrollo permite la caracterización de los dos

tipos de población siendo diferente en cada país.

La pobreza relativa arroja como resultado el porcentaje de personas que poseen

buenas condiciones monetarias y el porcentaje de los que poseen malas condiciones

monetarias en relación a las características de su país. Si bien, con esta medida no se

puede obtener la situación sobre las condiciones de las personas pobres, sino que

obtenemos un resultado de la situación meramente económico.

Para ello, es necesario comentar de qué manera se mide y la importancia de la

adopción de ciertos requisitos.

La línea o umbral de la pobreza relativa se calcula a partir de la variable económica

seleccionada dividida por el número de miembros de cada hogar para obtener el

ingreso per cápita, como tradicionalmente se ha realizado, o dividida por unidades de

consumo, como se hace en los estudios de pobreza de la Unión Europea.

Utilizando las unidades de consumo se tienen en cuenta las economías de escala y la

existencia de unidades equivalentes en el hogar calculándose en base a una escala de

equivalencia, la cual determina qué parte del ingreso corresponde a cada miembro de

manera que se obtiene un ingreso medio por individuo de una forma coherente. Hay

varias escalas de equivalencia igualmente válidas, como por ejemplo, la escala de

Oxford, escala paramétrica y la escala de dos parámetros. Sin embargo en Europa, la

escala de equivalencia más utilizada es la de la OCDE modificada de 2008, la cual ha

sido aplicada en el presente estudio.

Por economía de escala, los expertos, aluden al tamaño del hogar y a que éste no

tiene por qué tener relación directa con un aumento en los ingresos totales del hogar y,

por lo tanto, a una mejora económica. Y por unidad de consumo (u.c) permite

diferenciar las pautas de consumo y necesidades de adultos y niños, es decir, permite

obtener el ingreso equivalente mediante la composición de edad. (Vidal, 2006), (Lasso,

2003) y (Ray, 2002)

Una vez que se han realizado los cálculos pertinentes se obtendrá la pobreza relativa

equivalente a cada unidad de consumo y se calculará la mediana de los valores

obtenidos en los cálculos anteriores. Esto quiere decir que se van a identificar como

7

pobres aquellos que queden por debajo de la media o mediana (Pérez, García, Trujillo,

& Espinosa, 2009) o dicho de otro modo, se declarará como pobre aquellos individuos

que se encuentren en una situación clara de desventaja económica respecto al resto

de individuos de su entorno. (INE, 2004) También, cuando se tiene el resultado de la

mediana se suelen aplicar porcentajes para generar diferentes umbrales de pobreza

que en el caso de la producción europea se fija en el sesenta por ciento de la

mediana. Dicho resultado se convertirá en la línea que separa a la población pobre de

la no pobre.

1.1.4 La noción de vulnerabilidad

Como ya se ha comentado, la exclusión es un fenómeno procesual que exige de la

noción del tiempo para transcurrir, de manera que se hace necesario la introducción

de otro concepto clave en el desarrollo del presente trabajo. Puesto que, a menudo, es

difícil encontrar situaciones de exclusión social grave en base a las fuentes de

información disponibles para su estudio y que permitirá un mejor acercamiento,

detección y caracterización de la situación de los individuos de la muestra.

El concepto al que se está aludiendo aquí es el de vulnerabilidad, la cual es entendida

como: (Perona & Rocchi, 2000) Todo conjunto de situaciones intermedias que

conllevan al riesgo de padecer la exclusión en un futuro, ya sea cercano o lejano. La

vulnerabilidad se puede expresar de dos maneras: Los vulnerados, los cuales estarían

en situación de pobreza y presentarían dificultades en cuanto al desarrollo pleno de

sus condiciones de vida y, por otro lado, los vulnerables que serían aquellos que

experimentarían una fragilidad en sus condiciones de vida en un futuro. Se relaciona la

vulnerabilidad con las condiciones de vida porque ésta también es un fenómeno

multidimensional y complejo que afecta y debilita los aspectos más básicos de la vida

en relación al equipamiento y provisión de bienes del hogar, a la inserción en el mundo

laboral, a los niveles de educación alcanzados, al acceso a los servicios públicos y a la

participación de la sociedad.

La vulnerabilidad hace que los individuos, hogares o colectivos queden expuestos a

alteraciones en sus niveles de vida ante determinados cambios que provocan la

situación de privación, eso sí, privación en menor medida que la experimentada en la

exclusión social.

8

1.1.5 Dimensiones de análisis

Ésta será la noción de pobreza relativa y la definición de exclusión que se toma como

referencia en este estudio. A continuación, para completar su comprensión, se van a

enumerar y explicar las siguientes dimensiones para analizar, atendiendo al consenso

de las mismas por parte de los expertos y adecuadas a la información extraíble de la

Encuesta de Condiciones de Vida elaborada por el INE, para analizarla. Estas

dimensiones se corresponden a “esos ejes transversales en los que construye la

inserción y la inclusión social -educación, salud, vivienda y trabajo” (Boira et al.,

2006:132), entre otras.

La reflexión en torno a la introducción de otras dimensiones responde a la necesidad

de estudiar el bienestar de las condiciones de vida de los individuos desde la

perspectiva económica y desde otras dimensiones independientes a ésta, las cuales

aluden a factores de exclusión social. Si dichas dimensiones se obviaran se estaría

cometiendo un sesgo en la medición del objetivo del presente análisis. Además, la

consideración de éstas proporcionan un enriquecimiento al análisis y una visión

completa puesto que a partir de las mismas se podrá hablar de qué parte de la

población española tiene problemas económicos (en términos de desigualdad

económica) junto a otros problemas de otra índole, o si sólo tiene problemas

económicos o sólo posee problemas de otra naturaleza.

“La decisión de las siguientes dimensiones hacen referencia a dimensiones de la vida

de las personas que sean constitutivas básicas de su bienestar en las que si se

aprecian carencias o privaciones provocan serias amenazas en las condiciones y

calidad de vida de los individuos.” (Larrañaga, 2007:9)

Dimensión económica: La dimensión principal para el estudio de la pobreza relativa

de la población objeto de estudio. Mediante la medición de la pobreza relativa se va a

poder determinar qué parte de la población es pobre, cuántos están en riesgo de

pobreza y qué individuos está por encima de la media de ingresos y, por tanto, gozan

de una situación económica lejos de la pobreza.

Dimensión laboral: La participación en el ámbito laboral es considerado como uno de

los principales factores de inclusión social, ya que permite la integración social, el

acceso a los recursos del Estado de Bienestar no universalizados… El contar con un

empleo remunerado, generalmente, permite procurarse unas condiciones de vida

dignas. (Pérez et al., 2009)

9

Dimensión educativa: El nivel educativo alcanzado está relacionado con la posición

social. Puesto que a ciertos niveles de educación obtenidos permite la adquisición de

competencias profesionales y personales que posibilitan la integración social. Además,

el nivel de estudios, generalmente, está ligado con la ocupación laboral desempeñada

en el futuro y con los beneficios económicos derivados de ésta. Esta dimensión no

solo contribuye a unos mejores, en principio, beneficios económicos, sino que

contribuye al conocimiento y valoración del propio individuo. A menudo la educación y

el nivel educativo alcanzado son asociados con el bienestar de las personas. Por ello,

parafraseando a Larrañaga, es necesario introducir la variable que permita rescatar la

información sobre las competencias académicas adquiridas de los individuos que sean

el objeto de estudio del análisis. (2007)

Dimensión salud: Gozar de un buen estado de salud está directamente relacionado

con el bienestar de las personas. Por tanto, un problema de salud puede provocar

limitaciones para desarrollar actividades diarias que deriven en un alejamiento de la

vida social. Y la garantía de acceso a la cobertura médica provoca la eliminación de

desigualdad de oportunidades en su acceso. De no suceder de este modo se estaría

ante un problema que derivaría en procesos de exclusión social. (Poza, 2008)

Dimensión vivienda: La vivienda es el lugar básico de bienestar de los individuos.

Por tanto, la tenencia de malas condiciones de la vivienda pueden actuar como

desencadenantes de situaciones de exclusión dificultando la integración social.

Además, la manutención de la misma puede llevar a un nivel de endeudamiento

posicionando a los individuos en situaciones de riesgo de exclusión social y de

pobreza.

Dimensión del entorno: Esta dimensión permite conocer las condiciones del entorno

donde está situada la vivienda de los individuos de la muestra. Ésta trata de ahondar

en problemas de delincuencia, contaminación, suciedad y ruidos. El cúmulo de este

conjunto de problemáticas podría influir en las condiciones de vida de los individuos y

en las oportunidades de gozar de una vida integrada.

Dimensión carencia material: Esta dimensión es la que va a permitir conocer qué

parte de la población española posee tenencia material de aquellos objetos y bienes

que son considerados, en el contexto actual, como básicos y de uso cotidiano y que

parte de la población no.

10

La estructura del presente trabajo se corresponde a los siguientes apartados:

Introducción: En este capítulo se recoge una pequeña introducción y un marco

teórico para la contextualización de los dos conceptos clave en este trabajo, pobreza y

exclusión social.

Material y métodos: En esta sección del trabajo se exponen los datos utilizados, las

variables empleadas para la medición del fenómeno y la fuente de datos utilizada.

Además se explican las técnicas estadísticas multivariantes utilizadas.

Resultados: Se presentan los resultados obtenidos de la aplicación de diferentes

técnicas estadísticas. En este caso, se presentan los resultados descriptivos, del

Análisis Discriminante, de HOMALS y HJ Biplot.

Discusión: En este capítulo se trata de contraponer y comparar los resultados

obtenidos con los resultados de otros estudios y/o análisis con el fin de crear una

visión global sobre el estado de la investigación.

Conclusiones: En el último capítulo se exponen las conclusiones derivadas de los

análisis realizados de manera detallada con la intención de responder a los objetivos

marcados en el trabajo.

11

2. OBJETIVOS

Objetivo general

Analizar mediante técnicas multivariantes estadísticas el estado de la pobreza y de la

exclusión social en la muestra de la encuesta a partir de las dimensiones propuestas

en el marco teórico.

Objetivos específicos:

-Realizar un análisis territorial a nivel autonómico con el fin de crear grupos en relación

a las similaridades encontradas en las diferentes dimensiones que miden la exclusión

social y en relación a la pobreza relativa para conocer en qué situación se encuentran

los diferentes territorios del mapa nacional.

- Detectar y caracterizar los grupos más vulnerables a la exclusión social en relación a

las variables seleccionadas con el fin de poder conocer qué colectivos son los que

más riesgo poseen.

12

3. MATERIAL Y MÉTODOS

Para analizar el objeto de estudio del presente trabajo se ha hecho uso de la Encuesta

de Condiciones de Vida (ECV), elaborada y publicada por el INE en el año 2014,

puesto que ésta permite medir los dos fenómenos a los que se alude.

El apartado de metodología se divide en varios subapartados en los que se va a

exponer los aspectos generales y la estructura de la encuesta. Así como la

construcción de la base de datos con la que se ha trabajado y las variables

seleccionadas para el estudio. Todo ello se explicará a partir de la información

obtenida en el informe metodológico de la ECV (INE, 2013), en el cuestionario de la

encuesta y otros documentos de trabajo (INE, 2004) proporcionados por el Instituto

Nacional de Estadística. Así como del informe metodológico estandarizado disponible

en la página web del Instituto. (INE, 2016)

3.1 Aspectos generales de la ECV

La ECV es la encuesta predecesora de la PHOGUE (1994-2001) que fue puesta en

marcha en el año 2004 hasta la actualidad con periodicidad anual. Además esta

encuesta pertenece al conjunto de operaciones estadísticas armonizadas para la

Unión Europea respaldada por el Reglamento (CE) Nº 1177/2003 del Parlamento

Europeo y del Consejo del 16 de Junio de 2003 relativo a las estadísticas comunitarias

sobre la renta y las condiciones de vida.

El principal objetivo que persigue esta encuesta es disponer de una fuente de datos

comparables acerca de las condiciones de vida, de la distribución de ingresos, de la

pobreza y de la exclusión social. Los datos pueden encontrarse medidos de forma

transversal y longitudinal, pero en ambos casos permiten la comparación a escala

nacional y europea, ya que sigue las recomendaciones y reglamentos comunitarios

que regulan la European Survey on Income and Living Conditions (EU-SILC) de

Eurostat establecidas para todos los países miembros.

Como unidad de muestreo toma la definición censal de vivienda familiar,

considerándose como unidad primaria de muestreo la sección censal y, como última,

la vivienda familiar principal. Por tanto, se incluyen todos los hogares privados

13

residentes en las viviendas familiares principales seleccionadas recogiéndose la

información mediante entrevistas personales.

En cuanto a las unidades de análisis hay dos. Por un lado, los hogares privados y por

otro lado, los individuos miembros de dichos hogares, puesto que todas las edades

forman parte de la población objetivo, pero sólo los mayores de 16 años pueden

responder al cuestionario.

El tipo de muestreo es de diseño de panel rotante en el que la forman 4 submuestras

independientes formando un panel de 4 años de duración renovándose la muestra,

cada año, en uno de los paneles. La elección de cada una de las submuestras se basa

en un muestreo de diseño bietápico con estratificación de las unidades de las

secciones censales (1ª etapa).

En cada Comunidad Autónoma las unidades de la 1ª etapa se agrupan en estratos

según el tamaño del municipio al que pertenece la sección proporcionándose una

muestra independiente a cada una que se representativa. De esta manera, la ECV

también proporciona datos de desagregación autonómica.

En cuanto al criterio temporal de las preguntas en la encuesta se ha de reseñar que

hay diferentes periodos temporales de referencia según las preguntas realizadas:

-Año anterior a la realización de la encuesta: A este periodo van referidas

aquellas preguntas relacionadas con los ingresos y rentas. Si la encuesta está

realizada en el año 2014 estas preguntas vienen referidas al año 2013.

-Momento actual: Criterio temporal utilizado en preguntas relacionadas con la

actividad laboral, por ejemplo.

-Periodo biográfico: Recoge información biográfica de los individuos, la cual es

diferente para cada persona.

-Semana de referencia: Semana inmediatamente anterior a la entrevista.

-Otros tiempos: Hacer referencia, entre otros, a los últimos 12 meses, las

últimas 4 semanas… Como puede darse el caso en las preguntas sobre la

situación de salud de los individuos o en el caso de retraso de pagos.

14

3.2 Estructura de la encuesta

En este caso se trabajará con la ECV del año 2014 que fue publicada en el año 2015.

El tamaño muestral de la encuesta es de 11966 hogares y 31623 individuos y, su

cuestionario recoge un total de 421 preguntas, incluyéndose en esta cifra las llamadas

variables “FLAGS”. Por variables “FLASG” se entiende como variables de control que

acompañan a las preguntas y que indican si los individuos han respondido o no lo han

hecho.

A su vez, las preguntas están distribuidas en cuatro ficheros. Dos de ellos referidos a

hogares y los otros dos a personas:

-Fichero D, en el que se encuentran preguntas referidas a los datos básicos de

los hogares colaboradores e información para identificar el hogar, localizarlo

geográficamente, el grado de urbanización de la zona, el año de la encuesta y

los factores de ponderación.

-Fichero R, donde se recoge la información básica de la persona, tanto de

adultos como de menores de edad proporcionando información para su

identificación en relación a la pertenencia a su hogar, información

demográfica…

-Fichero H, donde se encuentran los datos detallados del hogar a cerca de la

vivienda, renta, datos básicos del hogar, carencia material y otras variables

complementarias.

-Fichero P, el cual recoge un conjunto de datos, de forma detallada, sobre los

adultos. Como por ejemplo, información sobre aspectos educacionales,

preguntas sobre el estado de salud, aspectos laborales, renta y, por último, una

serie de preguntas que permiten evaluar la carencia material objetiva.

3.3 Base de datos

Para la elaboración de la base de datos, en un primer momento, se seleccionó un total

de 55 preguntas. Si bien tras una exhaustiva revisión de las mismas se procedió a la

eliminación de alguna de ellas y a la creación de nuevas variables a partir de las

originales, las cuales serán explicadas con posterioridad.

15

La base de datos está formada por un total de 26531 casos, individuos de 16 años en

adelante, y, finalmente, por 23 variables tomadas de los 4 ficheros de datos. Se

decidió trabajar con los 4 ficheros de datos simultáneamente mediante la fusión de los

ficheros con información de los hogares y de los individuos. Dicha decisión fue tomada

porque la unidad de análisis son los individuos, pero se quería rescatar información

relevante de los hogares para extraer el máximo rendimiento de la ECV.

Para realizar la fusión e imputar datos de los hogares a cada individuo las variables

utilizadas fueron: DB030 renombrada en la base de datos como “IDH” y RB030

renombrada como “IDI”, lo cual alude al identificador del hogar e identificador del

individuo, respectivamente.

El identificador del hogar proporciona un número a cada uno de ellos y el identificador

de los individuos se compone por un primer dígito que corresponde al identificador del

hogar seguido por dos dígitos que numeran a los individuos. Por tanto, proporciona un

número a cada individuo en relación a su pertenencia a un hogar.

Las variables que integran la base de datos se han seleccionado con el interés de

analizar y explicar cada una de las dimensiones que se expusieron en el marco teórico

además de un conjunto de variables sociodemográficas e identificativas de los

individuos:

Sexo (PB150/SEXO):

1 Varón

2 Mujer

Región (DB040/ CC.AA.): Renombrada en la base de datos como “CC.AA.” siendo

recodificada las 19 categorías pertenecientes a cada comunidad según las normas

ISO08 de identificación en base a dos letras (GA, AS, CB, PV, NC, RI, AR, MD, CL,

CM, EX, CT, VC, IB, AN, MC, CE, ML y CN).

A demás, a partir de la variable CC.AA y de la variable Pobreza relativa (PobRelativa)

se ha generado una nueva variable específicamente para el análisis discriminante:

REGCat: Se han creado cinco grupos a partir del cálculo de la línea de pobreza

por Comunidad Autónoma, la cual es el punto de corte que separa a la

población considerada pobre de la considerada no pobre, y de la tasa de

16

pobreza. Para dicho cálculo se ha utilizado el criterio del 60% de la mediana de

los ingresos por unidad de consumo de cada CC.AA en relación al umbral

nacional (8163,6 € por unidad de consumo) y en base a los resultados

proporcionados se han agrupado en 5 grupos diferentes.

El cálculo es: 𝐻 =𝑞

𝑛

Donde:

H: es la tasa de pobreza

Q: es el número de población pobre.

N: Población total

El primer grupo (% pobres bajo) recoge todas aquellas Comunidades

Autónomas cuyo porcentaje de población pobre es más pequeño.

Navarra: 8,42% población pobre.

País Vasco: 11,67% población pobre.

Madrid: 12,70% población pobre.

El segundo grupo (% pobres medio-bajo) está compuesto por las siguientes

Comunidades Autónomas:

Cataluña: 13,92% población pobre.

Aragón: 14,04% población pobre.

Asturias: 14,53% población pobre.

Islas Baleares: 14,86% población pobre.

El tercer grupo con un porcentaje de población pobre medio están:

La Rioja: 16,39% población pobre.

Galicia: 16,45% población pobre.

Cantabria: 18,99% población pobre.

Castilla y León: 19,35% población pobre.

17

El cuarto grupo se ha creado a partir de porcentajes medio-altos de población

pobre:

Comunidad Valenciana: 22,74% población pobre.

Melilla: 26, 81% población pobre.

Islas Canarias: 27,58% población pobre.

Castilla- La Mancha: 29,01% población pobre.

Y por último, el quinto grupo son aquellas regiones con mayores porcentajes de

pobreza hallados:

Andalucía: 33,22% población pobre.

Extremadura: 34,32% población pobre.

Murcia: 36,43% población pobre.

Ceuta: 38,73% población pobre.

Grado de urbanización (DB100/URBAN):

1 Zona muy poblada

2 Zona media

3 Zona poco poblada

Estado civil (PB190/EDOCIVIL):

1 Soltero

2 Casado

3 Separado

4 Viudo

5 Divorciado

18

Edad: Esta variable se construyó a partir de la variable original “Año de nacimiento”,

cuyo código en el cuestionario de la encuesta es: PB140 y RB080.

Edad categórica (EDADCATEG): Se recodificó la variable anterior en grupos

de edades proporcionándose 6 categorías:

1) De 16 años a 25 años.





6) De 66 años en adelante.

Renta disponible del hogar (HHY020/RENHOG): “Renta disponible total del hogar en

el año anterior al de la encuesta”

Renta (RENTA); “Renta neta monetaria del individuo en el año anterior a la encuesta”:

Esta variable se construyó a partir de la suma de 8 variables (PY010N, Py050N,

PY090N, PY100N, PY110N, PY120N, PY130N, PY140N), las cuales aluden a ingresos

pero de diferentes fuentes.

Renta categórica (RentaHR): 6 categorías:

1 Menos hasta 8000€

2 De 8000€ a 14000€

3 De 14000€ a 20000€

4 De 20000€ a 33000€

5 De 33000€ a 45000€

6 De 45000€ y más

19

Ingresos mínimos (HS130/INGMIN): “Ingresos mínimos para llegar a final de mes”

Variable sujeta a la situación de cada hogar y a lo que cada individuo considere llegar

a final de mes. Por ello, esta variable también puede ayudar en el estudio de la

pobreza y de la distribución de los ingresos, ya que proporciona la información de con

cuánto dinero pueden los individuos vivir en un mes contando todos los gastos y

pagos.

Pobreza relativa (PobRelativa): Para la medición de la pobreza relativa el primer

ejercicio de reflexión gira en torno a la elección de la variable monetaria. Lo más

recurrente es, o bien utilizar la variable que represente el gasto total del hogar, o bien

la renta total disponible del hogar.

En este caso se ha elegido como variable monetaria la renta total disponible del hogar,

la cual refleja la capacidad económica del hogar, porque se ha decidido seguir los

estándares europeos en la producción estadística sobre pobreza y exclusión social.

Últimamente en los análisis de pobreza relativa como unidad de consumo está

primando el individuo en vez del hogar como tradicionalmente había sido, este cambio

viene dado por la consideración de que son las personas las que se ven afectadas por

el fenómeno, pero no se debe olvidar que las situaciones personales dependen

estrechamente de la renta del hogar y no únicamente de los ingresos personales.

Para solventar dicho problema, generalmente, se ha calculado el ingreso per cápita,

que no es más que el cociente entre la renta total disponible del hogar entre el número

de miembros que componen un hogar. Sin embargo, en la estadística oficial de la

Unión Europea se ha apostado por otro tipo de cálculo que da como producto el

ingreso por unidad de consumo o ingreso equivalente. Este último tipo de ingreso es

más recomendable porque tiene en cuenta factores como la economía de escala y la

existencia de unidades de consumo equivalentes en el hogar, como se ha explicado

en el marco teórico.

Por todo ello, esta variable ha sido creada a partir de la renta total del hogar y de la

variable unidad de consumo.

La unidad de consumo se calcula a partir de la siguiente fórmula que corresponde a la

escala modificada de la OCDE, la cual es utilizada por EUROSTAT:

1 + (𝑎 − 1) ∗ 0,5 + 𝑏 ∗ 0,3

20

Donde al primer adulto se le proporciona un peso de 1, a los siguientes adultos un

peso de 0,5 y a los menores de 14 años de 0,3. Por lo que, 𝑎 es el número de adultos

total que integran un hogar y 𝑏 es el número de niños menores de 14 años miembros

de un hogar.

Por tanto, la renta total del hogar se divide por la unidad de consumo obtenida de la

fórmula anterior para cada hogar y se obtiene el ingreso por unidad de consumo o

equivalente a cada uno de los miembros.

En cuanto a la fijación de la línea o umbral de pobreza, generalmente, se aplica en el

60% de la mediana de la distribución de los ingresos por unidad de consumo. Lo que

quiere decir que, aquellos que queden por debajo del 60% serán considerados como

pobres y aquellos que queden por encima como no pobres. Si bien se pueden aplicar

más umbrales, como por ejemplo, el 40%, 50% e incluso el 20% y 25%, según el

grado en que se desee caracterizar a la población pobre.

Ya se ha explicado cómo se ha elaborado la variable de pobreza relativa numérica y a

continuación se explicará cómo se ha creado la variable pobreza relativa categórica.

Pobreza Relativa Categórica (POBRELHR): Para la construcción de esta

variable se ha tomado como referencia la elaboración de umbrales de pobreza

relativa en el trabajo.

Se parte del cálculo de la mediana de la variable numérica “Pobreza relativa”

dando como resultado 13606 euros por unidad de consumo.

Si se aplica el criterio del 60% de la mediana el cálculo sería: 13606*0,6=

8163,6. Esta cifra indica dónde se encuentra el punto de corte entre los

individuos considerados como pobres y los considerados como no pobres.

En base a dichos cálculos se han establecido tres grupos:

1 No pobres: Esta categoría incluye a aquellos que se encuentran por encima

de la mediana nacional (> 13606).

2 Vulnerables: Aquellos que su renta por unidad de consumo se sitúa entre la

mediana y el umbral o línea de pobreza (entre 13606 y 8163,6).

3 Pobres: En esta categoría se agrupan aquellos individuos cuya renta es

inferior al umbral de pobreza (<8163,6 euros por unidad de consumo).

21

En la literatura se pueden encontrar muchos otros criterios porcentuales para

obtener nuevos umbrales o líneas de corte entre la población con el fin de

obtener una clasificación más exacta. Por ejemplo, calculando el 40%, 20% de

la mediana, como realizan en el trabajo “Condiciones de vida en Aragón”

(Pérez et al., 2009). En este caso, se calculó tomando como referencia dicho

trabajo, 6 grupos iniciales que quedaron descartados por la obtención de pocos

individuos en alguna de las categorías y por no presentar demasiadas

diferencias respecto a sus categorías más cercanas.

Situación laboral (PL031/SITLAB): “Situación en relación con la actividad definida

por el interesado”

1 Asalariados

2 Trabajadores por cuenta propia

3 Parado

4 Estudiante

5 Jubilado, retirado anticipado o ha cerrado un negocio

6 Incapacitado permanente para trabajar

7 Labores del hogar, cuidado de niños u otras personas

8 Otra clase de inactividad

No se usa la codificación original, ya que se han fusionado 4 categorías que aludían a

asalariados y trabajadores por cuenta propia. Así como se eliminó una categoría

“Servicio militar obligatorio” por no haber ningún individuo en la muestra en dicha

situación.

Ocupación (PL051/OCUPACIÓN): “Ocupación del empleo principal actual o del

último empleo principal”.

La variable original está codificada en base a la clasificación internacional ISCO08 a

dos dígitos. Sin embargo, la variable con la que se ha trabajado en el presente análisis

ha sido recodificada según la misma clasificación, pero en una versión más reducida

(un dígito). Si bien, a pesar de haber elaborado una codificación más generalizada no

se ha perdido de vista todas las profesiones que engloba cada grupo.

22

1 Directores y gerentes

2 Profesionales científicos e intelectuales

3 Técnicos y profesionales de nivel medio

4 Personal de apoyo administrativo

5 Servicios y vendedores en comercios y mercados

6 Agricultores y trabajadores agropecuarios, forestales y pesqueros

7 Oficiales, operarios y artesanos mecánicos

8 Operadores de instalaciones y máquinas y ensambladores

9 Ocupaciones elementales

10 Ocupaciones militares

Tipo de contrato (PL140/TIPOCONTRATO):

1 Contrato fijo de duración indefinida

2 Contrato temporal de duración determinada

Un contrato es considerado como temporal de duración determinada cuando el fin del

contrato está determinado por condiciones objetivas como la expiración de un plazo o

realización de una tarea, la realización de un periodo de prácticas o formación o

sustitución de la parte de trabajo no desarrollada por los prejubilados. De no ser así,

se estaría hablando de contratos de duración indefinida.

Estado de salud (PH010/Salud): “Estado general de salud” sigue la siguiente

clasificación, la cual tiene en cuenta las diferentes dimensiones de la salud, física o

mental, y queda a criterio del informante. Por lo que es una variable de carácter

subjetivo:

1 Buen estado de salud

2 Regular estado de salud

3 Mal estado de salud

23

Condiciones de la vivienda (CONDVIVIEND): En esta dimensión se investiga si la

vivienda posee instalaciones básicas y si sufre algún problema de deterioro que haga

de la vivienda un lugar en malas condiciones y carente de aspectos básicos que hoy

en día son considerados de necesidad básica. Esta nueva variable está formada por

tres variables

-HH040: “¿Tiene la vivienda problemas de goteras, humedades en paredes,

suelos, techos o cimientos, o podredumbre en suelos. Marcos de ventanas o

puertas?

-HH081: “¿Dispone la vivienda de ducha/bañera? Se considera que una

vivienda dispone de bañera/ducha cuando el hogar cuenta con una instalación

fija de la misma en el interior de la vivienda.

-HH091: “¿Dispone de inodoro con agua corriente en el interior de la vivienda?

Se dispone cuando el hogar cuenta con una instalación fija dotada de agua

corriente en el interior de la misma y adecuada para evacuar residuos

humanos.

La primera variable está codificada como 1 (Sí) y 2 (No) y las otras dos como 1 (Sí,

para uso exclusivo), 2 (Sí, para uso compartido con otras viviendas) y 3 (No). Así

pues, el primer paso fue recodificar las variables HH081 y HH091 como Sí (1),

incluyéndose aquí 1 y 2 de la codificación original, y No (2). Una vez realizado el

primer paso se sumaron las presencias de las tres variables dando como producto 4

categorías. Si bien nótese que, en la primera variable la respuesta objetiva sería 2

(No), mientras que en las otras dos sería 1 (Sí). De este modo, las categorías creadas

aluden a las siguientes realidades producto de la suma:

Muy buenas condiciones: 2 en HH040 y 1 en HH081 y en HH091.

Buenas condiciones: 1 en HH040.

Malas condiciones 2 en HH040 y 2 en bañera o en inodoro

Muy malas condiciones 1 en HH040 y 2 en el resto de variables.

Posteriormente, Muy buenas y buenas condiciones se fusionó en la categoría “Buenas

condiciones de vida (1)” y malas con muy malas condiciones de vida (2)”

24

Relaciones sociales (RELSOC): Formada por dos variables

-PD050: “¿Se reúne con amigos/familiares para comer o tomar algo al menos

una vez al mes?

-PD060: “¿Participa regularmente en actividades de ocio, deportes,

conciertos…?

Ambas variables están codificadas como: Sí (1), No, porque no puede permitírselo (2)

y No, por otras razones (3).

Por tanto, el primer paso fue recodificar las categorías originales 2 y 3 en una sola (2).

De esta manera pasaría a ser: Sí (1) y No (2).

El segundo paso fue recodificar, nuevamente, en 0 (ausencia) y 1 (presencia) para

poder sumar los valores de las variables y crear categorías. En este caso 2 categorías

atendiendo al número de presencias y ausencias registradas (Buenas relaciones

sociales y malas relaciones sociales).

Entorno (ENTORNO): Se estudia si el entorno físico y social es favorable o no.

Construida a partir de 4 variables:

-HS160: “¿Tiene la vivienda escasez de luz natural?”

-HS170: “¿Tiene la vivienda problemas de ruidos producidos por vecinos o

procedentes del exterior?

-HS180: “¿Tiene la vivienda problemas de contaminación, suciedad, u otros

problemas medioambientales en la zona producidos por industria o el tráfico?

-HS190: “¿Tiene la vivienda problemas de delincuencia o vandalismo en la

zona?”

Originalmente en el cuestionario todas ellas están codificadas como: Sí (1) y No (2),

pero para crear la nueva variable “entorno” se recodificó en binario (Sí (1) y No (0)).

Una vez realizado este paso se procedió a la suma de las variables y se crearon 2

categorías que responden a:

1 Condiciones de entorno buenas (0 presencias o 1 presencia)

2 Condiciones de entorno malas (de 2 presencias a 4 presencias)

25

Carencia material (CARENCIAMAT): Esta variable estudia la dimensión de carencia

material y está construida inspirada en el indicador AROPE analizado en los

resultados y publicaciones del INE. Si bien, se diferencia en que en esta variable se ha

construido integrando más variables que en dicho indicador que se consideraban

importantes. Construida a partir de 13 variables:

-HH050: “¿Puede el hogar permitirse mantener la vivienda con una temperatura

adecuada durante los meses de invierno?” (*1)

-HS040: “¿Puede el hogar permitirse ir de vacaciones fuera de casa, al menos

una semana al año? (*0,2)

-HS050: “¿Puede el hogar permitirse una comida de carne, pollo o pescado (o

equivalentes vegetarianos) al menos cada dos días?” (*1)

-HS060: “¿Tiene el hogar capacidad para afrontar gastos imprevistos? (*0,7)

-HS070: “¿Tiene el hogar teléfono (incluido móvil)?” (*0,5)

-HS080: “¿Tiene el hogar televisión en color?” (*0,2)

-HS090: “¿Tiene el hogar ordenador?” (*0,2)

-HS100: “¿Tiene el hogar lavadora? (*0,5)

-HS110: “¿Tiene el hogar coche?” (*0,5)

-PD020: “¿Sustituye las ropas estropeadas por otras nuevas? (*1)

-PD030: “¿Tiene dos pares de zapatos o un par adecuado para cualquier

época del año?” (*1).

-PD070: “¿Gasta una pequeña cantidad de dinero en usted mismo a la

semana? (*0,2)

-PD080: “¿Dispone de conexión a internet para uso personal en el hogar?

(*0,2)

En este caso el primer paso fue proporcionar y aplicar a cada una de las 13 variables

una ponderación según la importancia de poseer o no dicha lista de bienes, cabe

señalar que la ponderación está seleccionada de manera subjetiva. Los bienes

considerados como más importantes son ponderados multiplicados por 1, luego por

0,7, por 0,5 y, los menos importantes, por 0,2.

26

Sabido esto, el valor máximo que se puede alcanzar es de 7,2, lo cual equivaldría a

una situación excelente en la que no se carecería de ninguno de los bienes de la lista.

Por ello, los individuos podrán tomar valores dentro de la escala que va desde 0 hasta

7,2.

Para poder aplicar dichas ponderaciones, primeramente, se recodificaron todas las

variables en 0 (ausencia) y 1 (presencia). Por lo que, en algunos casos se pasó de Sí

(1) a presencia (1) y No (2) a ausencia (0) y, en otros casos se pasó de Sí (1) a

presencia (1), No, porque no puede permitírselo (2) y No, por otros motivos (3) a

ausencia (0). Una vez que se tuvieron las variables en escala de medición binaria se

multiplicaron por la ponderación elegida pasando de tener una variable vinaria a una

variable numérica (cuantitativa).

Carencia material Categórica (CarMatHR): A partir de la variable numérica

explicada arriba se creó otra con tres categorías:

1 No carencia material: <5,9

2 Carencia material intermedia: Entre 5,9 y 6,6

3 Carencia material: Entre 6,6 y 7,2

Educación (PE040/NIVESTUDIOS): En esta variable se considera el máximo nivel de

estudios alcanzado por la persona entrevistada. Por nivel de estudios alcanzados se

entiende aquél nivel máximo en el que se esté en posesión de un título o diploma, o en

su defecto, los casos en los que se haya superado todas las asignaturas y se

encuentre en trámites de pedir el título. Se utiliza la variable original, pero aplicando

cambios en su codificación. Por tanto, la variable empleada en el análisis quedaría

recodificada a partir de la clasificación CNED2014 de la siguiente manera: (INE, 2014)

1 Menos que primaria: En esta categoría se incluyen aquellos con estudios de

primaria incompletos y a analfabetos.

2 Educación primaria: Aquellos individuos con educación primaria

completada.

3 Educación Secundaria: Se clasifican aquí las personas que hayan

cursado como máximo los 9 primeros cursos de educación primaria y

secundaria o que hayan completado dicho nivel de estudios.

27

4 Bachillerato y similares: Por similares se refiere a las enseñanzas de COU

y BUP.

5 FPE: Esta categoría recoge todas aquellas enseñanzas destinadas a la

formación profesional

6 Educación superior: En esta categoría se incluyen todas las titulaciones de

Grado, Diplomaturas, Licenciaturas. Estudios de Máster universitario, estudios

de especialización (MIR, FIR, BIR…) y estudios de Doctorado.

7 NC: Recoge a las personas que decidieron no responder a esta pregunta.

3.4 Métodos estadísticos

3.4.1 Análisis discriminante

El análisis discriminante (AD) o función discriminante es una técnica que analiza la

relación entre una variable dependiente con un conjunto de variables independientes.

La variable dependiente ha de ser no numérica o categórica, mientras que las

independientes han de ser numéricas. Además, la variable dependiente determinará

cuántos grupos se van a comparar dependiendo del número de categorías que

albergue dicha variable. El AD es una técnica que permite describir, predecir y

clasificar, la cual fue desarrollada, en sus inicios, por Ronald Aylmer Fisher en el año

1936 a partir de la publicación de su estudio sobre la clasificación de flores del género

iris publicado con el nombre “The use of multiple measurements in taxonomic

problems”. (Cuadras, 2014)

Los objetivos principales del AD son: (Cea, 2016, p. 10)

1) Comprobar si la agrupación en categorías de los objetos dada es correcta y

si queda caracterizada por las variables que definen a cada grupo pudiendo

observar qué variable discriminante contribuye más al análisis clasificando

correctamente a los individuos en cada grupo.

2) Conocer la combinación de las variables independientes, llamadas en este

contexto función discriminante, que haga máxima la diferenciación entre los

grupos.

28

3) Predecir la probabilidad de pertenencia de un individuo u objeto a los

grupos a partir del conocimiento de los valores que toma en las variables

independientes. En este punto, es necesario conocer qué conjunto de

variables discriminan más a los grupos.

Supuestos del Análisis Discriminante: (Gil, 2009)

1) La variable que define los grupos debe ser categórica, pero las variables

independientes deben ser medidas en escala de intervalo o de razón

2) Es necesario la existencia de 2 grupos o más.

3) Para cada uno de los grupos es necesario que haya 2 o más casos.

4) El número de variables independientes debe ser menor al número de casos

menos 2.

5) Evitar colinealidad entre las variables discriminantes.

6) El número máximo de funciones discriminantes es el mínimo entre el

número de variables y el número de grupos menos 1

7) Las matrices de varianzas-covarianzas de todos los grupos deben ser

iguales.

8) Las variables deben seguir una distribución normal en cada grupo.

9) Eliminar “outliers” para que no distorsionen la clasificación de las

observaciones.

Para la explicación formal del Análisis Discriminante, se ha recurrido a la consulta del

manual de Uriel y Aldás. (Uriel & Aldás, 2005)

Se parte de una matriz de datos multivariantes cuyas filas están divididas en 𝑔 grupos

excluyentes de tamaño 𝑛𝑖(𝑖 = 1,2 … 𝑔) y 𝑝 variables en las columnas.

A partir de 𝑔 muestras aleatorias de 𝑔 grupos de individuos y de los valores en 𝑘

variables (𝑋1, 𝑋2, … , 𝑋𝑘) para cada miembro de cada muestra, se trata de obtener

𝐷1, … , 𝐷𝑚 funciones lineales de 𝑋1, … , 𝑋𝑘.

Por tanto se ha de buscar aquella función discriminante que garantice la máxima

separación entre los grupos, lo cual lleva a la explicación de la Función Discriminante

de Fisher, que se obtiene como una función lineal de 𝐾 variables explicativas de 𝑋:

𝐷𝑖 = 𝑢1𝑋1 + 𝑢2𝑋2 + ⋯ + 𝑢𝑘𝑋𝑘

29

Donde:

𝐷: Es la calificación discriminante

𝑖: Es la puntuación discriminante de la i-ésima observación.

𝑢: Los coeficientes discriminantes calculados de manera que hagan máxima la

separación entre los grupos.

𝑋: Las variables predictivas

Tras el cálculo de la función discriminante se obtiene la matriz, cuya notación es:

𝑑 = 𝑋𝑢 y la variabilidad es:

𝑑′𝑑 = 𝑢′𝑋′𝑋𝑢

Dicha matriz está compuesta por la suma de cuadrados y productos cruzados (SCPC)

total de las variables explicativas.

La matriz SCPC total se puede descomponer así:

𝑋′𝑋 = 𝑇 = 𝐹 + 𝑊

Donde:

𝑇: es la matriz SCPC total

𝐹: es la matriz entre-grupos

𝑊: es la matriz intra-grupos

Una vez obtenidas dichas matrices, se puede obtener a partir de la matriz obtenida por

la función discriminante:

𝐷′𝑑 = 𝑢′𝑇𝑢 = 𝑢′𝐹𝑢 + 𝑢′𝑊𝑢

30

A partir de aquí se busca la obtención del eje discriminante en el que las distribuciones

proyectadas sobre el mismo se separen lo máximo posible entre ellos y, a su vez,

sean lo más compactos posible internamente.

Mediante la maximización de lamda se determina el eje discriminante, de manera que

cuando las distribuciones sean proyectadas en él estén lo más separadas entre sí

(variabilidad entre grupos) y que, a su vez, cada una de las distribuciones esté

compacta y no dispersa (variabilidad intra grupos)

𝑀𝑎𝑥𝑖𝑚𝑖𝑧𝑎𝑐𝑖ó𝑛 𝑑𝑒 λ =𝑢′𝐹𝑢

𝑢′𝑊𝑢

La función discriminante de Fisher, casi siempre, se determina como lineal, ya que

ésta se obtiene mediante la combinación lineal de las variables originales y trata de

aplicar valores a (𝑋1, 𝑋2, … , 𝑋𝑘). Dichos valores son los resultantes de proyectar cada

punto sobre el espacio 𝐾 dimensional de las variables originales sobre el eje

discriminante.

A partir de esto último, se calculan los centroides (medias), que resumen la

información de cada uno de los grupos. Por ejemplo, si se tuvieran dos grupos los

vectores de medias serían:

�̅�g1= �̅�1,1, �̅�2,1,…, �̅�k,1

�̅�g2= �̅�1,2, �̅�2,2,…,�̅� k,2

Una vez obtenidos los centroides se han de introducir en la función discriminante de

Fisher, de tal manera que se obtendría:

�̅�1=u1�̅�1,1+u2�̅�2,1+…..+uK �̅�K1

�̅� 2=u1�̅�1,2+u2�̅�2,2+…..+uK �̅�K2

Lo siguiente es calcular el punto de corte discriminante para poder establecer los

criterios de clasificación, llamado 𝐶, que se calcula como el promedio de �̅�1 y �̅�2:

31

𝐶 =�̅�1 + �̅�2

2

Así pues, el criterio de clasificación de los individuos u objetos sería:

Si 𝐷𝑖 < 𝐶, se clasifica el individuo 𝑖 en el grupo 1

Si 𝐷𝑖 > 𝐶, se clasifica el individuo 𝑖 en el grupo 2

O mediante la resta del valor de 𝐶 a la función discriminante:

𝐷 − 𝐶 = 𝐷𝑖 = 𝑢1𝑋1 + 𝑢2𝑋2 + ⋯ + 𝑢𝑘𝑋𝑘 − 𝐶

De esta manera se obtendría una clasificación de los individuos en dos grupos donde

la heterogeneidad entre ellos y la homogeneidad en sí fuera la máxima posible.

3.4.2 Análisis de la homogeneidad

Los datos categóricos son muy frecuentes en Ciencias Sociales, así como en múltiples

áreas del conocimiento. Sin embargo su análisis es más complicado, en ocasiones, a

través de los procedimientos estadísticos estándar. Sobre todo cuando hay una

existencia de excesivas variables, demasiados valores para cada variable u

observaciones insuficientes.

Para paliar este problema existe un conjunto de técnicas basadas en la aplicación del

procedimiento del escalamiento óptimo, el cual proporciona cuantificaciones numéricas

a las categorías de cada variable. Esto permite utilizar los procedimientos estándar

para obtener una solución con las variables cuantificadas.

32

Dichas técnicas se enmarcan dentro del sistema Gifi, el cual aglutina: (Gifi, 1990)

-Análisis de componentes principales para datos categóricos, llamado CATPCA

(Categorical principal components) o PRINCALS (Nonlinear principal

component analysis).

-Análisis de correspondencias múltiples, también denominado HOMALS

(Homogeneity Analysis by means of Alternatin Least Squares).

-Correlación canónica no lineal, conocido como OVERALS (Nonlinear canonical

correlation analysis)

Todas estas técnicas siguen el algoritmo ALS (Mínimos Cuadrados Alternados) el cual

se usa como modelo general y cuando se persigue el objetivo de analizar las

relaciones multidimensionales en un espacio de dimensión reducida (bidimensional)

del sistema cuantificado en base a un modelo de análisis dado.

Dichas técnicas fueron realizadas e implementadas en el paquete estadístico SPSS de

IBM por el grupo “Data Theory Scaling System Group”, en el que participan diferentes

departamentos de la Universidad de Leiden, Holanda.

HOMALS es uno de los modelos recogidos en el grupo de técnicas que hacen uso del

Escalamiento Óptimo del sistema Gifi (1990), la cual alberga una serie de técnicas

exploratorias de análisis multivariante no lineal. Además, dentro de dicho sistema y de

las técnicas recogidas en éste es el menos restrictivo por trabajar con un conjunto de

variables de naturaleza nominal.

La utilización de la técnica HOMALS viene justificada por la naturaleza de las variables

empleadas y para la consecución de uno de los objetivos marcados en este análisis, el

cual reside en encontrar los perfiles de los individuos en situación de pobreza y de

exclusión social. Por tanto se trata de buscar e interpretar los perfiles en base a las

variables sociodemográficas y de las dimensiones que miden la exclusión social.

Puesto que el objetivo principal de dicha técnica versa sobre la representación de la

estructura de datos multivariantes categóricos para describir las relaciones entre dos o

más variables no numéricas en un espacio de reducida dimensionalidad en el que se

representan las categorías de cada variable y a cada individuo en relación a dichas

categorías.

Así pues, los individuos (objeto de estudio), cuya respuesta sea coincidente en la

misma categoría para la misma variable aparecerán próximos en el grafico proyectado

33

desde el hiperespacio, mientras que si sucede lo contrario aparecerán separadas.

Cada individuo aparecerá, aproximadamente, más junto de las categorías

respondidas.

Este análisis es conocido como Análisis de Correspondencias Múltiples o como

Análisis de Homogeneidad porque se realiza el análisis más adecuado cuando las

variables son homogéneas, es decir, cuando clasifican objetos de las mismas

categorías en los mismos subgrupos.

HOMALS permite cuantificar los datos de las variables categóricas aplicando valores

numéricos a los individuos objeto de estudio y a las categorías de las variables

seleccionadas para describir la relación entre dos o más variables en un espacio de

baja dimensión.

El objetivo es encontrar las cuantificaciones óptimas, lo que se traduce en que se

agrupen categorías semejantes en relación a la similitud entre ellas y que separe al

máximo aquellas que difieran, De esta manera, las categorías dividen los objetos en

subgrupos homogéneos.

El Escalamiento óptimo asigna cuantificaciones numéricas a las categorías de cada

variable permitiendo los procedimientos estándar para obtener una solución con las

variables cuantificadas. Además, se puede especificar el nivel de escalamiento óptimo,

lo que significa el nivel al que se escala y no al nivel al que se miden las variables.

Esta técnica cuantifica a partir de transformaciones de tal forma que se minimice la

pérdida de información que resulta al reducir la dimensionalidad del sistema

cuantificado en base a un modelo de análisis dado.

Dicha cuantificación, en el caso de esta técnica, se obtiene a partir del proceso

iterativo de los Mínimos Cuadrados Alternados para evitar problemas que se suelen

encontrar cuando se lleva a cabo investigaciones a partir de variables categóricas,

como por ejemplo, observaciones insuficientes, elevado número de variables y buena

cantidad de valores en cada variable.

El algoritmo ALS parte de una matriz de datos 𝑋𝑛𝑥𝑝, donde 𝑛 son los individuos (filas) y

𝑝 las variables categóricas (columnas), pero se necesita cuantificar a dichas variables

para poder representar en el plano. Para ello, el primer paso que lleva a cabo versa

sobre la cuantificación de las variables categóricas en análisis calculándose las

puntuaciones de los sujetos y de las variables. A partir de esto, se asignan

puntuaciones mediante el algoritmo ALS para poder representar los objetos en un

espacio p-dimensional reducido.

34

Por tanto, se considerará 𝑍 a la matriz de datos originales que tiene 𝑇 variables

categóricas observadas sobre 𝑁, donde la variable posee 𝑀 categorías.

Sea la matriz 𝑋𝑛𝑥𝑝, la cual contiene las coordenadas de los 𝑁 individuos e 𝑌𝑀𝑥𝑝 que

contiene las 𝑀 categorías. Se llamará 𝑋 a la matriz de cuantificaciones de los objetos y

a 𝑌 como matriz de cuantificaciones de las categorías.

El objetivo del algoritmo es minimizar la función de pérdida simultáneamente respecto

a la matriz 𝑋 e 𝑌, la cual se define como:

𝜎(𝑋, 𝑌) ≡ 𝑚−1 ∑ 𝑆𝑆𝑄 (𝑋 − 𝐺𝑗 𝑌𝑗)

𝑗

Donde:

𝜎(𝑋, 𝑌): Es la función de pérdida en los parámetros X e Y.

𝑀: El número de variables.

𝑆𝑆𝑄: Es la suma de cuadrados

𝑋: Se corresponde a la matriz 𝑛𝑥𝑝 de puntajes de los individuos.

𝐺𝑗: Es la matriz indicadora correspondiente a la j-ésima columna de la matriz 𝐻.

𝑌𝑗: Es la matriz de cuantificaciones de las categorías de la j-ésima variables.

3.4.3 Métodos Biplot

Los métodos Biplot fueron propuestos por Gabriel en “The biplot graphic display of

matrices with application to principal component analysis” en el año 1971 como

representaciones gráficas de datos multivariantes donde podían representarse 3 o

más variables. Estos métodos guardan cierta similitud con el Análisis de Componentes

Principales, pero con la diferenciación de que los métodos Biplot representan

conjuntamente a los individuos y a las variables en un espacio dimensional reducido.

Según Gabriel (1972), un Biplot es una representación gráfica de una matriz de datos

𝑋𝑛𝑥𝑝 mediante marcadores fila (𝑔1, … , 𝑔𝑛) y marcadores columnas (ℎ𝑗, … , ℎ𝑛). De

manera que el producto interno 𝑔𝑗′ℎ𝑗 represente el elemento 𝑥𝑖𝑗 de la matriz de datos

𝑋.

35

Por tanto, lo que se persigue es que la nueva matriz creada en base a marcadores

aproxime lo mejor posible la matriz 𝑋 de partirda en un espacio dimensional reducido

(q<r) mediante la Descompsición en Valores (vectores) Singulares. (DVS):

𝑋 = 𝑈𝐷𝑉′

Donde 𝑈 es la matriz cuyas columnas contienen los vectores propios de 𝑋𝑋′, 𝑉 es la

matriz cuyas columnas contienen los vectores propios de 𝑋𝑋′ y 𝐷 es la matriz diagonal

que contiene a los valores singulares de 𝑋.

Y debe cumplirse que 𝑈′𝑈 = 𝑉′𝑉 = 𝐼, es decir, las columnas de 𝑈 y 𝑉 son

ortonormales:

𝑋 = 𝐺𝐻′ = 𝑈𝐷𝑉′

La tipología propuesta por Gabriel son el JK Biplot y el GH Biplot siendo lo que les

diferencia la factorización y la elección de los marcadores a partir de dicha

factorización:

JK BIPLOT: Preserva la máxima calidad de representación de las filas, pero no

de las columnas donde:

𝐽 = 𝑈𝐷 𝐾 = 𝑉

GH BIPLOT: Consigue la máxima calidad de representación de las columnas,

pero no de las filas:

𝐺 = 𝑈 𝐻 = 𝑉𝐷

En el año 1986, Purificación Galindo propuso una alternativa a los Biplot de Gabriel

llamado HJ Biplot (Galindo, 1986). Éste es una representación gráfica multivariante de

una matriz de datos denotada como 𝑋 con marcadores fila o vectores fila 𝑗1,𝑗2, … , 𝑗𝑛 y

marcadores columna o vectores columna ℎ1, ℎ2, … , ℎ𝑝 de la matriz 𝑋. Dichos

marcadores pueden superponerse en un mismo sistema de referencia sin perder

36

calidad de representación a través de la DVS, como en los modelos anteriores,

obteniéndose marcadores en dimensión reducida.

El HJ Biplot no consigue reproducir los datos originales de la matriz 𝑋(𝑋 ≠ 𝐽𝐻′), pero

consigue la máxima calidad de representación en filas y columnas introduciendo la

matriz diagonal 𝐷 de la siguiente manera:

𝐽 = 𝑈𝐷 𝐻 = 𝑉𝐷

37

4. RESULTADOS

4.1 Análisis descriptivos1

Antes de iniciar los análisis multivariantes, que se presentan con posterioridad, se

realizó un análisis descriptivo de todas las variables que forman la base de datos con

el fin de conocer las características de los individuos que forman la muestra analizada.

Los resultados del análisis descriptivo de las variables se van a presentar dividido por

las mismas dimensiones que se presentaron en el marco teórico y a partir de las que

se organizó la agrupación de las variables en la metodología.

1) DESCRIPTIVOS DE LAS VARIABLES SOCIODEMOGRÁFICAS

La muestra con la que se está trabajando posee un porcentaje de hombres

de 47,8% y de mujeres, ligeramente superior, de 52,2%.

Los rangos de edad (Véase gráfico 1) más numerosos son, en primer lugar,

el de 66 años en adelante (23,3%), de 46 a 55 años con un 19,3%, mientras

que de los grupos de edad que corresponderían a individuos jóvenes son

más restringidos. El intervalo de edad de 16 a 15 años y el de 26 a 35 años

posee un porcentaje de 11,9% y 12,7%, respectivamente.

Gráfico 1. Análisis descriptivo: Edad

Fuente: Elaboración propia a partir de los datos de la ECV 2014.

1 Podrá observarse que en alguno de los análisis descriptivos el total no da 100%, lo cual viene explicado

por la eliminación de los casos perdidos.

38

Además, el 48% de la muestra vive en una zona urbana muy poblada y un

30,1% los que viven en zonas menos pobladas y rurales. Por tanto, hay más

representatividad de las grandes urbes en la muestra.

Gráfico 2. Análisis descriptivo: Estado civil


Más de la mitad de los individuos de la muestra está casados en contraposición

a los bajos porcentajes encontrados en las categorías de “divorciados” o

“separados”. (Véase gráfico 2)

2) DESCRIPTIVOS DE LA DIMENSIÓN ECONÓMICA

La media de la renta del hogar es de 30416,81€ al año (2534,73 € al mes),

el salario medio que cobran los individuos de la muestra es de 11339,37 €

al año y la media de ingresos mínimos para llegar a final de mes del

conjunto de casos es de 1904,99€.

39

Gráfico 3. Análisis descriptivo: Pobreza relativa


Justamente la mitad de la muestra no puede ser considerada como pobre,

mientras que el porcentaje de la muestra que sí es pobre es de 21,1%. (Véase

gráfico 3)

3) DESCRIPTIVOS DE LA DIMENSIÓN LABORAL

En cuanto a la situación laboral el mayor porcentaje se encuentra en la

categoría de asalariaos con un 33,5%, seguido por la categoría de jubilados

(17,8%), parados (15,8%) y labores del hogar (12,5%). (Véase gráfico 4)

40

Gráfico 4. Análisis descriptivo: Situación laboral


La ocupación laboral predominante es la que engloba todas las profesiones

dedicadas al sector servicios y de comercios con un 16,3% frente a un 0,5%

dedicado a ocupaciones militares y un 2,5% dedicado a profesiones que se

engloban dentro de la categoría de directores y gerentes.

En relación al tipo de contrato, cerca de la mitad de los casos que trabajan,

han firmado un contrato de duración indefinida, frente a un 21,7% que

declara poseer un contrato de duración determinada. Cabe mencionar que

en esta variable se registra un alto porcentaje de casos en los que se

prefirió no responder (34,5%).

4) DESCRIPTIVOS DE LA DIMESIÓN DE EDUCACIÓN

En el estudio del nivel académico alcanzado se observa que los mayores

porcentajes se encuentran en el nivel de estudios de educación secundaria,

tanto terminada como incompleta, y el nivel de educación superior. Estas

dos categorías poseen un porcentaje de 38,9% y 25,9 %, respectivamente.

Los menores porcentajes se pueden encontrar en estudios de bachillerato y

similares y en FPE. (Véase gráfico 5)

41

Gráfico 5. Análisis descriptivo: Nivel educativo


5) DESCRIPTIVOS DE LA DIMENSIÓN DE SALUD

Mediante el análisis descriptivo de la variable que integran esta dimensión

se podrá conocer a grandes rasgos la situación y el estado de salud de los

individuos de la muestra. (Véase gráfico 6)

Gráfico 6. Análisis descriptivo: Estado de salud


42

Más de la mitad consideran que poseen un buen estado de salud (70,5%),

frente a los que consideran que tienen un estado de salud muy malo

(8,9%). Por lo que, en general, la muestra goza de un buen estado de

salud.

6) DESCRIPTIVOS DE LAS DIMENSIÓNES DE LA VIVIENDA Y DEL

ETORNO

En relación a las condiciones de vida, casi la totalidad de la muestra

considera que su vivienda no está en malas condiciones ni padece de

ningún problema (99,9%). Y con las condiciones del entorno ocurre más o

menos lo mismo, aunque aquellos que consideran que su entorno no goza

de las mejores condiciones por diversos problemas son casi un 10% de la

muestra, considerando que su entorno es bueno un 90%.

7) DESCRIPTIVO DE LA DIMENSIÓN DE CARENCIA MATERIAL

Si analizamos la carencia material desde la variable cuantitativa obtenemos

que la media de la muestra es de 6,2 (0 –carencia material- a 7,2 –nada de

carencia material-), por lo que, en general, se goza de poca carencia

material.

Si ahora se analiza desde la variable recodificada como categórica se

obtiene que un 27,5% posee carencia material, un 23,6% carencia

intermedia y un 48,9% nada de carencia material.

8) DESCRIPTIVO DIMENSIÓN RELACIONES SOCIALES

Por último, el porcentaje de la muestra que posee una vida social plena es

del 55,7%, mientras que aquellos que no disfrutan de ello son un 44,3%.

43

4.2 Resultados análisis discriminantes

El primer análisis discriminante se ha utilizado como variable de agrupación

(POBRELHR) con tres grupos definidos:

1 No pobres

2 Vulnerables

3 Pobres

Y como variables independientes se han introducido las variables cuantitativas

económicas de la base de datos: RENTA, RENHOG e INGMIN.

La muestra del análisis es de 26454 casos válidos, los cuales participan en la

derivación de las funciones discriminantes. Los casos que se han excluido sólo lo son

en cuanto a la derivación de dichas funciones, ya que una vez derivadas todos los

casos de la muestra original (26531) participan en la clasificación en los grupos.

Este análisis discriminante se ha elaborado con el fin de comprobar si las variables

independientes introducidas discriminan y diferencian a los grupos propuestos en la

variable de agrupación.

Mediante el visor de SPSS se verificó que las medias aritméticas fueran diferentes en

los tres grupos propuestos. Aunque se detectaron valores altos en las desviaciones

típicas, lo cual tiene su explicación en la existencia de valores extremos en las

variables independientes. Esto es común al tratarse de variables que miden la cuantía

de ingresos o la cuantía de ingresos necesarios para llegar a final de mes

Otro de los requisitos que señala la literatura como necesario para la aplicación del

análisis discriminante es la comprobación de la homocedasticidad mediante la prueba

M de Box sobre la igualdad de las matrices de covarianza.

La M de Box prueba la siguiente hipótesis:

H0: Las matrices de covarianzas en los tres grupos son iguales

H1: Las matrices de covarianzas en los tres grupos son diferentes

En este caso, al obtener un p-valor (0,000) menor a 0,05 rechazamos la hipótesis nula

y, por lo tanto, las matrices de covarianzas en los tres grupos son diferentes.

44

Tabla 1. Autovalores Análisis Discriminante de Pobreza


Los autovalores obtenidos están colocados en orden descendente siendo el autovalor

mayor el perteneciente a la función 1 y menor el de la función 2. (Véase tabla 1)

En este caso, el autovalor de la primera función discriminante, combinación lineal de

variables que hacen máxima la diferenciación entre los grupos, es de 2,201 y explica

un 99,8% de la variabilidad de la variable dependiente. El porcentaje de la varianza se

obtiene a través del cociente entre la cifra del autovalor de la primera función y la

suma total de autovalores.

Autovalor de la primera función discriminante= 2,201

Suma total de los autovalores = 2,205

% de la varianza = 2,201/2,205 = 0,998 *100= 99,8%

En cuanto a la segunda función discriminante, compuesta por una combinación de

otras variables discriminantes que ha de ser diferente a la combinación de la primera

función discriminante, se ha obtenido un autovalor de 0,004 y explica un 0,2% de la

variabilidad de la variable dependiente.

Autovalor de la segunda función discriminante= 0,004

Suma total de los autovalores= 2,205

% de la varianza= 0,004/2,205= 0,002 *100= 0,2%

En base a los resultados obtenidos, la primera función discriminante es mucho más

importante en el análisis que la segunda función.

Una vez que se ha descrito la relevancia de las funciones discriminantes se ha de

comentar la importancia de dichas funciones en la diferenciación entre los grupos a

partir de los valores que otorga la correlación canónica. La correlación canónica ha de

45

ser elevada (cercana a 1) para considerar que una función es importante en la

diferenciación de los grupos.

En este caso, la correlación canónica más elevada es la que corresponde a la función

1 con un valor de 0,829, mientras que en la segunda función posee un valor de 0,061.

Por lo tanto, la primera función es más importante en términos de diferenciación entre

los grupos que la segunda función discriminante.

La correlación canónica se obtiene a partir de la raíz cuadrada del autovalor de la

primera función entre el mismo valor sumándole una unidad y multiplicándolo por 100:

𝑟1=√2,201

2,201+1x100 𝑟1 = √

0,004

00,004+1𝑥100

Ahora bien, si se eleva al cuadrado la correlación canónica de la primera función

discriminante se puede conocer el porcentaje explicado de la varianza total de la

variable dependiente:

0,8292=0,75*100= 68,7%

La primera función discriminante explica un 68,7% de la varianza total de la variable

dependiente.

Y la segunda función discriminante:

0,0612= * 100= 0,37%

La segunda función discriminante explica un 0,37% de la varianza total de la variable

dependiente que no ha sido explicada por la primera función discriminante. En vista de

este resultado, se puede considerar que la segunda función discriminante no aporta

demasiado a la explicación de la varianza total no explicada por la primera función.

El total de la varianza total explicada de la variable dependiente por ambas funciones

es:

68,7+0,37= 69,07%

46

Una vez descrito lo anterior se ha de conocer la significación de las funciones

discriminantes precedentes. Para ello, se hará uso de los estadísticos λ de Wilks y χ2.

Comprobando la significación de las funciones permite conocer si las medias

(centroides) de los grupos están separados. (Véase tabla 2)

Tabla 2. Lambda de Wilks. Análisis Discriminante pobreza


Se comenzará comentando los valores de λ de Wilks donde el valor de la misma en el

contraste de las funciones 1 a la 2 es de 0,311 y el valor del mismo estadístico para el

contraste de las funciones 2, cuando se elimina la primera función, es de 0.996. El

valor de la primera función es más cercano a 0 y el de la función 2 es muy cercano a

1. Por ello, la primera función posee un mayor poder discriminante que la segunda

función que no posee casi poder discriminante. No obstante, observando el p-valor

asociado al estadístico χ2 es menor a 0,05 (0,000) permite afirmar que las medias de

los grupos están separadas y que ambas funciones discriminantes son importantes

para el análisis, a pesar de que la función 2 posea un valor cercano a 1 en la λ de

Wilks.

El valor de la lambda de Wilks se obtiene de la siguiente manera:

Λ = (1

1 + 2,201) (

1

1 + 0,004) = 0,30

Si da cerca de 0 indica la existencia de una gran diferenciación entre los grupos y,

como se ve en el resultado (0,30) se puede afirmar que los grupos están

diferenciados. Al no haberse obtenido un resultado muy próximo a 0 hay indicios de

47

que pueda haber existencia de solapamiento entre los grupos, como más tarde se

verá.

En el presente análisis discriminante son 3 las variables predictoras que muestran

poder discriminante en la diferenciación de los grupos. Por ello, a continuación, se va a

conocer cuál es la participación de cada variable en las funciones discriminantes.

(Véase tabla 3)

En dicha tabla se observan los coeficientes estandarizados de las funciones

discriminantes, los cuales son similares a la interpretación de los coeficientes beta en

el análisis de regresión.

El valor de dichos coeficientes representa la contribución relativa de la variable a la

función en unidades de desviación típica.

En la primera función discriminante la variable que más contribuye al poder

discriminante es RENHOG (0,804) y, en la segunda función discriminante, la variable

que mayor relevancia posee es INGMIN (0,759) seguida de RENHOG (0,609).

Tabla 3. Coeficientes. Análisis discriminante pobreza


Los resultados de los coeficientes en la matriz de estructura tratan de la correlación de

las variables independientes con las funciones discriminantes del análisis. Cuanto más

próxima a ±1 mayor será la relación de la variable con la función discriminante.

48

En la tabla 4, se observa que la variable más correlacionada con la función

discriminante 1 es RENHOG 0,909, seguida de INGMIN con un 0,451 y, por último, la

variable RENTA, cuyo valor es 0,406.

En el caso de la segunda función discriminante la variable más correlacionada con

dicha función es INGMIN con un valor de 0,620 seguida de RENTA con un 0,428.

Tabla 4. Matriz estructura Análisis Discriminante pobreza


Si se elevan al cuadrado los coeficientes de la matriz de estructura se obtiene la

proporción de varianza de las variables independientes que es explicada por la función

discriminante.

Por ejemplo, en la primera función:

0,9092= 0,82*100= 82%

Eso significa que el 82% de la varianza de la variable RENHOG es explicada por la

primera función discriminante quedando un 18% de la varianza de la misma variable

que será explicada por la segunda función y así sucesivamente con el resto de

variables.

Con la matriz de centroides se obtiene las medias de los tres grupos para cada función

discriminante. Como se observa las medias son diferentes entre sí, lo que indica que

los centroides de los grupos están separados y discriminados. En el caso de la función

1 se observan que todas las medias son diferentes entre ellas, situación distinta a la

que ocurre en la función 2, donde no hay grandes diferencias entre el grupo 2 y el

grupo 3 (Véase tabla 5)

49

Tabla 5. Tabla de centroides AD pobreza


Para finalizar con la descripción de los resultados para este análisis discriminante se

comentarán los datos proporcionados en la tabla de resultados de clasificación.

De acuerdo con los resultados obtenidos, mediante el AD, se corrobora que los grupos

especificados originalmente se mantienen:

Grupo 1: No pobres

Grupo 2: Vulnerables

Grupo 3: Pobres

Con la realización de este análisis discriminante se ha conseguido un 88,5% de casos

correctamente clasificados. (Véase tabla 6)

Tabla 6. Clasificación AD pobreza


50

Gráfico 7. Funciones discriminantes canónicas (Pobreza)

Como puede verse en el gráfico (Gráfico 7) se han obtenido 3 grupos donde el color

rojo representa a los casos clasificados en pobreza, es decir, aquellos que se sitúan

por debajo del umbral de pobreza o línea de pobreza de España en mayor o menor

medida. En amarillo se encuentran los casos cuyo umbral de pobreza se sitúa

alrededor del umbral del 60% hasta la mediana de España. Y, por último, en verde

aquellos casos que su distribución de ingresos le sitúan por encima de la mediana de

ingresos a nivel nacional. Los tres grupos quedan, aparentemente, bien delimitados,

siendo más numeroso el grupo de color verde y, en el caso del grupo 2 y 3 se han

obtenido unas regiones mucho más compactas que en el caso del grupo 1 donde se

registran valores más extremos.

Se aprecia cierto solapamiento entre los grupos. Para ello, se ha elaborado una tabla

adicional a las proporcionadas por el AD con las medias de cada grupo, tomando la

variable obtenida fruto del análisis discriminante y cada variable independiente. Como

se puede observar, para la variable INGMIN, los grupos 2 (vulnerables) y 3 (pobres)

presentan medias muy parecidas a diferencia de lo que ocurre con el grupo 1 que se

distingue perfectamente.

En el caso de la variable RENHOG se aprecia una buena diferencia de las medias en

los 3 grupos y, por último, la variable RENTA que, en principio, tampoco debería

51

ocasionar ningún solapamiento debido a que las tres medias de cada grupo están bien

diferenciadas. (Véase tabla 7)

Tabla 7. Medias de los grupos en las variables cuantitativas.

Fuente: Elaboración propia a partir de los datos de la ECV 2014

En este segundo análisis discriminante se ha utilizado como variable de agrupación

(Regporcpob) con cinco grupos definidos:

1 Comunidades autónomas con bajo porcentaje de pobreza.

2 Comunidades autónomas con porcentaje medio-bajo de pobreza.

3 Comunidades autónomas con porcentaje medio de pobreza.

4 Comunidades autónomas con porcentaje medio-alto de pobreza.

5 Comunidades autónomas con porcentaje alto de pobreza.

Y como variables independientes se han introducido las mismas que en el análisis

discriminante anterior: RENTA, RENHOG e INGMIN.

La muestra del análisis es de 26454 casos válidos, los cuales participan en la

derivación de las funciones discriminantes. Los casos que se han excluido sólo lo son

en cuanto a la derivación de dichas funciones, ya que una vez derivadas los casos de

la muestra original (26531) participan en la clasificación en los grupos.

Este análisis discriminante se ha elaborado con el fin de comprobar si las variables

independientes introducidas discriminan y diferencian a los grupos propuestos en la

variable de agrupación.

Dicha comprobación se va a iniciar con la observación del visor de SPSS que

proporciona información sobre las medias y las desviaciones típicas para cada variable

independiente por separado. El requisito que se han de cumplir es que las medias

aritméticas sean diferentes en los cinco grupos propuestos, lo cual se cumple.

52

La comprobación del supuesto de homocedasticidad mediante la prueba M de Box

sobre la igualdad de las matrices de covarianza, muestra en este caso un valor de

0.000, por lo cual se cumple con el supuesto de que las matrices de covarianzas de

los grupos son diferentes.

Tabla 8. Autovalores. Análisis discriminante CC.AA. y porcentaje de pobreza


Los autovalores obtenidos están colocados en orden descendente siendo el autovalor

mayor el perteneciente a la función 1 y menor el de la función 3. (Véase tabla 8)

En este caso, el autovalor de la primera función discriminante, combinación lineal de

variables que hacen máxima la diferenciación entre los grupos, es de 3,246 y explica

un 87,5% de la variabilidad de la variable dependiente. El porcentaje de la varianza se

obtiene a través del cociente entre la cifra del autovalor de la primera función y la

suma total de autovalores.

Autovalor de la primera función discriminante= 3,246

Suma total de los autovalores = 3,712

% de la varianza = 3,246/3,712 =0,874 *100= 87,4%

En cuanto a la segunda función discriminante, compuesta por una combinación de

otras variables discriminantes que ha de ser diferente a la combinación de la primera

función discriminante, se ha obtenido un autovalor de 0,466 y explica un 12,5% de la

variabilidad de la variable dependiente.

Autovalor de la segunda función discriminante= 0,466

Suma total de los autovalores= 3,712

% de la varianza= 0,466/3,712= 0,125*100= 12,5%

53

En base a los resultados obtenidos, la primera función discriminante es mucho más

importante en el análisis, seguida por la segunda función mientras que la tercera

función discriminante aporta muy poca importancia en el análisis.

Una vez que se ha descrito la relevancia de las funciones discriminantes se ha de

comentar la importancia de dichas funciones en la diferenciación entre los grupos a

partir de los valores que otorga la correlación canónica. La correlación canónica ha de

ser elevada (cercana a 1) para considerar que una función es importante en la

diferenciación de los grupos.

En este caso, la correlación canónica más elevada es la que corresponde a la función

1 con un valor de 0,874, mientras que en la segunda función posee un valor de 0,564 y

la tercera un valor de 0,004. Por lo tanto, la primera función es más importante en

términos de diferenciación entre los grupos que la segunda función discriminante y,

sobre todo, que la tercera.

La correlación canónica se obtiene a partir de la raíz cuadrada del autovalor de la

primera función entre el mismo valor sumándole una unidad y multiplicándolo por 100:

𝑟1=√3,246

3,246+1𝑥100 𝑟1 = √

0,466

0,466+1𝑥100 𝑟1 = √

0,000

0,000+1𝑥100

Ahora bien, si se eleva al cuadrado la correlación canónica de la primera función

discriminante:

0,8742=0,763*100= 76,3%

La primera función discriminante explica un 76,3% de la varianza total de la variable

dependiente.

La segunda función discriminante:

0,5642= 0,318* 100= 31,8%

54

La segunda función discriminante explica un 31,8% de la varianza total de la variable

dependiente que no ha sido explicada por la primera función discriminante.

Y la tercera función discriminante:

0,0042=0,000016*100= 0,0016%

La tercera función discriminante explica un 0,0016% de la varianza total de la variable

dependiente que no ha sido explicada ni por la función 1 ni por la función 2.

Una vez descrito lo anterior se ha de conocer la significación de las funciones

discriminantes precedentes. Para ello, se hará uso de los estadísticos λ de Wilks y χ2.

Comprobando la significación de las funciones permite conocer si las medias

(centroides) de los grupos están separados. (Véase tabla 9)

Tabla 9. Lambda de Wilks. AD CC.AA. y porcentaje de pobreza


Se comenzará comentando los valores de λ de Wilks donde el valor de la misma en el

contraste de las funciones 1 a la 2 es de 0,161, el valor del mismo estadístico para el

contraste de las funciones 2 a la 3, cuando se elimina la primera función, es de 0.682

y, el de la tercera función toma un valor de 1. El valor de la primera función es más

cercano a 0 que el de la función 2 a la 3 y 3 y, por tanto, la primera función posee

mayor poder discriminante. No obstante, observando el p-valor asociado al estadístico

χ2 es menor a 0,05 (0,000) permitiendo afirmar que las medias de los grupos están

separadas y que ambas funciones discriminantes son importantes para el análisis, a

pesar de que la función 2 posea un valor cercano a 1 en la λ de Wilks.

El valor de la lambda de Wilks se obtiene de la siguiente manera:

Λ = (1

1 + 3,246) (

1

1 + 0,466) (

1

1 + 0) = 0,15

55

Como se observa, el resultado obtenido es cercano a 0, lo cual indica la existencia de

una gran diferenciación entre los grupos y que los centroides están separados.

En el presente análisis discriminante son 3 las variables predictoras que muestran

poder discriminante en la diferenciación de los grupos. Por ello, a continuación, se va a

conocer cuál es la participación de cada variable en las funciones discriminantes.

(Véase tabla 10)

Se observan los coeficientes estandarizados de las funciones discriminantes, los

cuales son similares a la interpretación de los coeficientes beta en el análisis de

regresión.

El valor de dichos coeficientes representa la contribución relativa de la variable a la

función en unidades de desviación típica.

Tabla 10. Coeficientes de las funciones discriminantes CC.AA. y pobreza


En la primera función discriminante la variable que más contribuye al poder

discriminante es RENHOG (0,665), seguida por INGMIN y RENTA con un valor de

0,589 y 0364, respectivamente. Lo mismo ocurre en la función discriminante 2 aunque

con valores diferentes. Sin embargo, en la tercera función discriminante la variable que

mayor relevancia posee es RENTA (0,962), mientras que RENHOG e INGMIN

proporcionan valores negativos (-0,400 y -0,045, respectivamente).

No obstante, se interpretará también los resultados de los coeficientes en la matriz de

estructura (véase tabla 11) porque éstos no se ven afectados por posibles

interrelaciones de algunas de las variables predictoras. El valor que se obtiene en la

siguiente tabla se trata de la correlación de las variables independientes con las

funciones discriminantes del análisis. Cuanto más próxima a ±1 mayor será la relación

de la variable con la función.

56

En esta tabla se incluyen todas las variables independientes que se han introducido en

un principio sin excluir aquellas no significativas para el análisis. No obstante, este

problema aquí no se ha obtenido, ya que las tres variables independientes

introducidas en el análisis han resultado ser significativas para el análisis.

Tabla 11. Matriz estructura. AD CC.AA y porcentaje pobreza


En la función discriminante 1 la variable más correlacionada con dicha función es

RENHOG con 0,781, que como se aprecia el valor es cercano a 1. A esta variable le

sigue INGMIN con un 0,599 y, por último, la variable menos correlacionada con la

función es RENTA, cuyo valor es 0,353, el cual se aproxima más a 0 que a 1.

En el caso de la segunda función discriminante la variable más correlacionada con

dicha función es INGMIN con un valor de 0,758. Y, por último, en la tercera función

discriminante, se observa que la variable más correlaciona con la función es la de

RENTA con un valor de 0,914.

Si se elevan al cuadrado los coeficientes de la matriz de estructura se obtiene la

proporción de varianza de las variables independientes que es explicada por la función

discriminante.

Por ejemplo, en la primera función:

0,7812= 0,60*100= 60%

Eso significa que el 60% de la varianza de la variable RENHOG es explicada por la

primera función discriminante quedando un 40% de la varianza de la misma variable

57

explicada por la segunda y tercera función y así sucesivamente con el resto de

variables.

Con la matriz de centroides se obtiene las medias de los tres grupos para cada función

discriminante. Como se observa las medias son diferentes entre sí, lo que indica que

los centroides de los grupos están separados y discriminados. (Véase tabla 12) Si

bien, los resultados obtenidos para la dimensión 3 son más similares que en el caso

de las otras dos funciones restantes.

Tabla 12. Centroides. AD CC.AA y porcentaje pobreza


Para finalizar con la descripción de los resultados para este análisis discriminante se

comentarán los datos proporcionados en la tabla de resultados de clasificación.

El AD para este análisis concreto ayuda a corroborar que mediante la introducción del

conjunto de variables independientes que se ha seleccionado es posible caracterizar y

discriminar a 4 de los 5 grupos predeterminados por la variable dependiente. Según

los resultados el grupo de Comunidades Autónomas con un porcentaje de población

pobre medio-alto no es posible caracterizarlos como un grupo único y homogéneo,

sino que sus individuos se han recolocado en otros grupos, principalmente en el grupo

de Comunidades Autónomas con un porcentaje alto de población en pobreza.

Además este análisis ha clasificado correctamente un 90,4 de casos originalmente

agrupados. (Véase tabla 13)

58

Tabla 13. Clasificación AD CCAA y porcentaje pobreza


Gráfico 8. Funciones discriminantes canónicas Comunidades Autónomas y porcentaje pobreza


Como puede verse en el gráfico 8 se han obtenido 4 grupos donde el color rojo hace

referencia a las Comunidades Autónomas cuyo porcentaje de pobreza es más

elevado, en amarillo las regiones donde el porcentaje de pobreza es medio, el color

azul engloba aquellas CC.AA. con un porcentaje de población declarada como pobre

medio-bajo y en verde las comunidades autónomas cuya porcentaje de pobreza es

más bajo. Los cuatro grupos quedan, aparentemente, bien delimitados, siendo más

numeroso y disperso el grupo de color verde, en comparación con el resto de grupos

dónde las regiones coloreadas en el gráfico son más compactas.

59

La distribución de las Comunidades Autónomas de España según los grupos

establecidos en las categorías de la variable dependiente es la que se puede ver en la

siguiente imagen (véase ilustración1):

Ilustración 1. Mapa de España según porcentaje de pobreza (CC.AA.)


Porcentaje población pobre bajo

Porcentaje de población pobre medio-bajo

Porcentaje de población pobre intermedio

Porcentaje de población pobre medio-alto

Porcentaje de población pobre alto

Como se ve, el mapa de España se encuentra coloreado en un degradado de tonos

azules dónde el color azul más oscuro alude a la obtención de un porcentaje de

población pobre elevado, y el azul claro está relacionado con aquellas regiones en las

que el porcentaje de población pobre es bajo.

En los resultados del AD, el tono de azul semioscuro que poseen Castilla La-Mancha,

Valencia, Melilla y las Islas Canarias no han sido clasificadas como un grupo

independiente al resto, sino que, en su gran mayoría, han sido clasificados en el grupo

de Andalucía, Extremadura, Ceuta y Murcia (azul oscuro).

60

Por tanto, quedaría evidente la diferenciación entre el norte, con porcentajes de

pobreza bajos, y centro de España frente a sur de España, con porcentajes de

pobreza altos. Esto viene determinado por la existencia de una distribución de

ingresos más elevada en algunas zonas que en otras, pues el cálculo del porcentaje

de pobreza viene dado por el cálculo del umbral de pobreza y ésta es una medida

relativa dependiendo su valor del nivel de renta y de la distribución de los ingresos en

cada población. Por ello, el valor obtenido tras su cálculo puede aumentar o disminuir

en la medida en que los ingresos de las poblaciones sean mayores o menores.

En base a esto último, se puede constatar con la visualización de la Ilustración 2, la

cual muestra un mapa coloreado en base a los umbrales de pobreza o línea de

pobreza de las CC.AA, en relación al umbral nacional.

En color rojo están señaladas aquellas cuyo umbral de pobreza es más bajo que el

umbral nacional, en amarillo referencia a aquellas cuyo umbral está en torno al umbral

nacional y en verde aquellas, cuyo umbral es superior al de España. Con esto se

puede concluir que la distribución de ingreso del color rojo es más baja y desigual que

en el caso del color verde, constatándose de nuevo, la polarización entre norte y sur. 2

2 Es necesario remarcar que un umbral de pobreza más bajo en relación al umbral de referencia, en este caso el

español, no necesariamente conlleva a mayores porcentajes de pobreza. Del mismo modo, umbrales de pobreza más

altos que el nacional no deriva, en todos los casos, en porcentajes bajos de población pobre. Por ejemplo, en el caso

de la Comunidad Valenciana en la figura 2 obtiene un umbral similar al de Castilla y León, pero ésta última posee

menor porcentaje de población pobre que la Comunidad Valenciana. (Véase Figura 1)

61

Ilustración 2. Mapa de España según umbrales de pobreza


Umbral de pobreza bajo

Umbral de pobreza medio

Umbral de pobreza alto

4.3 Resultados HOMALS

La herramienta estadística multivariante no lineal HOMALS se utiliza con el objetivo de

buscar la asociación de categorías. En este caso en concreto se basa en obtener qué

categorías de las dimensiones que miden la exclusión social se relacionan con las de

pobreza relativa. Con la visualización de dichas asociaciones se puede obtener los

perfiles de las categorías de pobreza relativa respecto las categorías de las

dimensiones y poder observar que características poseen. Por ello, permite conocer

posibles grupos (clusters), con la característica de poseer homogeneidad en su interior

y heterogeneidad respecto al resto.

62

Por ello, cada grupo que forma la pobreza relativa aparecerán tan próximas como sea

posible al conjunto de categorías seleccionadas por los integrantes de cada grupo.

Todas ellas son cualitativas y categóricas, excepto pobreza relativa y carencia material

que han sido recodificadas en categorías con el objetivo de poder introducirlas en el

análisis.

Cada una de las variables representan las dimensiones a estudiar para la exclusión

social y, por tanto, se busca con este análisis observar qué categorías de las variables

(dimensiones) se relacionan con la variable de pobreza relativa. Con todo ello se

pretende conocer la relación existente entre las variables y observar cuáles

contribuyen a establecer patrones o perfiles de la población considerada, en este

estudio, como “no pobre”, “vulnerable” y “pobre”.

Mediante los resultados del modelo se puede conocer en qué momento del proceso de

iteración alcanzó la mínima diferencia entre iteraciones y el nivel de ajuste del modelo

para llegar a la solución última, lo cual ocurrió en la iteración 32, pues el incremento de

varianza explicada dejó de ser significativo.

Tabla 14. Resumen del modelo Análisis de la Homogeneidad


En el presente modelo de ACM se va a trabajar en base a dos dimensiones siendo

más importante en el modelo la dimensión 1 con un autovalor de 2,547 que la

dimensión 2 con un autovalor de 1,951. Por tanto, la dimensión 1 al poseer un mayor

autovalor contiene una mayor proporción de información del modelo que la dimensión

2. En cuanto a la inercia, proporción de la varianza explicada por cada dimensión, se

ha obtenido globalmente un 56,2%. Esto significa que un 56,2% de la variabilidad de

los datos es explicada por las variables incluidas en el modelo, mientras que el 31,8%

de la variabilidad de los datos queda explicada por la dimensión 1 y el 24,4% por la

dimensión 2. (Véase tabla 14)

63

A continuación se va a aludir al coeficiente Alfa de Cronbach, el cual mide la fiabilidad

de la escala de medida y está basado en los autovalores promedio. Éste oscila entre el

0 y el 1, de manera que cuanto más se aproxime a 1 mayor será la fiabilidad. En el

presente modelo se ha obtenido un Alfa de Cronbach de 0,635, el cual muestra una

fiabilidad intermedia.

En cuanto a las coordenadas de cada categoría de cada una de las variables para

ambas dimensiones (Véase tabla 15) se podrá conocer la posición de las categorías

en los ejes X (dimensión 1) e Y (dimensión 2). Además de conocer la relación con los

ejes también se puede sustraer información sobre la asociación de las categorías en

relación a las dimensiones según los valores que se proporcionen en las dimensiones.

Una relación fuerte será aquella en la que las categorías se encuentren alejadas del

origen, mientras que si su posición se encuentra cerca del origen no existirá dicha

asociación o ésta será muy débil.

En cuanto a la variable “Carencia material” se observa que las tres categorías (No

carencia, carencia intermedia y carencia) posibles están posicionadas en la dimensión

1, es decir, en el eje X.

En el caso de esta variable, la categorías que mayor relación poseen con su eje

correspondiente es “Carencia” por poseer una puntuación más elevada respecto a las

categorías restantes., luego “No carencia” y, por último, “Carencia intermedia”. Que las

tres categorías de la variable “Carencia material” estén posicionadas en la dimensión

quiere decir que, en el gráfico que con posterioridad se comentará, se encontraran en

torno a dicha dimensión, aunque en el caso de “Carencia” con mayor distancia

respecto al origen por poseer más asociación.

En la variable de las condiciones de la vivienda se observa que, de nuevo, todas las

categorías se posicionan en la dimensión 1, pero las más asociadas a ésta son: Muy

malas (-2,652) y malas (-1,600), mientras que muy buenas (0,123) y buenas (-0,651)

no están tan asociadas.

Las categorías que miden las condiciones del entorno también se posicionan alrededor

de la dimensión 1, pero es la categoría de “malas condiciones del entorno” la que

posee más asociación con ésta. Sin embargo, la categoría de “buenas condiciones del

entorno”, en el mapa dimensional se podrá ver más cercana al origen debido a su

escasa asociación.

64

En cuanto a las categorías de la variable nivel de estudios, aquellas que presentan

mayor relación con la dimensión 1 son: Menos que primaria, primaria y educación

superior, mientras que el resto de categorías guardan mayor relación con la dimensión

2.

En el caso de las categorías de pobreza relativa, las categorías posicionadas en la

dimensión 1 son: “No pobres” (mayor asociación con la dimensión) y “vulnerables” y,

por el contrario, la categoría “pobres” está posicionada en la dimensión 2.

Las categorías de la variable que mide el estado de salud están todas posicionadas en

la dimensión 1 siendo la variable “regular estado de salud” y “mal estado de salud”

aquellas que guardan mayor relación con dicha dimensión.

En la variable sobre la situación laboral se encuentran varias categorías asociadas a la

dimensión 1: Asalariado, trabajador por cuenta propia, incapacitado, labores del hogar

y otras inactividades, mientras que posicionadas y muy asociadas con la dimensión 2

se encuentran: Parado, estudiante y jubilado. De las categorías posicionadas entorno

a la dimensión 1 son: Incapacitados y otras inactividades, mientras que las de la

dimensión 2.

Por último, la variable que categoriza los tipos de contratos laborales se posiciona y

ambas categorías poseen asociación con la dimensión 2.

65

Tabla 15. Cuantificaciones dimensiones de la exclusión social y pobreza

Fuente: Elaboración propia a partir de los datos de la ECV.

66

Con la ayuda de la siguiente tabla (véase tabla 16) se puede conocer qué variables

poseen mayores valores de discriminación en cada dimensión.

Tabla 16. Medidas de discriminación


Dicha tabla confirma que, en su gran mayoría, todas las variables están más

relacionadas con la dimensión 1, aunque alguna de ellas con mayor valor en dicha

dimensión, como es el caso de “carencia material” y “nivel de estudios” (0,568 y 0,544,

respectivamente), mientras que otras variables, a pesar de estar más relacionadas con

la dimensión 1 su valor discriminante es menor. En este segundo caso se puede aludir

a “condiciones del entorno” con un 0,021. Mientras que la variable “tipo de contrato”

está más relacionada con la dimensión 2 con un valor de 0,256.

Además, se puede decir que hay una variable que se relaciona con ambas

dimensiones por la obtención de un valor elevado en la media de ambas dimensiones

para una variable. Esto puede aplicarse a la variable “situación laboral”, cuya media es

de 0,599. Si bien, en este caso, a pesar de relacionarse con ambas dimensiones lo

hace en mayor medida con la segunda dimensión (0,737), frente a la dimensión 1 con

un valor de 0,461.

Como puede apreciarse, la variable que menor relación posee con ambas

dimensiones es “entorno” con 0,021 para la primera dimensión y 0,011 para la

segunda. En base a estos resultados con mucha probabilidad esta variable se

encontrará muy cerca del origen sin capacidad de discriminar, tal y como puede

apreciarse en el Gráfico 9. Además de la variable “entorno”, también posee poca,

67

ligeramente mayor que la variable anterior, capacidad de discriminar la variable

“condiciones de la vivienda”.

Gráfico 9. Medidas de discriminación análisis I HOMALS


Por último se comentará el gráfico de categorías conjuntas obtenido tras la ejecución

del modelo de ACM. (Véase gráfico 10)

Se aprecia que la primera dimensión (eje X) está caracterizada por la variable que

mide el nivel de estudios y la situación laboral, mientras que el eje Y por las variables

que miden las condiciones de la vivienda y la carencia material.

Si se analiza el gráfico a partir de la línea que parte del origen del eje X divide el

gráfico en dos zonas, la zona izquierda y la derecha, observándose como la parte

izquierda queda constituida por las categorías que indican peores condiciones en

varias de las dimensiones, mientras que la parte derecha agrupa a las categorías que,

en su conjunto, hacen que los individuos gocen de una vida cohesionada socialmente.

Sin embargo, si ahora se analiza las regiones resultantes de la partición del gráfico por

la línea que parte del origen del eje Y no se observa un patrón concreto.

68

Dicho esto, se va a llevar a cabo un comentario más exhaustivo que se realizará

mediante la descripción de las categorías más cercanas y por cada uno de los cuatro

cuadrantes del diagrama.

Así pues, el cuadrante 1 está caracterizado por la asociación de las categorías

“vulnerables” con malas y muy malas condiciones de la vivienda, estado de salud malo

y regular, con estudios inferiores a primaria y primarios, jubilados, incapacitados y

otras inactividades.

En el cuadrante dos se puede observar la asociación entre “no pobres” con contrato

fijo, educación superior, situación laboral de asalariados, no se posee carencia

material, gozan de muy buenas condiciones de vida y de un buen entorno.

Gráfico 10. Categorías conjuntas. Pobreza y dimensiones de la exclusión social


69

En el cuadrante 3 muestra que las categorías asociadas son: Buen estado de salud,

trabajadores por cuenta propia, estudiantes, estudios de FPE y Bachillerato.

Por último, en el cuadrante 4 muestra asociaciones entre la categoría de pobres con

carencia y carencia material intermedia, condiciones malas del entorno, contrato

laboral temporal, estudios de secundaria y con buenas condiciones de la vivienda.

En este segundo análisis de la homogeneidad se busca la asociación entre las

categorías de las variables sociodemográficas y cómo éstas se relacionan con la

variable de pobreza relativa. Con todo ello se pretende conocer la relación existente

entre las variables y observar cuáles contribuyen a establecer patrones o perfiles de la

población considerada.

En este caso, el proceso iterativo se ha detenido en la iteración 28 dónde el

incremento de varianza explicada dejó de ser significativo.

Tabla 17. Resumen del II modelo HOMALS.

Fuente: Elaboración propia a partir de los datos de la ECV (2014)

De nuevo se va a trabajar en base a dos dimensiones siendo más importante en el

modelo la dimensión 1 con un autovalor de 2,284 que la dimensión 2 con un autovalor

de 1,988. Por tanto, la dimensión 1 al tener un mayor autovalor posee una mayor

proporción de información del modelo que la dimensión 2. En cuanto a la inercia,

proporción de la varianza explicada por cada dimensión, se ha obtenido globalmente

un 71,2%. Esto significa que un 71,2% de la variabilidad de los datos es explicada por

las variables incluidas en el modelo, mientras que el 38,1% de la variabilidad de los

datos queda explicada por la dimensión 1 y el 33,1% por la dimensión 2. (Véase tabla

17)

A continuación se va a aludir al coeficiente Alfa de Cronbach, el cual mide la fiabilidad

de la escala de medida y está basado en los autovalores promedio. Éste oscila entre el

70

0 y el 1, de manera que cuanto más se aproxime a 1 mayor será la fiabilidad. En el

presente modelo se ha obtenido un Alfa de Cronbach de 0,638, el cual muestra una

fiabilidad intermedia.

Al comentar las coordenadas de cada categoría de cada una de las variables para

ambas dimensiones (Véase tabla 18) se podrá conocer la posición de las categorías

en los ejes X (dimensión 1) e Y (dimensión 2). Además de conocer la relación con los

ejes también se puede sustraer información sobre la asociación de las categorías en

relación a las dimensiones según los valores que se proporcionen en las dimensiones.

71

Tabla 18. Cuantificaciones


En cuanto a la variable “sexo” se observa que las dos categorías están posicionadas

en la dimensión 1, es decir, en el eje X. Además ambas categorías poseen,

aproximadamente, el mismo grado de asociación con su dimensión.

En la variable de la edad se observa que las edades de 16 años hasta 35 (categorías

1 y 2) y de 56 hasta 66 y más (categorías 5 y 6) están posicionadas en la dimensión 1,

mientras que las categorías 3 y 4, las cuales aluden a edades adultas están

posicionadas en la dimensión 2.

72

Las categorías sobre el estado civil se posicionan todas en la dimensión 1 excepto

viudos y divorciados. Así como, las categorías de pobreza; no pobre y vulnerable

también se sitúan en la dimensión 1, mientras que pobres en la 2

La variable sobre el estado de salud muestra que todas sus categorías se posicionan

en la dimensión 1 siendo la que más asociada está respecto a ésta es el estado de

salud malo.

Por último, las categorías de la ocupación todas se sitúan en la dimensión 1 menos la

categoría 5 que alude a la ocupación de servicios y comercio. De este grupo de

categorías la más asociada es directores y gerentes y ocupaciones militares.

También se puede conocer qué variables poseen mayores valores de discriminación

en cada dimensión. Mediante la lectura de la tabla 19 y grafico 11.

Tabla 19. Medidas de discriminación de Pobreza y variables sociodemográficas


Las variables más relacionadas con la dimensión 1 son: Estado civil, pobreza relativa,

edad y renta. Aunque en el caso de estas dos últimas también se podría considerar

que estarían relacionadas con las dos dimensiones y discriminarían bien en ellas

porque poseen valores en la media elevados, 0,549 y 0,560 respectivamente.

Por el contrario, las variables relacionadas y que discriminan más en la dimensión 2

son: sexo y ocupación.

Además de los comentarios expresados, como puede apreciarse, la variable que

menor relación posee con ambas dimensiones es “sexo” con 0,019 para la primera

dimensión y 0,093 para la segunda.

73

Gráfico 11. Medidas de discriminación. Análisis II HOMALS


Por último se comentará el gráfico de categorías conjuntas obtenido tras la ejecución

del modelo de ACM. (Véase gráfico 12)

Se empezará el comentario analizando el gráfico a partir de la línea que parte del

origen del eje X divide el gráfico en dos zonas, la zona izquierda y la derecha,

observándose como la parte izquierda queda caracterizada por las categorías que

representan ocupaciones laborales con menor retribución económica que en la parte

derecha (ocupaciones elementales versus directores y gerentes y profesionales

científicos e intelectuales), soltero versus casado y jóvenes (de 16 años a 35 años) a

la izquierda y mayores (de 46 hasta mayores de 66) a la derecha.

Sin embargo, si ahora se analiza las regiones resultantes de la partición del gráfico por

la línea que parte del origen del eje Y se observa en la parte de arriba a las mujeres y

abajo a los hombres.

74

Ahora, como en el caso anterior, se va a analizar el gráfico mediante la descripción de

las categorías más cercanas y por cada uno de los cuatro cuadrantes del diagrama.

El cuadrante 1 está caracterizado por la asociación de las categorías “mujer” con

pobre y vulnerable, ocupaciones elementales y ocupaciones de comercio y servicios.

Las categorías presentan alta asociación, ya que la gran mayoría no presenta grandes

distancias entre sí.

En el cuadrante dos se integran categorías que no guardan excesiva asociación

debido a la distancia existente entre ellas. Las categorías que se sitúan en dicho

espacio son: Viudos, mayores de 66 años y agricultores y trabajadores de la

ganadería, silvicultura…

Gráfico 12. Categorías conjuntas. Sociodemográficas y pobreza


75

El cuadrante 3 muestra gran asociación entre las categorías de hombre, de 36 a 65

años, no pobre, casado, divorciado y con las categorías de ocupación de directores y

gerentes, ocupaciones militares y profesionales científicos e intelectuales.

Por último, el cuadrante 4 muestra asociaciones entre la categoría de soltero con las

edades de 16 a 35 años y con la ocupación profesional de personal de apoyo

administrativo.

Se finaliza la utilización de esta técnica con la aplicación de HOMALS a las categorías

de la exclusión social junto con el sexo para conocer si las asociaciones

proporcionadas son reseñables y para obtener una visión global de los dos

fenómenos.

En este caso, el proceso iterativo se ha detenido en la iteración 30, pues es en ésta

donde se ha alcanzado la convergencia. También se va a trabajar sobre 2

dimensiones siendo la más importante la primera, ya que su autovalor es 2,719 frente

a 1,743 de la segunda dimensión.

La inercia explicada globalmente alcanza el 49,6%, lo que significa que se explica en

ese porcentaje la variabilidad de los datos en este modelo. Si bien, el 30,2% de

variabilidad es explicada por la dimensión 1 y el 19,4% por la dimensión 2. (Ver tabla

20)

Tabla 20. Resumen del modelo III HOMALS


Como se puede apreciar, en este caso el coeficiente Alfa de Cronbach, es

mínimamente más pequeño que el de los anteriores modelos. Aun así, se puede

considerar como una medida de fiabilidad suficiente. (Véase tabla 20)

76

Tabla 21. Cuantificaciones


A continuación se va a elaborar un comentario conjunto y global para todas las

categorías según su posicionamiento en una dimensión u otra y su asociación con la

misma. (Véase tabla 21)

En la dimensión 1 se posicionan las categorías siguientes: No carencia, condiciones

malas de la vivienda, todas las categorías del estado de salud, asalariado, trabajador

por cuenta propia, incapacitado, labores del hogar y otras actividades. También se

posicionan en ella las dos categorías de las condiciones del entono, estudios inferiores

a primaria, primaria, FPE y educación superior. Por último, las dos categorías de

relaciones sociales.

77

De este conjunto de categorías las más asociadas a la dimensión 1 son: Condiciones

malas de la vivienda, estado de salud malo, incapacitados y estudios inferiores a los

primarios.

Por el contrario, las posicionadas en la dimensión 2 son: sexo, carencia intermedia y

carencia, las dos categorías sobre el contrato laboral, parado, estudiante, jubilado y

estudios secundarios y de bachillerato. En este caso las más asociadas son:

Estudiante y bachillerato.

Observando la tabla que proporciona las medidas discriminantes se aprecia que las

variables que mayor poder discriminante poseen en la dimensión 1 son: Carencia

material, condiciones del entorno, condiciones de la vivienda, estado de salud y

relaciones sociales. Por el contrario, las variables más discriminantes en la dimensión

2 son: Sexo y tipo de contrato. Además, se puede apreciar que hay dos variables que

discriminan en las dos dimensiones, las cuales poseen altos valores en la media, que

son: Situación laboral y nivel de estudios. (Véase tabla 22 y gráfico 13)

Tabla 22. Medidas de discriminación Sexo y dimensiones de la exclusión social


78

Gráfico 13. Medidas de discriminación análisis III HOMALS


Como en los anteriores casos se va a finalizar la descripción de los resultados de este

modelo HOMALS con el comentario del gráfico de categorías conjuntas. (Véase

gráfico 14)

Se empezará el comentario analizando el gráfico a partir de la línea que parte del

origen del eje X divide el gráfico en dos zonas, la zona izquierda y la derecha,

observándose como la parte izquierda queda caracterizada por las categorías que

representan situaciones de exclusión social, mientras que la parte derecha queda

asociada a todo tipo de categorías que representan una vida integrada.

El cuadrante 1 está caracterizado por la asociación de las categorías de: Incapacitado,

jubilado, mal y regular estado de salud, estudios primarios e inferiores a éste.

En el cuadrante dos se integran las categorías siguientes: Contrato fijo, educación

superior, asalariados, trabajadores por cuenta propia, hombre, no carencia y buenas


79

Gráfico 14. Categorías conjuntas. Sexo y dimensiones de exclusión social.


El cuadrante 3 es el que menor asociación guardan las categorías, pero está integrado

por buen estado de salud, estudios de FPE y bachillerato y estudiante.

Y, por último, el cuadrante 4 asocia las categorías de malas relaciones sociales, malas

condiciones de la vivienda, carencia total e intermedia, labores del hogar, otras

inactividades, parado, contrato temporal, condiciones del entorno malas y mujer.

80

4.4 Resultados HJ Biplot

Se realiza un HJ Biplot, con la ayuda del programa estadístico MULTBIPLOT (Vicente,

2015), para los datos de las diferentes dimensiones de la exclusión social,

previamente recodificadas para este análisis en 0 y 1 para lograr un sumatorio de las

mismas y poder observar el comportamiento de las Comunidades Autónomas.

Una vez obtenidos los totales de los sumatorios se han dividido por el número de

población de cada Comunidad para evitar distorsiones en los resultados.

Gráfico 15. HJ Biplot. Comunidades Autónomas y dimensiones de la exclusión social (ejes 1-2)

Fuente: Elaboración propia a partir del Software MULTBIPLOT

En el gráfico 15 se representa el plano definido por los dos primeros ejes (eje 1 y eje

2) con los que se consigue explicar el 77,8% de la variabilidad total original con una

calidad de representación de 400, tanto para las filas (Comunidades Autónomas) como

para las variables.

81

En primera instancia se observa que todas las variables quedan bien representadas y

que 15 de las 19 Comunidades Autónomas también. Las que no quedan bien

representadas son: (véase tabla 23) La Rioja, Islas Baleares, Castilla y León y

Cataluña.

Tabla 23.Calidad de representación HJ Biplot

Fuente: Elaboración propia a partir del Software MULTBIPLOT

Lo primero que se distingue es que la variable que menor variabilidad posee, debido a

que la longitud de su vector es el más pequeño, es la que mide las condiciones del

entorno, mientras que en el resto de los vectores tiene una longitud mayor y similar

entre sí. También se puede conocer la covariación entre las variables según los

ángulos que formen dichos vectores respecto al origen. La mayor covariación

encontrada se da entre las variables de condiciones de la vivienda y estado de salud.

Luego, entre condiciones de entorno y laboral y entre carencia material y relaciones

sociales debido a la formación de ángulos pequeños entre ellas. Sin embargo, se

encuentra un ángulo recto entre laboral y carencia material, lo que indica que estas

dos variables son independientes.

82

A grandes rasgos se podría decir que, las variables vivienda, relaciones sociales,

carencia y salud covarían más entre ellas en comparación con entorno y laboral.

En relación a los individuos, se pueden apreciar dos grupos. En la parte derecha

aquellas Comunidades Autónomas que se sitúan en la parte positiva, lo que se puede

traducir en que poseen presencia de buenas condiciones en todas las variables. Y, en

la parte izquierda, un grupo más numeroso de CC.AA. que se sitúan en la parte

negativa, lo cual implica la presencia de malas condiciones en las variables. Sobre

todo en el caso de las Islas Canarias que al proyectar los vectores, obtendrían peores

puntuaciones en la variable laboral y entorno, mientras que, siguiendo el mismo

procedimiento, Ceuta y Melilla se encuentran más gravemente afectadas en las

variables de carencia material y relaciones sociales.

Estos resultados relacionados con el previo conocimiento del porcentaje de pobres en

cada Comunidad se puede decir que aquellas con bajo y bajo-medio porcentaje de

pobres no poseen riesgo de exclusión social. Como por ejemplo, País Vasco, Navarra,

Aragón, Asturias y Madrid. Y por el contrario, aquellas con altos porcentajes de

población han presentado en los resultados condiciones malas en todas las

dimensiones, como es el caso de Andalucía, Extremadura, Murcia y Ceuta.

Sin embargo, se encuentran dos situaciones intermedias en las que, se posee un

porcentaje medio de población pobre y una propensión al riesgo de exclusión, como es

el caso de Galicia y Melilla. Y la situación de porcentaje medio de pobreza pero no

riesgo de exclusión como es el caso de Cantabria.

83

5. DISCUSIÓN

En este apartado se busca la discusión de los resultados obtenidos a lo largo del

trabajo con el fin de compararlos con la literatura.

En primera instancia, se ha realizado un Análisis Discriminante para obtener una

clasificación de los individuos a partir de unos grupos definidos con anterioridad. En

este caso los grupos propuestos fueron mantenidos según los resultados del

discriminante. No obstante, la elección de los grupos para el estudio de la pobreza se

realiza de acuerdo al criterio de la mediana de los ingresos por unidad de consumo. En

este caso se realizó dicho cálculo obteniendo diferentes grupos, pero en alguno de los

grupos que identificaban distintos grados de pobreza resultaron ser grupos muy

reducidos en individuos y muy parecidos en relación a las variables monetarias, por

ello, se prefirió la reelaboración de los grupos con los que luego se contó con la

aprobación de éstos por el modelo de AD.

En cuanto a la aplicación del algoritmo HOMALS existen referencias en temas

similares de su utilización. Aquí se ha llevado a cabo con el fin de comprobar si las

dimensiones o indicadores que se presentaron en el marco teórico ayudan a identificar

y detectar situaciones de riesgo de exclusión social y de pobreza, como también se

muestra en el estudio de Laparra, Zugasti y García. (Laparra, Zugasti, & García, 2014)

En este caso, las que más ayudaban han sido la carencia material, nivel de estudios y

situación laboral.

A la vista de los resultados se han obtenido unos perfiles, que mediante un conjunto

de características es posible caracterizarlo. Los perfiles obtenidos no distan

demasiado de los obtenidos en otros estudios.

El protagonismo que cobran las mujeres en la caracterización del grupo que alude a la

pobreza es clave ya que, tanto la pobreza como la exclusión social son fenómenos

que tienden a la feminización, tal y como puede verse en los resultados y en estudios

elaborados por la Fundación Tomillo o la Fundación Foessa, entre otros estudios.

(Valls & Belzunegui, 2014)

Por último, en cuanto a los resultados obtenidos para las Comunidades Autónomas, se

podría hablar de las diferencias entre el norte y el sur de España. Dónde el norte, con

alguna excepción presenta mejores condiciones en los análisis, mientras que el sur

presenta peores valores y condiciones en los resultados.

84

Estos resultados son concordantes con la gran mayoría de trabajos que realizan una

comparativa por regiones como pueden ser los Documentos de Trabajo de la

Fundación BBVA (Subirats, Gomà, & Brugué, 2005b)

85

6. CONCLUSIONES

1. La utilización del Análisis Discriminante ha servido, en el primer caso, para

corroborar la existencia de los grupos que se habían fijado previos al análisis.

Ya que se obtuvo que, efectivamente, las variables cuantitativas introducidas

en el modelo eran capaces de discriminar y de clasificar a los individuos de la

muestra en los grupos que se habían establecido (no pobre, vulnerable, pobre).

2. El segundo Análisis Discriminante arrojó la información de que las mismas

variables que en el análisis anterior, no eran capaces de discriminar a los

individuos en los grupos de CC.AA. según su porcentaje de pobreza. Se

predefinieron 5 grupos, donde los individuos del grupo 4 (porcentaje de

pobreza medio-alto) fueron clasificados, casi, íntegramente en el grupo 5

(porcentaje de pobreza alto). Por tanto, las Comunidades Autónomas de

Castilla- La Mancha, Islas Canarias y Comunidad Valenciana no presentan

diferencias, en términos de las variables cuantitativas, con Andalucía,

Extremadura, Murcia y Ceuta. La confirmación del Análisis discriminante sobre

la existencia de los grupos permite los posteriores análisis.

3. El Análisis de la Homogeneidad ha permitido caracterizar a la muestra y

conocer los perfiles de cada grupo en relación a la asociación de las categorías

de cada variable implicada en el análisis.

4. Los perfiles de los individuos se han observado con los resultados del Análisis

de la homogeneidad que, los individuos pobres con ingresos por unidad de

consumo por debajo del umbral están asociados al riesgo de exclusión social

debido a graves carencias materiales, donde se incluyen aquellos bienes

materiales básicos para el uso diario y necesarios en la sociedad actual, por

situaciones laborales precarias, como por ejemplo, estar en paro. Además,

aquellos que son pobres y trabajan poseen un contrato temporal, lo cual

implica inestabilidad laboral.

5. Los individuos vulnerables a pesar de poseer una situación económica por

encima del umbral de pobreza están asociados a situaciones de clara

desventaja impidiendo gozar de una vida cohesionada estando asociados a al

riesgo de exclusión social, como en el caso anterior. El perfil de este grupo

86

respecto a las dimensiones a las dimensiones de la exclusión social se basan

en niveles de estudios bajos y situaciones laborales ajenas al mercado laboral,

como por ejemplo, jubilados, labores del hogar o incapacitados. Y, además,

poseen malas condiciones de la vivienda por problemas de goteras o

humedades, entre otros.

6. El perfil de los individuos no pobres alude a diversas situaciones que permiten

gozar de una vida cohesionada. (Estabilidad laboral, nivel de estudios alto,

situación laboral inmersa en el mercado laboral y buenas condiciones, tanto de

salud, como de vivienda y entorno).

7. Las mujeres poseen más riesgo de pobreza y exclusión social que los hombres

según los resultados obtenidos. Pues se asociaba más a las categorías

negativas.

8. La utilización del HJ Biplot ha resultado ser una herramienta muy útil en la

comparación por Comunidades Autónomas en relación a las dimensiones

analizadas a lo largo de todo el trabajo.

9. El HJ Biplot confirma que también existe cierta polarización entre el norte y sur

de España en el riesgo de exclusión social, al igual que ocurre con el de

pobreza.

10. Asturias y Cantabria presentan mayor similaridad en cuanto al no riesgo de

exclusión social, mientras que País Vasco y Navarra presentan más

diferencias. País Vasco presenta mejores condiciones en el ámbito laboral y en

el entorno, mientras que Navarra no posee carencia material y buenas


11. Las Comunidades Autónomas en riesgo de exclusión social que mayor similitud

presentan son: Murcia, Andalucía, Extremadura, Valencia y Galicia. Si bien,

Galicia presenta menor riesgo de exclusión.

12. Ceuta, Melilla y las Islas Canarias presentan mayores riesgos de exclusión

social y pobreza.

13. El estudio de la pobreza y de la exclusión de manera conjunta ha contribuido a

la obtención de una imagen más amplia de la situación de los individuos.

87

14. Los resultados obtenidos enfatizan el dejar atrás el estudio de los fenómenos

clave desde la dualidad “pobreza - no pobreza” o “excluido- incluido”, lo cual

impide el acercamiento a grupos que no sean pobres, pero si excluidos y

viceversa.

88

7. BIBLIOGRAFÍA

Boira, S., Betés, L., Espeleta, N., Esteve, J., García, G., García, C., … Vilas, L. (2006).

Pobreza, precariedad y exclusion social en la ciudadania. Zaragoza: Cáritas

Española.

Recuperado el 20 /04/2016 de:

https://books.google.com/books?id=2271sgPDjLMC&pgis=1

Castel, R. (2004). Encuadre de la exclusión. En S. Karsz (Ed.), La exclusión social:

bordeando sus fronteras. Definiciones y matices (pp. 55-86). Barcelona: Gedisa.

Cea, M. Á. (2016). Análisis discriminante. Madrid: Centro de Investigaciones

Sociológicas.

Comisión Europea. (2011). La Plataforma Europea contra la Pobreza y la Exclusión

Social. Un marco europeo para la cohesión social y territorial. Luxenburgo.

Cuadras, C. (2014). Nuevos métodos de análisis multivariante. Barcelona: CMC.

Fernández, R. (2011). Exclusión social de mujeres presas: Análisis de necesidades y

su percepción del proceso de rehabilitación en el centro penitencirio de Villabona

(Tesis Doctoral). Universidad de Oviedo, Oviedo.

Recuperado el 01/05/2016 de:

http://digibuo.uniovi.es/dspace/bitstream/10651/12893/4/TD_Roxana Fernandez

Galan.pdf

Gabriel, K.R. (1971) The biplot graphic display of matrices with application to principal

component analysis. Biometrika 58(3), 454-467

Galindo, M. P. (1986). Una alternativa de representación simultánea: HJ Biplot.

Questiio, 10(1), 13–23.

García, Á. G., Marín, F. J. G., Laparra, M., Obrador, A., Eransus, B. P., Yruela, M. P.,

… Ubrich, T. (2008). La exclusión social en España: un espacio diverso y

disperso en intensa transformación. Informe Foessa.

89

Gifi, A. (1990). Nonlinear multivariate analysis. New York: John Wiley & Sons.

Gil, J. A. (2009). Metodología cuantitativa en educación. Madrid: UNED.

Instituto Nacional de Estadística. (2004). La pobreza y su medición. Madrid: Instituto

Nacional de Estadística (INE)

Recuperado el 23/04/2016 de: http://www.ine.es/welcome.shtml

Instituto Nacional de Estadística. (2013). Condiciones de Vida. Encuesta de

Condiciones de Vida. Metodología. Madrid: Instituto Nacional de Estadística (INE)

Instituto Nacional de Estadística. (2014). Clasificación Nacional de Educación 2014 (

CNED-2014 ). Madrid: Instituto Nacional de Estadísica (INE)

Instituto Nacional de Estadística. (2016). Informes Metodológicos Estandarizados.

Madrid: Instituto Nacional de Estadística(INE)

Recuperado el 05/06/2016

de:http://www.ine.es/dynt3/metadatos/es/RespuestaDatos.html?oe=30453

Laparra, M., Obradors, A., Pérez, B., Pérez Yruela, M., Renes, V., Sarasa, S., …

Trujillo, M. (2007). Una propuesta de consenso sobre el concepto de exclusión:

implicaciones metodológicas. Revista Española Del Tercer Sector, (5), 15–57.

Laparra, M., Zugasti, N., & García, I. (2014). Reflexiones metodológicas en el análisis

de la exclusión social. Madrid: Fundación Foessa

Larrañaga, O. (2007). La medición de la pobreza en dimensiones distintas al ingreso

(Estudios estadísticos y prospectivos No. 58). Santiago de Chile: CEPAL.

Lasso, F. J. (2003). Economías de escala en los hogares y la pobreza. Revista de

Economía Del Rosario, 6(1), 71–93.

Maciá, M. A., San Luis, C., Espinosa, M. Á., Ochaita, E., Lorenzo, M. J., García, R., …

Noreña, E. (2009). Pobreza y exclusión social de la infancia en España. Madrid:

Ministerio de sanidad y política social centro de publicaciones

90

Marco, M. (2000). Consideraciones en torno al concepto de exclusión social. Acciones

e Investigaciones Sociales, (11), 9–22.

Ortiz, J. C. (2015). El estado de la pobreza. European Antipoverty Network (Vol. 5).

Ottone, E., Sojo, A., Feres, J. C., Hopenhayn, Ma., León, A., Uthoff, A., … Vergara, C.

(2007). Cohesión social: inclusión y sentido de pertenencia en América Latina y el

Caribe, 144. Santiago de Chile: CEPAL

Pérez, M., García, M. I., Trujillo, M., & Espinosa, E. (2009). Condiciones de vida y

pobreza relativa de la población de Aragón. Zaragoza: Consejo Económico y

Social de Aragón.

Recuperado el 24/04/16 de: http://digital.csic.es/handle/10261/71878

Perona, N., & Rocchi, G. (2000). Vulnerabilidad y Exclusión social. Una propuesta

metodológica para el estudio de las condiciones de vida de los hogares. KAIROS,

(8).

Poza, C. (2008). Pobreza multidimensional: El caso específico español a través del

panel de hogares de la Unión Europea (Tesis Doctoral). Universidad Complutense

de Madrid, Madrid.

Ray, D. (2002). Economía del desarrollo. Barcelona: Antoni Bosch.

Raya, E. (2007). Exclusión social: Indicadores para su estudio y aplicación para el

trabajo social. Revista Del Ministerio deTrabajo y Asuntos Sociales, 70(16), 155–

172.

Subirats, J. (dir). (2004). Pobreza y exclusión social. Un análisis de la realidad

española y europea (Informe). Barcelona: La Caixa.

Subirats, J., Gomà, R., & Brugué, J. (2005). Análisis de los factores de exclusión social

(No. 4). Documentos de trabajo (Fundación BBVA). Recuperado de

http://www.fbbva.es/TLFU/dat/DT_2005_04.pdf

Subirats, J., Gomà, R., & Brugué, J. (2005). Riesgos de exclusión social en las

Comunidades Autónomas (No. 5). Documentos de trabajo (Fundación BBVA).

Recuperado de http://www.fbbva.es/TLFU/dat/DT_2005_05.pdf

91

Subirats, J., Obradors, A., García, P., & Canal, R. (2010). Ciudadanía e Inclusión

Social. Barcelona: Fundación Esplai.

Uriel, E., & Aldás, J. (2005). Análisis multivariante aplicado. Madrid: Thomson.

Valls, F., & Belzunegui, Á. (2014). La pobreza en España desde una perspectiva de

género. Madrid: Fundación Foessa

Vicente Villardón, J.L. (2015). MULTBIPLOT: A package for Multivariate Analysis using

Biplots. Departamento de Estadística. Universidad de

Salamanca. (http://biplot.usal.es/ClassicalBiplot/index.html)

Vidal, F. (2006). Exclusión social y Estado de bienestar en España. Barcelona: Icaria.

Date post:	19-Sep-2018
Category:	Documents
Upload:	dinhquynh
View:	214 times
Download:	0 times

ANÁLISIS MULTIVARIANTE DE LA POBREZA Y LA … · Tabla 5. Tabla de centroides AD pobreza ... Tabla...

Documents