Date post: | 24-Oct-2015 |
Category: |
Documents |
Upload: | edwin-johny-asnate-salazar |
View: | 11 times |
Download: | 0 times |
Herramientas adicionales
en STATA para el análisis de
datos espaciales
Raúl Ramos y Vicente Royuela
AQR-IREA, Universitat de Barcelona
3ª Reunión Española de Usuarios de STATA 2010
2
Estructura de la presentación
• STATA como herramienta para el análisis de datos
espaciales: procedimientos disponibles
• Desarrollos en curso:
• Matriz de pesos espaciales
• Sobre la introducción de retardos espaciales de las
variables explicativas en modelos de regresión
• Sobre la visualización de los resultados del análisis
exploratorio espacial
Análisis de datos espaciales
3
ssc install spmapssc install shp2dtassc install mif2dta
Análisis de datos espaciales
Herramientas disponibles
4
net install sg162.pkg
Análisis de datos espaciales
http://www.stata.com/products/stb/journals/stb60.pdf
5Análisis de datos espaciales
Columbus – Ohio
http://www.rri.wvu.edu/WebBook/LeSage/spatial/anselin.html
http://www.rri.wvu.edu/WebBook/LeSage/spatial/aford.html
• 49 vecindarios del distrito de Columbus en Ohio
(Estados Unidos)
• Información para 1980 sobre:
– Precio de la vivienda
– Ingresos familiares
– Robos por cada 1000 viviendas
6Análisis de datos espaciales
(43.299999,96.400002](33.5,43.299999](25.700001,33.5][17.9,25.700001]
(48.585487,68.892044](34.000835,48.585487](20.048504,34.000835][.178269,20.048504]
Precio de la vivienda Crimen
_cons 68.61896 4.233089 16.21 0.000 60.09819 77.13973 INC -1.597311 .4609711 -3.47 0.001 -2.525197 -.6694242 HOVAL -.2739315 .1625712 -1.68 0.099 -.6011702 .0533073 CRIME Coef. Std. Err. t P>|t| [95% Conf. Interval] Robust
Root MSE = 11.435 R-squared = 0.5524 Prob > F = 0.0000 F( 2, 46) = 45.47Linear regression Number of obs = 49
7
• En el análisis econométrico “estándar”, se supone que cada
una de las observaciones analizadas es independiente del
resto (hipótesis de no autocorrelación”).
• Autocorrelación espacial y/o retardos espaciales de
las variables explicativas: matriz de pesos espaciales.
• La matriz de pesos espaciales recoge la existencia de
relaciones entre los territorios analizados. Existen
diferentes especificaciones de dicha matriz.
Análisis de datos espaciales
La matriz de pesos espaciales
8
• Se han propuesto distintas especificaciones:
– Contigüidad (matriz de contactos binaria)
– Proximidad (matriz basada en distancias entre
centroides o entre capitales)
– Flujos (matriz basada en movimientos de personas,
mercancias, etc. – asimétrica)
– …
• Es importante analizar la robustez de los resultados a
distintas especificaciones de la matriz.
Análisis de datos espaciales
9
• Pero, los procedimientos existentes en STATA sólo permiten
trabajar con matrices binarias generadas manualmente
por el usuario o matrices basadas en distancias
(simétricas).
• En otros programas como GEODA-PYSAL, MATLAB o R es
posible generar y utilizar distintas matrices de
manera muy simple (a partir del propio mapa). Sin
embargo, estos programas no ofrecen la potencialidad de
STATA en otros aspectos.
Análisis de datos espaciales
10Análisis de datos espaciales
Geoda
11
• Hemos desarrollado procedimientos que permiten importar
matrices generadas desde estos programas, normalizarlas
y utilizarlas con spatreg (aunque sean asimétricas por
naturaleza como las obtenidas a partir del procedimiento K-
nearest neighbours-)
gal2dta gwt2dta sparse2dta normw
Análisis de datos espaciales
12
• La existencia de autocorrelación espacial en un modelo de
regresión puede indicar la omisión de variables relevantes
como retardos espaciales de alguna de las explicativas.
• Sin embargo, los procedimientos existentes en STATA no
permiten introducir de manera directa retardos de las
variables, por lo que hemos desarrollado un procedimiento
que permite hacerlo de manera muy sencilla.
slag
Análisis de datos espaciales
Retardos espaciales de las variables explicativas
13Análisis de datos espaciales
Visualización del análisis exploratorio de datos espaciales
Geoda
Stata
spatlsa2
Measures of local spatial autocorrelationWeights matrix--------------------------------------------------------------Name: W1Type: Imported (binary)Row-standardized: No--------------------------------------------------------------Moran's Ii (CRIME)------------------------------------------------------------- Location | Ii E(Ii) sd(Ii) z p-value*--------------------+----------------------------------------- 1 | 1.474 -0.042 1.381 1.097 0.136 2 | 1.586 -0.063 1.674 0.985 0.162 3 | 0.375 -0.083 1.912 0.240 0.405
14Análisis de datos espaciales
Matriz binaria decontactos normalizada
SWMImpo 0 0 0 0 0 0 0SWMImpo 0 0 0 0 0 0 0SWMImpo 0 0 0 0 0 0 0SWMImpo 0 0 0 0 .25 0 0SWMImpo 0 0 0 0 0 0 .16666667SWMImpo 0 0 0 0 0 0 .33333333SWMImpo 0 0 0 0 0 0 0SWMImpo 0 0 0 0 .25 0 0SWMImpo 0 0 0 0 0 0 0SWMImpo 0 0 0 0 .16666667 .16666667 0SWMImpo 0 0 0 .2 .2 0 .2SWMImpo 0 0 0 0 0 0 0SWMImpo 0 0 0 0 .5 0 0SWMImpo 0 0 .14285714 .14285714 0 .14285714 0SWMImpo 0 .25 .25 0 .25 0 0SWMImpo .25 .25 0 .25 .25 0 0SWMImpo .33333333 0 .33333333 .33333333 0 0 0SWMImpo 0 .5 .5 0 0 0 0 c1 c2 c3 c4 c5 c6 c7W[49,49]
12
3
15Análisis de datos espaciales
Acceptable range for lambda: -1.531 < lambda < 1.000
Lagrange multiplier test of lambda=0: chi2(1) = 5.815 (0.016)Likelihood ratio test of lambda=0: chi2(1) = 8.127 (0.004)Wald test of lambda=0: chi2(1) = 13.365 (0.000) lambda .5484742 .1500262 3.66 0.000 .2544282 .8425201 _cons 60.37518 5.798748 10.41 0.000 49.00985 71.74052 INC -.9610433 .3704535 -2.59 0.009 -1.687119 -.2349678 HOVAL -.3031982 .0927166 -3.27 0.001 -.4849194 -.121477CRIME CRIME Coef. Std. Err. z P>|z| [95% Conf. Interval]
Log likelihood = -183.31357 Sigma = 9.75 Squared corr. = 0.537 Variance ratio = 0.329Spatial error model Number of obs = 49
Row-standardized: SWMImpo Type: Name: WWeights matrix
Iteration 4: log likelihood = -183.31357 Iteration 3: log likelihood = -183.31357 Iteration 2: log likelihood = -183.31857 Iteration 1: log likelihood = -183.50365 Iteration 0: log likelihood = -187.42512 rescale eq: log likelihood = -187.42512rescale: log likelihood = -187.42512initial: log likelihood = -187.42512
. spatreg CRIME HOVAL INC, weights(W) eigenval(E) model(error)
16Análisis de datos espaciales
Acceptable range for lambda: -1.531 < lambda < 1.000
Lagrange multiplier test of lambda=0: chi2(1) = 5.600 (0.018)Likelihood ratio test of lambda=0: chi2(1) = 5.943 (0.015)Wald test of lambda=0: chi2(1) = 7.422 (0.006) lambda .4480536 .1644596 2.72 0.006 .1257187 .7703886 _cons 72.69648 9.01754 8.06 0.000 55.02242 90.37053 WHOVAL1 .0961597 .2040779 0.47 0.638 -.3038257 .4961451 WINC1 -1.041591 .5847625 -1.78 0.075 -2.187704 .1045227 INC -1.057194 .3242875 -3.26 0.001 -1.692786 -.4216026 HOVAL -.2774837 .0919551 -3.02 0.003 -.4577123 -.0972552CRIME CRIME Coef. Std. Err. z P>|z| [95% Conf. Interval]
Log likelihood = -181.74271 Sigma = 9.60 Squared corr. = 0.597 Variance ratio = 0.524Spatial error model Number of obs = 49
Row-standardized: SWMImpo Type: Name: WWeights matrix
Iteration 5: log likelihood = -181.74271 Iteration 4: log likelihood = -181.74271 Iteration 3: log likelihood = -181.74275 Iteration 2: log likelihood = -181.76435 Iteration 1: log likelihood = -183.1555 Iteration 0: log likelihood = -184.85114 rescale eq: log likelihood = -184.85114rescale: log likelihood = -184.85114initial: log likelihood = -184.85114
. spatreg CRIME HOVAL INC WINC WHOVAL, weights(W) eigenval(E) model(error)
17Análisis de datos espaciales
Matriz binaria decontactos de primery segundo ordennormalizada
SWMImpo 0 0 0 0 .05263158 .05263158 0SWMImpo 0 0 0 0 .04166667 .04166667 0SWMImpo 0 0 0 0 .05555556 0 0SWMImpo 0 0 0 0 0 0 0SWMImpo 0 0 0 0 .05263158 .05263158 0SWMImpo 0 0 0 0 0 0 0SWMImpo 0 0 0 0 .04761905 .04761905 0SWMImpo 0 0 0 0 0 0 .09090909SWMImpo 0 0 0 0 .07142857 0 .07142857SWMImpo 0 0 0 0 0 0 0SWMImpo 0 0 .04761905 .04761905 .04761905 .04761905 .04761905SWMImpo 0 0 .05 .05 .05 .05 0SWMImpo 0 0 0 0 .08333333 0 .08333333SWMImpo 0 0 0 .1 .1 0 .1SWMImpo 0 0 0 .07692308 .07692308 0 .07692308SWMImpo 0 0 .0625 .0625 .0625 .0625 .0625SWMImpo 0 0 0 0 .0625 .0625 0SWMImpo 0 0 .04166667 .04166667 .04166667 .04166667 0SWMImpo 0 .07692308 .07692308 .07692308 .07692308 .07692308 .07692308SWMImpo 0 0 0 .1 .1 0 0SWMImpo 0 0 .07692308 .07692308 .07692308 0 0SWMImpo .04761905 .04761905 .04761905 .04761905 0 .04761905 .04761905SWMImpo .07692308 .07692308 .07692308 0 .07692308 .07692308 .07692308SWMImpo .1 .1 0 .1 .1 .1 0SWMImpo .2 0 .2 .2 .2 0 0SWMImpo 0 .25 .25 .25 .25 0 0 c1 c2 c3 c4 c5 c6 c7W[49,49]
12
34
5
18Análisis de datos espaciales
Acceptable range for lambda: -3.301 < lambda < 1.000
Lagrange multiplier test of lambda=0: chi2(1) = 2.977 (0.084)Likelihood ratio test of lambda=0: chi2(1) = 3.645 (0.056)Wald test of lambda=0: chi2(1) = 6.030 (0.014) lambda .5759911 .2345679 2.46 0.014 .1162464 1.035736 _cons 61.58694 6.763022 9.11 0.000 48.33166 74.84222 INC -1.177725 .3796858 -3.10 0.002 -1.921896 -.4335548 HOVAL -.2840458 .0930066 -3.05 0.002 -.4663353 -.1017563CRIME CRIME Coef. Std. Err. z P>|z| [95% Conf. Interval]
Log likelihood = -185.55462 Sigma = 10.47 Squared corr. = 0.548 Variance ratio = 0.385Spatial error model Number of obs = 49
Row-standardized: SWMImpo Type: Name: WWeights matrix
Iteration 4: log likelihood = -185.55462 Iteration 3: log likelihood = -185.55462 Iteration 2: log likelihood = -185.55549 Iteration 1: log likelihood = -185.59347 Iteration 0: log likelihood = -187.42512 rescale eq: log likelihood = -187.42512rescale: log likelihood = -187.42512initial: log likelihood = -187.42512
. spatreg CRIME HOVAL INC, weights(W) eigenval(E) model(error)
19Análisis de datos espaciales
Acceptable range for lambda: -3.301 < lambda < 1.000
Lagrange multiplier test of lambda=0: chi2(1) = 1.484 (0.223)Likelihood ratio test of lambda=0: chi2(1) = 1.397 (0.237)Wald test of lambda=0: chi2(1) = 1.598 (0.206) lambda .366046 .2896015 1.26 0.206 -.2015626 .9336545 _cons 81.06832 13.16094 6.16 0.000 55.27335 106.8633 WHOVAL1 .0177241 .4586195 0.04 0.969 -.8811537 .9166019 WINC1 -1.343775 .915043 -1.47 0.142 -3.137226 .4496763 INC -1.135263 .3397802 -3.34 0.001 -1.80122 -.469306 HOVAL -.3052847 .096751 -3.16 0.002 -.4949132 -.1156562CRIME CRIME Coef. Std. Err. z P>|z| [95% Conf. Interval]
Log likelihood = -183.83993 Sigma = 10.24 Squared corr. = 0.601 Variance ratio = 0.562Spatial error model Number of obs = 49
Row-standardized: SWMImpo Type: Name: WWeights matrix
Iteration 4: log likelihood = -183.83993 Iteration 3: log likelihood = -183.83993 Iteration 2: log likelihood = -183.84089 Iteration 1: log likelihood = -183.93603 Iteration 0: log likelihood = -184.67541 rescale eq: log likelihood = -184.67541rescale: log likelihood = -184.67541initial: log likelihood = -184.67541
. spatreg CRIME HOVAL INC WINC WHOVAL, weights(W) eigenval(E) model(error)
20Análisis de datos espaciales
High-HighLow-HighLow-LowNon Significant
Columbus Ohio. Source: Geoda
LISA MAP. CRIME1%5%10%Non Significant
Columbus Ohio. Source: Geoda
LISA SIGNIFICANCE MAP. CRIME
21
• Los interesados en los procedimientos mencionados pueden
contactar con nosotros a través del correo electrónico en las
siguientes direcciones: [email protected], [email protected]
• Existen otros procedimientos de interés en este ámbito:
anketest, usswm, chinaspatdwm, spmlreg, …
• … y seguimos a la espera de la difusión de spmat, sarml y
g2sls de David Drukker http://repec.org/snasug08/drukker_spatial.pdf
Análisis de datos espaciales