1 Bondad de Ajuste, MRLC Y MCO BANCO CENTRAL DE RESERVA DEL PERÚ CURSO DE ACTUALIZACIÓN PARA...

Post on 16-Feb-2015

3 views 2 download

transcript

1

Bondad de Ajuste, MRLC Y MCO

BANCO CENTRAL DE RESERVA DEL PERÚBANCO CENTRAL DE RESERVA DEL PERÚCURSO DE ACTUALIZACIÓN PARA PROFESORESCURSO DE ACTUALIZACIÓN PARA PROFESORES

ECONOMETRÍAECONOMETRÍA

Profesora: Donita Rodríguez.

Agosto 2011

2

1. El MRLCK en Desviaciones Muestrales

2. Descomposición de la Suma de Cuadrados

3. El Coeficiente de Determinación o R2

4. Algunas observaciones sobre el R2

5. Otros criterios de Bondad de Ajuste

6. Aplicaciones

ESQUEMA

3

• El MRLK en desviaciones, para la “t-ésima” observación, está

dado por la siguiente expresión (minúsculas son desvíos):

• Dado que desaparece el término constante, este se obtiene

de:

• Para expresar matricialmente el modelo en desviaciones,

utilizamos la matriz de desvíos A:

iktkttt exxxy ˆˆˆ3322

kk XXXY ˆˆˆˆ33221

ii'IAnn

1

1. EL MRLCK EN DESVIACIONES MUESTRALES

4

• La matriz A es simétrica (A’=A), idempotente (AA=A), Ae=e y

Ai=0. Con A se obtiene el MRLK en desviaciones:

• Para obtener las ecuaciones normales en términos de

desviaciones, multiplicamos el modelo por X*’ y obtenemos:

eβXy

eβXy

AeβAXAy

ˆ

ˆ

ˆ

D

D

yXβXX '2

'**

ˆ)(

1. EL MRLCK EN DESVIACIONES MUESTRALES

eβXy

AX0y

Aeβ

XiAAy

2*

2

2

2

2

ˆ

ˆ

ˆ][

ˆ

ˆ][

1

1

5

Para el caso del modelo de 2 variables:

SCT = SCE + SCR.

donde:

SCT = Suma total de los cuadrados de las desviaciones de la variable Y.

SCE = Suma explicada de los cuadrados a partir de la regresión de Y

sobre X.

SCR = Suma residual o no explicada de los cuadrados a partir de la

regresión de Y sobre X.

n

ii

n

ii

n

ii eeYYYY

1

2

1

2

1

2 )()ˆˆ()(

2. DESCOMPOSICIÓN DE SUMA DE CUADRADOS.

n

ii

n

ii

n

ii eyy

1

2

1

2

1

2 ˆ

6

• Las expresiones alternativas –en términos de desviaciones- para

la descomposición son:

n

ii

n

ii

n

ii exy

1

2

1

22

1

2 ˆ

n

ii

n

iii

n

ii eyxy

1

2

11

2 ˆ

n

ii

n

ii

n

ii eyry

1

2

1

22

1

2

2. DESCOMPOSICIÓN DE SUMA DE CUADRADOS.

7

• Para el MRLCK, es posible debido a que X’e=0.

• Se parte de , y se obtiene:

• En términos de desviaciones:

SCRSCESCT

YnYn

ee'βXX''βyy' )ˆˆ( 22

eyy ˆ

SCRSCESCT ee'βXXβy'y ' )ˆˆ( 2

'*2

2. DESCOMPOSICIÓN DE SUMA DE CUADRADOS.

8

3. EL COEFICIENTE DE DETERMINACIÓN O R2

• El R2 centrado (alrededor de la media) se define como:

• En términos vectoriales:

– Se demuestra que:

– En el MRLC2:

2

1

1

2

1

2

1

2

2

)(11

)(

)ˆˆ(

n

iii

n

ii

n

iii

n

iii

YY

e

SCTSCR

YY

YY

SCTSCE

R

22 rR

2ˆ,

2

YYrR

Ayy'ee'

Ayy'βXXβ

Ayy'βAXX'β 2

'*

'2 1

ˆˆ)ˆ'ˆ(2

SCTSCE

R

9

• El R2 también se denomina coeficiente de determinación o

bondad de ajuste.

• Mide el porcentaje de la variación total observada de la

variable endógena explicada linealmente por la variación de

las variables independientes del modelo estimado.

• Esta interpretación es válida bajo las siguientes condiciones:

– El estimador analizado debe ser MCO.

– La relación tiene que ser lineal.

– La relación lineal estimada debe incluir intercepto.

3. EL COEFICIENTE DE DETERMINACIÓN O R2

10

Observaciones Importantes sobre el R2.

(1) Lo único que se puede afirmar a partir del valor del R2 es si el

grado de ajuste de los datos muestrales al modelo estimado

es bueno o malo.

(2) Solamente bajo el supuesto de que la muestra es

representativa de los valores poblacionales (verdaderos), un

buen (mal) ajuste de los datos al modelo será equivalente a

que la relación estimada entre las variables involucradas es

relevante (irrelevante).

4. ALGUNAS OBSERVACIONES SOBRE EL R2

11

(3) Si el modelo poblacional tiene intercepto y se estima sin

intercepto, SCE y SCR pueden crecer mucho:

El R2 puede tomar valores mayores que 1: R2 =

SCE/SCT.

El R2 puede tomar valores negativos:

R2=1-(SCR/SCT).

4. ALGUNAS OBSERVACIONES SOBRE EL R2

12

X

Y

ii XY ˆˆˆ

ii XY ˆˆ

4. ALGUNAS OBSERVACIONES SOBRE EL R2

13

(4) El R2 es sensible al rango de variación de las variables

independientes:

– Un mayor rango de variación generará mayor rango de

variación para la dependiente, afectando el R2.

– No tiene sentido comparar el R2 de dos muestras

diferentes: dos períodos diferentes o dos países.

– Tiene más sentido comparar estimados de varianza de la

perturbación de diferentes muestras.

4. ALGUNAS OBSERVACIONES SOBRE EL R2

14

(5) Los econometristas buscan obtener buenos estimados, lo cual

no depende del R2, sino de la metodología y los supuestos

del modelo probabilístico.

(6) Otras advertencias:

• No deben compararse los R2 de dos modelos con

diferentes variables dependientes.

• Las variables dummy pueden “inflar” el R2.

4. ALGUNAS OBSERVACIONES SOBRE EL R2

15

• El R2 no es adecuado para comparar la bondad de ajuste de

dos modelos (anidados) con distinto número de regresores.

• Sólo para comparar modelos (con la misma dependiente)

con igual número de regresores.

– Cuando se añade al modelo un regresor, la SCR o la

parte no explicada por el modelo nunca aumenta: se

mantiene igual o disminuye.

• Se necesitan criterios alternativos: R2 ajustado, AIC, SC

6. OTROS CRITERIOS DE BONDAD DE AJUSTE

16

El R2 Ajustado

• Se define como:

• Puede expresarse alternativamente como:

• Penaliza la inclusión de regresores adicionales.

• La bondad de ajuste de un modelo será mejor mientras

más alto sea el valor del R2 ajustado.

)1/(

)/(12

nSCT

knSCRR

)1()(

)1(1 22 R

kn

nR

)()(

)1(

)(

)1( 22 Rkn

n

kn

kR

6. OTROS CRITERIOS DE BONDAD DE AJUSTE

17

El Criterio de Schwarz (Swarchz Criterion o SC)

• El SC también penaliza el hecho de incluir regresores

adicionales, contrarrestándolo con el nivel de información que

esta variable incluye al modelo.

• Se define como:

• La bondad de ajuste de un modelo será mejor mientras más

bajo sea el valor del SC.

)ln('

ln nn

k

n

eeSC

6. OTROS CRITERIOS DE BONDAD DE AJUSTE

18

El Criterio de Información de Akaike (Akaike Information

Criterion o AIC).

• Es similar al SC. La única diferencia es en la manera de

penalizar la inclusión de regresores adicionales al modelo.

• Se define como:

• La bondad de ajuste de un modelo será mejor mientras más

bajo sea el valor del SC.

n

k

n

eeAIC

2'ln

6. OTROS CRITERIOS DE BONDAD DE AJUSTE

19

7. APLICACIONES

Dependent Variable: EARNINGSMethod: Least SquaresDate: 07/31/11 Time: 23:27Sample: 1 540Included observations: 540

Variable Coefficient Std. Error t-Statistic Prob.  

C -19.79196 3.585928 -5.519341 0.0000S 2.870943 0.255034 11.25710 0.0000

R-squared 0.190639     Mean dependent var 19.93339

Adjusted R-squared 0.189135     S.D. dependent var 16.43569

S.E. of regression 14.80002     Akaike info criterion 8.230831

Sum squared resid 117843.8     Schwarz criterion 8.246725Log likelihood -2220.324     F-statistic 126.7222

Durbin-Watson stat 1.885753     Prob(F-statistic) 0.000000

20

7. APLICACIONES

Dependent Variable: EARNINGS

Method: Least Squares

Date: 07/31/11 Time: 23:27

Sample: 1 540

Included observations: 540

Variable Coefficient Std. Error t-Statistic Prob.  

C -12.57680 12.03502 -1.045017 0.2965

S 2.878874 0.255490 11.26805 0.0000

AGE -0.179826 0.286313 -0.628074 0.5302

R-squared 0.191233     Mean dependent var 19.93339

Adjusted R-squared 0.188221     S.D. dependent var 16.43569

S.E. of regression 14.80835     Akaike info criterion 8.233800

Sum squared resid 117757.3     Schwarz criterion 8.257642

Log likelihood -2220.126     F-statistic 63.48704

Durbin-Watson stat 1.883935     Prob(F-statistic) 0.000000

Age: edad

21

7. APLICACIONES

Dependent Variable: EARNINGS

Method: Least Squares

Date: 07/31/11 Time: 23:27

Sample: 1 540

Included observations: 540

Variable Coefficient Std. Error t-Statistic Prob.  

C -17.43225 4.024129 -4.331931 0.0000

S 2.788855 0.262711 10.61567 0.0000

SIBLINGS -0.391983 0.304064 -1.289144 0.1979

R-squared 0.193136     Mean dependent var 19.93339

Adjusted R-squared 0.190131     S.D. dependent var 16.43569

S.E. of regression 14.79092     Akaike info criterion 8.231444

Sum squared resid 117480.2     Schwarz criterion 8.255287

Log likelihood -2219.490     F-statistic 64.27001

Durbin-Watson stat 1.869203     Prob(F-statistic) 0.000000

Siblings: número de hermanos

22

• ¿Cuál de los dos modelos elegiría? ¿Por qué?

7. APLICACIONES

Modelo 1 Modelo 2 Modelo 3

R2 0.190639 0.191233 0.1931

R2 Ajustado 0.189135 0.188221 0.1901AIC 8.230831 8.2338 8.2314SC 8.246725 8.257642 8.2553

23

1. El MRLCK en Desviaciones Muestrales

2. Descomposición de la Suma de Cuadrados

3. El Coeficiente de Determinación o R2

4. Algunas observaciones sobre el R2

5. Otros criterios de Bondad de Ajuste

6. Aplicaciones

ESQUEMA