Revista Ingenierías Universidad de Medellín
ISSN: 1692-3324
Universidad de Medellín
Colombia
Franco Arbeláez, Luis Ceferino; Zuluaga Díaz, Francisco Iván
Modelos de elección discreta para datos de panel, utilizables en el análisis de riesgo financiero
Revista Ingenierías Universidad de Medellín, vol. 4, núm. 7, julio-diciembre, 2005, pp. 69-81
Universidad de Medellín
Medellín, Colombia
Disponible en: http://www.redalyc.org/articulo.oa?id=75004706
Cómo citar el artículo
Número completo
Más información del artículo
Página de la revista en redalyc.org
Sistema de Información Científica
Red de Revistas Científicas de América Latina, el Caribe, España y Portugal
Proyecto académico sin fines de lucro, desarrollado bajo la iniciativa de acceso abierto
69
Universidad de Medellín
RESUMENRESUMENRESUMENRESUMENRESUMEN
En este artículo se hace una revisión formal de losprincipales modelos de elección discreta para datosde panel, mostrando sus ventajas y desventajas;el énfasis es hecho en modelos estáticos, aunquela problemática es extensible a modelos dinámicos,consideramos que este campo de la econometríatiene gran aplicabilidad en la modelación de riesgofinanciero, concretamente en las temáticas deriesgo de crédito y operacional.
PALABRAS CLAVEPALABRAS CLAVEPALABRAS CLAVEPALABRAS CLAVEPALABRAS CLAVE
Datos de Panel, Máxima Verosimilitud, ParámetroAccidental, Score Máximo, Perfil Modificado
Modelos de eleccióndiscreta para datos de panel,
utilizables en el análisisde riesgo financiero
LLLLLuis Ceferino Franco Arbeláezuis Ceferino Franco Arbeláezuis Ceferino Franco Arbeláezuis Ceferino Franco Arbeláezuis Ceferino Franco ArbeláezProfesor del Programa de Ingeniería Financiera de la Universidad de Medellín ([email protected])
Francisco Iván Zuluaga DíazFrancisco Iván Zuluaga DíazFrancisco Iván Zuluaga DíazFrancisco Iván Zuluaga DíazFrancisco Iván Zuluaga DíazProfesor del Programa de Ingeniería Financiera de la Universidad de Medellín ([email protected])
RECIBIDO: 05/08/2005ACEPTADO:30/09/2005
Modelos de elección discreta para datos de panel...
70
Revista Ingenierías
ABSTRACTABSTRACTABSTRACTABSTRACTABSTRACT
In this Paper becomes a formal revision of the mainmodels of discrete election for panel data, showingto its advantages and disadvantages; the emphasisis done in static models, although the problematicit applies a partly to dynamic models, weconsidered that this field of Econometric has greatapplicability in the modeling of financial risk,concretely in the thematic of risk operational andrisk credit.
KEY WORDSKEY WORDSKEY WORDSKEY WORDSKEY WORDS
Panel Data, Maximum likelihood, IncidentalParameter, Maximum Score, Modified Profile.
Franco & Zuluaga
71
Universidad de Medellín
1. IntroducciónPara el estudio de las propiedades estadísticas delos métodos de inferencia en econometría,generalmente se utilizan aproximacionesasintóticas TP. Si N (número de individuos) espequeño y T (número de períodos) es grande sepuede afirmar que se tienen N variables a explicar
, sobre las cuales se tienen
observaciones de series de tiempo. En este tipode situaciones las aproximaciones importantes sonpara N fijo y T . Ahora, en micro-paneles, lautilización de resultados asintóticos para Tno necesariamente proporcionará buenasaproximaciones a las distribuciones de losestimadores. Por eso generalmente se asume eneste tipo de modelación que N y T fijo. Asíse puede pensar que se tienen T variables aexplicar sobre las que se
tienen N observaciones de corte transversal.
En el estudio de las propiedades asintóticas paraestimadores de datos de panel dinámicos lineales,Arellano y Álvarez (2003) han demostrado que losestimadores de máxima verosimilitud coninformación limitada y el método generalizado delos momentos resultan ser consistentes
cuando para T fijo; mientras que el
estimador Intra-Grupo resulta no serlo. De igual
manera para el caso en el cual , donde C
es una constante positiva, los autores demuestranque cada uno de los estimadores anterioresexhiben sesgos asintóticos negativos.
En el campo de los estimadores para modelos nolineales, que es nuestro interés, el estudio secomplica más. Por ejemplo, la dificultad deencontrar estimadores consistentes a las tasa como en el caso del modelo estático probit deefectos fijos, y las dificultades se vuelven másserias para modelos dinámicos de elección
discreta, ya que en este tipo de modelos,elementos como la dependencia en el estado,regresores predeterminados y correlación serial sevuelven trascendentales. Por ejemplo, Heckman(1981) muestra que cuando se incluye una variabledependiente rezagada, el desempeño del estimadorde máxima verosimilitud para modelos probit esmuy deficiente. En este sentido hay mucho queestudiar en la construcción de argumentosasintóticos y en la aproximación de distribucionesmuestrales para los modelos de datos de panel nolineales.
2. EL MODELO TEÓRICOA continuación se hará una presentación formalde los modelos de elección discreta para datos depanel y las complicaciones que surgen de ellos. Elenfoque será para modelos estáticos pero laproblemática también es extensible a modelosdinámicos.
2.1 El modelo básicoEl modelo básico a considerar es el siguiente
Donde los son distribuidos independien-temente con función de distribución condicional
sobre de modo que
La función de Log-Verosimilitud de (1.1)suponiendo que los son condicionalmenteindependientes de estará dada por
(1.3)
(1.1)
(1.2)
Modelos de elección discreta para datos de panel...
72
Revista Ingenierías
Donde , ahora definiendo
(1.4)
Diferenciando (1.4) tenemos
De donde se desprende que
(1.5)
(1.6)
representa la función de densidadcorrespondiente a . (1.5) y (1.6) se conocencomo los scores, los cuales se denotarán como
y respectivamente.
En el caso del modelo logit, F es la función dedistribución logística
(1.7)
En este caso
Por lo tanto en esta situación
En este tipo de situación, para β dado, elestimador de máxima verosimilitud de ηi estarádado por
(1.8)
Donde resuelve
(1.9)
Y el estimador de Máxima Verosimilitud de β estarádado por
(1.10)
es conocida como la función deLog-Verosimilitud concentrada. La condición deprimer orden que permite encontrar (1.10) es
Por (1.9) esta expresión se transforma en
(1.11)
Franco & Zuluaga
73
Universidad de Medellín
La dificultad con (1.11) es que esta expresiónevaluada en β = β
0 no convergerá a cero en
probabilidad cuando para T fijo. Estefenómeno es conocido como el problema delparámetro accidental. Para entender un poco esteproblema considérese el siguiente ejemplo en elcual T = 2, f es simétrica, β es un escalar, y xit esuna dummy temporal tal que xi1= 0 y xi2=1.
Ahora, para el caso en el cual
tenemos que
Ahora tomando como base el modelo logit
(1.12)
Diferenciando (1.12) con respecto a η e igualandoa cero:
cuya solución se tiene con , lo que implica
que
Ahora para el caso en el cual
Diferenciando (1.13) con respecto a η e igualandoa cero:
Donde se tiene que y
Por último, para tenemos
Diferenciando (1.14) con respecto a η e igualandoa cero
De donde se tiene
(1.15)
(1.15) también es el valor que se obtiene
con . El desarrollo anterior tiene
como interpretación que la contribución de lasobservaciones (0,0) y (1,1) a la función de Log-Verosimilitud concentrada es cero, la observación
(0,1) contribuye con , y la
(1.13)
(1.14)
Modelos de elección discreta para datos de panel...
74
Revista Ingenierías
observación (1, 0) contribuye con
por lo tanto la función de Log-Verosimilitudconcentrada estará dada por
(Donde y
. Ahora diferenciando
(1.16) con respecto a e igualando a cero
Por lo tanto el estimador Máximo verosímil
de es
(1.17)
Denotando tenemos que
(1.18)
Ahora dado que
��
es la contraparte muestralde , por lotanto se tiene que
De donde
Donde G es la función de distribución
de , ahora obsérvese que
La cual no depende de η y por lotanto ( )� �
� β= Λ . Reemplazando esta expresiónen (1.19) se tiene
(1.21).
Por lo tanto, este estimador no es consistente.
2.2 Estimación por máxima verosimilitudcondicional
El objetivo de este método es usar la función de
verosimilitud condicionada sobre un estadístico
suficiente para ηi, para hacer inferencias acerca
de β0. Según Hsiao (2003) la idea de usar el modelo
logit es basarse en el hecho de que es un
estadístico suficiente para �
η , con lo cual(1.19)
(1.16)
(1.20)
Franco & Zuluaga
75
Universidad de Medellín
(1.22)
Donde Bi es el conjunto de todas las sucesiones
de ceros y unos tales que = . Para el caso
en el cual T = 2 y según (1.20) tenemos
(1.23)
Basándonos en (1.4), (1.20), y (1.23) la función deLog-Verosimilitud condicionada sobre estará dada por
(1.24)
Diferenciando (1.24) tenemos
De donde se tiene el siguiente score
(1.25)
2.3 Estimación por Score máximoEl procedimiento anterior descansa sobre elsupuesto de la distribución logística para los
errores. Manski (1987) propone un método
alternativo en el cual el supuesto requerido es que
. Este supuesto
impone estacionariedad, pero permite correlación
serial y heterocedasticidad en el corte transversal;
las implicaciones de este supuesto son las
siguientes, para el caso en cual T = 2:
(1.26)
La prueba de (1.26) parte del hecho de que paratodo � se tiene que
porlo cual
(1.27)
Donde , ahora de (1.27) y del
supuesto de estacionariedad, se desprende que
(1.28)
De donde se desprende inmediatamente (1.26).Reescribiendo (1.26) en términos de primerasdiferencias se tiene la siguiente representaciónequivalente:
Modelos de elección discreta para datos de panel...
76
Revista Ingenierías
(1.29)
Como anota Manski (1987) el supuesto deestacionariedad permite identificar a como unmodelo de regresión de mediana sobre datos desección cruzada, lo que hace natural que elproblema de datos de panel tenga unainterpretación de regresión de mediana.
Ahora, dado que , la diferencia será igual a 1 ó -1; de modo que la mediana será1 o -1 dependiendo de cuando
por tanto
(1.30)
Donde sgn es la función signo definida como
Es decir sgn (u) = 1 si u > 0, sgn (u) = 0 si u = 0,y sgn (u) = -1 si u < 0. Ahora por (1.29) tenemosque
Es decir
Manski prueba que el vector de coeficientes
estandarizado está identificado.
El problema con (1.32) es que no se puede utilizar
para definir un estimador GMM, ya que la funciónsigno no es invertible. Manski propone estimar β0
seleccionando el valor que haga coincidir el signode con el de para tantas observacionescomo sea posible en la submuestra. El estimadorpropuesto es el del score máximo que maximiza lasiguiente función criterio
Donde el espacio de parámetros B está dado por
(1.34)
Ahora SN (β) tendrá varios máximos locales, lo
que implicará que la elección de los valores iniciales
de los parámetros es fundamental. Un problema
con este estimador es que no es asintóticamente
normal a la tasa de convergencia , lo cual no
hace posible realizar pruebas de hipótesis
asintóticas en la forma habitual. La función dada
por (1.33) da el número de éxitos menos el número
de fracasos.
Una forma alternativa de la función score es
(1.35)
Nótese que el score es el número de prediccionescorrectas que se pueden hacer si predecimos que
cuando .
2.4 Función de verosimilitud de perfilmodificado
(1.31)
(1.32)
(1.33)
Franco & Zuluaga
77
Universidad de Medellín
Este método fue desarrollado por Cox y Reid (1987)y ampliado por Lancaster (1997-2000). En él seconsidera el problema de hacer inferencia acercade los parámetros de interés cuando no se tieneconocimiento acerca de ηi. Este tipo de inferenciase puede realizar introduciendo información deortogonalidad; tal información requiere que enpromedio las derivadas cruzadas sean cero. Debidoa que esta condición no ocurre generalmente enlos modelos de elección discreta, se hace necesario
introducir una reparametrización de (β, ηi) a
(β, λ i) de tal manera que β y λ i sean
ortogonales en información. Por tanto
ηi =η (β, λi) es elegida tal que
(1.36)
Donde es la función de Log-Verosimilitudreparametrizada satisfaciendo
Diferenciando (1.36)
Por tanto
(1.38)
De (1.38) se desprende que
(1.39)
Ahora, dado que , la
matriz de información esperada nos queda así
(1.40)
Por último, reemplazando (1.37) en (1.40) nosqueda que η(β, λi) debe satisfacer la ecuacióndiferencial parcial
(1.41)
La solución de (1.41) determina la dependenciade ηi sobre β. El efecto fijo ortogonalizado λi
puede ser introducido como la constante deintegración arbitraria, pero teniendo presente queno existe un único efecto fijo ortogonalizado, yaque cualquier función de tal efecto es tambiénortogonal a los parámetros comunes.
Ahora de (1.6) tenemos que
y por lo tanto
(1.42)
Y de (1.5)
(1.43)
(1.37)
Modelos de elección discreta para datos de panel...
78
Revista Ingenierías
Dado que (1.42) es diferente de cero, se hace necesariauna reparametrización ortogonal de ηi que satisfaga(1.41) así
La reparametrización de Lancaster (2000) se puede
obtener a partir del siguiente calculo, sea
, por lo cual
(1.45)
Y teniendo presente que
Ahora de (1.45) y (1.46) se desprende que
(1.47)
Donde resolviendo (1.47) obtenemos lareparametrización ortogonal
En un resultado anterior ya habíamos obtenidoque en el caso de la distribución logística
Con lo cual h(r) = fit, que coincide con la funciónde densidad logística de modo que el efectoortogonal en el caso del modelo logit es
(1.49)
2.5 Función de verosimilitud concentradamodificadaCox y Reid (1987) proponen hacer inferenciaacerca de β sobre la función de verosimilitudcondicional basados en el estimativo de máximaverosimilitud de λi, tomando β como conocido.En este caso, cuando existe un estadísticosuficiente para λi es posible definir la función deverosimilitud condicional sobre este estadístico. Loque sucede en general es que la distribucióncondicional exacta es difícil de identificar. Cox yReid (1987) proponen una fórmula aproximadapara la función de verosimilitud condicional dadapor
Donde , por lo tanto la función
de Log-Verosimilitud Concentrada Modificada
(1.44)
(1.46)
(1.48)
(1.50)
Franco & Zuluaga
79
Universidad de Medellín
puede ser escrita como
Donde es el logaritmo de (1.50).
El primer término del lado derecho de es
la función de Log-Verosimiltud concentrada cuyo
máximo provee el estimativo de máxima
verosimilitud de β. El segundo término modifica
la función de Log-Verosimilitud concentrada y su
papel es penalizar los valores de β para los cuales
la información acerca de los efectos es
relativamente grande. El score modificado estará
dado por
(1.52)
Tal como demuestran Cox y Reid (1991), una
ventaja de usar es que, mientras la
diferencia entre el score con λi conocido y el score
concentrado es en general de orden Op(1), con el
score concentrado modificado es de orden
.
Siguiendo a Cox y Reid (1987), el término
puede ser calculado como el producto de la
información de Fisher en la parametrización
(β,η i) y el cuadrado del Jacobiano de la
transformación de (β,ηi) a (β,ηi) , de (1.36)
tenemos
El término se hace cero en . Por lo
tanto de (1.53) tenemos
(1.54)
De esta manera, puede ser escrita como
(1.55)
Ahora de (1.41) tenemos
Y en virtud de (1.46)
(1.51)
(1.53)
(1.56)
(1.57)
Modelos de elección discreta para datos de panel...
80
Revista Ingenierías
2.6 Función de verosimilitud concentradamodificada para elección discretaLos desarrollos anteriores nos permitirán encontrarla función de Log-verosimilitud ConcentradaModificada para el modelo logia. Remplazando(1.47) en (1.54) tenemos
(1.58)
Y de (1.5)
(1.59)
Ahora de (1.7) y (1.49) se desprende que
(1.60)
El cual no depende de β y por tanto se convierteen un estadístico suficiente para el efecto fijo. Ahoraobsérvese que para el modelo logit
Y por tanto la función de Log-VerosimilitudConcentrada Modificada para el modelo logit es
(1.61)
3. CONCLUSIONESLa presentación formal realizada en este artículo,muestra las complicaciones que surgen en eltratamiento de los modelos de elección discretapara datos de panel y sus posibles soluciones. Estees un campo promisorio en la modelacióncuantitativa del riesgo financiero.
� ÁLVAREZ, J. y M. ARELLANO., �The Time Series and Cross-Section Asymptotics of Dynamic Panel DataEstimators�, Econometrica, 2003,71,1121-1159,2003
� AMEMIYA, T., Advanced Econometrics, Harvard University Press,Cambridge, 1985.
� ARELLANO, M., �Discrete choices with Panel Data�,Investigaciones Económicas XXVII(3),423-458,2003
� ARELLANO, M y B. Honore.,�Panel Data Models: Some Recent Developments�, in Heckman,J.J. and E.Leamer(eds.),Handbook of Econometrics,vol 5,chapter 53,North-Holland, 2001.
� COX, D. R. and N. Reid �Parameter ortogonality and approximate conditional inference�, Journal of theRoyal Statistical Society, Series B, 1-39, 1987.
� CHAMBERLAIN, G. �Analysis of covariance with qualitative data�, Review of Economic Studies 47, 225-238, 1980.
BIBLIOGRAFIABIBLIOGRAFIABIBLIOGRAFIABIBLIOGRAFIABIBLIOGRAFIA
Franco & Zuluaga
81
Universidad de Medellín
� CHAMBERLAIN, G. �Panel Data�, in 2, Griliches and M.D. Intriligator (eds), Handbook of Econometrics,vol. 2, El sevier Science, Amsterdam, 1984.
� HECKMAN, J. J., �The incidental parameters problem and the problem of initial conditions in estimation adiscrete time-discrete data stochastic process�. In: Manski,C.f.
� MCFADDEN, D.(Eds), Structural Analysis of Discrete Data with Econometric Applications. MITPress,Cambridge Mass,1981
� HSIAO, C., Analysis of Panel Data, Second Edition, Cambridge University Press, 2003.
� LANCASTER, T., �The Incidental Parameter Problem Since 1948�, Journal of Econometrics 95,391-413,2000.
� LANCASTER, T., �Orthogonal Parameters and Panel Data�, Review of Economic Studies 69,647-666,2002.
� MANSKI, C., �Semi parametric Analysis of Random Effect Linear Models from Binary Panel�, Econometrica55,357-362,1987.
Modelos de elección discreta para datos de panel...