Date post: | 15-Jan-2016 |
Category: |
Documents |
Upload: | juan-alejandro-perez-contreras |
View: | 1 times |
Download: | 0 times |
INTRODUCCION1. ALGEBRA MATRICIAL, ESTADISTICA MATEMATICA Y
TEORIA ASINTÓTICA
2. EL MODELO CLÁSICO DE REGRESIÓN LINEAL SIMPLE
Notas de Clase Econometría I – Introducción
1. ALGEBRA MATRICIAL, ESTADISTICA MATEMATICA Y TEORIA ASINTÓTICA
1.1 CONCEPTOS BÁSICOS DE ALGEBRA MATRICIAL
DEFINICIONESDefinición 1 (Matriz)Una matriz es un ordenamiento rectangular de números en filas y columnas.
Específicamente, una matriz de dimensión es un conjunto de números
ordenados en m filas y n columnas. Se puede expresar una matriz como:
Definición 2 (Escalar)Un escalar es un número real. En términos de matrices un escalar es una
matriz 1 × 1.
Definición 3 (Vector Columna)Es una matriz que consta de m filas y 1 columna.
Definición 4 (Vector Fila)Es una matriz que consta de 1 fila y n columnas.
Definición 5 (Matriz Cuadrada)
Jhon Alexis Diaz Contreras 2
Notas de Clase Econometría I – Introducción
Es una matriz que consta que posee el mismo número de filas y columnas m
= n.
Definición 6 (Matriz Diagonal)Es una matriz cuadrada que tiene al menos un elemento diferente de cero
sobre la diagonal principal, siendo cero los valores restantes.
Definición 7 (Matriz Escalar)Es una matriz diagonal cuyos elementos diagonales son todos iguales.
Definición 8 (Matriz Identidad)Es una matriz diagonal cuyos elementos diagonales son todos 1.
Generalmente, la matriz identidad se denota como Im×n.
Definición 9 (Matriz Simétrica)Es una matriz cuadrada cuyos elementos por encima de la diagonal son
imagen de los elementos por debajo de la diagonal.
Definición 10 (Matrices y Vectores Nulos)
Jhon Alexis Diaz Contreras3
Notas de Clase Econometría I – Introducción
Son matrices y vectores cuyos elementos son cero.
CARACTERISTICAS DE LAS MATRICESDefinición 11 (Independencia Lineal)Una matriz tiene independencia lineal si ninguna fila y ninguna columna
dependen de otra fila u otra columna. La afirmación de que una matriz es
linealmente dependiente equivale a decir que una fila (columna) es una
transformación lineal de otra fila (columna).
Definición 12 (No Singular)Una matriz se dice No Singular si es cuadrada, tiene independencia lineal y
su determinante es diferente de cero.
Definición 13 (Rango)El rango de una matriz es el orden de la submatriz cuadrada más grande
cuyo determinante es diferente de cero.
La matriz A que es de orden 3 y cuyo determinante es cero, tiene una
submatriz B cuadrada de orden 2 con determinante -6. Por lo tanto el rango
de A es 2.
Definición 14 (Traza)La traza de una matriz es la suma de los elementos diagonales.
Tr (A) =
OPERACIONES CON MATRICES Transposición Definición 15 (La Matriz Transpuesta)
Jhon Alexis Diaz Contreras 4
Notas de Clase Econometría I – Introducción
Sea una matriz m × n. La transpuesta de A, denotada como es la
matriz n × m que se obtiene al intercambiar las filas y las columnas de A. Es
decir .
Suma de MatricesSea y . Si A y B son del mismo orden se define la suma de
matrices como:
A + B = C
donde es del mismo orden de A y B y se obtiene como . Si
la suma puede realizarse se dice que A y B son conformables con la suma.
Dado que A y B son del mismo orden son conformables con la suma; de ahí,
que A + B = C donde C es igual a:
Multiplicación por un escalarPara multiplicar una matriz por un escalar , se multiplica cada elemento de
la matriz por .
Si = 2 y , entonces
Multiplicación de Matrices
Jhon Alexis Diaz Contreras5
Notas de Clase Econometría I – Introducción
Sean y . Para poder efectuar la multiplicación el número de
columnas de A deben ser igual al número de filas de B. Entonces, el
producto AB es igual a una matriz que se define como:
Ejemplo 1:
Propiedades de la Multiplicación de Matrices:1. La multiplicación de Matrices no es conmutativa.
2.
3.
4.
5.
6.
7.
8.
9.
10.
Determinante de una MatrizPara cada matriz cuadrada A, existe un número conocido como
determinante que se denota como .
Jhon Alexis Diaz Contreras 6
Notas de Clase Econometría I – Introducción
Evaluación de un Determinante para una Matriz 2 × 2
Si entonces el determinante se calcula como
Ejemplo 2:
Evaluación de un Determinante para una Matriz 3 × 3
Si entonces el determinante se puede calcular utilizando el
Cálculo de Laplace (Matriz de Cofactores). Para realizar este calculo, se
procede de la siguiente manera:
Para cada fila i:
Para cada columna j:
Ejemplo 3:
Si el determinante puede calcularse como:
Si se utiliza la fila 1 Si se utiliza la
columna 1
Jhon Alexis Diaz Contreras7
Notas de Clase Econometría I – Introducción
Propiedades de los Determinantes1. Si todos los elementos de una fila o una columna son cero .
2. Si
3. El intercambio de dos filas o columnas cualquiera de una matriz A,
cambian el signo de .
4. Si cada elemento de una fila o de una columna de A se multiplica
por un escalar , entonces es multiplicado por .
5. Si dos filas o columnas de una matriz son idénticas, su
determinante es cero.
6. Si una fila o una columna de una matriz depende linealmente de
otra fila o columna =0.
7.
Inversa de una MatrizSi A es cuadrada y no singular ( ) su inversa puede encontrarse así:
Los pasos comprendidos en el cálculo son:
1. Encontrar .
2. Remplazar cada elemento de de A por su cofactor para obtener la
matriz de cofactores.
3. Transponer la matriz de cofactores para obtener la matriz adjunta de
A.
4. Dividir cada elemento de la matriz adjunta por .
Ejemplo 4:
Para su se calcula así:
Jhon Alexis Diaz Contreras 8
Notas de Clase Econometría I – Introducción
El determinante de A es:
Matriz de Cofactores:
Matriz Adjunta (Transpuesta de la Matriz de Cofactores):
Matriz Inversa
1.2 NOCIONES BÁSICAS DE ESTADÍSTICA MATEMÁTICA
VARIBALES ALEATORIAS Y DISTRIBUCIONES DE PROBABILIDADDefinición 1 (Variable Aleatoria)Una variable aleatoria es aquella que toma valores numéricos y que tiene un
resultado determinado por un experimento.
Al lanzar una moneda (experimento), el número de caras que aparecerán en,
por ejemplo 10 lanzamientos, es una variable aleatoria, por que antes de
realizarse el experimento no se sabe cuantas caras van a salir en los 10
Jhon Alexis Diaz Contreras9
Notas de Clase Econometría I – Introducción
lanzamientos. De ahora en adelante, notaremos a las variables aleatorias
con mayúsculas W, X, Y y Z y los resultados que toma la variable con sus
respectivas minúsculas w, x, y, y z. Las variables aleatorias pueden ser
discretas o continuas.
Definición 2 (Variable Aleatoria Discreta)Una variable aleatoria discreta es aquella que puede tomar un número de
valores finito o infinito contable. Donde infinito contable hace referencia a
que una variable puede tomar un infinito número de valores y es posible
hacer corresponder estos con números enteros positivos.
Por ejemplo, si se define a la variable aleatoria X como la suma de los
números que parecen en los dados, entonces X tomará uno de los siguientes
valores: 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 o 12.
Definición 3 (Variable Aleatoria Continua)Una variable aleatoria continua es aquella que puede tomar cualquier valor
dentro de un intervalo de valores.
Por ejemplo, la estatura de una persona es una variable aleatoria continua
por que para el rango comprendido entre 150.0 y 185.5 centímetros la
estatura puede tomar cualquier valor, dependiendo de la precisión de la
medición.
Definición 4 (Función de Densidad de Probabilidad de una VAD)Sea X una variable aleatoria discreta que toma valores diferentes x1, x2,… xn.
Entonces, la función
Se denomina la función de densidad de probabilidad discreta (FDP) de
X. donde la P(X=xi) significa la probabilidad de que la va discreta X tome el
valor de xi.
Ejemplo 1:
Jhon Alexis Diaz Contreras 10
Notas de Clase Econometría I – Introducción
La variable aleatoria discreta X (la suma de los números que aparecen en
dos dados) puede tomar uno de los siguientes resultados:
Definición 5 (Función de Densidad de Probabilidad de una VAC)Sea X una variable aleatoria continua. Entonces, se dice que es la FDP
de X si se satisfacen las siguientes condiciones:
Donde significa la probabilidad de que X se encuentre en el
intervalo a a b. Para una variable continua la probabilidad de que X tome un
valor específico es cero; la probabilidad para tal variable puede medirse
solamente sobre un rango o intervalo dado, tal como (a, b).
CARACTERISTICAS DE LAS DISTRIBUCIONES DE PROBABILIDADEs común describir una distribución de probabilidad de acuerdo a algunas
de sus características. Estas, pueden clasificarse en medidas de tendencia
central, medidas de variabilidad y medidas de asociación entre dos variables
aleatorias.
Medida de Tendencia Central: El Valor EsperadoSi X es una variable aleatoria, el valor esperado (o esperanza) de X, es un
promedio ponderado de todos los posibles valores de X. Las ponderaciones
están determinadas por la FDP de la variable.
Entonces, sea X es una variable aleatoria discreta, el valor esperado,
denotado como , se define de la siguiente manera.
Jhon Alexis Diaz Contreras11
Notas de Clase Econometría I – Introducción
Ejemplo 2:
Si se toman los datos del Ejemplo 1, el valor esperado de la suma de los
números que aparecen en el lanzamiento de dos dados, se calcula como
sigue:
Propiedades del Valor Esperado1. El valor esperado de una constante es la constante misma. Así, sí c
es una constante .
2. Si a y b son constantes el . Este resultado se
puede generalizar para N variables.
3. Si son constantes y son variables
aleatorias, entonces
. O bien, en
notación de sumatoria .
Medidas de Variabilidad (Varianza y Desviación Estándar)VarianzaSea X una variable aleatoria y sea . La distribución o dispersión de
los valores de X alrededor de su valor esperado puede ser medida por la
varianza, la cual se define como
En otras palabras la varianza indica la distancia esperada de X a su valor
esperado (media), ó cuanto se aleja X en promedio de µ.
Propiedades de la Varianza1. La varianza de una constante es cero.
Jhon Alexis Diaz Contreras 12
Notas de Clase Econometría I – Introducción
2. Si a y b son constantes, entonces .
Desviación Estándar La desviación estándar de una variable aleatoria, denotada por , es la raíz
cuadrada positiva de la varianza .
Propiedades de la Desviación Estándar1. La desviación estándar de una constante es cero.
2. Si a y b son constantes, entonces .
Medidas de AsociaciónCovarianzaSea y y consideremos la variable aleatoria .
Entonces la covarianza entre dos variables aleatorias X y Y se define como
el valor esperado del producto :
La covarianza también se denota por . Si >0, entonces, en promedio,
cuando X está sobre su media, Y también lo está. Si <0, entonces, en
promedio cuando X está sobre su media, Y está por debajo de la suya. Dado
que la covarianza mide al grado de dependencia lineal entre dos variables
aleatorias, una covarianza positiva indica que las dos variables van en la
misma dirección, en tanto que una covarianza negativa señala que lo hacen
en direcciones contrarias. Para calcular la covarianza se puede proceder
como sigue:
Propiedades de la Covarianza:1. Si X y Y son independientes, entonces la Cov(X, Y) = 0.
2. Para cualquier constantes a1, b1, a2 y b2.
3.
Jhon Alexis Diaz Contreras13
Notas de Clase Econometría I – Introducción
Coeficiente de CorrelaciónAl igual que la covarianza el coeficiente de correlación mide el grado de
asociación lineal entre dos variables. Sin embargo, a diferencia de la
covarianza, no depende de las unidades de medida. El coeficiente de
correlación entre X y Y se define como:
El coeficiente de correlación que se denota por siempre tiene el mismo
signo que la covarianza dado que las desviaciones estándar siempre son
positivas.
Propiedades del Coeficiente de Correlación1. Si la no hay una relación lineal entre
las variables. Si = 1 implica una relación lineal positiva y
perfecta; si la correlación es cercana a 1 indica un fuerte grado de
asociación lineal positiva. De la misma forma si = – 1
implica una relación lineal negativa perfecta; si la correlación es
cercana a – 1 indica un fuerte grado de asociación lineal negativa.
2. Para constantes a1, b1, a2 y b2 con a1 a2 > 0
. Sí a1 a2 < 0
.
ALGUNAS DISTRIBUCIONES DE PROBABILIDAD
La distribución Normal y las que se derivan de ella son las más empleadas
en estadística y econometría. A partir de estas distribuciones es que se
realiza la inferencia estadística en econometría.
Distribución NormalSe dice que una variable aleatoria esta normalmente distribuida si su FDP
tiene la forma:
Jhon Alexis Diaz Contreras 14
Notas de Clase Econometría I – Introducción
Propiedades de la Distribución Normal1. Es simétrica alrededor de su valor medio.
2. A una desviación estándar se encuentra el 68% de los datos, a dos
desviaciones estándar se encuentra el 95% y a tres desviaciones
estándar el 99.7% de los datos.
3. Dados los parámetros y se puede encontrar la probabilidad de
que x se encuentre dentro de cierto intervalo. Para esto, la variable
x normalmente distribuida con media y se convierte en una
variable Z normal estandarizada mediante:
Sí X ~ N(µ, σ2) entonces ahora X ~ N(0, 1).
4. Sí X1 ~ y X2 ~ entonces se tiene que
Y ~
Distribución (Ji – Cuadarado)Sean Z1, Z2,…, Zk variables normales estándar independientes, entonces
sigue la distribución con k grados de libertad.
Propiedades de la Distribución Ji- Cuadrado1. La media de es k y su varianza es 2k.
2. Si Z1 y Z2 son dos variables que se distribuyen con k1 y k2 grados
de libertad. Entonces Z1 + Z2 es también una variable con k1 + k2
grados de libertad.
3. La distribución es asimétrica y el grado de asimetría depende de
los grados de libertad.
Jhon Alexis Diaz Contreras15
Notas de Clase Econometría I – Introducción
Distribución t de StudentSi Z1 es una variable normal estandarizada y otra variable Z2 sigue la
distribución con k grados de libertad, entonces sigue una
distribución t de student con k grados de libertad.
Propiedades de la Distribución t de Student1. Es simétrica pero más plana que la distribución normal.
2. La media de la distribución t es cero y su varianza es
Distribución F de FischerSi Z1 y Z2 son variables distribuidas independientemente con k1 y k2
grados de libertad, entonces sigue la distribución F con k1 y k2
grados de libertad.
Propiedades de la Distribución F de Fischer1. Esta sesgada a la derecha, a medida que k1 y k2 aumentan se
acerca a una normal.
2. La media de una distribución F es y su varianza es
3. El cuadrado de una variable aleatoria con distribución t con k
grados de libertad es una distribución F con 1 y k grados de
libertad
INFERENCIA ESTADÍSTICAEstimación PuntualSe establece un estadístico que toma un valor numérico particular llamado
estimación. Por ejemplo, si queremos conocer la media de una población,
representada por , podemos tomar una muestra aleatoria de la población y
Jhon Alexis Diaz Contreras 16
Notas de Clase Econometría I – Introducción
estimar el parámetro poblacional por medio de un estimador muestral
llamado .
Estimación por IntervalosSe establece un rango de posibles valores dentro de los cuales se puede
encontrar el parámetro. Por ejemplo, si se supone que una variable está
distribuida normalmente la media muestral también está normalmente
distribuida; así, el verdadero valor de se encuentra dentro de un Intervalo
de Confianza de la forma
PUEBAS DE HIPÓTESISUna de las herramientas estadísticas más utilizadas en la econometría son
las Pruebas de Hipótesis. El problema de una prueba de hipótesis puede
plantearse así:
Supóngase que se tiene una variable aleatoria X con una FDP conocida
, donde es el parámetro de la distribución. Después de obtener una
muestra aleatoria de tamaño n, se obtiene el estimador puntual . Puesto
que el verdadero casi nunca se conoce, se plantea la pregunta: ¿Es el
estimador compatible con algún valor de bajo hipótesis, por ejemplo,
, donde es un valor numérico específico de ? En el lenguaje de las
pruebas de hipótesis, se denomina hipótesis nula y generalmente se
denota por . Esta hipótesis nula se contrasta con una hipótesis
alternativa denotada por , la cual, por ejemplo, puede plantear que .
Existen dos enfoques para abordar el problema de la prueba de hipótesis, el
del intervalo de confianza y el de la prueba de significancia. Se asume que
el estudiante está en capacidad de abordar y comprender por si solo el
Jhon Alexis Diaz Contreras17
Notas de Clase Econometría I – Introducción
enfoque del intervalo de confianza. Por ser el más usado en econometría se
presentará el enfoque de la prueba de significancia.
Hay que recordar que:
Para cualquier muestra dada se conocen los valores de y . Si se supone
que , entonces puede ser directamente calculado y se puede
utilizar la distribución normal para encontrar la probabilidad de obtener el
valor de calculado. Si esta probabilidad es baja, por ejemplo menor que
5%, se puede rechazar la hipótesis nula.
Específicamente, la decisión de rechazar o no rechazar una hipótesis nula
depende del nivel de significancia “ ” que se plantee. Si la probabilidad del
estadístico calculado es menor que se rechaza la hipótesis nula; por el
contrario si la probabilidad del estadístico calculado es mayor que no se
rechaza la hipótesis nula.
1.3 INTRODUCCION A LA TEORIA ASINTOTICAPara realizar análisis empírico con cierto rigor, se deben tener muestras
grandes. La teoría asintótica estudia el comportamiento de los estimadores
cuando la muestra es grande (tiende a infinito). De la teoría asintótica solo
estudiaremos la consistencia y la normalidad asintótica.
ConsistenciaSea un estimador de , basado en una muestra de tamaño n.
Entonces, es un estimador consistente de , si para cada
cuando
Jhon Alexis Diaz Contreras 18
Notas de Clase Econometría I – Introducción
Cuando es consistente, decimos también que es el límite de la
probabilidad de y se escribe como
A pesar de que no todo estimador pueda ser en principio consistente se
puede llegar a este resultado si se cumple lo siguiente: Si es un
estimador insesgado de y cuando , entonces .
Lo que permite estos resultados de consistencia es la Ley de los grandes
números.
Ley de Los Grandes Números Sea variables aleatorias independientes e idénticamente
distribuidas con media . Entonces, .
NormalidadLa consistencia y la ley de los grandes números nos dicen que la
distribución del estimador se colapsa alrededor del verdadero parámetro a
medida que aumenta el tamaño de la muestra, pero no nos dice nada acerca
de la forma de tal distribución. En econometría para que las pruebas de
hipótesis y los intervalos de confianza tengan validez necesitamos una forma
de aproximar esta distribución.
Sea una sucesión de variables aleatorias, tal que para toda z,
cuando ; entonces tiene una distribución normal
estándar asintótica. Este resultado es posible gracias al teorema del límite
central.
Teorema del Límite CentralSea una muestra aleatoria con media y varianza . Entonces,
tiene una distribución normal estándar asintótica. En otras
Jhon Alexis Diaz Contreras19
Notas de Clase Econometría I – Introducción
palabras la distribución completa de se acerca arbitrariamente a la
distribución normal estándar a medida que n crece.
2. EL MODELO CLÁSICO DE REGRESIÓN LINEAL SIMPLE
2.1 CONCEPTOS BÁSICOS
Análisis de Regresión PoblacionalEs la estimación de la media o valor promedio de la variable dependiente
con base en los valores conocidos o fijos de las variables independientes.
Para el caso de la regresión lineal simple, lo que interesa es “explicar y en
términos de x”. La notación que expresa este problema es:
Jhon Alexis Diaz Contreras 20
Notas de Clase Econometría I – Introducción
Función de Regresión Poblacional
Función de Regresión Lineal Poblacional FRLP
La linealidad de la función esta dada en los parámetros y las variables. A la
variable y se le conoce como variable dependiente, explicada, de respuesta
o regresando; y la variable x se llama variable independiente, explicativa,
control o regresor.
Especificación Estocástica de la FRLPSin embargo, la FRLP es una expresión determinística y el análisis de
regresión es esencialmente estocástico. Se considera así, ya que no es
posible, por diferentes motivos, encontrar todas las variables explicativas
que inciden directamente sobre la variable dependiente. De esta forma, la
especificación estocástica de la FRLP es:
La variable ui es el término de error ó de perturbación de la función y
representa todos aquellos factores que influyen sobre y aparte de x. El
término de error, puede ser generado por diferentes motivos:
No hay disponibilidad de la información: Usualmente, es característico
de los modelos econométricos requerir de información que en muchas
ocasiones no es fácil de encontrar. Por ejemplo, a veces se definen
variables para las cuales no existe información disponible; otras veces,
la información que se requiere para el modelo no es pública y llevar a
cabo encuestas para recolectar la información puede resultar costoso.
Variables centrales vs. Variables periféricas: Pueden ser numerosas
las variables explicativas que permiten determinar el comportamiento
de una variable endógena; sin embargo, por claridad en la expocisión
y explicación del problema, se recurre a aquellas variables que son
más relevantes.
Jhon Alexis Diaz Contreras21
Notas de Clase Econometría I – Introducción
Principio de Parsimonia: Un modelo debe conseguir el mayor grado de
explicación haciendo uso del menor número de variables posible
De la misma forma el término ui es esencial en la interpretación de una
FRLP. Si los factores de u se mantienen fijos tal que , x tiene un efecto
lineal sobre y:
Así, el cambio en y es multiplicado por el cambio en x. De aquí se obtiene
una conclusión fundamental en la economía aplicada: mide la relación
entre y y x si se mantienen fijos los otros factores medidos por u.
Ahora si suponemos que es lineal entonces se puede escribir que:
Si se toma el valor esperado de se obtiene que:
El anterior resultado nos dice que el valor promedio de u no depende de x y
esto implica además que . Estos resultados serán fundamentales a la
hora de estimar los valores muestrales de los parámetros.
2.2 ESTIMACIÓN POR EL MÉTODO DE MÍNIMOS CUADRADOS ORDINARIOSLo más importante en el análisis de regresión es la estimación de los
parámetros. Para esto se puede hacer uso del Método de Mínimos
Jhon Alexis Diaz Contreras 22
Notas de Clase Econometría I – Introducción
Cuadrados Ordinarios (MCO). Primero, necesitamos una muestra de la
población; por lo tanto la FRLM es:
Ahora utilicemos las conclusiones que se derivaron de la sección anterior,
en términos de la población con respecto al error. El y la
. De esta forma podemos escribir que:
En términos muestrales, para estimar y las ecuaciones anteriores se
puede expresar como:
Dado que por propiedades de la sumatoria tenemos que la
primera ecuación se puede escribir como . De lo anterior se
deduce que .
La segunda ecuación puede utilizarse para obtener el . Si se elimina n-1 y
se incluye el resultado de en esta ecuación tenemos:
Que al reordenar da
De las propiedades del operador sumatoria se tiene que
y . En últimas, se concluye
que:
Jhon Alexis Diaz Contreras23
Notas de Clase Econometría I – Introducción
Las estimaciones de los parámetros que se acaban de deducir se conocen
como estimadores de mínimos cuadrados ordinarios. Las conclusiones
anteriores se pueden obtener a partir de . El residuo puede
expresarse como . Ahora si lo que se busca es elegir los
coeficientes que minimicen la suma de los residuales al cuadrado se tiene
que:
Las ecuaciones de las cuales se obtuvieron los estimadores son las
condiciones de primer orden del problema de minimización anterior y si se
realizan los cálculos correctos se llegan a los mismos resultados.
Propiedades de los Estimadores de Mínimos Cuadrados Ordinarios1. Se dice que los estimadores MCO son lineales si provienen de una función
lineal de una variable aleatoria.
2. Se dice que los estimadores de MCO son insesgados si su valor promedio
o esperado es igual a su valor verdadero .
3. Se dice que los estimadores MCO son eficientes si dentro de la clase de
todos los estimadores lineales insesgados son los de mínima varianza.
Teorema de Gauss – Markov: Dados los supuestos del modelo de regresión lineal, los estimadores de
mínimos cuadrados ordinarios, dentro de la clase de estimadores lineales
insesgados, tienen varianza mínima; es decir, son MELI.
2.3 VALORES ESPERADOS Y VARIANZAS DE LOS ESTIMADORES
Jhon Alexis Diaz Contreras 24
Notas de Clase Econometría I – Introducción
Para comprobar las propiedades de los estimadores de MCO se plantean
unos supuestos que permiten mostrar el insesgamiento y la varianza de de
los mismos. Los supuestos son:
SRLS 1. Lineal en los ParámetrosEn el modelo poblacional, la variable dependiente y se relaciona con la
variable independiente x y el error u así:
SRLS 2. Muestreo AleatorioDel modelo poblacional se puede tomar una muestra aleatoria de tamaño n
SRLS 3. Media Condicional Cero
SRLS 4. Variación Muestral en la Variable IndependienteEn la muestra, las variables independientes no son todas
iguales a una misma constante. Se requiere cierta variación de x en la
población.
Teorema Insesgamiento de los Estimadores MCOBajo las suposiciones RLS1 a RLS4 se tiene que .
SRLS 5. HomoscedasticidadLa varianza del error es constante; es decir, . En otras palabras
se supone que la varianza del error no depende de las variables
independientes. Cuando la depende de x se dice que el término de
error presenta Heteroscedasticidad.
Teorema Varianza Muestrales de los Estimadores de MCO
Jhon Alexis Diaz Contreras25
Notas de Clase Econometría I – Introducción
Bajo los supuestos RLS1 a RLS5 se tiene que y
.
Estimación de la Varianza del ErrorComo se puede observar en las ecuaciones anteriores, las varianzas de los
estimadores dependen de la varianza del modelo; es decir de . Sin
embargo, esta casi nunca se conoce y por lo tanto hay que estimarla. Antes
de pasar a la estimación de , resulta útil aclarar la diferencia entre los
errores y los residuos.
La ecuación muestra cómo escribir el modelo poblacional en
términos de una observación elegida al azar, donde es el error de la
observación i. Estos errores no son observables y aparecen solo en las
ecuaciones que contengan los parámetros poblacionales y . También se
puede expresar en términos de su valor ajustado y de su residuo, como en
la ecuación , donde son los residuos de la estimación y
pueden calcularse de los datos.
Ya que se ha hecho la distinción entre los errores y el residuo ya se puede
calcular el estimador de la varianza del modelo. Esta se puede calcular
como . En otras palabras el estimador de la varianza del
modelo es la Suma de Residuales al Cuadrado sobre los grados de libertad.
Para calcular el error estándar de la regresión se procede de la forma usual;
es decir se obtiene la raíz cuadrada de la varianza.
Jhon Alexis Diaz Contreras 26
Notas de Clase Econometría I – Introducción
2.4 UNIDADES DE MEDIDA Y FORMA FUNCIONAL
Unidades de medidaSupongamos que se tiene la siguiente regresión:
donde la fonación bruta de capital fijo FBKF, es una función lineal del PIB.
Ambas variables están expresadas en miles de millones de pesos. ¿Cómo
cambian los resultados de la regresión sí en lugar de que las variables estén
medidas en miles de millones de pesos, se miden en millones de pesos?
Para contestar a esta pregunta, definamos entonces a:
donde yi = FBKF y xi = PIB. Ahora, definamos a y donde y
son factores de escala. Por lo tanto se puede estimar la regresión:
Y de esta regresión los nuevos estimadores se definen como y
. Los demás estimadores que se han obtenido hasta ahora se
puede redefinir así:
EjemploPara la regresión , con las variables en miles de
millones; expresar la regresión con FBKF en miles de millones y PIB en
millones.
Los factores de escala son y . Por lo tanto, utilizando los
resultados anteriores tenemos que la nueva regresión es
Jhon Alexis Diaz Contreras27
Notas de Clase Econometría I – Introducción
Forma FuncionalEn econometría no siempre las variables se expresan en niveles y además en
algunas ocasiones en economía aplicada son muy útiles las elasticidades.
Por esto, es muy común emplear modelos logarítmicos y combinaciones de
modelos lineales con logarítmicos. Para cada forma funcional, las relaciones
entre la variable dependiente y la variable independiente, expresadas en los
coeficientes, se interpretan de manera diferente. La interpretación de la
relación para cada uno de los modelos es la siguiente:
Modelo
Variable
Independi
ente
Variable
Dependient
e
Cambio en x
en:
Cambio en y
en:
Nivel -
Nively x 1 unidad unidades
Nivel –
Logy Log (x) 1 %
( /100)
unidades
Log –
NivelLog (y) x 1 unidad ( *100)%
Log – Log Log (y) Log (x) 1 % %
Ejemplo Supongamos que se tiene un modelo de la forma el cual
puede ser expresado en forma lineal como donde
. La importancia de modelos de este tipo en Economía Aplicada
radica en que el parámetro mide la elasticidad de y con respecto x;
es decir, el cambio porcentual en y ante un cambio porcentual en x. El
siguiente modelo relaciona el consumo del café con su precio:
De este modelo se puede decir que si el precio del café se incrementa
en 1%, el consumo de café disminuye en 0.25%.
Jhon Alexis Diaz Contreras 28
Notas de Clase Econometría I – Introducción
Asumamos que se tiene el siguiente modelo donde
PIB en el tiempo t; PIB inicial; tasa de crecimiento del
PIB. Un modelo como el anterior puede expresarse como
donde y ; de esta forma el
modelo es . Se estimó el modelo anterior y se
obtuvieron los siguientes resultados
De este modelo se concluye que el PIB real crece a una tasa de
2.469% por año.
Se tiene una relación del PIB con los cambios porcentuales en la
Oferta Monetaria expresada en el siguiente modelo
. Se realizaron los cálculos y se obtuvo el
siguiente modelo:
El PIB aumenta 25.848 mil millones de pesos por cada aumento del
1% en la oferta monetaria.
Para relacionar la Formación Bruta de Capital Fijo con el PIB se
plantea el siguiente modelo que arrojó los siguientes
resultados:
Si el PIB aumenta en 1000 millones la Formación Bruta de Capital Fijo
se incrementa en 0.17395 miles de millones.
2.5 MEDIDA DE BONDAD DE AJUSTE: EL r2
Para encontrar una medida de que tan bien explica la variable
independiente a la variable dependiente, es necesario utilizar algunas
propiedades algebraicas de los estimadores de MCO.
Jhon Alexis Diaz Contreras29
Notas de Clase Econometría I – Introducción
La suma y el promedio muestral de los residuos suman cero.
Matemáticamente, De esta propiedad se deduce que los
estimadores de MCO se eligen para que los residuos sumen cero.
El promedio muestral de los residuos de los MCO es cero.
Con estas propiedades es posible escribir una regresión para cada i como
y se nota como se puede descomponer cada i es dos partes; los
valores ajustados y los residuos. En función de lo anterior, se define a la
Suma Total de Cuadrados (STC) como:
La STC mide la variación muestral de ; es decir que tan disperso esta en
la muestra. Así mismo se define la Suma Explicada de Cuadrados (SEC)
como la variación muestral de , matemáticamente se puede expresar
como:
Por último se tiene a la Suma de Residuales al Cuadrado (SRC) que mide la
variación muestral de :
De las definiciones anteriores se puede mostrar que STC = SEC + SRC. Con
este resultado se puede obtener el coeficiente de determinación o R2. Si se
divide todo sobre la STC se obtiene que:
El coeficiente de determinación es la proporción de la variación explicada
en la variación total y por lo tanto se interpreta como el porcentaje en la
variación de y que es explicado por la variación en x.
Jhon Alexis Diaz Contreras 30
Notas de Clase Econometría I – Introducción
2.6 INTERPRETACIÓN E INFERENCIA ESTADÍSTICA EN EL MCRLPara realizar Test de Hipótesis con el modelo de regresión lineal se debe
suponer que cada está normalmente distribuido. Lo anterior se puede
notar como:
Es decir, los errores se encuentran distribuidos como ~ . Bajo
este supuesto se puede construir intervalos de confianza y pruebas de
hipótesis.
Intervalos de ConfianzaSi suponemos que están normalmente distribuidos los coeficientes del
modelo y también están normalmente distribuidos; por ejemplo:
Pero dado que no se conoce se estima a partir de y entonces se puede
escribir como:
En general un IC se puede construir como y a un nivel de
significancia dado se lee como la probabilidad de que el verdadero beta
poblacional se encuentre entre los límites del intervalo.
Pruebas de HipótesisLa idea del análisis de regresión lineal es encontrar los coeficientes que
capten la relación entre las variables. Por esto es necesario realizar un test
de hipótesis para probar que los betas estimados no son, estadísticamente,
iguales a cero.
Jhon Alexis Diaz Contreras31
Notas de Clase Econometría I – Introducción
A un nivel de significancia (α) dado y con n – 2 grados de libertad se calcula
un t estadístico de la forma y se concluye como sigue: Bajo la
hipótesis nula si el t calculado es menor (en valor absoluto) que el t
crítico No se rechaza la hipótesis y existe evidencia estadística de que el
beta sea igual a cero. Por el contrario si el t calculado es mayor (en valor
absoluto) que el t crítico se rechaza la hipótesis y existe evidencia
estadística de que el beta sea igual no es igual cero.
Una manera muy sencilla de realizar una evaluar una hipótesis es utilizando
el valor p del estadístico calculado. A un nivel de significancia dado si se
rechaza la hipótesis nula; y si no se rechaza la hipótesis nula.
Análisis de VarianzaEl análisis de varianza es útil cuando se quiere establecer si los betas de
manera conjunta son estadísticamente iguales a cero o no. Para el caso del
análisis de regresión lineal, esta prueba no es de mucha importancia ya que
existe solo un coeficiente para evaluar (el que acompaña la x); sin embargo
cuando se tiene más de una variable explicativa esta prueba arroja
resultados robustos.
Bajo la hipótesis nula de se utiliza la información del
análisis de varianza para realizar un test de Fischer.
Fuente de Variación Grados de Libertad Estadístico
F
SEC 1 SEC/SRC
SRC n – 2
STC n – 1
Jhon Alexis Diaz Contreras 32
Notas de Clase Econometría I – Introducción
El estadístico F se compara con un Fcritico con α nivel de significancia y 1 y n
– 2 grados de libertad en el numerados y en el denominador
respectivamente. Sí el estadístico F es mayor que Fcritico se rechaza la
hipótesis nula; de lo contrario no se rechaza.
Jhon Alexis Diaz Contreras33