Date post: | 11-Mar-2015 |
Category: |
Documents |
Upload: | carlitos-cancino |
View: | 4 times |
Download: | 2 times |
Profesor : Héctor Allende O.
Departamento de InformáticaUniversidad Técnica Federico Santa María
Departamento de InformáticaUniversidad Técnica Federico Santa María
EconometríaEconometríaEconometríaEconometría
Estructura del Estructura del CursoCursoEstructura del Estructura del CursoCurso
1.- Introducción.2.- Modelos de Regresión Múltiple3.- Construcción de Modelos de Regresión4.- Verificación de Supuestos: Linealidad, Normalidad, Homocedasticidad, Independencia5.- Contraste de Hipótesis y Estimación.6.- Modelos Estadísticos de Series de Tiempo: Suavizamiento Exponencial, ARIMA, 7.- ANN: modelos de Regresión libre, Series de Tiempo8. Aplicaciones
HECHOSHECHOS
DATOSDATOS
TEORÍASTEORÍAS
MODELOSMODELOS
FENÓMENOSFENÓMENOS
INTUICIONESINTUICIONES
Problema realProblema realProblema realProblema real
Depuración de los datosDepuración de los datos(Análisis de datos)(Análisis de datos)
Depuración de los datosDepuración de los datos(Análisis de datos)(Análisis de datos)
Estimación de los parámetrosEstimación de los parámetros(Teoría de la estimación)(Teoría de la estimación)
Estimación de los parámetrosEstimación de los parámetros(Teoría de la estimación)(Teoría de la estimación)
Modelos EstadísticosModelos Estadísticos(Cálculo de probabilidades)(Cálculo de probabilidades)
Modelos EstadísticosModelos Estadísticos(Cálculo de probabilidades)(Cálculo de probabilidades)
Planteamiento del problemaPlanteamiento del problemaObjetos y mediosObjetos y medios
Planteamiento del problemaPlanteamiento del problemaObjetos y mediosObjetos y medios
Recolección de información muestralRecolección de información muestral(Técnicas de muestreo ; diseño de experimentos)(Técnicas de muestreo ; diseño de experimentos)
Recolección de información muestralRecolección de información muestral(Técnicas de muestreo ; diseño de experimentos)(Técnicas de muestreo ; diseño de experimentos)
Contrastes de SimplificaciónContrastes de Simplificación(Contrastes de hipótesis)(Contrastes de hipótesis)
Crítica y Diagnosis del ModeloCrítica y Diagnosis del Modelo(Análisis de datos)(Análisis de datos)
Nuevo Conocimiento Nuevo Conocimiento
PrevisionesPrevisiones DecisionesDecisiones
Cómo diseñar un equipo de Cómo diseñar un equipo de mantenimientomantenimiento
Cómo aumentar el Cómo aumentar el rendimiento de un procesorendimiento de un proceso
MODELO VariablesVariables::- Número de averías (- Número de averías (xx11))
- Tiempo reparación (- Tiempo reparación (xx22))
HipótesisHipótesis:: las averías las averías•Se producen Se producen independientementeindependientemente•La probabilidad de no La probabilidad de no avería disminuye avería disminuye exponencialmente con el exponencialmente con el tiempotiempoHipótesis:Hipótesis:tiempo reparacióntiempo reparación•Depende de muchos Depende de muchos pequeños factorespequeños factores
Dos ejemplos de modelos cuantitativosDos ejemplos de modelos cuantitativosDos ejemplos de modelos cuantitativosDos ejemplos de modelos cuantitativos
PREGUNTA
VariablesVariables::- Rendimiento en % (- Rendimiento en % (yy))- Temperatura - Temperatura xx11
- Concentración - Concentración xx22
HipótesisHipótesis:: •El rendimiento aumenta en El rendimiento aumenta en promedio linealmente con la promedio linealmente con la temperatura y la temperatura y la concentraciónconcentración•Para valores fijos de Para valores fijos de xx11 y y xx22
el rendimiento varía el rendimiento varía aleatoriamente alrededor de aleatoriamente alrededor de su valor mediosu valor medio
RECOLECCIÓN DE INFORMACIÓN
Muestreo de máquinas para estudiar sus averías y tiempo de reparación
Diseño de un experimento que se varíen x1 y x2 y se mida y
ESTIMACIÓN PARÁMETROS
Estimar:• , tasa media de averías• , tiempo medio de reparación• , variabilidad en el tiempo de reparación
Estimar:• El efecto de la temperatura (b) y el de la concentración (c) sobre el rendimiento•Variabilidad experimental
CONTRASTES DE SIMPLIFI-CACIÓN
¿Tienen todos los tipos de máquinas el mismo ?¿Los tipos de averías, el mismo y ?
¿Es el efecto de la temperatura y concentración idéntico (b=c ) ?
CRÍTICA DEL MODELO
¿Es cierta la independencia entre las averías?¿Son la variabilidad de x1 y x2 en la muestra consistentes con las hipótesis ?
¿Es la relación entre y (x1 , x2) lineal?¿Es la variabilidad de y para x1, x2 fijos, independ. de los valores concretos de x1, x2 ?
¿ Qué es la Econometría ?¿ Qué es la Econometría ? Disciplina que se ocupa del análisis cuantitativo de fenómenos económicos:Teoría Económica, Economía Matemática y el Modelado Estadístico de datos
Modelo Keynesiano del ConsumoModelo de KleinModelo de Cuentas NacionalesModelo de producción Cobb-Douglas
Rol de la econometría :Rol de la econometría : Proporcionar métodos para estudiar y medir las relaciones de las variables económicas (teoría v/s la realidad)
Aplicaciones de los modelos Aplicaciones de los modelos EconométricosEconométricos
Ciencias de la Ingeniería Ciencias EconómicasCiencias NaturalesCiencias Médicas Ciencias políticas y sociales
Modelo Keynesiano de Consumo
(Fu Consumo)
(Fu Ingreso)
tU
tY
tC 1 0
ttt ICY
donde: tC Gasto de Consumo
tY Ingresos
tI Gasto de Inversión (Ahorro)
tU Perturbación Aleatoria
Modelo de Klein (I)Fu Consumo
tttttt PWWPC 113210
Fu Inversión
ttttt KPPI 2171654
Demanda Trabajo
tttttttt tWTYWTYW 3111111098
Identidades
ttttt GICTY
tttt PWWY
ttt IKK 1
C : Gasto de Consumo
I : Gasto de Inversión
G : Gasto de Gobierno
T : Impuesto
Y : Ingreso descontado impuesto
K : Existencia Capital
W : Nómina Sector Privado
W´ : Nómina Sector Público
t : Tiempo
P : Ganancias
321 ,, : Perturbaciones estocásticas
Relaciones Funcionales (Típicas)Modelos Estructurales (Metamodelos)
a) MODELO LINEAL
Estocástico XY 10
b) MODELO CUADRATICO
2242132210 XXXXXY
c) MODELO EXPONENCIAL
21210 XXY
d) etc.
Formulación de Modelos
E1: Conocimiento profundo del fenómeno : Observación cuidadosa y identificación de posibles elementos relevantes. (variables)
E2: Estado del Arte : Revisar los postulados teoricos existentes, formular hipótesis.(nuevo conociemiento.
E3: Determinar los Pocos Vitales : Pareto, causalidad.
E4: Validación : Probar con Datos Empíricos, Hipótesis.
Sepamos buscar como quien espera encontrar y encontrar
como quien espera buscar
Teoría EconómicaTeoría EconómicaTeoría EconómicaTeoría Económica
Contraste de HipótesisContraste de HipótesisContraste de HipótesisContraste de Hipótesis
Validación de ModeloValidación de ModeloValidación de ModeloValidación de Modelo
Análisis Explorativode Datos (DM)Análisis Explorativode Datos (DM)Análisis Explorativode Datos (DM)Análisis Explorativode Datos (DM)
Formulación de HipótesisFormulación de HipótesisFormulación de HipótesisFormulación de Hipótesis
Estimación de ParámetrosEstimación de ParámetrosEstimación de ParámetrosEstimación de Parámetros
Informaciónprevia
Datos
Modelo Econométrico
CLASES DE MODELOS: Función, Estructura, Referencia del Tiempo, Referencia de la
Incertidumbre, Generalidad
• Descriptivos, Explicativos, Predictívos• Icónicos, Analógicos, Simbólicos• Estáticos, Dinámicos• Determinísticos, Probabilísticos, de Juego• Generales, Especializados
Estáticos Dinámicos
Explicativos
y = + u(Primera parte)
Descriptivos
Extrapolativos
y = + x + u(Tercera y cuarta
parte)
y = + yt-1 + ut
(Quinta parte)
y = + x + yt-1 + ut
(Quinta parte)
DATA MININGDATA MINING
YY
Métodos Métodos Estadísticos Estadísticos
CuantitativosCuantitativos
Knowledge Discovery in Data Bases (KDD)
Knowledge Discovery in Data Bases (KDD)
“Es un proceso de identificación de patrones válidos, innovativos, potencialmente útiles, no explícitos y comprensibles a partir de los datos”.
KDDKDD
Etapas del KDD :
1. Selección de Datos
2. Depuración
3. Enriquecimiento
4. Codificación
5. Data Mining
6. Reportes
Information Requirement
Data Bases
Action
External Data
Data Selection
Cleaning:Domain consistencyDe-duplication Outliers detection
Enrichment
Coding
Data Mining Association Clustering Classification Regression Reporting
Feedback
KDDKDD
Data Mining (DM)Data Mining (DM)
“Etapa de reconocimiento de patrones, a través de algoritmos automáticos o semiautomáticos de grandes bases de datos con el objeto de apoyar a la toma de decisiones dentro de una organización”.
DM permite construir modelos mediante algoritmos automáticos
SM permite construir modelos orientado por un experto.
DM v/s SM
• Capacidad o poder predictivo
• Manejabilidad
• Perfomance
• legibilidad
• Rapidez
• Tamano
•Existen diversos algoritmos en Data Mining los que se pueden clasificar:
•Estadísticos
•Machine Learning
• Redes Neuronales etc.
•Actividades de Data Mining:
•Preparación de los datos
•Aplicación de algoritmos de DM
•Análisis de datos
Algoritmos en DMAlgoritmos en DM
•Algoritmos de DM:
• Estadísticos
-Clustering
-Clasificación
-Regresión
-Pronósticos
DMDM
•Energía: Apoyo a la toma de decisiones en plantas energía eléctrica (centro de despacho de cargas)
•Medicina: Mejora de diagnósticos y asignación de tratamientos en base a reconocimiento de patrones.
•Marketing: información demográfica y sistemas de información geográficos, patrones de compra, segmentación de mercados.
•Finanzas: predicción de valores y riesgo en el mercado de opciones.
Aplicaciones Aplicaciones
• Una superficie de respuesta: Es un gráfico de la variable respuesta como una función de varias variables (factores).
• Un metamodelo: Es una representación algebraica, con los factores como variables independientes (determinísticas o estocásticas) y la variable respuesta como variable dependiente. La que representa una aproximación de la superficie de respuesta.
• Metamodelos típicos usado en muchas aplicaciones son: • a) Regresión multiple• b) Markovianos• c) ANN
Superficies de Respuesta y Metamodelos
Superficies de Respuesta y Metamodelos
• A través de un metamodelo la metodología de superficie de respuesta (RSM) trata de encontrar la respuesta óptima de un conjunto de factores.
• La Experimentación con un metamodelo es comúnmente un método de adquirir información
• Un proceso de diseño de experimento asume un particular forma funcional o estructura dentro del metamodelo (Lineal model, Quadratic model, etc).
PTBTBPBBTPCE 12210)],([
Meta-modelos Meta-modelos
• Los métodos de Regresión son usados para determinar la mejor relación funcional entre las variables.
• Supongamos que la relación funcional puede ser representada por:
E(Y) = f (X1, ..., Xp / B1, ..., BE)
donde E(Y) es el valor esperado de la variable de respuesta Y; los X1, ..., Xp son factores; y los B1, ..., BE son los parámetros de la forma funcional;
E(Y) = B1 + B2 X1 + B3 X2 + B4 X1 X2+……
Conceptos de Análisis de RegresiónConceptos de Análisis de Regresión
• La observación de un valor de la respuesta Y, para un conjunto de X ’s, es asumida como una variable aleatoria dada por:
Y = f (X1, ..., Xp/B1, ..., BE) +
Donde , es una variable aleatoria con media igual a 0 y varianza . Los valores de B1,...,BE son obtenidos por algún método de estimación conveniente ( LS, M, GM etc.).
u
u2
u
Conceptos de Análisis de RegresiónConceptos de Análisis de Regresión
• La metodología de superficie de respuesta (Response surface methodology RSM) involucra una combinación de metamodelos (i.e., regresión lineal y no lineal) y procedimientos secuenciales de optimización (iterative optimization).
Métodos en Superficie de Respuesta
Métodos en Superficie de Respuesta
Modelo EstadísticoModelo Estadístico (Lineal)(Lineal)Modelo EstadísticoModelo Estadístico (Lineal)(Lineal)
x , y son variables independiente y dependiente respectivamente. Además “u” una variable estadística que representa el error.
Los parámetros 0 y 1 pueden ser estimados a partir de los datos {(xi , yi)}i=1,...,n mediante método de mínimos cuadrados.
Entonces
uxy 10
iiiii xyyye 10 ˆˆˆ Sea ;
Modelo de Regresión simple
iju
ix
ijY 1 0
injdi ,.....2,1;,....2,1
Supuestos: ijij uy , v.a.
10 , parámetros
ix Variable de control
iju Perturbación Aleatoria, con esperranza nula, variancia constante, distribuida normalmente con independencia
Hipótesis Estructural
Consecuencias de los supuestos
i Xi
xij
Y E a1 0 ) / ( )..
2)/(). i
xij
YVb), / ( )
ix
ijY f cDist. Normalmente
n
i
n
iiijij xyminemin
1 1
210
2 )(1010
n
iiE eSC
1
2
x
xy
SC
SC1̂ xy 10 ˆˆ
n
iix xxSC
1
2)( ))(( yyxxSC i
n
iixy
1
n
iieVNE
1
2
))(,(0 00
^
VN
Distribución de los Parámetros mínimo cuadráticos
))(,(1 11
^
VN
Ejemplo de Regresión SimpleEjemplo de Regresión Simple
t 0 1 2 3 4 5 6
V(t) 30 60 46 32 10 4 1720 40 26 14 8
20 12
V(t) 25 40 46 29 12 6 17
Sea xt = sen t yt = V(t)
Luego y(t) = a + b xt + ut
t
ttbaba
bxayminbaQmin 2
,,)(),(
325,ˆˆ xbya 202 xS
yxb
),cov(ˆ
12762 yS 45222 ,)ˆ( tt yy
% de Ajuste del Modelo =
%%,ˆ
981009801 2
2
y
t
S
e