Profesor : Héctor Allende O. Departamento de Informática Universidad Técnica Federico Santa...

Profesor : Héctor Allende O.

Departamento de InformáticaUniversidad Técnica Federico Santa María

Departamento de InformáticaUniversidad Técnica Federico Santa María

EconometríaEconometríaEconometríaEconometría

Estructura del Estructura del CursoCursoEstructura del Estructura del CursoCurso

1.- Introducción.2.- Modelos de Regresión Múltiple3.- Construcción de Modelos de Regresión4.- Verificación de Supuestos: Linealidad, Normalidad, Homocedasticidad, Independencia5.- Contraste de Hipótesis y Estimación.6.- Modelos Estadísticos de Series de Tiempo: Suavizamiento Exponencial, ARIMA, 7.- ANN: modelos de Regresión libre, Series de Tiempo8. Aplicaciones

HECHOSHECHOS

DATOSDATOS

TEORÍASTEORÍAS

MODELOSMODELOS

FENÓMENOSFENÓMENOS

INTUICIONESINTUICIONES

Problema realProblema realProblema realProblema real

Depuración de los datosDepuración de los datos(Análisis de datos)(Análisis de datos)

Depuración de los datosDepuración de los datos(Análisis de datos)(Análisis de datos)

Estimación de los parámetrosEstimación de los parámetros(Teoría de la estimación)(Teoría de la estimación)

Estimación de los parámetrosEstimación de los parámetros(Teoría de la estimación)(Teoría de la estimación)

Modelos EstadísticosModelos Estadísticos(Cálculo de probabilidades)(Cálculo de probabilidades)

Modelos EstadísticosModelos Estadísticos(Cálculo de probabilidades)(Cálculo de probabilidades)

Planteamiento del problemaPlanteamiento del problemaObjetos y mediosObjetos y medios

Planteamiento del problemaPlanteamiento del problemaObjetos y mediosObjetos y medios

Recolección de información muestralRecolección de información muestral(Técnicas de muestreo ; diseño de experimentos)(Técnicas de muestreo ; diseño de experimentos)

Recolección de información muestralRecolección de información muestral(Técnicas de muestreo ; diseño de experimentos)(Técnicas de muestreo ; diseño de experimentos)

Contrastes de SimplificaciónContrastes de Simplificación(Contrastes de hipótesis)(Contrastes de hipótesis)

Crítica y Diagnosis del ModeloCrítica y Diagnosis del Modelo(Análisis de datos)(Análisis de datos)

Nuevo Conocimiento Nuevo Conocimiento

PrevisionesPrevisiones DecisionesDecisiones

Cómo diseñar un equipo de Cómo diseñar un equipo de mantenimientomantenimiento

Cómo aumentar el Cómo aumentar el rendimiento de un procesorendimiento de un proceso

MODELO VariablesVariables::- Número de averías (- Número de averías (xx11))

- Tiempo reparación (- Tiempo reparación (xx22))

HipótesisHipótesis:: las averías las averías•Se producen Se producen independientementeindependientemente•La probabilidad de no La probabilidad de no avería disminuye avería disminuye exponencialmente con el exponencialmente con el tiempotiempoHipótesis:Hipótesis:tiempo reparacióntiempo reparación•Depende de muchos Depende de muchos pequeños factorespequeños factores

Dos ejemplos de modelos cuantitativosDos ejemplos de modelos cuantitativosDos ejemplos de modelos cuantitativosDos ejemplos de modelos cuantitativos

PREGUNTA

VariablesVariables::- Rendimiento en % (- Rendimiento en % (yy))- Temperatura - Temperatura xx11

- Concentración - Concentración xx22

HipótesisHipótesis:: •El rendimiento aumenta en El rendimiento aumenta en promedio linealmente con la promedio linealmente con la temperatura y la temperatura y la concentraciónconcentración•Para valores fijos de Para valores fijos de xx11 y y xx22

el rendimiento varía el rendimiento varía aleatoriamente alrededor de aleatoriamente alrededor de su valor mediosu valor medio

RECOLECCIÓN DE INFORMACIÓN

Muestreo de máquinas para estudiar sus averías y tiempo de reparación

Diseño de un experimento que se varíen x1 y x2 y se mida y

ESTIMACIÓN PARÁMETROS

Estimar:• , tasa media de averías• , tiempo medio de reparación• , variabilidad en el tiempo de reparación

Estimar:• El efecto de la temperatura (b) y el de la concentración (c) sobre el rendimiento•Variabilidad experimental

CONTRASTES DE SIMPLIFI-CACIÓN

¿Tienen todos los tipos de máquinas el mismo ?¿Los tipos de averías, el mismo y ?

¿Es el efecto de la temperatura y concentración idéntico (b=c ) ?

CRÍTICA DEL MODELO

¿Es cierta la independencia entre las averías?¿Son la variabilidad de x1 y x2 en la muestra consistentes con las hipótesis ?

¿Es la relación entre y (x1 , x2) lineal?¿Es la variabilidad de y para x1, x2 fijos, independ. de los valores concretos de x1, x2 ?

¿ Qué es la Econometría ?¿ Qué es la Econometría ? Disciplina que se ocupa del análisis cuantitativo de fenómenos económicos:Teoría Económica, Economía Matemática y el Modelado Estadístico de datos

Modelo Keynesiano del ConsumoModelo de KleinModelo de Cuentas NacionalesModelo de producción Cobb-Douglas

Rol de la econometría :Rol de la econometría : Proporcionar métodos para estudiar y medir las relaciones de las variables económicas (teoría v/s la realidad)

Aplicaciones de los modelos Aplicaciones de los modelos EconométricosEconométricos

Ciencias de la Ingeniería Ciencias EconómicasCiencias NaturalesCiencias Médicas Ciencias políticas y sociales

Modelo Keynesiano de Consumo

(Fu Consumo)

(Fu Ingreso)

tU

tY

tC 1 0

ttt ICY

donde: tC Gasto de Consumo

tY Ingresos

tI Gasto de Inversión (Ahorro)

tU Perturbación Aleatoria

Modelo de Klein (I)Fu Consumo

tttttt PWWPC 113210

Fu Inversión

ttttt KPPI 2171654

Demanda Trabajo

tttttttt tWTYWTYW 3111111098

Identidades

ttttt GICTY

tttt PWWY

ttt IKK 1

C : Gasto de Consumo

I : Gasto de Inversión

G : Gasto de Gobierno

T : Impuesto

Y : Ingreso descontado impuesto

K : Existencia Capital

W : Nómina Sector Privado

W´ : Nómina Sector Público

t : Tiempo

P : Ganancias

321 ,, : Perturbaciones estocásticas

Relaciones Funcionales (Típicas)Modelos Estructurales (Metamodelos)

a) MODELO LINEAL

Estocástico XY 10

b) MODELO CUADRATICO

2242132210 XXXXXY

c) MODELO EXPONENCIAL

21210 XXY

d) etc.

Formulación de Modelos

E1: Conocimiento profundo del fenómeno : Observación cuidadosa y identificación de posibles elementos relevantes. (variables)

E2: Estado del Arte : Revisar los postulados teoricos existentes, formular hipótesis.(nuevo conociemiento.

E3: Determinar los Pocos Vitales : Pareto, causalidad.

E4: Validación : Probar con Datos Empíricos, Hipótesis.

Sepamos buscar como quien espera encontrar y encontrar

como quien espera buscar

Teoría EconómicaTeoría EconómicaTeoría EconómicaTeoría Económica

Contraste de HipótesisContraste de HipótesisContraste de HipótesisContraste de Hipótesis

Validación de ModeloValidación de ModeloValidación de ModeloValidación de Modelo

Análisis Explorativode Datos (DM)Análisis Explorativode Datos (DM)Análisis Explorativode Datos (DM)Análisis Explorativode Datos (DM)

Formulación de HipótesisFormulación de HipótesisFormulación de HipótesisFormulación de Hipótesis

Estimación de ParámetrosEstimación de ParámetrosEstimación de ParámetrosEstimación de Parámetros

Informaciónprevia

Datos

Modelo Econométrico

CLASES DE MODELOS: Función, Estructura, Referencia del Tiempo, Referencia de la

Incertidumbre, Generalidad

• Descriptivos, Explicativos, Predictívos• Icónicos, Analógicos, Simbólicos• Estáticos, Dinámicos• Determinísticos, Probabilísticos, de Juego• Generales, Especializados

Estáticos Dinámicos

Explicativos

y = + u(Primera parte)

Descriptivos

Extrapolativos

y = + x + u(Tercera y cuarta

parte)

y = + yt-1 + ut

(Quinta parte)

y = + x + yt-1 + ut

(Quinta parte)

DATA MININGDATA MINING

YY

Métodos Métodos Estadísticos Estadísticos

CuantitativosCuantitativos

Knowledge Discovery in Data Bases (KDD)

Knowledge Discovery in Data Bases (KDD)

“Es un proceso de identificación de patrones válidos, innovativos, potencialmente útiles, no explícitos y comprensibles a partir de los datos”.

KDDKDD

Etapas del KDD :

1. Selección de Datos

2. Depuración

3. Enriquecimiento

4. Codificación

5. Data Mining

6. Reportes

Information Requirement

Data Bases

Action

External Data

Data Selection

Cleaning:Domain consistencyDe-duplication Outliers detection

Enrichment

Coding

Data Mining Association Clustering Classification Regression Reporting

Feedback

KDDKDD

Data Mining (DM)Data Mining (DM)

“Etapa de reconocimiento de patrones, a través de algoritmos automáticos o semiautomáticos de grandes bases de datos con el objeto de apoyar a la toma de decisiones dentro de una organización”.

DM permite construir modelos mediante algoritmos automáticos

SM permite construir modelos orientado por un experto.

DM v/s SM

• Capacidad o poder predictivo

• Manejabilidad

• Perfomance

• legibilidad

• Rapidez

• Tamano

•Existen diversos algoritmos en Data Mining los que se pueden clasificar:

•Estadísticos

•Machine Learning

• Redes Neuronales etc.

•Actividades de Data Mining:

•Preparación de los datos

•Aplicación de algoritmos de DM

•Análisis de datos

Algoritmos en DMAlgoritmos en DM

•Algoritmos de DM:

• Estadísticos

-Clustering

-Clasificación

-Regresión

-Pronósticos

DMDM

•Energía: Apoyo a la toma de decisiones en plantas energía eléctrica (centro de despacho de cargas)

•Medicina: Mejora de diagnósticos y asignación de tratamientos en base a reconocimiento de patrones.

•Marketing: información demográfica y sistemas de información geográficos, patrones de compra, segmentación de mercados.

•Finanzas: predicción de valores y riesgo en el mercado de opciones.

Aplicaciones Aplicaciones

• Una superficie de respuesta: Es un gráfico de la variable respuesta como una función de varias variables (factores).

• Un metamodelo: Es una representación algebraica, con los factores como variables independientes (determinísticas o estocásticas) y la variable respuesta como variable dependiente. La que representa una aproximación de la superficie de respuesta.

• Metamodelos típicos usado en muchas aplicaciones son: • a) Regresión multiple• b) Markovianos• c) ANN

Superficies de Respuesta y Metamodelos

Superficies de Respuesta y Metamodelos

• A través de un metamodelo la metodología de superficie de respuesta (RSM) trata de encontrar la respuesta óptima de un conjunto de factores.

• La Experimentación con un metamodelo es comúnmente un método de adquirir información

• Un proceso de diseño de experimento asume un particular forma funcional o estructura dentro del metamodelo (Lineal model, Quadratic model, etc).

PTBTBPBBTPCE 12210)],([

Meta-modelos Meta-modelos

• Los métodos de Regresión son usados para determinar la mejor relación funcional entre las variables.

• Supongamos que la relación funcional puede ser representada por:

E(Y) = f (X1, ..., Xp / B1, ..., BE)

donde E(Y) es el valor esperado de la variable de respuesta Y; los X1, ..., Xp son factores; y los B1, ..., BE son los parámetros de la forma funcional;

E(Y) = B1 + B2 X1 + B3 X2 + B4 X1 X2+……

Conceptos de Análisis de RegresiónConceptos de Análisis de Regresión

• La observación de un valor de la respuesta Y, para un conjunto de X ’s, es asumida como una variable aleatoria dada por:

Y = f (X1, ..., Xp/B1, ..., BE) +

Donde , es una variable aleatoria con media igual a 0 y varianza . Los valores de B1,...,BE son obtenidos por algún método de estimación conveniente ( LS, M, GM etc.).

u

u2

u

Conceptos de Análisis de RegresiónConceptos de Análisis de Regresión

• La metodología de superficie de respuesta (Response surface methodology RSM) involucra una combinación de metamodelos (i.e., regresión lineal y no lineal) y procedimientos secuenciales de optimización (iterative optimization).

Métodos en Superficie de Respuesta

Métodos en Superficie de Respuesta

Modelo EstadísticoModelo Estadístico (Lineal)(Lineal)Modelo EstadísticoModelo Estadístico (Lineal)(Lineal)

x , y son variables independiente y dependiente respectivamente. Además “u” una variable estadística que representa el error.

Los parámetros 0 y 1 pueden ser estimados a partir de los datos {(xi , yi)}i=1,...,n mediante método de mínimos cuadrados.

Entonces

uxy 10

iiiii xyyye 10 ˆˆˆ Sea ;

Modelo de Regresión simple

iju

ix

ijY 1 0

injdi ,.....2,1;,....2,1

Supuestos: ijij uy , v.a.

10 , parámetros

ix Variable de control

iju Perturbación Aleatoria, con esperranza nula, variancia constante, distribuida normalmente con independencia

Hipótesis Estructural

Consecuencias de los supuestos

i Xi

xij

Y E a1 0 ) / ( )..

2)/(). i

xij

YVb), / ( )

ix

ijY f cDist. Normalmente

n

i

n

iiijij xyminemin

1 1

210

2 )(1010

n

iiE eSC

1

2

x

xy

SC

SC1̂ xy 10 ˆˆ

n

iix xxSC

1

2)( ))(( yyxxSC i

n

iixy

1

n

iieVNE

1

2

))(,(0 00

^

VN

Distribución de los Parámetros mínimo cuadráticos

))(,(1 11

^

VN

Ejemplo de Regresión SimpleEjemplo de Regresión Simple

t 0 1 2 3 4 5 6

V(t) 30 60 46 32 10 4 1720 40 26 14 8

20 12

V(t) 25 40 46 29 12 6 17

Sea xt = sen t yt = V(t)

Luego y(t) = a + b xt + ut

t

ttbaba

bxayminbaQmin 2

,,)(),(

325,ˆˆ xbya 202 xS

yxb

),cov(ˆ

12762 yS 45222 ,)ˆ( tt yy

% de Ajuste del Modelo =

%%,ˆ

981009801 2

2

y

t

S

e

Date post:	11-Mar-2015
Category:	Documents
Upload:	carlitos-cancino
View:	4 times
Download:	2 times

Profesor : Héctor Allende O. Departamento de Informática Universidad Técnica Federico Santa...

Documents