Regresion Polinomial Unidad 4

Tecnológico de Mérida, Métodos Numéricos

1

En un Análisis de Regresión simple existe una variable respuesta o dependiente (y) que puede ser el número de especies, la abundancia o la presencia-ausencia de una sola especie y una variable explicativa o independiente (x).

El propósito es obtener una función sencilla de la variable explicativa, que sea capaz de describir lo más ajustadamente posible la variación de la variable dependiente.

Como los valores observados de la variable dependiente difieren generalmente de los que predice la función, ésta posee un error. La función más eficaz es aquella que describe la variable dependiente con el menor error posible o, dicho en otras palabras, con la menor diferencia entre los valores observados y predichos.

La diferencia entre los valores observados y predichos (el error de la función) se denomina variación residual o residuos.

Análisis de regresión

F(y)=[x]

2

Para estimar los parámetros de la función se utiliza el ajuste por mínimos cuadrados. Es decir, se trata de encontrar la función en la cual la suma de los cuadrados de las diferencias entre los valores observados y esperados sea menor.


3

Sin embargo, con este tipo de estrategia es necesario que los residuos o errores estén distribuidos normalmente y que varíen de modo similar a lo largo de todo el rango de valores de la variable dependiente. Estas suposiciones pueden comprobarse examinando la distribución de los residuos y su relación con la variable dependiente.


4


5

Cuando la variable dependiente es cuantitativa (por ejemplo, el número de especies) y la relación entre ambas variables sigue una línea recta, la función es del tipo,

Y= C + BX,


donde c es el intercepto o valor del punto de corte de la línea de regresión con el eje de la variable dependiente (una medida del número de especies existente cuando la variable ambiental

tiene su mínimo valor) y b es la pendiente o coeficiente de regresión (la tasa de incremento del número de especies con cada unidad de la variable ambiental considerada). Si la relación no es lineal pueden transformarse los valores de una o ambas variables para intentar linearizarla.

6


7

8


9


Coeficiente de determinación

10

11

Si no es posible convertir la relación en lineal, puede comprobarse el grado de ajuste de una función polinomial más compleja. La función polinomial más sencilla es la cuadrática (y= c + bx + bx2) que describe una parábola, pero puede usarse una función cúbica u otra de un orden aun mayor capaz de conseguir un ajuste casi perfecto a los datos.


12


13


14

REGRESION POLINOMIAL

Algunos datos científicos o de ingeniería, pueden presentar un patrón como este:

Que como puede intuirse, se representan pobremente mediante una línea recta.En estos casos, se ajusta mejor una curva a los datos. Para ello se recomienda regresión polinomial.

El procedimiento de mínimos cuadrados se puede extender fácilmente y ajustardatos a un polinomio de grado m.

Y = ao + a1x + a2x2 + a3x3 + … + amxm


15


En este caso, la suma de los cuadrados es:

( Yi – ao - a1xi - a2xi2 – a3xi

3 - … - amxim )2 Sr = ∑

i = 1

n

Que a la larga nos llevará al siguiente conjunto de ecuaciones :


16


Entonces, el problema de determinar polinomios de grado m con mínimoscuadrados es equivalente a resolver un sistema de m+1 ecuaciones linealessimultáneas.

Así como en la regresión lineal, el error en la regresión polinomial se puede cuantificar mediante el error estándar de aproximación:

Sy/x = Sr

n – (m+1)

Donde m es el grado del polinomio que queremos ajustar.

Además del error estándar, se puede calcular también el coeficiente de determinación, de la misma manera que para el caso lineal:

r = St - Sr

St2


17


Ejemplo: a partir de los datos de la tabla que se presenta a continuación, ajuste un polinomio de segundo grado, utilizando regresión polinomial.

Xi Yi

0 2,1

1 7,7

2 13,6

3 27,2

4 40,9

5 61,1

Para el caso que nos ocupa,

m = 2 (el grado del polinomio que necesitamos)n = 6 (la cantidad de datos)

Y el conjunto general de ecuaciones queda instanciado de la siguiente manera:

Xi Yi Xi2 Xi3 Xi4 XiYi Xi2 Yi

0 2,1 0 0 0 0 01 7,7 1 1 1 7,7 7,72 13,6 4 8 16 27,2 54,4

3 27,2 9 27 81 81,6 244,8

4 40,9 16 64 256 163,6 654,4

5 61,1 25 125 625 305,5 1527,5∑Xi ∑Yi ∑Xi2 ∑Xi3 ∑Xi4 ∑XiYi ∑Xi2Yi15 152,6 55 225 979 585,6 2488,8


18


Por lo tanto, las ecuaciones lineales simultáneas son:

O en un “formato” más familiar:

Resolviendo ese sistema con alguna técnica como la eliminación gaussiana, se obtiene:

ao = 2.47857 a1 = 2.35929 a2 = 1.86071

El polinomio es: 1.86071x2 + 2.35929x + 2.47857


19

REGRESION POLINOMIALDebemos calcular Sr y StSr nos servirá para calcular el error estándar de aproximación basado en

la regresión polinomial.(SUMA DE LOS CUADRADOS)St nos servirá para calcular el coeficiente de determinación.

Xi Yi Xi2 Xi3 Xi4 XiYi Xi2 Yi ( Yi – Ytrazo )2 ( Yi - ao - a1xi - a2xi2 )2

0 2,1 0 0 0 0 0 544,4444 0,143321 7,7 1 1 1 7,7 7,7 314,4711 1,002862 13,6 4 8 16 27,2 54,4 140,0278 1,08158

3 27,2 9 27 81 81,6 244,8 3,1211 0,80491

4 40,9 16 64 256 163,6 654,4 239,2178 0,61951

5 61,1 25 125 625 305,5 1527,5 1272,1111 0,09439∑Xi ∑Yi ∑Xi2 ∑Xi3 ∑Xi4 ∑XiYi ∑Xi2Yi St Sr15 152,6 55 225 979 585,6 2488,8 2513,3933 3,74657

Xtrazo 2,5000Ytrazo 25,4333

ao = 2.47857 a1 = 2.35929 a2 = 1.86071

Sy/x = Sr

n – (m+1)Sy/x =

3.746576 – 3 = 1.1175

Sy = St

n - 12513.3933

5= = 22.4205

r = St - Sr

St2 2513.3933 - 3.74657

2513.3933= 0.99851=

El resultado indica que el 99.851% de la incertidumbre original se ha explicado mediante el modelo.


error estándar de aproximación

Resultados en Excel regresión lineal

20


X Y0 2.1

1 7.7

2 13.6

3 27.2

4 40.9

5 61.1

6 66.25427 77.91728 89.5802

0 1 2 3 4 5 60

10

20

30

40

50

60

70

f(x) = 11.6628571429 x − 3.72380952381R² = 0.94708182411712

0 1 2 3 4 5 6 7 8 90

20

40

60

80

100

120

140

160

f(x) = 17.24491 x − 14.88792R² = 0.943421084593626

Resultados en Excel regresión polinomial

21

X Y0 2.1

1 7.7

2 13.6

3 27.2

4 40.9

5 61.1

6 83.61967 110.1688 140.4378

0 1 2 3 4 5 60

10

20

30

40

50

60

70

f(x) = 1.860714 x² + 2.359286 x + 2.478571R² = 0.998509357298405

0 1 2 3 4 5 6 7 8 90

20

40

60

80

100

120

140

160

f(x) = 1.86069 x² + 2.359386 x + 2.478525R² = 0.999801908129514


Date post:	02-Aug-2015
Category:	Documents
Upload:	romangcastropena
View:	601 times
Download:	6 times

Regresion Polinomial Unidad 4

Documents