Date post: | 02-Aug-2015 |
Category: |
Documents |
Upload: | romangcastropena |
View: | 601 times |
Download: | 6 times |
Tecnológico de Mérida, Métodos Numéricos
1
En un Análisis de Regresión simple existe una variable respuesta o dependiente (y) que puede ser el número de especies, la abundancia o la presencia-ausencia de una sola especie y una variable explicativa o independiente (x).
El propósito es obtener una función sencilla de la variable explicativa, que sea capaz de describir lo más ajustadamente posible la variación de la variable dependiente.
Como los valores observados de la variable dependiente difieren generalmente de los que predice la función, ésta posee un error. La función más eficaz es aquella que describe la variable dependiente con el menor error posible o, dicho en otras palabras, con la menor diferencia entre los valores observados y predichos.
La diferencia entre los valores observados y predichos (el error de la función) se denomina variación residual o residuos.
Análisis de regresión
F(y)=[x]
2
Para estimar los parámetros de la función se utiliza el ajuste por mínimos cuadrados. Es decir, se trata de encontrar la función en la cual la suma de los cuadrados de las diferencias entre los valores observados y esperados sea menor.
Tecnológico de Mérida, Métodos Numéricos
3
Sin embargo, con este tipo de estrategia es necesario que los residuos o errores estén distribuidos normalmente y que varíen de modo similar a lo largo de todo el rango de valores de la variable dependiente. Estas suposiciones pueden comprobarse examinando la distribución de los residuos y su relación con la variable dependiente.
Tecnológico de Mérida, Métodos Numéricos
4
Tecnológico de Mérida, Métodos Numéricos
5
Cuando la variable dependiente es cuantitativa (por ejemplo, el número de especies) y la relación entre ambas variables sigue una línea recta, la función es del tipo,
Y= C + BX,
Tecnológico de Mérida, Métodos Numéricos
donde c es el intercepto o valor del punto de corte de la línea de regresión con el eje de la variable dependiente (una medida del número de especies existente cuando la variable ambiental
tiene su mínimo valor) y b es la pendiente o coeficiente de regresión (la tasa de incremento del número de especies con cada unidad de la variable ambiental considerada). Si la relación no es lineal pueden transformarse los valores de una o ambas variables para intentar linearizarla.
6
Tecnológico de Mérida, Métodos Numéricos
7
8
Tecnológico de Mérida, Métodos Numéricos
9
Tecnológico de Mérida, Métodos Numéricos
Coeficiente de determinación
10
11
Si no es posible convertir la relación en lineal, puede comprobarse el grado de ajuste de una función polinomial más compleja. La función polinomial más sencilla es la cuadrática (y= c + bx + bx2) que describe una parábola, pero puede usarse una función cúbica u otra de un orden aun mayor capaz de conseguir un ajuste casi perfecto a los datos.
Tecnológico de Mérida, Métodos Numéricos
12
Tecnológico de Mérida, Métodos Numéricos
13
Tecnológico de Mérida, Métodos Numéricos
14
REGRESION POLINOMIAL
Algunos datos científicos o de ingeniería, pueden presentar un patrón como este:
Que como puede intuirse, se representan pobremente mediante una línea recta.En estos casos, se ajusta mejor una curva a los datos. Para ello se recomienda regresión polinomial.
El procedimiento de mínimos cuadrados se puede extender fácilmente y ajustardatos a un polinomio de grado m.
Y = ao + a1x + a2x2 + a3x3 + … + amxm
Tecnológico de Mérida, Métodos Numéricos
15
REGRESION POLINOMIAL
En este caso, la suma de los cuadrados es:
( Yi – ao - a1xi - a2xi2 – a3xi
3 - … - amxim )2 Sr = ∑
i = 1
n
Que a la larga nos llevará al siguiente conjunto de ecuaciones :
Tecnológico de Mérida, Métodos Numéricos
16
REGRESION POLINOMIAL
Entonces, el problema de determinar polinomios de grado m con mínimoscuadrados es equivalente a resolver un sistema de m+1 ecuaciones linealessimultáneas.
Así como en la regresión lineal, el error en la regresión polinomial se puede cuantificar mediante el error estándar de aproximación:
Sy/x = Sr
n – (m+1)
Donde m es el grado del polinomio que queremos ajustar.
Además del error estándar, se puede calcular también el coeficiente de determinación, de la misma manera que para el caso lineal:
r = St - Sr
St2
Tecnológico de Mérida, Métodos Numéricos
17
REGRESION POLINOMIAL
Ejemplo: a partir de los datos de la tabla que se presenta a continuación, ajuste un polinomio de segundo grado, utilizando regresión polinomial.
Xi Yi
0 2,1
1 7,7
2 13,6
3 27,2
4 40,9
5 61,1
Para el caso que nos ocupa,
m = 2 (el grado del polinomio que necesitamos)n = 6 (la cantidad de datos)
Y el conjunto general de ecuaciones queda instanciado de la siguiente manera:
Xi Yi Xi2 Xi3 Xi4 XiYi Xi2 Yi
0 2,1 0 0 0 0 01 7,7 1 1 1 7,7 7,72 13,6 4 8 16 27,2 54,4
3 27,2 9 27 81 81,6 244,8
4 40,9 16 64 256 163,6 654,4
5 61,1 25 125 625 305,5 1527,5∑Xi ∑Yi ∑Xi2 ∑Xi3 ∑Xi4 ∑XiYi ∑Xi2Yi15 152,6 55 225 979 585,6 2488,8
Tecnológico de Mérida, Métodos Numéricos
18
REGRESION POLINOMIAL
Por lo tanto, las ecuaciones lineales simultáneas son:
O en un “formato” más familiar:
Resolviendo ese sistema con alguna técnica como la eliminación gaussiana, se obtiene:
ao = 2.47857 a1 = 2.35929 a2 = 1.86071
El polinomio es: 1.86071x2 + 2.35929x + 2.47857
Tecnológico de Mérida, Métodos Numéricos
19
REGRESION POLINOMIALDebemos calcular Sr y StSr nos servirá para calcular el error estándar de aproximación basado en
la regresión polinomial.(SUMA DE LOS CUADRADOS)St nos servirá para calcular el coeficiente de determinación.
Xi Yi Xi2 Xi3 Xi4 XiYi Xi2 Yi ( Yi – Ytrazo )2 ( Yi - ao - a1xi - a2xi2 )2
0 2,1 0 0 0 0 0 544,4444 0,143321 7,7 1 1 1 7,7 7,7 314,4711 1,002862 13,6 4 8 16 27,2 54,4 140,0278 1,08158
3 27,2 9 27 81 81,6 244,8 3,1211 0,80491
4 40,9 16 64 256 163,6 654,4 239,2178 0,61951
5 61,1 25 125 625 305,5 1527,5 1272,1111 0,09439∑Xi ∑Yi ∑Xi2 ∑Xi3 ∑Xi4 ∑XiYi ∑Xi2Yi St Sr15 152,6 55 225 979 585,6 2488,8 2513,3933 3,74657
Xtrazo 2,5000Ytrazo 25,4333
ao = 2.47857 a1 = 2.35929 a2 = 1.86071
Sy/x = Sr
n – (m+1)Sy/x =
3.746576 – 3 = 1.1175
Sy = St
n - 12513.3933
5= = 22.4205
r = St - Sr
St2 2513.3933 - 3.74657
2513.3933= 0.99851=
El resultado indica que el 99.851% de la incertidumbre original se ha explicado mediante el modelo.
Tecnológico de Mérida, Métodos Numéricos
error estándar de aproximación
Resultados en Excel regresión lineal
20
Tecnológico de Mérida, Métodos Numéricos
X Y0 2.1
1 7.7
2 13.6
3 27.2
4 40.9
5 61.1
6 66.25427 77.91728 89.5802
0 1 2 3 4 5 60
10
20
30
40
50
60
70
f(x) = 11.6628571429 x − 3.72380952381R² = 0.94708182411712
0 1 2 3 4 5 6 7 8 90
20
40
60
80
100
120
140
160
f(x) = 17.24491 x − 14.88792R² = 0.943421084593626
Resultados en Excel regresión polinomial
21
X Y0 2.1
1 7.7
2 13.6
3 27.2
4 40.9
5 61.1
6 83.61967 110.1688 140.4378
0 1 2 3 4 5 60
10
20
30
40
50
60
70
f(x) = 1.860714 x² + 2.359286 x + 2.478571R² = 0.998509357298405
0 1 2 3 4 5 6 7 8 90
20
40
60
80
100
120
140
160
f(x) = 1.86069 x² + 2.359386 x + 2.478525R² = 0.999801908129514
Tecnológico de Mérida, Métodos Numéricos