REGRESIÓN LINEAL
CORRELACIÓN POSITIVA Y NEGATIVA
• A cada muestra de tamaño se le puede hacer corresponder un par de números.
• Los números de cada par son las medidas o valores correspondientes a cada característica o aspectos que tienen los elementos de la muestra.
Por ejemplo si la muestra esta constituida por N personas,
cada persona se le hace corresponder dos números uno mide su estatura y otro
mide su peso.
El conjunto de valores X1, X2…Xn. Representa las diferentes medidas de su estatura y el conjunto de
valores Y1, Y2…Yn. Representa las diferentes
medidas de su peso.
• Se llama variable a la característica o aspecto que se considera para cada elemento de la muestra y que puede tomar diferentes valores.
• Por ejemplo la estatura es una variable que puede tomar distintos valores como X1, X2…Xn. Y también el peso es una variable al tomar los distintos valores de Y1, Y2…Yn
• Se dice que existe una relación o correlación positiva entre dos variables X y Y. al aumentar los valores de X
debe aumentar los valores de Y, y al disminuir los valores de X deben disminuir los valores de Y.
DIAGRAMA DE DISPERSIÓN.
• Si en un sistema de coordenadas se representan los puntos de (X1,Y1), (X2,Y2)…(Xn,Yn) los valores de dos variables de X y Y entonces se obtiene una grafica llamada diagrama de dispersión.
Y
X
• Se dice que existe una relación o correlación negativa entre dos variables de X y Y, si al aumentar los valores de X disminuyen los
valores Y. o viceversa.
Positiva Negativa
• Si la elipse que encierra los puntos de un diagrama de dispersión su diámetro es muy ancho su correlación es débil, pero si el diámetro es muy angosto su correlación es fuerte. Cuando los
puntos del diagrama de dispersión están alineados su relación es máxima.
COEFICIENTE DE CORRELACIÓN LINEAL.
• Para medir la relación que existe entre dos variables se calcula el coeficiente de relación lineal
Donde N es el numero de pares de datos. El valor de r es un numero que satisface las desigualdades. El coeficiente de
correlación lineal es un número real comprendido entre −1 y 1.−1 ≤ r ≤ 1
La correlación entre el numero de paginas y el precio de venta del libro es de 0.614, eso indica
una asociación moderada entre las variables.
ECUACIONES DE REGRESIÓN • La relación entre dos variables X y Y con un alto coeficiente de
correlación lineal puede suponerse una relación lineal, la ordenada al origen (a) y la pendiente (b) de la recta de regresión se obtiene mediante
las siguientes expresiones:
Dada la información en el ejemplo anterior se puede utilizar para estimar el precio de ventas basado en el numero de paginas
• La grafica se obtiene de la formula :
Y = a + bXDonde “Y" sería la variable dependiente, es decir, aquella que viene
definida a partir de la otra variable “X" (variable independiente).
• Si Y vale $89.14, ¿Cuánto valdrá realmente X?
X=
b
Y-a X= (89.14 -48) / 0.05143X=799.93= 800 paginas (ya redondeado)