Date post: | 13-Feb-2015 |
Category: |
Documents |
Upload: | blas-casado |
View: | 8 times |
Download: | 0 times |
ESTADÍSTICA DESCRIPTIVA
Medidas de Dispersión
k
iii fX
1
Dispersión
• La dispersión muestra la disparidad que existe entre los valores de la variable. Si es elevada, las medidas de posición pueden resultar poco representativas, al ser una muestra poco homogénea para esa variable. Si la dispersión es baja, la representatividad de las medidas de posición mejora, siendo el grupo más homogéneo.
Medidas de dispersión
• Las medidas de tendencia central son valores en una distribución y las medidas de la variabilidad son intervalos, designan distancias o un número de unidades en la escala de medición.
• Sólo pueden obtenerse con variables de escala de intervalo o de razón en las que puede valorarse el grado de representatividad de medidas de posición como la media.
Medidas de dispersión
Pueden ser
ABSOLUTAS RecorridoDesviación mediaVarianzaDesviación estándar
RELATIVASCoeficiente de aperturaRecorrido relativoCoeficiente de variación
MEDIDAS DE DISPERSIÓN ABSOLUTAS
• Recorrido
• Desviación media
• Varianza
• Desviación estándar
Recorrido
• Es la diferencia entre el mayor y el menor valor de la variable:
minxxR Max
Recorrido
VENTAJAS
• Cálculo sencillo
DESVENTAJAS
• Sólo tiene en cuenta dos valores de la serie.
• Le afecta la existencia de valores extremos.
• No se refiere a ninguna medida de posición central por lo que no sirve para valorar representatividad de alguna de ellas.
8
DESVIACION MEDIA
n
XXDM
i
n
i
1
Desviación media
De una muestra:
n
XDM
i
n
i
1De una población:
Desviación media
• Si no se tomaran los valores absolutos de las diferencias entre los valores de la variable y la media el resultado sería igual a 0.
• La DM puede calcularse respecto a la mediana y a la moda, en el caso de que la media no sea representativa de los valores que toma la variable.
CALCULO DE LA DESVIACION MEDIA
Caso de una Distribución de Frecuencia de Datos No Agrupados:
Ejemplo:
Un pediatra obtuvo la siguiente tabla sobre los meses de edad de 50 niños de su consulta en el momento de empezar a caminar:
mesesDM 04,150
52
μ = 12,2 meses n = 50
n
XDM
i
n
i
1
Meses (x) Niños (f) lxi-μl lxi-μl fi
9 1 3,2 3,2
10 4 2,2 8,8
11 9 1,2 10,8
12 16 0,2 3,2
13 11 0,8 8,8
14 8 1,8 14,4
15 1 2,8 2,8
50 52
CALCULO DE LA DESVIACION MEDIA
CALCULO DE LA DESVIACION MEDIA
Caso de una Distribución de Frecuencia de Datos Agrupados:
Ejemplo:
Las alturas de los jugadores de un equipo de basquet vienen dadas por la tabla:
CALCULO DE LA DESVIACION MEDIA
μ = 186,63 cm n = 23
Altura (cms)
Nº de jugado
resMC lMCi-μl lMCi-μl fi
[170, 175) 1 172,5 14,13 14,13
[175, 180) 3 177,5 9,13 27,39
[180, 185) 4 182,5 4,13 16,52
[185, 190) 8 187,5 0,87 6,96
[190, 195) 5 192,5 5,87 29,35
[195, 200) 2 197,5 10,87 21,74
23 116,09
n
XDM
i
n
i
1
cmDM 05.523
09,116
Es una medida de dispersión que cuantifica la variabilidad de los datos con respecto a la media aritmética y se denota por V(X).
Se define como la media aritmética de las desviaciones al cuadrado de cada uno de los datos con respecto a la media.
Varianza
Cuando se refiere a la población se representa por σ2 y si se refiere a la muestra se representa como s2
n
nx
n
xx
n
ii
n
ii
2
1
2
1
2
2
)()(
Para una población:
Para una muestra:n
xnx
n
xxxs
n
ii
n
ii
2
1
2
1
2
2
)()(
μ = 12,2 meses n = 50
CALCULO DE LA VARIANZA
Meses (x)
Niños (f) (xi-μ)2 (xi-μ)2 fi
9 1 10,24 10,24
10 4 4,84 19,36
11 9 1,44 12,96
12 16 0,04 0,64
13 11 0,64 7,04
14 8 3,24 25,92
15 1 7,84 7,84
50 84
21
2
2 68,150
84)(
)( mesesn
xx
n
ii
μ = 12,2 meses n = 50
CALCULO DE LA VARIANZA
Meses (x)
Niños (f) xi2 xi
2 fi
9 1 81 81
10 4 100 400
11 9 121 1089
12 16 144 2304
13 11 169 1859
14 8 196 1568
15 1 225 225
50 7526
68,150
2,12507526)(
22
1
2
2
n
nxx
n
ii
Propiedades de la Varianza
1. Nunca es negativa: el numerador incluye diferencias al cuadrado.
2. Si se suma una constante k (positiva o negativa) a todos los valores de la variable, la varianza no cambia.
3. Si se multiplica por una constante k a todos los valores de la variable, la varianza queda multiplicada por k2. Si se divide por k la varianza queda dividida por k2.
Varianza
• Es un concepto estadístico sumamente importante porque muchas de las pruebas cuantitativas se fundamentan en él.
• En general, es difícil interpretar puesto que su magnitud se expresa en valores al cuadrado. Para fines descriptivos se utiliza preferentemente la desviación estándar.
Se define como la raíz cuadrada de la varianza
Desviacion Standard
Cuando se refiere a la población se representa por σ y si se refiere a la muestra se representa como s
n
nx
n
xx
n
ii
n
ii
2
1
2
1
2)()(
n
xnx
n
xxxs
n
ii
n
ii
2
1
2
1
2)()(
Para una población:
Para una muestra:
μ = 12,2 meses n = 50
CALCULO DE LA DESVIACIÓN ESTÁNDAR
Meses (x)
Niños (f) (xi-μ)2 (xi-μ)2 fi
9 1 10,24 10,24
10 4 4,84 19,36
11 9 1,44 12,96
12 16 0,04 0,64
13 11 0,64 7,04
14 8 3,24 25,92
15 1 7,84 7,84
50 84
mesesmesesn
xx
n
ii
30,168,150
84)(
)( 21
2
μ = 12,2 meses n = 50
CALCULO DE LA DESVIACIÓN ESTÁNDAR
Meses (x)
Niños (f) xi2 xi
2 fi
9 1 81 81
10 4 100 400
11 9 121 1089
12 16 144 2304
13 11 169 1859
14 8 196 1568
15 1 225 225
50 7526
mesmesn
nxx
n
ii
30,168,150
2,12507526)( 2
22
1
2
Propiedades de la Desviación estándar
1. Nunca es negativa, dado que se toma la raíz positiva.
2. Si se suma una constante k (positiva o negativa) a todos los valores de la variable, la desviación estándar no cambia.
3. Si se multiplica por una constante k a todos los valores de la variable, la desviación estándar queda multiplicada por k. Si se divide por k la desviación estándar queda dividida por k.
Desviación estándar
• Su ventaja frente a la varianza es que sus unidades son las mismas que la variable. Luego, puede ser comparada directamente con la media para determinar su representatividad.
• Se emplea con varios métodos de inferencia estadística.
MEDIDAS DE DISPERSIÓN RELATIVAS
• Coeficiente de apertura
• Recorrido relativo
• Coeficiente de variación
Coeficiente de Apertura
Es el cociente entre el mayor y el menor valor de la variable. A mayor CA, mayor dispersión.
Es sencillo de calcular pero le afecta la existencia de valores extremadamente grandes y/o pequeños y no se refiere a ninguna medida de posición central.
minx
xCA Max
Recorrido relativo
Es el cociente entre el recorrido y la media. Es el número de veces que el recorrido incluye a la media. A mayor recorrido relativo, mayor dispersión.
Es sencillo de calcular y tiene en cuenta una medida de posición central, pero le afecta la existencia de valores extremos.
X
xxR Maxr
min
Coeficiente de variación
Es el cociente entre la desviación estándar y la media. Es el número de veces que la desviación estándar incluye a la media. A mayor coeficiente de variación, mayor dispersión.
Expresa si la dispersión es alta o no y el grado de representatividad de la media. Además permite comparar coeficientes de distintas series de datos y sus respectivos niveles de dispersión.
X
sCV
28
Cálculo del Coeficiente de variación
Se va a comparar la dispersión en precios anuales de las acciones que se venden a menos de $20 y
la dispersion en los precios de aquellas que se venden por arriba de $100. El precio medio de las
acciones que se venden a menos de $20 es de $5.25 y la desviación estandar es de $1.52 y el precio medio de las acciones que se negocian a
mas de $100 es de $92.50 y su desviación estandar es de $5.28
29
29,025,5
52,1
1
11
x
sCV
06,050,92
28,5
2
22
x
sCV
21 CVCV
Valores del Coeficiente de variación
• Si la media es negativa, se toma su valor absoluto.• No es posible calcularlo si la media es cero.• Si la desviación estándar es igual a cero, no hay dispersión:
todos los valores son iguales• Si existe poca dispersión. La media es
representativa.• Si la dispersión será baja si CV es cercano a
0,3 y alta si es cercano a 1. La media será bastante o poco representativa, dependiendo del valor de CV.
• Si existe mucha dispersión. La media no es representativa.
0 CV
3,00 CV
13,0 CV
1CV
ASIMETRÍA
En distribuciones totalmente simétricas, la media, la mediana y la moda coinciden, localizándose en un mismo valor. En cambio, en distribuciones moderadamente asimétricas, la siguiente relación se mantiene aproximadamente:
Media – Moda = 3(Media – Mediana)
Asimetría hacia la izquierda o negativa
Asimetría hacia la derecha o positiva
Simetría
Coeficiente de Asimetría de Pearson
• Mide la desviación respecto de la simetría expresando la diferencia entre la media y la mediana en relación con la desviación estándar del grupo:
• Si la asimetría es moderada:
MoP
Si P=0, distribución simétricaSi P>0, asimetría positivaSi P<0, asimetría negativa
)(3 Me
P
Puntuación “Z”Las puntuaciones “Z” son transformaciones que se pueden
hacer a los valores obtenidos, con el propósito de analizar su distancia respecto a la media, en unidades de desviación estándar.
• Una puntuación “Z” nos indica la dirección y grado en que una observación se aleja de la media, en una escala de unidades de desviación estándar.
• El estandarizar valores permite comparar puntuaciones de dos distribuciones. La variable debe estar medida en una escala de intervalos o de razón.
x
Z
Ejemplo
• La media de una distribución de frecuencias es 60 y la desviación estándar de 10. Se desea comparar la observación de valor 50 con el resto de la distribución:
μ= 60
σ = 10
x = 50
110
6050
x
Z} Podemos decir que el valor “50” está localizado a una desviación estándar por debajo de la media de la distribución.
-σ -σ -σ μ σ σ σ
68.27 %
95.45 %
99.73 %
DISTRIBUCIÓN NORMAL Y DESVIACION STANDARD