ESTADÍSTICA DESCRIPTIVA Medidas de Dispersión
∑=
k
iii fX
1
Dispersión
• La dispersión muestra la disparidad que existe entre los valores de la variable. Si es elevada, las medidas de posición pueden resultar poco representativas, al ser una muestra poco homogénea para esa variable. Si la dispersión es baja, la representatividad de las medidas de posición mejora, siendo el grupo más homogéneo.
Medidas de dispersión
• Las medidas de tendencia central son valores en una distribución y las medidas de la variabilidad son intervalos, designan distancias o un número de unidades en la escala de medición.
• Sólo pueden obtenerse con variables de escala de intervalo o de razón en las que puede valorarse el grado de representatividad de medidas de posición como la media.
Medidas de dispersión
Pueden ser
ABSOLUTAS RecorridoDesviación mediaVarianzaDesviación estándar
RELATIVASCoeficiente de aperturaRecorrido relativoCoeficiente de variación
MEDIDAS DE DISPERSIÓN ABSOLUTAS
• Recorrido• Desviación media
• Varianza• Desviación estándar
Recorrido
• Es la diferencia entre el mayor y el menor valor de la variable:
minxxR Max −=
RecorridoVENTAJAS
• Cálculo sencillo
DESVENTAJAS
• Sólo tiene en cuenta dos valores de la serie.
• Le afecta la existencia de valores extremos.
• No se refiere a ninguna medida de posición central por lo que no sirve para valorar representatividad de alguna de ellas.
8
DESVIACION MEDIA
n
XXDM
i
n
i−
=∑=1
Desviación media
De una muestra:
n
XDM
i
n
iµ−
=∑=1De una población:
Desviación media
• Si no se tomaran los valores absolutos de las diferencias entre los valores de la variable y la media el resultado sería igual a 0.
• La DM puede calcularse respecto a la mediana y a la moda, en el caso de que la media no sea representativa de los valores que toma la variable.
CALCULO DE LA DESVIACION MEDIA
Caso de una Distribución de Frecuencia de Datos No Agrupados:
Ejemplo:
Un pediatra obtuvo la siguiente tabla sobre los meses de edad de 50 niños de su consulta en el momento de empezar a caminar:
mesesDM 04,15052
==
µ = 12,2 mesesn = 50
n
XDM
i
n
iµ−
=∑=1
5250
2,82,8115
14,41,8814
8,80,81113
3,20,21612
10,81,2911
8,82,2410
3,23,219
lxi-µl filxi-µlNiños (f)Meses
(x)
CALCULO DE LA DESVIACION MEDIA
CALCULO DE LA DESVIACION MEDIA
Caso de una Distribución de Frecuencia de Datos Agrupados:
Ejemplo:
Las alturas de los jugadores de un equipo de basquet vienen dadas por la tabla:
CALCULO DE LA DESVIACION MEDIA
µ = 186,63 cmn = 23
116,092321,7410,87197,52[195, 200)
29,355,87192,55[190, 195)
6,960,87187,58[185, 190)
16,524,13182,54[180, 185)
27,399,13177,53[175, 180)
14,1314,13172,51[170, 175)
lMCi-µl filMCi-µlMCNº de
jugadores
Altura (cms)
n
XDM
i
n
iµ−
=∑=1
cmDM 05.523
09,116==
Es una medida de dispersión que cuantifica la variabilidad de los datos con respecto a la media aritmética y se denota por V(X).
Se define como la media aritmética de las desviaciones al cuadrado de cada uno de los datos con respecto a la media.
Varianza
Cuando se refiere a la población se representa por σ2 y si se refiere a la muestra se representa como s2
n
nx
n
xx
n
ii
n
ii
2
1
2
1
2
2)(
)(µµ
σ−
=−
=∑∑==Para una población:
Para una muestra:n
xnx
n
xxxs
n
ii
n
ii
2
1
2
1
2
2)(
)(−
=−
=∑∑==
µ = 12,2 mesesn = 50
CALCULO DE LA VARIANZA
8450
7,847,84115
25,923,24814
7,040,641113
0,640,041612
12,961,44911
19,364,84410
10,2410,2419
(xi-µ)2 fi(xi-µ)2Niños (f)Meses (x)
21
2
2 68,15084
)()( meses
n
xx
n
ii
==−
=∑=
µσ
µ = 12,2 mesesn = 50
CALCULO DE LA VARIANZA
752650
225225115
1568196814
18591691113
23041441612
1089121911
400100410
818119
xi2 fixi
2Niños (f)Meses (x)
68,150
2,12507526)(2
2
1
2
2 =⊗−
=−
=∑=
n
nxx
n
ii µ
σ
Propiedades de la Varianza
1. Nunca es negativa: el numerador incluye diferencias al cuadrado.
2. Si se suma una constante k (positiva o negativa) a todos los valores de la variable, la varianza no cambia.
3. Si se multiplica por una constante k a todos los valores de la variable, la varianza queda multiplicada por k2. Si se divide por k la varianza queda dividida por k2.
Varianza
• Es un concepto estadístico sumamente importante porque muchas de las pruebas cuantitativas se fundamentan en él.
• En general, es difícil interpretar puesto que su magnitud se expresa en valores al cuadrado. Para fines descriptivos se utiliza preferentemente la desviación estándar.
Se define como la raíz cuadrada de la varianza
Desviacion Standard
Cuando se refiere a la población se representa por σ y si se refiere a la muestra se representa como s
n
nx
n
xx
n
ii
n
ii
2
1
2
1
2)()(
µµσ
−=
−=
∑∑==
n
xnx
n
xxxs
n
ii
n
ii
2
1
2
1
2)()(
−=
−=
∑∑==
Para una población:
Para una muestra:
µ = 12,2 mesesn = 50
CALCULO DE LA DESVIACIÓN ESTÁNDAR
8450
7,847,84115
25,923,24814
7,040,641113
0,640,041612
12,961,44911
19,364,84410
10,2410,2419
(xi-µ)2 fi(xi-µ)2Niños (f)Meses (x)
mesesmesesn
xx
n
ii
30,168,15084
)()( 21
2
===−
=∑=
µσ
µ = 12,2 mesesn = 50
CALCULO DE LA DESVIACIÓN ESTÁNDAR
752650
225225115
1568196814
18591691113
23041441612
1089121911
400100410
818119
xi2 fixi
2Niños (f)Meses (x)
mesmesn
nxx
n
ii
30,168,150
2,12507526)( 22
2
1
2
==⊗−
=−
=∑=
µσ
Propiedades de la Desviación estándar
1. Nunca es negativa, dado que se toma la raíz positiva.
2. Si se suma una constante k (positiva o negativa) a todos los valores de la variable, la desviación estándar no cambia.
3. Si se multiplica por una constante k a todos los valores de la variable, la desviación estándar queda multiplicada por k. Si se divide por k la desviación estándar queda dividida por k.
Desviación estándar
• Su ventaja frente a la varianza es que sus unidades son las mismas que la variable. Luego, puede ser comparada directamente con la media para determinar su representatividad.
• Se emplea con varios métodos de inferencia estadística.
MEDIDAS DE DISPERSIÓN RELATIVAS
• Coeficiente de apertura• Recorrido relativo
• Coeficiente de variación
Coeficiente de Apertura
Es el cociente entre el mayor y el menor valor de la variable. A mayor CA, mayor dispersión.
Es sencillo de calcular pero le afecta la existencia de valores extremadamente grandes y/o pequeños y no se refiere a ninguna medida de posición central.
minxxCA Max=
Recorrido relativo
Es el cociente entre el recorrido y la media. Es el número de veces que el recorrido incluye a la media. A mayor recorrido relativo, mayor dispersión.
Es sencillo de calcular y tiene en cuenta una medida de posición central, pero le afecta la existencia de valores extremos.
XxxR Max
rmin−
=
Coeficiente de variación
Es el cociente entre la desviación estándar y la media. Es el número de veces que la desviación estándar incluye a la media. A mayor coeficiente de variación, mayor dispersión.
Expresa si la dispersión es alta o no y el grado de representatividad de la media. Además permite comparar coeficientes de distintas series de datos y sus respectivos niveles de dispersión.
XsCV =
28
Cálculo del Coeficiente de variación
Se va a comparar la dispersión en precios anualesde las acciones que se venden a menos de $20 y la dispersion en los precios de aquellas que se
venden por arriba de $100. El precio medio de lasacciones que se venden a menos de $20 es de $5.25 y la desviación estandar es de $1.52 y el precio medio de las acciones que se negocian a
mas de $100 es de $92.50 y su desviaciónestandar es de $5.28
29
29,025,552,1
1
11 ===
xsCV
06,050,9228,5
2
22 ===
xsCV
21 CVCV ⟩
∴
Valores del Coeficiente de variación
• Si la media es negativa, se toma su valor absoluto.• No es posible calcularlo si la media es cero.• Si la desviación estándar es igual a cero, no hay dispersión:
todos los valores son iguales• Si existe poca dispersión. La media es
representativa.• Si la dispersión será baja si CV es cercano a
0,3 y alta si es cercano a 1. La media será bastante o poco representativa, dependiendo del valor de CV.
• Si existe mucha dispersión. La media no es representativa.
0=⇒ CV3,00 ≤≤ CV
13,0 ⟨≤ CV
1≥CV
ASIMETRÍAEn distribuciones totalmente simétricas, la media, la mediana y la moda
coinciden, localizándose en un mismo valor. En cambio, en distribuciones moderadamente asimétricas, la siguiente relación se mantiene aproximadamente:
Media – Moda = 3(Media – Mediana)
Asimetría hacia la izquierda o negativa
Asimetría hacia la derecha o positivaSimetría
Coeficiente de Asimetría de Pearson
• Mide la desviación respecto de la simetría expresando la diferencia entre la media y la mediana en relación con la desviación estándar del grupo:
• Si la asimetría es moderada: σ
µ MoP −≈
Si P=0, distribución simétricaSi P>0, asimetría positivaSi P<0, asimetría negativa
σµ )(3 MeP −
=
Puntuación “Z”Las puntuaciones “Z” son transformaciones que se pueden
hacer a los valores obtenidos, con el propósito de analizar su distancia respecto a la media, en unidades de desviación estándar.
• Una puntuación “Z” nos indica la dirección y grado en que una observación se aleja de la media, en una escala de unidades de desviación estándar.
• El estandarizar valores permite comparar puntuaciones de dos distribuciones. La variable debe estar medida en una escala de intervalos o de razón.
σµ−
=xZ
Ejemplo
• La media de una distribución de frecuencias es 60 y la desviación estándar de 10. Se desea comparar la observación de valor 50 con el resto de la distribución:
µ= 60σ = 10x = 50
110
6050−=
−=
−=
σµxZ} ⇒
Podemos decir que el valor “50” está localizado a una desviación estándar por debajo de la media de la distribución.
-σ -σ -σ µ σ σ σ
68.27 %
95.45 %
99.73 %
DISTRIBUCIÓN NORMAL Y DESVIACION STANDARD