RESUMEN DE DATOS
Juan Carlos Colonia P.
LAS MEDIDAS RESUMEN
¿Que son?
•Las medidas resumen comúnmente llamados estadísticas son valores descriptivos de un conjunto de datos.
¿Cual es su utilidad?
•Permiten resumir la información proveniente de un conjunto de datos pasando de una visión detallada a una idea general preservando sus características esenciales.
¿Por que resumir datos?
•Para simplificar
la información
facilitando la
comprensión de
los mismos.
•Facilitar el
análisis
comparativo.
LAS MEDIDAS RESUMEN
Medidas de Tendencia Central, Posición o Localización:
Describen el valor alrededor del cual se distribuyen las observaciones.
•Media
•Mediana
•Moda
Medidas de Dispersión, Variabilidad o Escala:
Miden la variabilidad de un conjunto de datos alrededor de un valor central.
•Varianza
•Desviación Estándar
•Coeficiente de variación
MEDIDAS DE TENDENCIA CENTRAL
MEDIDAS DE TENDENCIA CENTRAL
La tendencia central de un conjunto de datos es la
disposición de estos para agruparse ya sea alrededor del
centro o de ciertos valores numéricos.
Las Medidas de Tendencia Central son valores que se
sitúan en el centro de la distribución e identifican el punto
alrededor del cual se concentran los datos.
Las principales Medidas de Tendencia Central son:
Media
Mediana
Moda
LA MEDIA
La media o media aritmética comúnmente llamada promedio, es la medida de tendencia central mas usada y conocida. Se presenta por o .
Es el promedio aritmético de los datos.
Ejemplo:
1
1
n
i
i
x xn
X M X
1
0.02 0.15 ..... 4.7525
x
1.63x
LA MEDIA
Cuando se tiene datos agrupados en tablas de frecuencia
con intervalos la media se calcula:
Donde representa:
La marca de clase de cada intervalo, si se trabaja con
tablas de frecuencia con intervalos
Los distintos valores de la variable, si se trabaja con
tablas de frecuencia sin intervalos
1
1
1
k
i iki
i
i
x x f
f
ix
CALCULO DE LA MEDIA PARA DATOS
AGRUPADOS EN INTERVALOS
0.48 8 1.44 8 2.40 5 3.36 3 4.32 1
8 8 5 3 1
x
1
1
k
i i
i
k
i
i
x f
x
f
1.67x
CALCULO DE LA MEDIA PARA DATOS
AGRUPADOS EN INTERVALOS
0 8 1 16 2 38 3 22 4 10 5 6
8 16 38 22 10 6
x
1
1
k
i i
i
k
i
i
x f
x
f
2.28x
LA MEDIANA
La Mediana o media posicional es el valor que divide al total
de las observaciones en dos partes iguales, tal que a uno y
otro lado de este valor se encuentre no mas del 50% del
total de observaciones. Se representa por .
Reglas para calcular la mediana
Las mediciones se ordenan de menor a mayor
Si n es impar, la mediana es el valor que ocupa la posición
Si n es par, la mediana es el promedio de los valores que
ocupan las posiciones y .
n 1
2
n
2
n1
2
Me
CALCULO DE LA MEDIANA
Los datos siguientes corresponden al tiempo en minutos
necesario para procesar 25 trabajos en una CPU.
25n
1 2613
2 2
n
1.38Me
CALCULO DE LA MEDIANA EN TABLAS DE
FRECUENCIAS
Se determina las frecuencias acumuladas que permite
conocer hasta que valor se tiene acumulado el 50% de n.
Se calcula .
Se ubican las frecuencias y tal que:
iF
iF
n
2
i 1 i
nF F
2
i 1F
CALCULO DE LA MEDIANA EN TABLAS DE
FRECUENCIA
La mediana esta dada por:
Donde:
: Frecuencia acumulada inferior a
: Frecuencia acumulada superior a
: Limite inferior del intervalo correspondiente a
: Amplitud el intervalo correspondiente a
i 1F
iF
1
1
2
i
i i
i i
nF
Me L AF F
iL
iA
n 2
n 2
iF
iF
CALCULO DE LA MEDIANA EN TABLAS CON
INTERVALOS
12.52
n
12.51iF
iF
iL
1
1
2
i
i i
i i
nF
Me L AF F
1.92 0.96 0.96 iA
12.5 80.96 0.96
16 8
Me
1.5Me
LA MODA
La moda es el valor mas frecuente en el conjunto de
datos, es decir es la observación que ocurre con mayor
frecuencia.
Esta medida se usa mas cuando se tiene datos
nominales.
Puede darse el caso que un conjunto de datos tenga mas
de una moda.
LA MODA
Distribución
bimodal