Date post: | 22-Jan-2018 |
Category: |
Education |
Upload: | julio-barreto-garcia |
View: | 300 times |
Download: | 0 times |
PROFESOR: JULIO C BARRETO G ESC: 78 ÁLGEBRA LINEAL
TEMA III: MEDIDAS DE CENTRALIZACIÓN
NOTACIÓN DE ÍNDICES
Denotemos por iX (léase « X sub i » cualquiera de los N valores
NXXXX ,,,, 321 que toma
una variable X . La letra i en iX , que puede valer N,,3,2,1 se llaman subíndice. Es claro que
podíamos haber empleado cualquier otra letra en vez de i , por ejemplo ,,,,,,,, qponmlkj etc.
NOTACIÓN DE SUMA
El símbolo
N
i
iX1
denotará la suma de todos los iX desde 1i a ;Ni por definición:
N
N
i
i XXXXX
321
1
Cuando no ocasiones confusión, denotaremos esa suma simplemente por i
XX , o i iX .
El símbolo es la letra griega SIGMA mayúscula, que denota suma.
PROMEDIOS O MEDIDAS DE TENDENCIA CENTRAL
Un PROMEDIO es un valor típico o representativo de un conjunto de datos. Como tales
valores suelen situarse hacia el centro del conjunto de datos ordenados por magnitud, los promedios
se conocen como MEDIDAS DE TENDENCIA CENTRAL.
Se definen varios tipos, siendo los más comunes la media aritmética, la mediana, la moda, la
media geométrica y la media armónica. Cada una tiene ventajas y desventajas, según los datos y el
objetivo perseguido.
LA MEDIA ARITMÉTICA
La MEDIA ARITMÉTICA, o simplemente MEDIA, de un conjunto de N números
NXXXX ,,,, 321 se denota por X (léase « X barra») y se define por:
1 1321
N
X
N
X
N
XXXXX
N
i
i
N
TEMA III: MEDIDAS DE CENTRALIZACIÓN
PROFESOR: JULIO C BARRETO G 2 ESTADÍSTICA GENERAL
EJEMPLO: La media aritmética de los números 8, 3, 5, 12 y 10 es:
7,65
38
5
1012538
X
Si los números KXXXX ,,,, 321 ocurren
Kffff ,,,, 321 veces, respectivamente (o sea, con
frecuencias Kffff ,,,, 321 ), la media aritmética es:
2
1
1
321
332211
K
Xf
f
Xf
f
Xf
ffff
XfXfXfXfX
K
i
i
K
i
ii
K
KK
Donde Kf es la FRECUENCIA TOTAL (o sea, el número total de casos).
EJEMPLO: Si 5, 8, 6 y 2 ocurren con frecuencias 3, 2, 4, y 1, respectivamente, su media
aritmética es:
7,5
10
57
10
2241615
1423
21648253
X
LA MEDIA ARITMÉTICA PONDERADA
A veces asociamos con los números KXXXX ,,,, 321 ciertos FACTORES PESO (o PESOS)
KWWWW ,,,, 321 dependientes de la relevancia asignada a cada número. En tal caso:
3 321
332211
W
XW
WWWW
XWXWXWXWX
K
KK
Se llama la MEDIA ARITMÉTICA PONDERADA con pesos KWWWW ,,,, 321 .
EJEMPLO: Si el examen final de un curso cuenta tres veces más que una evaluación parcial,
y un estudiante tiene calificación 85 en el examen final 70 y 90 en los dos parciales, la calificación
media es:
83
5
145
5
2559070
311
853901701
X
TEMA III: MEDIDAS DE CENTRALIZACIÓN
PROFESOR: JULIO C BARRETO G 3 ESTADÍSTICA GENERAL
PROPIEDADES DE LA MEDIA ARITMÉTICA
1. La suma algebraica de las desviaciones de un conjunto de número respecto de su media
aritmética es cero.
EJEMPLO: Las desviaciones de los números 8, 3, 5, 12 y 10 respecto de su media aritmética 7.6
son: 8 – 7.6=0.4; 3 – 7.6= –4,6; 5 – 7.6= –2,6, 12 – 7.6=4,4 y 10 – 7.6=2,4, con suma algebraica:
0.4 – 4.6 – 2.6 + 4.4 + 2.4 = 0.
2. La suma de los cuadrados de las desviaciones de un conjunto de números iX respecto de un
cierto número a es mínima si y sólo si .Xa
3. Si 1f números tiene media ,1m
2f números tiene media Kfm ,,2 números tienen media
,Km entonces la media de todos los números es:
4 321
2211
K
KK
ffff
mfmfmfX
Es decir, una media aritmética ponderada de todas las medias.
4. Si A es una MEDIA ARITMÉTICA SUPUESTA o CONJETURADA (que puede ser
cualquier número) y si AXd ii son las desviaciones de iX respecto de A , las ecuaciones (1) y
(2) se convierten, respectivamente en:
6
5
1
1
1
K
dfA
f
df
AX
N
dA
N
d
AX
K
i
i
K
i
ii
N
i
i
Donde
.1
ffKK
i
i Nótese que las formulas (5) y (6) se resumen en .dAX
5. Si a todos los valores de la variable se les suma un mismo número, la media aritmética queda
aumentada en dicho número.
6. Si todos los valores de la variable se multiplican por un mismo número la media
aritmética queda multiplicada por dicho número.
TEMA III: MEDIDAS DE CENTRALIZACIÓN
PROFESOR: JULIO C BARRETO G 4 ESTADÍSTICA GENERAL
CÁLCULO DE LA MEDIA ARITMÉTICA PARA DATOS AGRUPADOS
Cuando los datos se presentan en una distribución de frecuencias, todos los valores que caen
dentro de un intervalo de clase dado se consideran iguales a la marca de clase, o punto medio, del
intervalo. Las fórmulas (2) y (6) son válidas para tales datos agrupados si interpretamos iX como la
marca de clase if como su correspondiente frecuencia de clase, a A como cualquier marca de clase
conjeturada y AXd ii como las desviaciones de iX respecto de A .
Los cálculos con (2) y (6) se llaman MÉTODOS LARGOS y CORTOS, respectivamente.
Si todos los intervalos de clase tienen idéntica anchura c , las desviaciones AXd ii
pueden expresarse como iuc , donde iu pueden tomar valores enteros positivos o negativos o cero
(es decir, 0 + 1, + 2, + 3,…) con lo que la fórmula (6) se convierte en:
7 1 cK
fuA
K
uf
AX
K
i
ii
Que es equivalente a la ecuación .ucAX A esta ecuación se conoce como MÉTODO
CODIFICADO para calcular la media. Es un método muy breve y debe usarse siempre para datos
agrupados con intervalos de clase de anchuras iguales. Nótese que en el método codificado los
valores de la variable X se TRANSFORMAN en valores de la variable u de acuerdo con
.ucAX
LA MEDIANA
La MEDIANA de un conjunto de números acomodados en orden de magnitud (es decir, en
una ordenación) es el valor central o la media de los dos valores centrales.
En tal sentido, “La mediana se define como el valor de la distribución por encima de la cual
está el 50% de los casos y por debajo el otro 50%, es decir, divide la distribución en dos partes
iguales…” (Hamdan- González, 1994, p. 52).
EJEMPLO 1: El conjunto de números 3, 4, 4, 5, 6, 8, 8, 8 y 10 tiene mediana 6 (pues la serie
tiene un número impar de medidas y por tanto es el valor central).
EJEMPLO 2: EL conjunto de números 5, 5, 7, 9, 11, 12, 15 y 18 tiene mediana:
10
2
119
Ya que la serie tiene un número par de medidas, valores o puntuaciones la mediana es
la media entre las dos puntuaciones centrales.
Un procedimiento práctico para encontrar la posición de la mediana consiste en ordenar La
serie de datos de menor a mayor o viceversa, dividir la serie entre dos y sumar 0,5. Veamos los
siguientes ejemplos:
TEMA III: MEDIDAS DE CENTRALIZACIÓN
PROFESOR: JULIO C BARRETO G 5 ESTADÍSTICA GENERAL
(a) Para la serie de calificaciones de Castellano: 01, 13, 14, 15 y 16, según con lo discutido al
principio la mitad esta en 14, ahora la posición de la mediana usando el procedimiento
viene dada por: ,35,05,25,02
5 es decir, el valor de la mediana está en la tercera
posición (14 puntos).
(b) Para otra serie de calificaciones de Castellano: 12, 13, 14 y 25, de acuerdo con lo discutido
al principio es ,5,132
27
2
1413
ahora la posición de la mediana de acuerdo con el
procedimiento queda definida por ;5,25,025,02
4 así, el valor de la mediana es
13,5 puntos.
Estos dos ejemplos conducen a las siguientes conclusiones:
1. Para determinar la mediana hay que ordenar en forma ascendente o descendente la serie
de valores.
2. La posición de la mediana viene dada por el número de casos dividido entre dos más 0,5:
5,02
PMe N
Además, para datos agrupados según su rol de frecuencias es dado por:
8 Mediana 2
i
f
pNfL
i
a
Donde:
2L = Límite superior real del valor que toma la variable.
af = Frecuencia acumulada.
N = Número de casos de la distribución en estudio.
p = 50% ó 0,5, posición según definición de la mediana.
if = Frecuencia absoluta correspondiente.
i = Intervalo que corresponda a la posición de la mediana.
Para datos agrupados en intervalos de clase, la mediana obtenida por interpolación viene dada
por:
8
anterior2Mediana 1
c f
fN
Li
a
Donde:
TEMA III: MEDIDAS DE CENTRALIZACIÓN
PROFESOR: JULIO C BARRETO G 6 ESTADÍSTICA GENERAL
1L = Frontera o límite inferior real de la clase de la mediana (es decir, de la clase que
contiene la mediana).
N = Número de datos (es decir, la frecuencia total).
af = Frecuencia acumulada antes de la fila de la posición aproximada de la mediana.
if = Frecuencia absoluta de la clase de la mediana.
i = Intervalo que corresponda a la posición de la mediana.
Geométricamente la mediana es el valor de X (abscisa) que corresponde a la recta vertical
que divide un histograma en dos partes de igual área. Ese valor de X se suele denotar por .~X
La mediana es independiente de las amplitudes de los intervalos.
Calcular la mediana de una distribución estadística que viene dada por la siguiente tabla:
iX if af
63,60 5 5
66,63 18 23
69,66 42 65
72,69 27 92
75,72 8 100
100 if
SOLUCIÓN:
Como: 502
100
Clase de la mediana: .69,66 Luego, de acuerdo con la fórmula 8 :
93,67Mediana
93,166Mediana
42
8166Mediana
342
2766Mediana
342
502366Mediana
TEMA III: MEDIDAS DE CENTRALIZACIÓN
PROFESOR: JULIO C BARRETO G 7 ESTADÍSTICA GENERAL
LA MODA
La MODA de un conjunto de números es el valor que ocurre con mayor frecuencia; es decir,
el valor más frecuente. La moda puede no existir, e incluso no ser única en caso de existir.
EJEMPLO 1: El conjunto de 2, 2, 5, 7, 9, 9, 9, 10, 10, 11, 12 y 18 tiene moda 9. En este caso
la distribución con moda única se dice UNIMODAL.
EJEMPLO 2: El conjunto de 3, 5, 8, 10, 12, 15, y 16 no tiene moda.
EJEMPLO 3: El conjunto 2, 3, 4, 4, 4, 5, 5, 7, 7, 7 y 9, tiene dos modas, 4 y 7, y se llama
BIMODAL.
EJEMPLO 4: En el conjunto 2, 2, 3, 3, 6, 6, 9, 9, no tiene moda, ya que todas
las puntuaciones de un grupo tienen la misma frecuencia, no hay moda.
EJEMPLO 5: En el conjunto 0, 1, 3, 3, 5, 5, 7, 8; la moda es Mo = 4, ya que dos
puntuaciones adyacentes tienen la frecuencia máxima, la moda es el promedio de las dos
puntuaciones adyacentes.
En el caso de datos agrupados donde se haya construido una curva de frecuencias para ajustar
los datos, la moda será el valor (o valores) de X correspondientes al punto (o puntos) máximo (o
máximos) de la curva.
Ese valor de X se denota por .X
En una distribución de frecuencia o en un histograma la moda se puede obtener mediante la
fórmula siguiente:
9 Moda21
11 c L
Donde:
1L = Frontera inferior de la clase modal (es decir, de la clase que contiene la moda).
1 = Exceso de frecuencia modal sobre la frecuencia en la clase inferior inmediata.
2 = Exceso de frecuencia modal sobre la frecuencia en la clase superior inmediata.
c = Amplitud del intervalo de la clase modal.
CÁLCULO DE LA MODA PARA DATOS AGRUPADOS
1) TODOS LOS INTERVALOS TIENEN LA MISMA AMPLITUD.
9 Mo
11
1
affff
ffL i
iiii
iii
Donde:
TEMA III: MEDIDAS DE CENTRALIZACIÓN
PROFESOR: JULIO C BARRETO G 8 ESTADÍSTICA GENERAL
iL = Es el límite inferior de la clase modal.
if = Es la frecuencia absoluta de la clase modal.
1if = Es la frecuencia absoluta inmediatamente inferior a la clase modal.
1if = Es la frecuencia absoluta inmediatamente posterior a la clase modal.
ia = Es la amplitud de la clase.
También se utiliza otra fórmula de la moda que da un valor aproximado de ésta:
9 Mo11
1
aff
fL i
ii
ii
EJEMPLO: Calcular la moda de una distribución estadística de la siguiente tabla:
iX if
63,60 5
66,63 18
69,66 42
72,69 27
75,72 8
100 if
SOLUCIÓN:
Usando la fórmula 9 :
846,67Mo
846,166Mo
39
7266Mo
339
2466Mo
31524
2466Mo
327421842
184266Mo
TEMA III: MEDIDAS DE CENTRALIZACIÓN
PROFESOR: JULIO C BARRETO G 9 ESTADÍSTICA GENERAL
Ahora, usando la fórmula 9 :
8,67Mo
8,166Mo
45
8166Mo
345
2766Mo
32718
2766Mo
2) LOS INTERVALOS TIENEN AMPLITUDES DISTINTAS.
En primer lugar tenemos que hallar las alturas: i
ii
a
fh
La clase modal es la que tiene mayor altura.
9 Mo
11
1
ahhhh
hhL i
iiii
iii
La fórmula de la moda aproximada cuando existen distintas amplitudes es:
iv
i
ii
ii a
hh
hL 9 Mo
11
1
EJEMPLO: En la siguiente tabla se muestra las calificaciones (suspenso, aprobado, notable y
sobresaliente) obtenidas por un grupo de 50 alumnos. Calcular la moda.
iX if ih
5,0 15 3
7,5 20 10
9,7 12 6
10,9 3 3
50 if
TEMA III: MEDIDAS DE CENTRALIZACIÓN
PROFESOR: JULIO C BARRETO G 10 ESTADÍSTICA GENERAL
SOLUCIÓN:
Usando la fórmula 9 :
72,6Mo
72,15Mo
11
145Mo
211
75Mo
247
75Mo
2610310
3105Mo
Ahora, usando la fórmula iv9 :
33,6Mo
33,15Mo
9
125Mo
29
65Mo
263
65Mo
RELACIÓN EMPÍRICA ENTRE MEDIA, MEDIANA Y MODA
Para curvas de frecuencias unimodales que sean poco asimétricas tenemos la siguiente
relación empírica.
10 mediana-media3moda-Media
TEMA III: MEDIDAS DE CENTRALIZACIÓN
PROFESOR: JULIO C BARRETO G 11 ESTADÍSTICA GENERAL
Las Figuras 3.1 y 3.2 muestran las posiciones relativas de la media, la mediana y la moda
para curvas de frecuencia asimétricas a derecha e izquierda, respectivamente. Para curvas simétricas,
los tres valores coinciden.
Figura 3.1: Posiciones relativas de la
media, la mediana y la moda en curvas de
frecuencias sesgadas a la derecha.
Figura 3.2: Posiciones relativas de la media,
la mediana y la moda en curvas de
frecuencias sesgadas a la izquierda.
FORMAS DE DISTRIBUCIÓN
Con los valores que se obtienen de la media, mediana y moda se puede evaluar el
comportamiento central de diferentes aspectos de una distribución de datos estadísticos;
dependiendo de su comportamiento los resultados de estas tres medidas pueden ser iguales o
diferentes:
Si el valor de la media es igual al de la mediana MeX los datos tienen una
DISTRIBUCIÓN SIMÉTRICA.
Si la media es igual al valor de la mediana e igual al valor de la moda MoMe X entonces
es una DISTRIBUCIÓN SIMÉTRICA y UNIMODAL, conocida también como
DISTRIBUCIÓN NORMAL.
Cuando la media es mayor que la mediana MeX la distribución es ASIMÉTRICA
POSITIVA y cuando el valor de la media es menor que el de la mediana MeX , la
ASIMETRÍA ES NEGATIVA.
LA MEDIA GEOMÉTRICA G
La MEDIA GEOMÉTRICA G de un conjunto de N números positivos NXXXX ,,,, 321 es
la raíz N -ésima del producto de esos números.
11 321N
NXXXXG
TEMA III: MEDIDAS DE CENTRALIZACIÓN
PROFESOR: JULIO C BARRETO G 12 ESTADÍSTICA GENERAL
EJEMPLO: La media geométrica de 2, 4 y 8 es:
.464842 33 G
Podemos calcular G por logaritmos o con una calculadora. Para la media geométrica de datos
agrupados veamos el siguiente ejemplo:
EJEMPLO 1: Los números KXXXX ,,,, 321 se presentan con frecuencias
Kffff ,,,, 321
donde Nffff K 321 es la frecuencia total.
(a) Encontrar la media geométrica G de estos números.
(b) Deducir una expresión para log G .
(c) ¿Cómo se pueden emplear los resultados para hallar la media geométrica de datos agrupados
en una distribución de frecuencias?
SOLUCIÓN:
(a)
21
21
21
veces veces
222
veces
111
N f
K
ff
N
f
KKK
ff
K
K
XXXG
XXXXXXXXXG
Donde .fN A esta media suele llamársele MEDIA GEOMÉTRICA PONDERADA.
(b)
N
XfG
XfN
G
XfXfXfN
G
XXXN
G
XXXN
G
XXXG
K
ii
KK
f
K
ff
f
K
ff
N f
K
ff
K
K
K
loglog
log1
log
logloglog1
log
logloglog1
log
log1
log
loglog
1i
2211
21
21
21
21
21
21
TEMA III: MEDIDAS DE CENTRALIZACIÓN
PROFESOR: JULIO C BARRETO G 13 ESTADÍSTICA GENERAL
Donde se supone que todos los números son positivos; de otra manera, los logaritmos no están
definidos. Obsérvese que el logaritmo de una media geométrica de un conjunto de números
positivos es la media aritmética de los logaritmos de los números.
(c) Al hallar la media geométrica de datos agrupados, este resultado puede emplearse tomando
KXXXX ,,,, 321 como las marcas de clase y Kffff ,,,, 321 como sus frecuencias correspondientes.
LA MEDIA ARMÓNICA H
La MEDIA ARMÓNICA H de un conjunto de números NXXXX ,,,, 321 es el reciproco de
la media aritmética de los recíprocos de esos números:
12 111
1
1
X
N
XN
HN
i i
En la práctica es más fácil recordar que:
13 1
N
11
1
XNX
H
EJEMPLO: La media armónica de los números 2, 4 y 8 es
43,37
24
8
7
3
8
1
4
1
2
1
3
H
Para la media armónica de datos agrupados: Si ,,, 321 XXX son las marcas de clase de una
distribución de frecuencias y ,,,, 321 fff son sus frecuencias correspondientes, demostrar que su
media armónica está dada por:
N
111
3
3
2
2
1
1
X
f
X
f
X
f
X
f
NH
Donde .321 ffffN
RELACIÓN ENTRE LAS MEDIAS ARITMÉTICAS, GEOMÉTRICAS Y ARMÓNICA
La media geométrica de una colección de números positivos NXXXX ,,,, 321 es menor o igual
que su media aritmética, pero mayor o igual que su media armónica. En símbolos,
XGH
La igualdad ocurre si y sólo si todos los números NXXXX ,,,, 321 son idénticos.
TEMA III: MEDIDAS DE CENTRALIZACIÓN
PROFESOR: JULIO C BARRETO G 14 ESTADÍSTICA GENERAL
EJEMPLO: La media aritmética de los números 2, 4, 8 es 4, 67; su media geométrica 4 y
media armónica 3,43.
LA RAÍZ CUADRADA MEDIA
La RAÍZ CUADRADA MEDIA (RCM) o MEDIA CUADRÁTICA (MQ) de un conjunto
de números NXXXX ,,,, 321 suele denotarse 2X y se define
RCM
2
1
2
2
N
X
N
X
X
N
i
i
Este tipo de promedio suele usarse en aplicaciones físicas.
EJEMPLO: La raíz cuadrada media del conjunto 1, 3, 4, 5, y 7 es:
47,4205
100
5
49251691
5
75431RCM
22222
MEDIDAS DE POSICIÓN
Cuando trabajamos la mediana se hizo con el propósito de encontrar n valor que permitiera
localizar la posición de algún caso con relación a otros que están ordenados de manera ascendente o
descendente. En ese preciso instante se inicio el estudio de las medidas de posición, puesto que se
dividió la distribución en dos partes iguales, pero igualmente puede dividirse en cuatro (cuartiles),
en diez (deciles) o en cien partes iguales (percentiles).
CUARTILES, DECILES Y PERCENTILES
Si un conjunto de datos está ordenado por magnitud, el valor central (o la media de los dos
centrales) que divide al conjunto en dos mitades iguales, es la mediana. Extendiendo esa idea,
podemos pensar en aquellos valores que dividen al conjunto en cuatro partes iguales y que se
denominan CUARTILES. Esos valores, denotados 21,QQ y ,3Q se llaman primer, segundo y tercer
cuartil, respectivamente, en donde: “El 1Q significa que por debajo de su valor se encuentra el 25%
de los casos en la distribución que se está analizando, el 2Q coincide con la mediana y bajo el 3Q
se encuentra el 75% de los casos”.
CÁLCULO DE LOS CUARTILES
1. Ordenamos los datos de menor a mayor.
2. Buscamos el lugar que ocupa cada cuartil mediante la expresión: .23,1,4
kNk
Por ejemplo:
TEMA III: MEDIDAS DE CENTRALIZACIÓN
PROFESOR: JULIO C BARRETO G 15 ESTADÍSTICA GENERAL
(a) Número impar de datos: 2, 5, 3, 6, 7, 4, 9
321
9 ,7 ,6 ,5 ,4 ,3 ,2
QQQ
(b) Número par de datos: 2, 5, 3, 4, 6, 7, 1, 9
321
6,54,52,5
9 ,7 ,6 ,5 ,4 ,3 ,2 ,1
QQQ
CÁLCULO DE LOS CUARTILES PARA DATOS AGRUPADOS
En primer lugar buscamos la clase donde se encuentra ;3,2,1,4
kNk
en la tabla de las
frecuencias acumuladas.
.3,2,1,
anterior4
kaf
fNk
LQ i
i
a
ik
Donde:
iL = Es el límite inferior de la clase donde se encuentra el cuartil.
N = Es la suma de las frecuencias absolutas.
af = Es la frecuencia acumulada anterior a la clase del cuartil.
ia = Es la amplitud de la clase.
EJEMPLO: Calcular los cuartiles de la distribución de la tabla:
iX if af
60,50 8 8
70,60 10 18
80,70 16 34
90,80 14 48
100,90 10 58
110,100 5 63
120,110 2 65
65 if
TEMA III: MEDIDAS DE CENTRALIZACIÓN
PROFESOR: JULIO C BARRETO G 16 ESTADÍSTICA GENERAL
Cálculo del primer cuartil: Como ;25,164
65
4
651
entonces:
25,6825,8601010
825,16601
Q
Cálculo del segundo cuartil: Como ;5,324
130
4
652
entonces:
0625,790625,97016
1457010
16
5,147010
16
185,32702
Q
Cálculo del tercer cuartil: Como ;75,484
95
4
653
entonces:
75,9075,0901010
4875,48903
Q
Análogamente, los valores que dividen a los datos en 10 partes iguales se llaman DECILES, y
se denotan .,,, 921 DDD
Los deciles dan los valores correspondientes al 10%, al 20%... y al 90% de los datos.
5D coincide con la mediana.
CÁLCULO DE LOS DECILES
En primer lugar buscamos la clase donde se encuentra ;9,,23,1,10
kNk
en la tabla de las
frecuencias acumuladas.
.9,,3,2,1,
anterior10
kaf
fNk
LD i
i
a
ik
iL = Es el límite inferior de la clase donde se encuentra el decil.
N = Es la suma de las frecuencias absolutas.
af = Es la frecuencia acumulada anterior a la clase el decil.
ia = Es la amplitud de la clase.
EJEMPLO: Calcular los deciles de la distribución de la tabla anterior.
SOLUCIÓN:
Cálculo del primer decil: Como ;5,610
65
10
651
entonces:
TEMA III: MEDIDAS DE CENTRALIZACIÓN
PROFESOR: JULIO C BARRETO G 17 ESTADÍSTICA GENERAL
125,58125,8508
655010
8
5,65010
8
05,6501
D
Cálculo del segundo decil: Como ;1310
130
10
652
entonces:
655601010
813602
D
Cálculo del tercer decil: Como ;5,1910
195
10
653
entonces:
9375,709375,07016
157010
16
5,17010
16
185,19703
D
Cálculo del cuarto decil: Como ;2610
260
10
654
entonces:
7557016
807010
16
87010
16
1826704
D
Cálculo del quinto decil: Como ;5,3210
325
10
655
entonces:
0625,790625,97016
1457010
16
5,147010
16
185,32705
D
Cálculo del sexto decil: Como ;3910
390
10
656
entonces:
57,8357,38014
508010
14
58010
14
3439806
D
Cálculo del séptimo decil: Como ;5,4510
455
10
657
entonces:
21,8821,88014
1158010
14
5,118010
14
345,45807
D
Cálculo del octavo decil: Como ;5210
520
10
658
entonces:
944901010
4852908
D
Cálculo del noveno decil: Como ;5,5810
585
10
659
entonces:
10111005
510010
5
5,010010
5
585,581009
D
TEMA III: MEDIDAS DE CENTRALIZACIÓN
PROFESOR: JULIO C BARRETO G 18 ESTADÍSTICA GENERAL
Mientras que los valores que los dividen en 100 partes iguales se llaman PERCENTILES,
denotados por ,,,, 9921 PPP . Además, el percentil es el punto por debajo del cual se encuentra un
determinado porcentaje de casos, por ejemplo, el percentil ochenta 80P es el punto por debajo del
cual se encuentra el 80% de los casos en la distribución.
Además, tenemos que: “El percentil veinticinco 25P es igual al cuartil uno ,1Q el percentil
cincuenta 50P es igual a la mediana e igual al cuartil dos 250 Me QP y el percentil setenta y
cinco es igual al cuartil tres 375 QP ”. Para su cálculo con datos agrupados en distribuciones de
frecuencia el cálculo de los percentiles se hace mediante un procedimiento análogo al utilizado para
la mediana:
i
f
fNK
LPi
a
iK
anterior100
Donde:
K = Es el percentil que se desea determinar.
N = Es la suma de las frecuencias absolutas de la distribución Nfi .
Los demás componentes de la fórmula ya fueron estudiadas en la mediana.
EJEMPLO: Calcular los percentil 35 y 60 de la distribución de la tabla anterior.
SOLUCIÓN:
Percentil 35: Como ;75,22100
2275
100
6535
entonces: 97,7210
16
1875,227035
P
Percentil 60: Como ;39100
3900
100
6560
entonces: 57,8310
14
34398060
P
Colectivamente, cuartiles, deciles y percentiles se denominan CUANTILES.
Veamos otros siguientes ejemplos:
EJEMPLO 1: Dado el conjunto de calificaciones (iX ) recogidas en forma desorganizada en
una evaluación parcial realizada a los estudiantes de Informática en la materia Electrónica Digital en
el Instituto Universitario de Tecnología “Antonio José de Sucre” (IUTAJS) fueron las siguientes:
11, 10, 12, 13, 11, 14, 14, 13, 15, 16, 15.
SOLUCIÓN:
Veamos la siguiente tabla en donde tenemos la frecuencia acumulada, la frecuencia relativa, la
frecuencia relativa porcentual:
TEMA III: MEDIDAS DE CENTRALIZACIÓN
PROFESOR: JULIO C BARRETO G 19 ESTADÍSTICA GENERAL
Tabla 1
Calificaciones de una evaluación parcial realizada a los estudiantes de
Informática en la materia Electrónica Digital en el IUTAJS
iX if af
rf rf % ii Xf
10
1
1
09,0
11
1 9%
10
11 2
3
18,0
11
2 18% 22
12 1 4 09,0
11
1 9% 12
13 2 6 18,0
11
2 18% 26
14 2 8 18,0
11
2 18% 28
15 2
10 18,0
11
2 18%
30
16 1 11 09,0
11
1 9% 16
11 if 99,0 rf 144 ii Xf
Nota: Tabla elaborado con los datos tomados en el lapso académico 2014-1 en el IUTAJS.
De acá que la media es: Fórmula
i
ii
f
XfX
Luego de acuerdo con los cálculos de la Tabla 1: 09,1311
144X
Para el cálculo de la mediana la columna de las frecuencias acumuladas juega un papel
preponderante ya que una vez preparado el cuadro de frecuencias acumuladas, el paso siguiente
consiste en ubicar la posición de la mediana, la cual viene dada por el producto de .5,55,011 pN
Este valor se ubica en la columna de frecuencias acumuladas y la primera fila que contenga una
cantidad igual o mayor a 5,5 (en este caso es 6) y es donde está localizada la posición de la
mediana1. En esta fila (la cuarta) están además:
2L = Límite superior real del valor que toma la variable (13,5).
af = Frecuencia acumulada (6).
N = Número de casos de la distribución en estudio (11).
p = 50% ó 0,5, posición según definición de la mediana.
if = Frecuencia absoluta correspondiente (2).
i = Intervalo que corresponda a la posición de la mediana (1).
1 Notemos que ordenándolos crecientemente la mitad es: 10, 11, 11, 12, 13, 13, 14, 14, 15, 15, 16 además, de
acuerdo con la fórmula:
65,05,55,02
11PMe
Lo cual coincide con el 13.
TEMA III: MEDIDAS DE CENTRALIZACIÓN
PROFESOR: JULIO C BARRETO G 20 ESTADÍSTICA GENERAL
Luego de a la formula 8 : ,Mediana 2 if
pNfL
i
a
tenemos que:
25,13Mediana
25,05,13Mediana
125,05,13Mediana
12
5,05,13Mediana
12
5,565,13Mediana
La moda (o modas) son: 11, 13,14 y 15
CÁLCULOS EN EXCEL2
Media 13,09090909
Mediana 13
Moda 11
GRÁFICAS
Un HISTOGRAMA es una representación gráfica de una variable en forma de barras. Se
utilizan para variables continuas o para variables discretas, con un gran número de datos, y que
se han agrupado en clases. En el eje abscisas se construyen unos rectángulos que tienen
por base la amplitud del intervalo, y por altura, la frecuencia absoluta de cada intervalo.
La superficie de cada barra es proporcional a la frecuencia de los valores representados.
Un DIAGRAMA DE SECTORES o DIAGRAMA CIRCULAR se puede utilizar para todo
tipo de variables, pero se usa frecuentemente para las variables cualitativas.
2 En EXCEL se selecciona la secuencia “Tools ⇒ Data Analysis ⇒ Descriptive Statistics”, se obtienen las
medidas de tendencia central mediana, media y moda.
TEMA III: MEDIDAS DE CENTRALIZACIÓN
PROFESOR: JULIO C BARRETO G 21 ESTADÍSTICA GENERAL
Los datos se representan en un círculo, de modo que el ángulo de cada sector es proporcional a
la frecuencia absoluta correspondiente.
ifN
0360
De acuerdo con cada frecuencia tenemos que:
Para 10: 00
1 73,32111
360 Para 11: 0
0
2 45,65211
360 Para 12: 0
0
3 73,32111
360
Para 13: 00
4 45,65211
360 Para 14: 0
0
5 45,65211
360 Para 15: 0
0
6 45,65211
360
Para 16: 00
7 73,32111
360
El diagrama circular se construye con la ayuda de un transportador de ángulos.
Para construir el POLÍGONO DE FRECUENCIA se toma la marca de clase que coincide
con el punto medio de cada rectángulo.
CÁLCULOS DE LOS CUARTILES
Cálculo del primer cuartil: Como ;75,24
11
4
111
entonces:
875,11875,0112
75,1111
2
175,2111
Q
Cálculo del segundo cuartil: Como ;5,54
22
4
112
entonces:
75,1375,0132
5,1131
2
45,5132
Q
Cálculo del tercer cuartil: Como ;25,84
33
4
113
entonces:
125,15125,1142
25,2141
2
625,8143
Q
TEMA III: MEDIDAS DE CENTRALIZACIÓN
PROFESOR: JULIO C BARRETO G 22 ESTADÍSTICA GENERAL
OTRO ANÁLISIS: Ordenándolo los datos crecientemente: 10, 11, 11, 12, 13, 13, 14, 14, 15,
15, 16; luego:
Como teníamos que ;75,24
11
4
1111
Q al revisar la posición 2, le corresponde a 11, pero
como hay decimales, debemos interpolar entre la posición 11 y 11 de la siguiente forma:
11025,011111125,0111 = + = + = Q
Así, el valor del Q1 es 11 y bajo de él deja el 25 % de la serie de datos.
Como teníamos que ;5,54
22
4
1122
Q al revisar la posición 5, le corresponde a 13, pero
como hay decimales, debemos interpolar entre la posición 13 y 13 de la siguiente forma:
1305,01313135,0132 = + = + = Q
Así, el valor del Q2 es 13 y bajo de él deja el 50 % de la serie de datos.
Como teníamos que ;25,84
33
4
1133
Q al revisar la posición 8, le corresponde a 14,
pero como hay decimales, debemos interpolar entre la posición 14 y 15 de la siguiente forma:
75,1475,014175,014141575,0143 = + = + = Q
Así, el valor del Q3 es 14,75 y bajo de él deja el 75 % de la serie de datos.
Notemos que usando EXCEL tenemos que:
PRIMER CUARTIL SEGUNDO CUARTIL TERCER CUARTIL
11,5 13 14,5
Fórmula: =CUARTIL(Matriz; k) k=1,2,3
EJERCICIO: Hallar
(a) Los deciles.
(b) Los percentiles (30, 60,90).
(c) Verificar los cálculos en Excel (=PERCENTIL(Matriz; k) k entre 0 y 1.
EJEMPLO 2: Dado el conjunto de calificaciones, en intervalos de clase, de una evaluación
parcial realizada a los estudiantes que le aplicaron una prueba de conocimiento en el Instituto
Universitario de Tecnología “Antonio José de Sucre” (IUTAJS). Veamos la siguiente tabla en donde
tenemos la frecuencia acumulada, la frecuencia relativa, la frecuencia relativa porcentual:
SOLUCIÓN:
TEMA III: MEDIDAS DE CENTRALIZACIÓN
PROFESOR: JULIO C BARRETO G 23 ESTADÍSTICA GENERAL
Tabla 2
Calificaciones de una evaluación parcial realizada a los estudiantes de una prueba de
conocimiento en el IUTAJS
Puntaje en una
prueba de
conocimientos
( iX )
Estudiante
s
if
af
rf
rf %
X
ii Xf
10-14 5 5 12,0
42
5 12% 12 60
15-19 3 8 07,0
42
3 7% 17 51
20-24 6 14 14,0
42
6 14% 22 132
25-29 14 28 33,0
42
14 33% 27 378
30-34 6 34 14,0
42
6 14% 32 192
35-39 3 37 07,0
42
3 7% 37 111
40-44 5 42 12,0
42
5 12% 42 210
42 if 99,0 rf 1134 ii Xf
Nota: Tabla elaborada durante el lapso académico 2014-2 en el IUTAJS.
De acá que la media es:
Fórmula
1
1
K
i
i
K
i
ii
f
Xf
X
Luego de acuerdo con los cálculos de la Tabla 2: 2742
1134X
La posición aproximada de la mediana es ,215,042 equivalente a ;2
N este valor está
contenido en el ,28af el cual corresponde al intervalo de clase 25 a 29, además:
1L = Frontera o límite inferior real de la clase de la mediana (es decir, de la clase que contiene
la mediana) es 24,5.
N = Número de datos (es decir, la frecuencia total) son 42.
af = Frecuencia acumulada antes de la fila de la posición aproximada de la mediana es 14.
if = Frecuencia absoluta de la clase de la mediana es 14.
i = Intervalo que corresponda a la posición de la mediana es 5.
TEMA III: MEDIDAS DE CENTRALIZACIÓN
PROFESOR: JULIO C BARRETO G 24 ESTADÍSTICA GENERAL
Así, de acuerdo con la fórmula 8 :
27Mediana
5,25,24Mediana
52
15,24Mediana
514
75,24Mediana
514
14215,24Mediana
INTERPRETACIÓN: El 50% de los estudiantes logró en el examen de conocimientos
puntajes superiores a 27.
En este ejemplo la moda es 27 que corresponde al punto medio de la categoría modal:
272
54
2
2925
mX
Esta es la categoría que tiene mayor frecuencia en la distribución (14 estudiantes).
GRÁFICAS
TEMA III: MEDIDAS DE CENTRALIZACIÓN
PROFESOR: JULIO C BARRETO G 25 ESTADÍSTICA GENERAL
EJEMPLO DE CLASE: Sean las siguientes calificaciones de una evaluación en Matemática
realizada en la Universidad Nacional Experimental del Yaracuy (UNEY) a unos estudiantes de la
Ingeniería en Instrumentación y Control: 2, 5, 6, 4,2 9, 11, 18, 19, 14, 2, 1, 6, 10, 11, 10, 12, 19, 14,
12, 10, 3, 8, 9, 9, 8. Realizar:
1. Una tabla estadística y calcular:
(a) Intervalo de clase (Con 4 categorías).
(b) Frecuencias absoluta
(c) Frecuencia acumulada.
(d) Frecuencia relativa absoluta y porcentual.
(e) Marca de Clase (Punto Medio).
2. Con base a lo anterior hallar:
(a) Media.
(b) Mediana.
(c) Moda.
(d) Cuartiles.
(e) Deciles.
(f) Percentil (30, 60)
3. Hacer los gráficos: Histograma, Polígono de Frecuencia y Diagrama Circular.
SOLUCIÓN: Antes de hacer la tabla debemos buscar los Intervalos de Clase:
Primero ordenamos los datos en forma ascendente (creciente): 1, 2, 2, 2, 3, 4, 5, 6, 6, 8, 8, 9, 9,
9, 10, 10, 10, 11, 11, 12, 12, 14, 14, 18, 19, 19. Ahora, podemos agrupar las calificaciones de los
estudiantes en intervalos de clase en consonancia con los pasos descrito:
1. Se ubica las calificaciones superior e inferior: ( 19sX y 1iX ). Y luego se determina la
amplitud total ( 18119 tA ).
2. Dado que esta fijo el número de intervalos de clases ( 4m categorías), se determina la
amplitud del intervalo en cada categoría
5,4
4
18i . Como el resultado no es un numero
entero (como este caso), por lo general se redondea al inmediato superior más próximo, cuando
la primera cifra decimal es cinco o más; en nuestro caso, la distribución tendrá .5i
3. De los datos originales se toma la menor edad (1) como límite inferior del primer intervalo y se
le suma 1i para obtener el límite superior de la primera categoría de edades .5151 Es
decir, que la primera categoría de edades está conformada por 1-5 (insistimos, es recomendable
que todas las categorías tengan el mismo intervalo para facilitar los cálculos). Así,
sucesivamente se construye el segundo intervalo (6-10) a partir del primero, se coloca en su
límite inferior la calificación que sigue al límite superior de la primera categoría (6) y se le
suma (5-1); de esta forma se procede para las restantes categorías.
Ahora procedamos a extraer la frecuencia absoluta ( if ) en cada Intervalo de Clase: 1, 2, 2, 2,
3, 4, 5, 6, 6, 8, 8, 9, 9, 9, 10, 10, 10, 11, 11, 12, 12, 14, 14, 18, 19, 19, además agreguemos a la tabla
las frecuencias acumuladas ( af ), frecuencia relativa
N
ff i
r y relativa porcentual
%100%
N
ff i
r , la Marca de Clase .182
2016,13
2
1511,8
2
106,3
2
51
X
TEMA III: MEDIDAS DE CENTRALIZACIÓN
PROFESOR: JULIO C BARRETO G 26 ESTADÍSTICA GENERAL
Tabla 3
Calificaciones de una evaluación en Matemática realizada en la UNEY a estudiantes
de la Ingeniería en Instrumentación y Control.
Puntaje en una
prueba ( iX )
Estudiantes
if
af
rf
rf %
X
ii Xf
1-5 7 7 27,0
26
7 27% 3 21
6-10 10 17 38,0
26
10 38% 8 80
11-15 6 23 23,0
26
6 23% 13 78
16-20 3 26 12,0
26
3 12% 18 54
26 ifN 1 rf 233 ii Xf
Nota: Tabla elaborada durante el lapso académico 2014-2015 en la UNEY.
De acá que la media es:
Fórmula
1
1
K
i
i
K
i
ii
f
Xf
X
Luego de acuerdo con los cálculos de la Tabla 3:
96,826
233X
La posición aproximada de la mediana es ,135,026 equivalente a ;2
N este valor está
contenido en el ,17af el cual corresponde al intervalo de clase 6 a 10, además:
1L = Frontera o límite inferior real de la clase de la mediana (es decir, de la clase que contiene
la mediana) es 5,5.
N = Número de datos (es decir, la frecuencia total) son 26.
af = Frecuencia acumulada antes de la fila de la posición aproximada de la mediana es 7.
if = Frecuencia absoluta de la clase de la mediana es 10.
i = Intervalo que corresponda a la posición de la mediana es 5.
Así, de acuerdo con la fórmula 8 tenemos que la Mediana (Clase Medianal) es:
TEMA III: MEDIDAS DE CENTRALIZACIÓN
PROFESOR: JULIO C BARRETO G 27 ESTADÍSTICA GENERAL
5,8Mediana
35,5Mediana
10
305,5Mediana
510
65,5Mediana
510
7135,5Mediana
INTERPRETACIÓN: El 50% de los estudiantes logró en el examen de conocimientos
puntajes superiores a 8,5.
Ahora, encontremos la moda (Clase Modal) usando la fórmula 9 con:
iL = Es el límite inferior de la clase modal es 6.
if = Es la frecuencia absoluta de la clase modal es 10.
1if = Es la frecuencia absoluta inmediatamente inferior a la clase modal es 7.
1if = Es la frecuencia absoluta inmediatamente posterior a la clase modal es 6.
ia = Es la amplitud de la clase es 5.
En este caso tenemos que:
14,8Mo
14,26Mo
7
156Mo
57
36Mo
543
36Mo
5610710
7106Mo
Cálculos de los cuartiles:
Cálculo del primer cuartil: Como ;5,64
26
4
261
entonces:
64,564,417
5,3215
7
5,615
7
05,611
Q
TEMA III: MEDIDAS DE CENTRALIZACIÓN
PROFESOR: JULIO C BARRETO G 28 ESTADÍSTICA GENERAL
Cálculo del segundo cuartil: Como ;134
52
4
262
entonces:
93610
3065
10
665
10
71362
Q
Cálculo del tercer cuartil: Como ;5,194
78
4
263
entonces:
08,1108,2116
5,12115
6
5,2115
6
175,19113
Q
Cálculos de los deciles:
Cálculo del primer decil: Como ;6,210
26
10
261
entonces: 85,25
7
06,211
D
Cálculo del segundo decil: Como ;2,510
52
10
262
entonces: 71,45
7
02,512
D
Cálculo del tercer decil: Como ;8,710
78
10
263
entonces: 4,65
10
78,763
D
Cálculo del cuarto decil: Como ;4,1010
104
10
264
entonces: 7,75
10
74,1064
D
Cálculo del quinto decil: Como ;1310
130
10
265
entonces: 95
10
71365
D
Cálculo del sexto decil: Como ;6,1510
156
10
266
entonces: 3,105
10
76,1566
D
Cálculo del séptimo decil: Como ;2,1810
182
10
267
entonces: 125
6
172,18117
D
Cálculo del octavo decil: Como ;8,2010
208
10
268
entonces: 17,145
6
178,20118
D
Cálculo del noveno decil: Como ;4,2310
234
10
269
entonces: 7,165
3
234,23169
D
Ahora hallemos los percentiles:
Percentil 30: Como ;8,7100
780
100
2630
entonces: 4,65
10
78,7630
P
TEMA III: MEDIDAS DE CENTRALIZACIÓN
PROFESOR: JULIO C BARRETO G 29 ESTADÍSTICA GENERAL
Percentil 60: Como ;6,15100
1560
100
2660
entonces: 3,105
10
76,15660
P
LA MEDIA GEOMÉTRICA G
18,7
10789101094,1
361181961441211000729643654381
19181412111098654321
26 22
26
26 21222332211131
G
G
G
G
LA MEDIA ARMÓNICA H
3,5
19,01
9,426
11
19
2
18
1
14
2
12
2
11
2
10
3
9
3
6
2
5
1
4
1
3
1
2
3
1
1
26
11
H
H
H
H
EJERCICIO: Hallar LA RAÍZ CUADRADA MEDIA
En EXCEL
Media 9
Error típico 1,0137516
Mediana 9
Moda 2
Rango 18
Mínimo 1
Máximo 19
Suma 234
Cuenta 26
Clase Frecuencia
3 7
8 10
13 6
18 3
TEMA III: MEDIDAS DE CENTRALIZACIÓN
PROFESOR: JULIO C BARRETO G 30 ESTADÍSTICA GENERAL
En EXCEL
Primer Cuartil Segundo Cuartil Tercer Cuartil
5,25 9 11,75
En EXCEL
Percentil 30 Percentil 60
6 10
ANEXO
OBSERVACIONES SOBRE LA MEDIA ARITMÉTICA
(a) La media se puede hallar sólo para variables cuantitativas.
(b) La media es independiente de las amplitudes de los intervalos.
(c) La media es muy sensible a las puntuaciones extremas. Si tenemos una distribución con los
siguientes pesos: 65 kg, 69kg, 65 kg, 72 kg, 66 kg, 75 kg, 70 kg, 110 kg. La media es igual a
74 kg, que es una medida de centralización poco representativa de la distribución.
(d) La media no se puede calcular si hay un intervalo con una amplitud indeterminada.
iX iX if
63,60 61,5 5
66,63 64,5 18
69,66 67,5 42
72,69 70,5 27
,72 8
100 if
En este caso no es posible hallar la media porque no podemos calcular la marca de clase de
último intervalo.
REFERENCIAS BIBLIOGRÁFICAS
Haber, Audrey. (1973). Estadística General. Traducción de Ricardo Lazada.
Meyer P. (1998). Probabilidad y Aplicaciones estadísticas. Edición revisada. Addison Wesley
Logman.
Pulido, J. (2006). Estadística aplicada a la educación. Manual Instruccional. UPEL-IMPM. Caracas:
Venezuela.
Ritchey F. (2002). Estadística para las ciencias sociales. Mc Graw Hill.
Spiegel, Murray R. 1996). Teoría y problemas de probabilidad y estadística. Traducción de Jairo
Osuna S. México: McGraw-Hill.
Walpole R., Myers R., Myers S., Ye K. (2007). Probabilidad y Estadística para ingeniería y ciencias.
Octava Edición. Pearson, Prentice Hall.