1
Cuaderno de Aprendizaje
Carrera Ingeniera en Administracin de Empresas
Asignatura Estadstica
2
Nombre de la carrera Ingeniera en Administracin de Empresas
Ttulo profesional Ingeniero en Administracin de Empresas
Nombre de la asignatura Estadstica
Cdigo N68131
Duracin 72 Horas
Competencias de egreso vinculadas a la asignatura
Al trmino de la asignatura el alumno ser capaz de conocer y aplicar los conocimientos bsicos de la Estadstica Descriptiva, de manera tal de aplicar estos conceptos, en los ramos de la especialidad de la carrera
3
Competencias profesionales
El Ingeniero en Administracin de Empresas tendr slidos conocimientos de administracin, marketing, finanzas y contabilidad, lo que le permitirn comprender el funcionamiento de las empresas, aplicar y evaluar los procesos de la administracin general, contables, econmicos y financieros y de conducir entidades empresariales en el marco de una economa globalizada .
4
Nombre del autor Alejandro Yeza Ramos
Ttulo profesional Nombre: Profesor de Estado con mencin en Matemticas Institucin donde lo obtuvo: Universidad de Chile, ao 1979
Grados acadmicos
Magster Nombre: Magster en Educacin, mencin Currculum y Evaluacin Educacional Institucin: Universidad La Repblica, ao 2008
Doctor Nombre: Institucin:
reas de especializacin 1. 2. 3. Etc.
5
Objetivos de la asignatura Objetivo general de la asignatura Entregar a los alumnos los conocimientos
bsicos de la Estadstica Descriptiva, de manera tal de aplicar estos conceptos, en los ramos de la especialidad de la carrera
Objetivos especficos de la asignatura - Aplicar y comprender principios bsicos de la estadstica descriptiva
- Organizar datos, Interpretar grficos. - Distribucin de frecuencias - Regresin lineal y series de tiempo - Trabajar con tablas de frecuencia y
medidas de tendencia central y de dispersin.
6
Unidades temticas de la asignatura
Nombre unidad Sub-unidades
Unidad 1: Estadstica y Conceptos bsicos
Sub Unidad 1: Poblacin y muestra Sub Unidad 2: Tabulacin de datos
Unidad 2: Representacin Grfica Sub Unidad 1: Tipos de grficos Sub Unidad 2: Aplicacin
Unidad 3: Medidas de tendencia central Sub Unidad 1: Media aritmtica Sub Unidad 2: Moda y Mediana
Unidad 4: Medidas de dispersin Sub Unidad 1 : Rango y Desviacin
Media Sub Unidad 2: Varianza y Desviacin Estndar
7
UNIDADES DE CONTENIDO UNIDAD 1: Estadstica y Conceptos bsicos
1.1. Sub Unidad 1: Poblacin y Muestra 1.1.1. Contenido 1 ........................................................................................ 18 1.1.2. Contenido 2 ....................................................................................... 19
1.2. Sub Unidad 2: Tabulacin de datos 1.2.1. Contenido 1 ......................................................................................... 20 1.2.2. Contenido 2 .......................................................................................... 21
UNIDAD 2 : Representacin grfica
2.1. Sub Unidad 1: Tipos de Grficos 2.1.1. Contenido 1 ......................................................................................... 33 2.1.2. Contenido 2 .......................................................................................... 34
2.2. Sub Unidad 2: Aplicacin 2.2.1. Conceptos ............................................................................................. 40 2.2.2. Aplicacin ............................................................................................ 42
UNIDAD 3: Medidas de Tendencia Central
3.1. Sub Unidad 1: Media Aritmtica 3.1.1. Media Aritmtica ............................................................................... 47 3.1.2. Ejercicios de aplicacin ................................................................... 54
3.2. Sub Unidad 2: Moda y Mediana 3.2.1. Mediana ................................................................................................ 49 3.2.2. Moda ...................................................................................................... 52
UNIDAD 4: Medidas de Dispersin 4.1 Sub Unidad 1: Rango y Desviacin Media
4.1.1 Rango ..................................................................................................... 66 4.1.2 Desviacin Media ............................................................................... 67
4.2Sub Unidad 2: Varianza y Desviacin Estndar 4.2.1 Varianza .............................................................................. 72 4.2.2 Desviacin Estndar ........................................................ 75
RECURSOS PARA PROFUNDIZAR LOS APRENDIZAJES
Recursos complementarios .................................................................................................... 98 Glosario especializado .............................................................................................................. 98
8
Webgrafa ...................................................................................................................................... 99 Bibliografa .................................................................................................................................... 99
ANEXOS Anexo N 1: Anexo N 2:
9
La importancia del estudio de la Estadstica radica en su aplicacin en todas las reas del quehacer humano; as, encontramos estadsticas sobre poblacin, deportes, salud, estudios econmicos, pruebas de laboratorio, etc. por lo que se pretende que el estudiante logre obtener las bases necesarias propias de la Estadstica Descriptiva para que, en un futuro, pueda realizar inferencias estadsticas. Les invito a interiorizarse del mdulo, realizar la ejercitacin sugerida, despejar dudas e intercambiar informacin a travs de los foros y a realizar un trabajo a conciencia que permita avanzar en las 4 unidades propuestas.
10
Estimado(a) estudiante
Esta actividad inicial de reflexin tiene por objetivo estimularlo hacia el
aprendizaje de los nuevos contenidos. Por favor revise en detalle las
instrucciones de la actividad.
Nombre de la actividad de reflexin:
Instrucciones para realizar la actividad:
Estimada y estimado alumno
Por qu estudiar estadstica?
Porque los datos estadsticos y las conclusiones obtenidas aplicando metodologa
estadstica ejercen una profunda influencia en casi todos los campos de la actividad
humana. En particular, la estadstica invade cada vez ms cualquier investigacin
relativa a salud pblica. Este crecimiento, probablemente relacionado con el inters
por aumentar la credibilidad y confiabilidad de las investigaciones, no garantiza que
en todos los casos la metodologa estadstica haya sido correctamente utilizada, o
peor an, que sea vlida.
Cul es su opinin del texto en comento?
Cmo afecta este prrafo a los campos de la actividad humana?
Qu fundamento dara Ud. para estudiar estadstica?
11
Estimado(a) estudiante:
Esta actividad tiene por objetivo que usted identifique los conocimientos,
habilidades y actitudes que trae al inicio de la asignatura, los cuales haya
podido adquirir en sus experiencias de aprendizaje previo, ya sea en
estudios anteriores, o a travs de su ejercicio laboral o experiencias
personales. Por favor lea en detalle las instrucciones.
Nombre de la actividad de contextualizacin: Activacin de conocimientos previos
Instrucciones para realizar la actividad:
Qu sabe Ud. sobre el estudio de la estadstica? Cmo se vinculan sus conocimientos con que debe aprender ahora? Dnde adquiri esos aprendizajes? Cul es el desafo que se ha propuesto? Por qu es necesario que aprenda lo nuevo? Cmo cree Ud. que le servir para su desempeo profesional? Le invito a leer pausadamente cada una de las interrogantes propuestas y responderlas mediante una reflexin personal. Sugiero que anote sus respuestas y las vuelva a leer cuando hayamos terminado con nuestras 4 unidades
12
La estadstica descriptiva es una ciencia que analiza series de datos (por ejemplo, edad de una poblacin, altura de los estudiantes de una escuela, temperatura en los meses de verano, etc.) y trata de extraer conclusiones sobre el comportamiento de estas variables. Las variables pueden ser de dos tipos: Variables cualitativas o atributos: no se pueden medir numricamente (por ejemplo: nacionalidad, color de la piel, sexo). Variables cuantitativas: tienen valor numrico (edad, precio de un producto, ingresos anuales). Por su parte, las variables cuantitativas se pueden clasificar en discretas y continuas:
Discretas: slo pueden tomar valores enteros (1, 2, 8, -4, etc.). Por ejemplo: nmero de hermanos (puede ser 1, 2, 3..., etc., por ejemplo, nunca podr ser 3,45).
Continuas: pueden tomar cualquier valor real dentro de un intervalo. Por ejemplo, la velocidad de un vehculo puede ser 80,3 km/h, 94,57 km/h...etc.
Cuando se estudia el comportamiento de una variable hay que distinguir los siguientes conceptos:
Individuo: cualquier elemento que porte informacin sobre el fenmeno que se estudia.
Poblacin: conjunto de todos los individuos (personas, objetos, animales, etc.) que porten informacin sobre el fenmeno que se estudia.
Muestra: subconjunto que seleccionamos de la poblacin. I. Medidas de tendencia central Las medidas de tendencia central nos facilitan informacin sobre la serie de datos que estamos analizando. Estas medidas permiten conocer diversas caractersticas de esta serie de datos. Las principales medidas de tendencia central son las siguientes: 1.- Media Aritmtica: es el valor medio ponderado de la serie de datos. Se calcula multiplicando cada valor por el nmero de veces que se repite. La suma de todos estos productos se divide por el total de datos de la muestra 2.- Mediana: es el valor de la serie de datos que se sita justamente en el centro de la muestra (un 50% de valores son inferiores y otro 50% son superiores). 3.- Moda: es el valor que ms se repite en la muestra.
13
II. Medidas de dispersin 1.- Rango: mide la amplitud de los valores de la muestra y se calcula por diferencia entre el valor ms elevado y el valor ms bajo. 2.- Varianza: Mide la distancia existente entre los valores de la serie y la media. Se calcula como sumatorio de las diferencias al cuadrado entre cada valor y la media, multiplicadas por el nmero de veces que se ha repetido cada valor. El sumatorio obtenido se divide por el tamao de la muestra. La varianza siempre ser mayor que cero. Mientras ms se aproxima a cero, ms concentrados estn los valores de la serie alrededor de la media. Por el contrario, mientras mayor sea la varianza, ms dispersos estn. 3.- Desviacin tpica: Se calcula como raz cuadrada de la varianza.
14
Estimado(a) estudiante
Sea muy bienvenido(a) a los contenidos de la asignatura. Como institucin
tenemos un gran desafo de formarlo(a) a usted en esta modalidad, por
tanto, sintase en todo momento libre de acercarse a nosotros y hacernos
llegar sus inquietudes. Recuerde que estamos a su servicio.
15
Estimado(a) estudiante:
A continuacin usted comenzar el estudio de la asignatura a travs de las
diversas Unidades y Sub-Unidades. Para que usted alcance los objetivos
proyectados y que su aprendizaje sea de calidad, le entregamos algunas
recomendaciones:
1. Tmese su tiempo para el estudio y acomdese en un lugar que le sea grato y sin distractores.
2. Detngase en aquellas materias que le sean ms difciles de entender. Vuelva atrs toda vez que lo necesite.
3. Apyese en el material complementario para el estudio, el cual le permitir profundizar y obtener mayor informacin sobre un tema en particular.
4. Si se le presenta alguna duda que no pueda despejar en este documento, dirjase al foro de la asignatura y plantesela a su tutor(a).
Bienvenido(a) al estudio!
16
Antecedentes de la Unidad 1
Nombre Unidad Objetivos de aprendizaje de la Unidad
Sub-unidades
Estadstica y conceptos bsicos
El alumno (a) ser capaz de: 1. Construir
representaciones
grficas, y
2. Aplicar conocimientos
para elaborar tablas de
distribucin de
frecuencias
3. Analizar datos y
obtener conclusiones
vlidas de ellos.
4. Evaluar datos
agrupados y no
agrupados para
obtener conclusiones
relevantes de ellos
.
1.1 Poblacin y muestra 1.2 Tabulacin de datos
17
1. Nombre de la Unidad: Estadstica y conceptos bsicos
1.1. Nombre de la Sub-unidad: Poblacin y muestra
Estadstica es la ciencia que se encarga de obtener, describir, interpretar y analizar datos para la toma decisiones, lo que la constituye en una importante herramienta de trabajo, para hacer un inferencia de sobre comportamientos futuros. Podemos definir la estadstica descriptiva como los mtodos utilizados para recopilar, presentar y caracterizar un conjunto de datos con el objetivo de describir en forma apropiada las diversas caractersticas de dicho conjunto. En la actualidad la inferencia estadstica ha adquirido la importancia que antes tena la estadstica descriptiva. La inferencia estadstica trata de generalizaciones basadas en muestras de datos. El contenido de la estadstica moderna incluye la recopilacin, presentacin y caracterizacin de la informacin con el objeto de ayudar el anlisis de datos y la posterior toma de decisiones.
Conceptos utilizados en el anlisis estadstico
1. Poblacin: Conjunto completo de personas, objetos o medidas; los cuales poseen una
caracterstica comn observable, considerados en un estudio.
Ejemplos:
Los habitantes de la Segunda Regin, segn ltimo censo del INE
Los alumnos (as) de la Universidad de Chile
Las patentes de los automviles de la Regin Metropolitana
Las personas que padecen Sndrome de Down
2. Muestra: Subconjunto o parte de una poblacin.
Ejemplo:
Si deseamos saber el gasto promedio anual de la Tercera Regin, extraemos una
muestra formada por 1.000 mil personas, luego determinamos el gasto anual
correspondiente a cada uno de ellos y finalmente obtendremos el promedio de
los gastos de los habitantes de la Tercera Regin.
18
Ejercicios:
1. Un estudio de opinin para determinar qu compaa de celular prefieren para su uso.
Se consulta a 5.000 personas y entre ellas 3.200 prefirieron Entel.
Responda:
i. Cul es la muestra?
ii. Cul es la poblacin?
iii. Las 1.800 personas que eligieron otras compaas de telefona mvil que
constituyen?
2. Se realiza una encuesta telefnica a 2.000 personas para determinar con qu equipo
de ftbol se identifican. De los consultados 950 personas declararon ser hinchas de
Universidad de Chile.
Responda:
I. Cul es la muestra?
II. Cul es la poblacin?
3. Variable: Caracterstica de una poblacin o muestra en estudio. Puede tomar diversos
valores.
Ejemplos:
Nivel educacional de los chilenos
Religin de los habitantes de la Quinta Regin
Color de ojos de los alumnos (as) de un curso
Temperatura y humedad en el mes de Julio
Las variables se clasifican en:
1. Cualitativas: Estn asociadas a una cualidad o atributo
Ejemplos:
i. Calidad de la atencin de una persona en un hospital pblico
Buena
Regular
Mala
ii. Satisfaccin de un espectador por una obra de teatro
Entretenida
Aceptable
Aburrida
19
2. Cuantitativas: Se expresan mediante nmeros, se dividen en discretas y continuas
a) Variables cuantitativas discretas, su resultado es siempre un nmero entero.
Ejemplos:
i. Cantidad de vehculos producidos por Chevrolet entre los aos 2007
y 2010
ii. Matrcula de Valle Central por meses de Marzo a diciembre de 2013
iii. Cantidad de libros ledos por 100 personas durante un mes
b) Variables cuantitativas continuas, se obtienen de un proceso de medicin,
toman un valor entre dos nmeros reales.
Ejemplos: i. % de empleados enfermos durante Junio en una empresa
ii. Estatura de los alumnos (as) de un curso
iii. Peso de 50 personas
Ejercicios: 1. Clasifique en variables cualitativas, cuantitativas discretas y cuantitativas
continuas
i. Aos de servicio de personal de un hospital ________________________________
ii. Hora de entrada al trabajo ________________________________
iii. Porcentaje de aprobados en un Instituto ________________________________
iv. Humedad relativa del aire en Santiago ________________________________
v. Promedio de estatura de una universidad ________________________________
vi. Altura de un cuerpo geomtrico ________________________________
2. En octubre de 1997 se aplic un censo en Antofagasta, a la poblacin residente en
sectores aledaos al Ferrocarril de Antofagasta a Bolivia, reclutando a los
menores de 7 aos. Se obtuvo la participacin de 432 nios del sector ferrocarril y
54 del puerto. Se obtuvo muestras de sangre, delas cuales el 1,6% no fueron
analizadas por estar coaguladas o por ser insuficientes. Las concentraciones de
plomo variaron entre 81 y 3.159 mg/kg de tierra en el sector del ferrocarril y
entre 51 y 321 mg/kg de tierra en el sector no expuesto. Cinco muestras
sobrepasaron la norma chilena para plomo en agua de consumo humano (o,o5
ppm), alcanzando el valor mximo a 0,17 ppm.
Responda:
i. Identifique poblacin en estudio
ii. Muestra estudiada y su tamao
iii. Identifique y clasifique las variables consideradas en el estudio.
3. Enuncie cuatro variables cualitativas
4. Enuncie cuatro variables cuantitativas discretas
5. Enuncie cuatro variables cuantitativas continuas
20
1.2. Nombre de la Sub-unidad: Tabulacin de datos
En los anlisis estadsticos los datos recolectados pueden corresponder una
poblacin o una muestra. Para realizar un mejor estudio de datos
numerosos obtenidos debemos organizarlos en tablas de distribucin de
frecuencias.
Desinaremos por N = Tamao de la poblacin en estudio
n = Tamao de la muestra, es decir, parte de la poblacin
Para realizar un mejor y acabado estudio de los datos obtenidos, debemos
organizarlos, usando una tabla de distribucin de frecuencias, divididos en
grupos ordenados numricamente, a los que denominamos clases.
I. Tabulacin de datos cualitativos
La construccin de una tabla de distribucin de frecuencias de datos cualitativos es
bastante simple, basta enumerarlos con su respectiva en la tabla.
Frecuencia absoluta, designada por fi, indica el nmero de veces que se repite un dato
Ejemplo:
Observemos las notas de un curso de 40 alumnos en una prueba de matemticas
NOTAS fi
1 1
2 3
3 2
4 8
5 14
6 8
7 4
n = 40
tamao de la muestra n = 40 nmero de clases m = 7
21
II. Tabulacin de una variable cuantitativa
Estudiaremos dos casos
I. Tabulacin de una variable discreta: est formada por cinco columnas
i. Frecuencia absoluta, ya dijimos que era el nmero de veces que se
repite una variable.
ii. Tamao de la muestra, cantidad de elementos que conforman la
muestra, obtenida sumando todas las frecuencias absolutas.
m
n = fi i =1
iii. Frecuencia relativa (f rel), es el % de datos que se encuentra en una
clase, lo obtenemos dividiendo la frecuencia absoluta de la clase por
el nmero por el tamao de la muestra, es decir,
fi / n
iv. Frecuencia acumulada (fac), cantidad de datos que se encuentran
hasta cierta clase.
i m fac = fj j =1
v. Frecuencia acumulada relativa (fac rel), es el % de datos que se
encuentran hasta cierta clase.
Ejercicio: En un curso de 40 alumnos, se desea estudiar el comportamiento de la variable estatura, registrndose los siguientes valores:
1,52 1,64 1,54 1,64 1,73 1,55 1,56 1,57 1,58 1,58 1,59 1,53 1,60 1,60 1,61 1,61 1,65 1,63 1,79 1,63 1,62 1,60 1,64 1,54 1,65 1,62 1,66 1,76 1,70 1,69 1,71 1,72 1,72 1,55 1,73 1,73 1,75 1,67 1,78 1,63
x fi fac f rel % fac rel
estatura
1,52
Ahora responde las preguntas:
1. Cantidad de alumnos que miden 1,67 m ______________
22
2. Cantidad de alumnos que miden menos de 1,70 m ______________
3. Porcentaje de alumnos que miden menos de 1,58 m ______________
4. Porcentaje de alumnos que miden menos de 1,75 m ______________
II. Tabulacin de una variable continua o discreta
Si la variable toma un gran nmero de datos para su tabulacin necesitamos varios
elementos, los que detallamos a continuacin:
i. Rango (R), considerado como la diferencia entre el mximo y mnimo
valor que toma la variable.
R = max valor - min valor
ii. Intervalos de clase (x), constituyen el nmero de grupos en que se
pueden dividir los valores de la variable. El nmero de clases no debe
ser ni muy pequeo ni muy grande, deben seleccionarse tantos
intervalos para que puedan entregar informacin til para su anlisis,
se recomienda que se elijan entre 5 a 20 intervalos.
La regla de Sturges nos da una aproximacin razonable para el nmero
de clases a elegir.
m = 1 + 3,3 log (n) donde n es el nmero de datos de la muestra
iii. Amplitud del intervalo de clase (a)
Est dado por la frmula:
a = recorrido = R
N de clases m
iv. Lmites de un intervalo, son los valores extremos de una clase. El
menor valor de la variable es considero como el lmite inferior, para
obtener el lmite inferior de la clase siguiente, basta sumar la amplitud
del intervalo (a) al lmite inferior de la clase anterior.
v. Marca de clase (xi), punto medio de cualquier intervalo.
xi = lim superior lim inferior
2
vi. Frecuencia absoluta (fi), es el nmero de casos que pertenecen a un
intervalo dado
vii. Frecuencia acumulada, es la suma de las frecuencias anteriores
viii. Frecuencia relativa (f rel), es el % de datos que se encuentra en una
clase
ix. Frecuencia acumulada relativa (fac rel), es la suma de los porcentajes
obtenidos en las frecuencias relativas anteriores.
Ejemplo
23
Se observ el tiempo de espera en la fila de una caja de supermercado con los siguientes resultados: Tiempo de espera en minutos
Vamos a construir una tabla con intervalos de tiempo de igual amplitud. Para esto:
1. Calcular el Rango R, o sea R=34.5 0.5 =34 2. Escogemos el nmero de intervalos (k). Escojamos k=7.
3. 58.4 k
Ramplitud del intervalo.
4. Determinamos los extremos de la primera clase tomando el menor valor y aproximando por abajo. Aqu, el menor es 0.5 y lo aproximamos para 0.
5. En los intervalos no consideramos el ltimo valor, es decir, el valor 5 no lo consideramos en primer intervalo, como tampoco consideramos el 10 en el segundo y as sucesivamente.
6. Smale la amplitud a 0 550 7. El lmite inferior del primer intervalo es 0 y el superior es 5. 8. Define las dems clases en forma similar. 9. Cuenta el nmero de elementos en cada clase 10. Construye la tabla.
Inte
rval
o d
e cl
ases
tiempox
Mar
ca d
e cl
ases
ix
Fre
cuen
cia
Ab
solu
ta
if
Fre
cuen
cia
Acu
mu
lad
a
fac
Fre
cuen
cia
rela
tiva
fr
el
Fre
cuen
cia
Acu
mu
lad
a re
lati
va f
ac r
el %
0 - 5 2,5 15 15 25 % 25,0 % 5 - 10 7,5 18 33 30 % 55,0 % 10 - 15 12,5 11 44 18,3 % 73,3 % 15 - 20 17,5 8 52 13,4 % 86,7 % 20 - 25 22,5 3 55 5 % 91,7 % 25 - 30 27,5 4 59 6,7 % 98,4 % 30 - 35 32,5 1 60 1,6 % 100 %
n= 60 100 %
4 7 12 21 27 18 12 0.5 20 8.5
18 26 3 7 4 9 10 11 1.5 12
8 8 2 13 34.5 12 7 10 5 5
25 16 9 27 19 16 21 13 7 10
5.5 2 16 8 7 2 3 4 12 18
7 1 4 8 5 6 1 5 2 0.5
24
Ejercicios
1. El puntaje obtenido en porcentaje por 60 alumnos en una prueba es:
75 25 41 36 65 73 20 36 65 66
33 79 77 85 14 71 45 13 32 73
96 17 40 22 17 60 95 21 79 30
69 55 14 78 99 89 97 26 20 71
95 69 86 39 25 40 16 60 86 16
10 16 23 45 30 50 61 72 80 80
Construye con estos datos una tabla de distribucin de frecuencias, con intervalos de amplitud 10
x xi fi fac frel % fac rel
%
10 - 19 14,5 9 9 9 % 9 %
20 - 29 24,5 8 17 8 % 17%
90 - 99
n = 100 100%
a) Cul es la frecuencia absoluta en el sexto intervalo?
b) Cul es la frecuencia relativa en el quinto intervalo?
c) En qu intervalo (s) se concentr el mayor puntaje?
d) Indica la frecuencia acumulada relativa del ltimo intervalo
e) Nombra la marca de clase del sptimo intervalo
f) Cuntos alumnos obtuvieron menos de 70 puntos?
g) Qu porcentaje de alumnos obtuvo entre 40 y 49 puntos?
h) Qu significa la frecuencia relativa del cuarto intervalo?
2. Los datos corresponden a la duracin en horas de uso continuo de 30 pilas alcalinas
iguales, sometidas a un control de calidad. Se le pide agrupar los datos en una tabla de
frecuencias con cinco intervalos de igual amplitud entre el 400 y el 900. Responda las
preguntas.
480 496 724 780 801 570 802 795 886 714
25
557 712 683 830 760 826 560 794 676 760 890 590 750 489 725 666 746 668 880 570
i. Cul es la amplitud de cada intervalo?
A. 50 B. 100 C. 150 D. 250
ii. Cul es la marca de clase del intervalo que contiene al dato 710?
A. 600 B. 650 C. 700 D. 714
iii. Cul es la marca de clase del intervalo que contiene al 725?
A. 11 B. 700 C. 725 D. 750
iv. Cul es la marca de clase del intervalo que contiene el mayor nmero de datos?
A. 11 B. 700 C. 725 D. 750
v. Cul es la frecuencia relativa del intervalo que contiene el menor nmero de
datos?
A. 700 B. 750 C. 760 D. 793
PARA PRACTICAR
1. Identifica cules variables son discretas o continuas:
- habitantes por Regin -
_____________________________
- estatura de 100 empleados de una empresa
_____________________________
- nmero de hijos de 100 familias
_____________________________
26
- nmero de automviles que pasan por un peaje el da domingo
_____________________________
- peso de 50 personas
_____________________________
- promedio de notas de un alumno
_____________________________
2. Se realiz una encuesta a 620 personas, por la compra de un Tablet.
Las respuestas de las personas encuestadas a la pregunta comprara usted un Tablet? a) Qu porcentaje de personas no responden? _________________
b) Qu porcentaje de personas comprara un Tablet? _________________
Para responder las preguntas debes calcular las frecuencias relativas
3. La siguiente informacin corresponde a los pesos en Kg. de ochenta personas: i. Construya una tabla de distribucin de f r e c u e n c i a s en
intervalos de amplitud 5, siendo el primer intervalo [50; 55].
ii. Calcule el porcentaje de personas de peso menor que 65 Kg. ____________
iii. Cuntas personas tienen peso mayor o igual que 70 Kg. pero menor
Respuestas a la pregunta
fi
Si 431
No 157
No responde 32
Total encuestados
620
RESPUESTAS A LA PREGUNTA fi f rel %
SI 431
NO 157
NO RESPONDE 32
TOTAL ENCUESTADO 620
27
que 85? ____________
60, 66, 77, 70, 66, 68, 57, 70, 66, 52, 75, 65, 69, 71, 58, 66, 67, 74, 61, 63, 69, 80, 59, 66, 70, 67, 78, 75,64, 71, 81, 62, 64, 69, 68, 72, 83, 56, 65, 74, 67, 54, 65, 65, 69, 61, 67, 73, 57, 62, 67, 68, 63, 67, 71, 68, 76, 61, 62, 63, 76, 61, 67, 67, 64, 72, 64, 73, 79, 58, 67, 68, 59, 69, 70, 66, 63, 66, 71, 62
4. Dada la distribucin siguiente, construya una tabla de distribucin de frecuencias en
la que aparezcan la frecuencia absoluta, la frecuencia relativa y las frecuencias
acumuladas
5. Se ha realizado una encuesta en 30 hogares en la que se les pregunta el n de personas que viven en la casa. Las respuestas obtenidas han sido las siguientes: 4, 4, 1, 3, 5, 3, 2, 4, 1, 6, 2, 3, 4, 5, 5, 6, 2, 3, 3, 2, 2, 1, 8, 3, 5, 3, 4, 7, 2, 3.
i. Calcule la distribucin de frecuencias de la variable obteniendo las
frecuencias absolutas, relativas y sus correspondientes acumuladas. ii. Qu porcentaje de hogares est compuesto por tres o menos personas?
_________________ iii. Qu porcentaje de personas vive en hogares de tres o menos miembros?
_________________ iv. Construya la tabla de distribucin de frecuencia absoluta, relativa y acumulada v. Agrupe por intervalos de amplitud 2 los valores de la variable, calcule su
distribucin de frecuencias y represente la frecuencia absoluta, relativa y acumulada.
6. En septiembre de 2013 el diario El Pas publicaba el siguiente grfico sobre la
situacin del turismo a nivel mundial.
xi
1 2 3 4 5 6
fi
5 7 9 6 7 6
28
i. Qu variable es la que se est presentando en el grfico? _____________________________
ii. Qu tipo de variable es? ___________________________
iii. Construya la tabla de distribucin de frecuencias
7. Se realiza un estudio en una ciudad sobre la capacidad hotelera y se obtienen los
siguientes resultados:
i. Represente la tabla de distribucin de frecuencia ii. Cul es el porcentaje de hoteles que disponen de entre 11 y 60
plazas? ___________________ iii. Cuntos hoteles tienen treinta o menos plazas?
___________________ iv. Calcule las marcas de clase de cada intervalo.
v. Cul es la proporcin de hoteles que disponen de entre 15 y 50 plazas? ___________________
vi. Qu hiptesis puede hacer para este ltimo clculo? _____________________________________________________ _______________________________________________________________________________________________________________
8. Una entidad bancaria dispone de 50 sucursales en el territorio nacional y ha observado el nmero de empleados que hay en cada una de ellas para un estudio posterior. Las observaciones obtenidas han sido:
N de plazas N de hoteles
0 - 10 25
oct-30 50
30 - 60 55
60 - 100 20
29
12, 10, 9, 11, 15, 16, 9, 10, 10, 11, 12, 13,14,15, 11, 11, 12, 16, 17, 17,16,16, 15, 14, 12, 11 11, 11, 12, 12, 12, 15, 13, 14, 16, 15, 18, 19, 18, 10, 11, 12, 12, 11, 13, 13, 15, 13, 11, 12.
i. Calcule la distribucin de frecuencias de la variable obteniendo la frecuencia absoluta, relativa y sus correspondientes acumuladas.
ii. Qu porcentaje de sucursales tiene ms de 15 empleados? ___________________________________
iii. Construya la tabla de distribucin de frecuencias respectivas, use intervalos de
amplitud 3
9. En la siguiente tabla de distribucin de frecuencias se muestran 175 datos
Variable xi
Frecuencia absoluta
fi
Frecuencia Acumulada
fac
Frecuencia Relativa frel %
Frecuencia acumulada
relativa fac rel%
11 - 15 5 5 0,03 3%
16 20 12 17 0,07 7%
21 25 20 37 0,12 12%
26 30 30 67 0,17 17%
31 35 35 102 0,20 20%
36 40 32 134 0,19 19%
41 45 26 160 0,15 15%
46 - 50 15 175 0,09 9%
total n = 175 0,99 1 99% 100%
i. Qu porcentaje de personas tiene entre 11 y 15 aos?
________________________________
ii. Cules son las edades consideradas en el quinto intervalo?
________________________________
iii. Cuntas personas tienen entre 26 y 30 aos?
________________________________
iv. Cuntas personas tienen menos de 45 aos?
________________________________
v. Qu porcentaje de personas tiene menos de 35 aos?
________________________________
10. Se encuest a 54 familias de un determinado grupo socioeconmico, sobre su
consumo mensual en telefona mvil. Las respuestas obtenidas, en miles de pesos,
son las siguientes.
12 26 31 11 45 11 16 35 23 46 28 50 13 38 32 28 34 19 21 35 41 13 16 24 28 32 42 14 17 22 37 18 15 23 27 31 10 23 35 12 14 29 33 27 32 19 31 28 17 36 41 38 20 - 28
30
i. Organizar los datos entregados en una tabla de frecuencia para datos agrupados,
distribuyndolos en intervalos de amplitud 5.
ii. La tabla de frecuencias solicitada debe contener:
a. Marca de clase
b. Frecuencia absoluta
c. Frecuencia acumulada
d. Frecuencia relativa
e. Frecuencia acumulada relativa
Por favor revise el siguiente enlace para complementar su estudio: http://jrvargas.wordpress.com/estadistica/
Nombre del contenido del enlace Ejercicios De Distribucin De Frecuencias
Enlace http://jrvargas.files.wordpress.com/2010/07/ejercicio1.pdf
31
Antecedentes de la Unidad 2
Nombre Unidad Objetivos de aprendizaje de la Unidad
Sub-unidades
Representacin Grfica El alumno (a) ser capaz de: 1. Aplicar conocimientos
entregados en el
mdulo para
elaboracin de
distintos tipos de
grficos estadsticos.
2. Analizar informacin
representada en
diversos tipos de
grficos.
3. Inferir conclusiones a
partir de informacin
entregada en grficos.
4. Evaluar el
comportamiento de
datos presentados en
grficos estadsticos
.
2.1Tipos de grficos 2.1.2 Aplicacin
32
Nombre de la Unidad 2: Representacin Grfica
2.1. Nombre de la Sub-unidad: Tipos de Grficos
Un grfico estadstico es una representacin visual de una serie de datos estadsticos. Es una herramienta muy eficaz, ya que un buen grfico:
capta la atencin del lector;
presenta la informacin de forma sencilla, clara y precisa;
no induce a error;
facilita la comparacin de datos y destaca las tendencias y las diferencias;
ilustra el mensaje, tema o trama del texto al que acompaa.
La utilidad de los grficos estadsticos consiste en que nos permiten interiorizarnos de inmediato de la caracterstica ms importante de una distribucin de frecuencias. Los grficos estadsticos ms conocidos y utilizados son:
i. Pictograma
ii. Grfico Circular
iii. Grfico de barras
iv. Histograma
v. Polgono de frecuencias
En un estudio estadstico los datos obtenidos se pueden presentan por medio de cualquier grfico de los mencionados, donde se relacionan los valores de la variable y su respectiva frecuencia. Observemos lo siguiente: Si se trata de una variable cualitativa:
LA FRECUENCIA ES: SE REPRESENTA EN:
ABSOLUTA DIAGRAMA DE BARRAS
RELATIVA CIRCULAR
PORCENTAJE PICTOGRAMA
33
Si se trata de una variable cuantitativa discreta:
LA FRECUENCIA DE CUALQUIER TIPO SE REPRESENTA EN:
DIAGRAMA DE BARRAS
POLGONO DE FRECUENCIAS
CIRCULAR Finalmente, se trata de una variable cuantitativa continua:
LA FRECUENCIA DE CUALQUIER TIPO SE REPRESENTA EN:
HISTOGRAMA
POLGONO DE FRECUENCIAS
1. PICTOGRAMA
Es utilizado para variables cualitativas, sus datos se representan por imgenes alusivas al
fenmeno estudiado. Se trata de imgenes expresivas pero poco precisas.
Ejemplo 1: Para evaluar el conocimiento del concepto de Seguridad Social en la opinin pblica, se realiz una encuesta telefnica entre el 14 de Febrero y el 28 de Febrero de 2013. Se entrevist a una muestra de 500 personas, hombres y mujeres, entre 15 y 70 aos, de los GSE Alto, medio y bajo,
Los resultados se muestran en la siguiente tabla:
RESPUESTA PERSONAS
CONSULTADAS
SI 154
NO 273
NO SABE 73
TOTAL 500
34
Su pictograma es:
Ejemplo 2:
Una multitienda registra la forma de pago en una muestra de clientes, segn grupo de edad, la que se muestra en la siguiente tabla de frecuencias:
MEDIO DE PAGO
18 A 29 30 A 60 TOTAL
EFECTIVO 64 136 200
TARJETA 32 188 220
CHEQUE 8 32 40
Su pictograma es:
0
100
200
300
400
500
600
SI NO NO SABE TOTAL
PERSONAS CONSULTADAS
PERSONASCONSULTADAS
0
50
100
150
200
250
18 A 29 30 A 60 TOTAL
EFECTIVO
TARJETA
CHEQUE
35
Ejemplo 3: Con qu nota evala la atencin del Consultorio Norte?
Nota % de casos
1 39,5
2 15,7
3 13
4 8,5
5 10,5
6 5,9
7 6,9
TOTAL 100%
Su pictograma es:
2. GRFICO CIRCULAR
Este tipo de grfico es utilizado para mostrar porcentajes y proporciones. Cada sector del crculo indica la parte proporcional a la frecuencia absoluta. Para su construccin se utiliza la siguiente frmula: Los grados de cada sector se obtienen multiplicando la frecuencia absoluta (fi) por 360 y dividiendo por el nmero total de datos (n)
fi =
0
5
10
15
20
25
30
35
40
45
1 2 3 4 5 6 7 TOTAL
% de casos
% de casos
36
El nmero de elementos comparados dentro de un grfico circular, no deben ser ms de 7, ordenando los segmentos de mayor a menor, iniciando con el ms amplio a partir de las 12 como en un reloj.
Ejemplo 1: La superficie de los 5 ocanos en millones de km2 es:
Antrtico = 20, rtico = 12, Atlntico = 105, Indico = 73 y Pacfico = 180.
Lo expresamos en la siguiente tabla de distribucin de frecuencias.
Ejemplo 2: Ocho vecinos conversan sobre el nmero de hermanos que tiene cada uno. Llegan a la informacin que se muestra en la siguiente tabla:
SUPERFICIE EN KMS CUADRADOS
ANTRTICO
RTICO
ATLNTICO
NDICO
PACFICO
OCEANOS SUPERFICIE EN MILLONES DE
KMS CUADRADOS
ANTRTICO 20
RTICO 12
ATLNTICO 105
NDICO 73
PACFICO 180
37
Su grfico circular es:
3. GRFICO DE BARRAS
Las barras se utilizan generalmente para representar atributos cualitativos o
cuantitativos discretos. La longitud (largo de la barra)es igual a la frecuencia absoluta
de cada dato. Las barras pueden ser horizontales o verticales.
Ejemplo 1: Las remuneraciones medias de sectores laborales se expresan en la
siguiente tabla:
Su grfico de barras se representa por:
fi
1
2
3
4
n
N DE HERMANOS
fi
1 2
2 2
3 2
4 2
n 8
SECTOR REMUNERACIN
INDUSTRIAL 800.000
BANCARIO 950.000
ESTATAL 670.000
EDUCACIONAL 580.000
COMERCIO 350.000
38
Ejemplo 2: El entrenador de un equipo de natacin debe elegir a uno de sus integrantes para la prxima competencia de estilo libre. Segn los tiempos en segundos que obtuvieron los postulantes de las cinco ltimas carreras de 100 m de estilo libre.
Diego 61,7 61,7 62,3 62,9 63,1
Toms 61,5 62,9 62,9 63,7 63,7
Sergio 60,7 62,4 62,7 62,7 63,2
Su grfico de barras horizontales es:
0
0.2
0.4
0.6
0.8
1
REMUNERACIONES
#REF!
0 0.2 0.4 0.6 0.8 1
1
#REF!
#REF!
#REF!
39
4. HISTOGRAMA
Se utiliza para representar una tabla de frecuencias de intervalos de clase.
Sobre el eje horizontal (X) de las abscisas se representan los intervalos de clase y
sobre el eje vertical (Y) de las ordenadas, las frecuencias de los intervalos.
El grfico consiste en un conjunto de rectngulos adyacentes cuya base
representa un intervalo de clase y cuya altura representa la frecuencia del
intervalo.
Ejemplo 1:
La edad en aos de 38 docentes se presenta en la siguiente tabla de frecuencias: Su histograma es:
5. POLGONO DE FRECUENCIAS
Es la resultante de unir los puntos medios de los techos de las barras de un
histograma, tal como se muestra en la figura.
Usemos el ejemplo anterior
fi
EDAD EN AOS
31 - 35 1
36 - 40 5
41 - 45 5
46 - 50 12
51 - 55 9
56 - 60 6
n = 38
40
EJERCICIOS
i. Dada la siguiente tabla de distribucin, grafica el Polgono de Frecuencias:
intervalo de clases marca de clase frecuencia absoluta frecuencia relativa
x xi fi frel %
20 - 24 22 2 10
24 -28 26 3 15
28 - 32 30 6 30
32 - 36 34 6 30
36 - 40 36 3 15
n = 20 100%
ii. Representa mediante grfico de barras, los beneficios de la empresa COPEC
(en millones) que han sido:
fi
EDAD EN AOS
31 - 35 1
36 - 40 5
41 - 45 5
46 - 50 12
51 - 55 9
56 - 60 6
n = 38
41
18 %
21%
33%
1
14%
14%
AO MILLONES DE
AO MILLONES DE
DOLARES DOLARES
1990 200 1997 400
1991 250 1998 300
1992 250 1999 350
1993 300 2000 400
1994 350 2001 375
1995 425 2002 425
1996 400 2003 430
Responde: a) Qu ao obtuvo mayores ganancias? ____________
b) Cul fue el porcentaje de ganancia 2.002? _____________
c) Qu porcentaje de ganancias obtuvo entre los aos 1.990 y 2.000? ____________
d) Qu ganancia en millones de dlares obtuvo entre los aos 1.990 y1.997? ___________
iii. Analizar un grfico circular a partir de la siguiente tabla de frecuencia que
resume las preferencias de un grupo de encuestados hacia cinco candidatos
a eleccin de Alcaldes:
Clase Frecuencia
Candidato 1 25
Candidato 2 30
Candidato 3 45
Candidato 4 20
Candidato 5 20
n = 140
Respuesta: as nos queda el grfico circular
42
Responde:
a) Qu porcentaje obtendrn los candidatos 1, 4 y 5 si juntan sus votos? _______________
b) Qu porcentaje obtienen los candidatos 1,3 y 5? _______________
c) Si los electores fueran 1.500, cuntos votos obtendra el candidato 3? _______________
iv. Construye un Histograma con los datos entregados en la siguiente tabla de
distribucin de frecuencias.
Responde:
a) Cul es la frecuencia acumulada hasta el cuarto intervalo? ___________
b) Cul es la frecuencia relativa del tercer intervalo? ___________
c) Cul es la frecuencia relativa acumulada porcentual hasta el quinto intervalo?
_________________________
d) Qu porcentaje representan los intervalos 1, 2 y 3? __________
e) Cul es la frecuencia absoluta del sexto intervalo? __________
v. Un equipo de ftbol en su trayectoria tiene 120 partidos ganados, 60 perdidos y 30
empatados. Al representar estos datos mediante pictogramas se obtiene:
Partidos Ganados
120
Partidos Perdidos
60
Partidos Empatados
30
Otra forma de representar los datos mediante pictogramas se muestra en la siguiente figura:
xi fi
A 5
B 11
C 11
D 4
E 15
F 18
G 24
Total 88
43
Partidos Ganados 120
Partidos Perdidos 60
Partidos Empatados 30
Confecciona el pictograma respectivo
vi. Dado el siguiente Histograma responde:
MILES DE HOGARES SEGN INGRESOS (EUROS) AO 2.008
a) Cuntos hogares obtuvieron por ingreso entre 3.000 y 4.999 euros? __________
b) Cuntos hogares obtuvieron por ingreso anual entre 1.500 y 1.999 euros? ____
c) Cuntos hogares obtuvieron menos de 500 euros por ingreso anual? _________
vii. Nmeros de aos cumplidos de antigedad de los trabajadores de la
empresa Alianza hasta el 31 de diciembre de 2013.
Intervalo de clase x
marca de clase xi fi fac frel % fac rel %
13 - 16 14,5 2 2 4,2 4,2
16 -19 17,5 6 8 12,5 16,7
19 - 22 20,5 10 18 20,8 37,5
22 - 25 23,5 16 34 33,3 70,8
25 - 28 26,5 8 42 16,7 87,5
28 - 31 29.5 5 47 10,4 97,9
31 - 34 32,5 1 48 2,1 100
n = 48 100%
a) Con los datos entregados construye un polgono de frecuencias.
44
b) Analiza la grfica anterior y piensa que eres el gerente general. Explica con tus
propias palabras toda la informacin sobre la antigedad de los trabajadores, qu
puedas inferir de ella? -
______________________________________________________________________________________________
___________________________________________________________________
viii. Del siguiente problema representa los datos en un grfico circular
indicando el porcentaje correspondiente a cada categora.
Un transporte carg su camin con los siguientes productos:
.
a) Cul es la variable del problema?
b) Qu tipo de variable es?
c) En cuntas categoras se clasific la variable?
d) Cul es la frecuencia de la ms alta calificacin?
PRODUCTO Kg cargados
A 450
B 300
C 500
D 1.600
E 1.750
TOTAL = 4.600
45
Antecedentes de la Unidad 3
Nombre Unidad Objetivos de aprendizaje de la Unidad
Sub-unidades
Medidas De Tendencia Central
El alumno (a) ser capaz de: 1. Aplicar el clculo de las
medidas de tendencia
central en datos
agrupados y no
agrupados.
2. Analizar el
comportamiento de las
medidas de
centralizacin en
ejercicios prcticos.
3. Evaluar el
comportamiento de las
medidas de tendencia
central en situaciones
problemticas.
.
3.1 Sub Unidad 1: Media aritmtica 3.2 Sub Unidad 2: Moda y Mediana
46
Nombre de la Unidad 3: Medidas de Tendencia Central
3.1 Nombre de la Sub-unidad: Moda, Mediana y Media Aritmtica
Las medidas de centralizacin o de tendencia central son medidas de un conjunto de datos que proporcionan un valor simple y representativo, que resume un gran volumen de informacin. Este valor tiende a ubicarse en el centro del conjunto. Las ms conocidas son: media aritmtica, la moda y la mediana.
Estos indicadores estadsticos muestran hacia qu valor o hacia qu valores se agrupan los datos en anlisis. Son utilizadas para comparar un dato con otro, por ejemplo el promedio de notas en Matemticas del curso A con el promedio de notas del curso B en la misma asignatura.
Las medidas de centralizacin nos sirven para representar el valor medio de los datos, es decir, el valor que refleja el tamao del dato ms esperado. Ello nos indica la posicin en la
que se encuentra en el centro de los datos.
1. MEDIA ARITMTICA x
Hay que entender que existen dos formas distintas de trabajar con los datos tanto
poblacionales como muestrales: sin agruparlos o agrupndolos en tablas de frecuencias. Esta
apreciacin nos sugiere dos formas de representar la media aritmtica.
Media (Media aritmtica).
Es el promedio con el que probablemente ests ms familiarizado. La media
aritmtica o promedio se representa por . La media se encuentra al sumar todos los
valores de la variable X (denotada por ) y dividir el resultado entre la cantidad
de valores utilizados (n).
47
Clculo de la Media Aritmtica en Datos no agrupados
Ejemplo 1: Un conjunto de datos consta de los cinco valores 6, 3, 8, 6 y 4. Encuentra la media.
Solucin.
Con la frmula X
Xn
, encontramos
6 3 8 6 4 275.4
5 5
XX
n
Por lo tanto, la media aritmtica es 5.4.
Ejemplo 2: El profesor de matemticas desea conocer el promedio de las notas finales
de 10 alumnos de su clase. Las notas de los alumnos son:
7.2 8.1 6.4 9.0 8.5 9.0 7.5 8.8 4.2 10.0 Cul es el promedio de notas de los alumnos de su clase?
Solucin.
Aplicando la frmula tenemos:
7.2 8.1 6.4 9.0 7.5 8.8 4.2 10.0 78.77.87
10 10
XX
n
El promedio de los 10 alumnos de la clase de matemticas es de 7.87.
Clculo de la Media Aritmtica en Datos no agrupados en tablas de frecuencias
Ejemplo 1: La siguiente tabla de frecuencia muestra el nmero de preguntas de 81
encuestados sobre su preferencia al adquirir una determinada marca de automvil, de
la cual se eligieron 6 alternativas.
MARCAS DE AUTOMVILES N DE PERSONAS ENCUESTADAS
1 15
2 13
3 8
4 19
5 21
6 5
Solucin.
48
i. Realizar la sumatoria del producto resultante de las clases por su frecuencia absoluta.
Para efectos del clculo de la media, deberamos sumar 15 veces el valor 1, 13 veces el
valor 2, 8 veces el valor 3, y as sucesivamente hasta llegar a la ltima clase:
(1*15) (2*13) (3*8) (4*19) (5*21) (6*5) 276X
ii. Dividir la sumatoria sobre el nmero total de datos.
2763.41
81
XX
n
En promedio los encuestados eligieron aproximadamente 3 marcas de automviles
mayoritariamente (el valor exacto es 3.41).
Clculo de la Media Aritmtica en Datos Agrupados
donde xi = marca de clase; fi = frecuencia absoluta, n = nmero de casos o frecuencia total Ejemplo En la siguiente tabla de datos agrupados calcular la media aritmtica
x xi fi xi.fi
60 - 64 62 5 310
64 - 68 66 18 1.188
68 - 72 70 42 2.940
72 - 76 74 27 1.998
76 - 80 78 8 624
n = 100 7.060
Solucin: Aplicamos la frmula
Por tanto, la media aritmtica es, 70,60
49
2. MEDIANA (Me)
Estudiaremos dos casos:
1. Clculo de la Mediana para datos no agrupados
Ejemplo 1: Si el nmero de datos es impar
10 1 5 12 9 11 3 7 12 2,
Solucin: debemos ordenar de menor a mayor
1 2 - 3 5- 7- 8 -9 10 -11- 12 , luego tomamos los dos datos que estn al
centro, en este caso 7 y 8, los sumamos y dividimos por 2
Por tanto, la mediana, en este ejemplo en particular es 7,5
Ejemplo 2: Si el nmero de datos es impar
7 9 1 3- 5 8 -2,
Solucin: debemos ordenar de menor a mayor los datos
1 2 3- 5 -7 -8 -9, contamos los datos (en total 7 datos) y ubicamos el dato que
est al centro, en este ejemplo, es el nmero 5, por tanto, la Mediana es 5.
Clculo de la Mediana para datos a g r u p a d o s La Mediana en datos agrupados equivale al dato que se encuentra en toda la mitad, y para encontrarlo se necesita el mtodo estudiado anteriormente para datos no agrupados; y luego se requiere de aplicar la siguiente frmula.
12
i
i
i
na F
Me Lf
donde
Me= Mediana Li = Lmite inferior del intervalo donde se encuentra la mediana a = amplitud
Mediana.
La mediana es el valor que se encuentra en el centro de una secuencia ordenada de datos. Es el
valor que ocupa la posicin media cuando los datos estn clasificados en orden de acuerdo
con su tamao. La mediana se representa por Me.
Para calcular la Mediana siempre se deben ordenar los datos en forma creciente.
50
n = Nmero de datos Fi-1 = frecuencia acumulada anterior al intervalo que contiene la mediana fi = La frecuencia absoluta que corresponde al intervalo que contiene la mediana Ejemplo: La tabla de datos corresponde a las edades de 50 alumnos de la Jornada Nocturna del Liceo Mario Bahamonde Silva de Antofagasta Curso Intervalo
x Marca
de clase:
Xi
Frecuencia absoluta:
fi
Frecuencia absoluta
acumulada: Fi
Frecuencia relativa
porcentual
100.n
fi =%
Frecuencia porcentual acumulada
%
Xi.fi
1 15 - 22 18,5 37 37 0,74=74% 74% 684.5 2 22 - 29 25,5 5 42 0,10=10% 84% 127.5 3 29 - 36 32,5 3 45 0,06=6% 90% 97.5 4 36 - 43 39,5 4 49 0,08=8% 98% 158 5 43 - 50 46,5 0 49 0,00=0% 98% 0 6 50 - 57 53,5 0 49 0,00=0% 98% 0 7 57 - 64 60,5 1 50 0;02=2% 100% 60.5
Total n=50 1,00=100% La mediana es la edad que se encuentra en el centro de todas las edades para calcularla utilizaremos la frmula Donde
Me= Mediana, la cual se encuentra ubicada en el primer intervalo pues n 50
252 2 y este
dato se encuentra en la frecuencia acumulada del primer intervalo. Li = Lmite inferior del intervalo que contiene la mediana, es decir, 15 a = amplitud = 7 porque 22 - 15 = 7 n = Nmero de datos = 50 Fi-1 = frecuencia acumulada anterior al intervalo que contiene la mediana = 0 porque antes de este primer intervalo no hay datos acumulados. fi = La frecuencia absoluta que corresponde al intervalo que contiene la mediana = 37
12
i
i
i
na F
Me Lf
51
Por tanto:
507 0
215
37
7 2515
37
17515
37
15 4,73
19,73
Me
Me
Me
Me
Me
Por tanto, la mediana de las edades de los alumnos de la Jornada Nocturna es, Me = 19 aos
3. MODA (Mo)
La moda, Mo, de una distribucin estadstica es el valor de la variable que ms se repite, el de mayor frecuencia absoluta. Clculo de la Moda (Mo) para datos no agrupados Ejemplo 1: Determina la moda para los siguientes datos: 2 4 3 0 2 1 1 2 3 3 3 1 1 1 0 1 4 0 1 3 4 0 1 2 Solucin: El valor que ms repite es el 1, aparece ocho veces, por tanto, Mo = 1 Ejemplo 2: Determinar la moda del siguiente conjunto de datos: 1,2,3,3,4,5,6,7,7,3,1,9,3 Solucin: La moda de este conjunto de datos es igual a 3 y la muestra se considera Unimodal Ejemplo 3: 1,2,3,4,4,5,2,1,3,4,2,-3,4,6,3,3 Solucin: Las modas de este conjunto de datos son 3 y 4 ya que ambas tienen la ms alta frecuencia, por lo que la muestra es binomial.
Moda
La moda de una poblacin o de una muestra, es aquel valor que se
presenta con mayor frecuencia (aquel que se repite ms veces).
En el caso de que dos valores presenten la misma frecuencia. Dcimos
que existe un conjunto de datos bimodal. Para ms de dos modas
hablaremos de un conjunto de datos multimodal.
52
Ejemplo 4: 1,2,3,4,5,6,7,8,9 Solucin: La muestra no contiene ningn dato repetido por lo que se considera que no existe moda.
Moda para datos agrupados
Para determinar la moda para datos agrupados en clases de igual tamao su clculo se
realiza por medio de la siguiente frmula:
Mo = Li + ___d1__ . a , siendo: d1 + d2
Li = Lmi te real inf eri or del intervalo de la m oda. El intervalo de la moda es el intervalo con mayor frecuencia absoluta.
d1 = Diferencia entre la frecuencia absoluta del intervalo de la moda y el intervalo anterior. d2 = Diferencia entre la frecuencia absoluta del intervalo de la moda y el intervalo posterior. a = amplitud de los intervalos. Ejemplo 1: Calcular la moda de la distribucin de puntajes de 200 estudiantes que rindieron la PSU el ao 2012, que se muestra en la siguiente tabla Solucin: Utilizamos la frmula
INTERVALOS xi f fac
350 - 400 375 4 4
400 - 450 425 6 10
450 - 500 475 9 19
500 - 550 525 20 39
550 - 600 575 31 60
600 - 650 625 70 130
650 - 700 675 40 170
700 - 750 725 10 180
750 - 800 775 8 188
800 - 850w 825 2 20
875 n = 200
53
Mo = Li + ___d1__ . a d1 + d2
Li = 600 d1 = 70 -31 = 39 d2 = 70 40 = 30 a = 50 Mo = 600 + ( 30 / 39 + 40). 50 Mo = 600 + (0,379).50 Mo = 600 + 18,95 Mo = 618,95, aproximando, la Moda, es decir, el puntaje que ms se repiti en la muestra de 200 alumnos que rindieron la PSU el ao 2012, es 619 puntos.
EJERCICIOS DE APLICACIN
1. En la conferencia El Tratado de Libre Comercio con Asia, realizada en el hotel Antofagasta Inn para altos ejecutivos, la asistencia diaria fue la siguiente:
DIA N DE PERSONAS
LUNES 20
MARTES 15
MIRCOLES 16
JUEVES 16
VIERNES 18
SBADO 16
DOMINGO 25
n =
i. Cul es la moda de la asistencia? _____________________ ii. Qu tipo de variable es la moda? ______________________ iii. Qu da fue la moda de asistencia? ______________________ iv. Qu tipo de variable aleatoria es el da de moda en asistencia? ________________
Solucin: i. La moda de asistencia es Mo = 16 ii. El tipo de variable es de cantidad iii. El da con mayor frecuencia de asistencia fue Mo = Domingo iv. El tipo de variable es de cualidad
2. El nmero de personas que ingres al cine en la primera semana de Febrero
registr las siguientes cantidades:
54
i. Qu da fue la moda en asistencia?
ii. Cul es la moda en asistencia?
3. En la fiesta de graduacin 2013, de la Escuela Jos Papic se observ el color del vestido de las primeras 25 alumnas que llegaron al saln de fiestas, obtenindose los resultados que se muestran en la siguiente tabla:
Calcula la Mediana (Me)
4. El dueo de un negocio de venta de aparatos electrodomsticos tiene diez
vendedores en el rea metropolitana. En una determinada semana, el dueo
seleccion una muestra de cinco sucursales y encontr que el nmero de LCD
vendidos en cada sucursal fue:
SUCURSALES fi
LAS CONDES 5
LA FLORIDA 3
PROVIDENCIA 6
SANTIAGO 5
PEALOLEN 1
n = 20
DIA PERSONAS QUE INGRESARON
LUNES 150
MARTES 200
MIRCOLES 180
JUEVES 200
VIERNES 275
SBADO 200
DOMINGO 300
Color del Vestido fi
Blanco 2
Negro 5
Rojo 7
Azul 6
Verde 3
Gris 1
Amarillo 1
n = 25
55
Calcular la Media, la Mediana y la Moda 5. Una muestra de 20 empleados de Alto Las Condes, obtuvo como sueldo
mensual, los siguientes datos: 340.000, 240.000, 330.000, 240.000, 325.000, 240.000, 240.000, 305.000, 240.000, 300.000, 240.000, 290.000, 240.000, 280.000, 240.000, 280.000, 255.000, 265.000, 255.000, 265.000, Calcula: a) Media, b) Mediana, c) Moda
6. En las exportaciones de cierto artculo, el porcentaje de impuestos que debe pagar su productor depende del pas al que se desea introducir el producto. La tabla siguiente muestra estos porcentajes y las ventas obtenidas en el ltimo trimestre. Determina el promedio global de lo que se paga por impuestos:
7. El entrenador de un equipo de atletismo debe elegir a uno de sus integrantes para la prxima competencia. Segn los tiempos en segundos que obtuvieron los postulantes de las cinco ltimas carreras de 100 m, qu atleta le conviene elegir?
Para poder decidir, calcula las medidas de tendencia central de cada uno si existen.
8. Parece ser que una mquina automtica que llena recipientes esta trabajando de manera anormal. Una verificacin de los pesos del contenido de un nmero de recipientes revel lo siguiente:
Peso en gramos Nmero de recipientes
130 - 139 3
140 - 149 7
150 - 159 19
160 - 169 36
170 - 179 38
180 - 189 9
190 - 199 7 200 - 209
3
PAIS % VENTAS
ARGENTINA 7,4 5.000.000
CHINA 5,5 20.000.000
INDIA 10,1 3.000.000
USA 4,2 30.000.000
Pedro 61,7 61,7 62,3 62,9 63,1
Pablo 61,5 62,9 62,9 63,7 63,7
Fernando 60,7 62,4 62,7 62,7 63,2
56
i. Si el 50% de los recipientes tiene un peso mayor o igual a 168 gramos se
detendr el proceso. Justificando su respuesta, usted debe decidir si se sigue
o no con el proceso.
ii. Un ingeniero experto dice que antes de seguir con el proceso, se debe
verificar el peso promedio de los recipientes, el cual no debe ser superior a
166 gramos. De acuerdo con el concepto del ingeniero. El proceso se debe
detener?
iii. Cul es peso ms frecuente de los recipientes?
9. Susana y Catalina realizaron una encuesta a algunos de sus compaeros de la
carrera de Medicina.
Ellas queran averiguar cuntas veces al mes practicaban algn deporte.
Estas fueron las respuestas obtenidas:
i. Completa la tabla de frecuencias
x xi fi fac frel % fac rel %
0 4 9
4 8 10
8 12 12
12 16 8
16 20 10
20 24 6
Ahora conteste:
a) Cuntos estudiantes fueron encuestados?
_______________________________________________________________________________
N de veces fi
0 4 9
4 8 10
8 12 12
12 16 8
16 20 10
20 24 6
57
b) Cuntos estudiantes practican deporte menos de 12 veces en el mes?
_______________________________________________________________________________
c) Cuntos estudiantes practican deporte ms de 16 veces en el mes?
_______________________________________________________________________________
d) Cul es el intervalo que tiene mayor nmero de elecciones? Qu informacin puede
concluir?
_______________________________________________________________________________
_______________________________________________________________________________
e) De acuerdo a su respuesta anterior, si tuviese que asignar un nmero representativo
del intervalo que tiene la mayor cantidad de elecciones, cmo lo hara y por qu?
_______________________________________________________________________________
_______________________________________________________________________________
_______________________________________________________________________________
f) Con la informacin del recuadro, comente en qu se asemeja y en qu se diferencia
respecto del clculo de la moda.
_______________________________________________________________________________
Las ltimas dos preguntas se refieren al clculo de la moda, en datos agrupados en intervalos. Para ello, debe seguir los siguientes pasos:
1. Identificar el intervalo que tiene mayor frecuencia absoluta.
2. Determinar la marca de clase del intervalo con mayor frecuencia absoluta, ese nmero
corresponder a la moda.
58
_______________________________________________________________________________
_______________________________________________________________________________
Sigamos avanzando.
1. Qu representa la marca de clase de cada intervalo?
_______________________________________________________________________________
_______________________________________________________________________________
2. Qu relacin puede encontrar entre la marca de clase y el clculo del promedio de
das que los estudiantes encuestados practican algn deporte?
_______________________________________________________________________________
_______________________________________________________________________________
_______________________________________________________________________________
Las preguntas anteriores apuntan al clculo la media aritmtica en datos agrupados en
intervalos. Observe la estrategia que se debe seguir:
Ahora conteste:
Como los datos se encuentran agrupados en intervalos, debemos buscar un nmero representativo de cada uno de ellos; en consecuencia, trabajaremos con la marca de clase.
1. Multiplique cada marca de clase por la frecuencia absoluta que le corresponde.
2. Sume los resultados anteriores.
3. Divida la suma por el nmero de personas entrevistadas.
4. De esa manera encuentra la media aritmtica de datos agrupados en intervalos.
59
En promedio, cuntas veces a la semana practican deportes los estudiantes encuestados?
Qu informacin obtiene con ese dato?
_______________________________________________________________________________
_______________________________________________________________________________
_______________________________________________________________________________
Si compara la moda y la media aritmtica, hay alguna relacin entre ellos? Qu puede
concluir al respecto?
_______________________________________________________________________________
_______________________________________________________________________________
10. Los pases pertenecen a las diez principales economas del mundo, esta fue su
poblacin el ao 2.000, segn el Banco Mundial, en su Informe sobre el Desarrollo
Mundial.
i. Calcule el % de poblacin para cada uno de los pases.
ORDEN PAISES POBLACION
1 USA 270
2 JAPN 126
3 ALEMANIA 82
4 FRANCIA 59
5 INGLATERRA 59
6 ITALIA 58
7 CHINA 960
8 BRASIL 166
9 CANADA 31
10 ESPAA 39
POBLACIN EN MILLLONES DE HABITANTES
60
ii. Cul es la poblacin promedio de la poblacin de las diez principales economas?
iii. Cul es el pas donde se ubica el 25% menos de poblacin?
iv. Cul es el pas donde est el 25% de mayor cantidad de poblacin?
11. Calcular la Media Aritmtica, la Mediana y la Moda en la siguiente tabla:
12. E
l
t
r
a
t
a
m
iento de los nios con desrdenes de la conducta puede ser complejo.
El tratamiento se puede proveer en una variedad de escenarios
dependiendo de la severidad de los comportamientos. Adems
del reto que ofrece el tratamiento, se encuentran la falta de
cooperacin del nio/nia y el miedo y la falta de confianza de los
adultos. Para poder disear un plan integral de tratamiento, el
siquiatra de nios y adolescentes puede utilizar la informacin del
nio, la familia, los profesores y de otros especialistas mdicos
para entender las causas del desorden. Para ello, un siquiatra local
ha considerado una muestra aleatoria de 20 nios, anotando el
tiempo necesario que requiere en cada nio para lograr un plan
integral del tratamiento, obtenindose lo siguiente (en horas):
6 7 7 8 8 8 8 9 9 9 9 9 9 9 10 10 10 10 10 11
Calcule las medidas de tendencia: Media, Mediana y Moda
13. El tiempo en segundos registrado por un grupo de 40 atletas en los 100 metros
planos, presenta el siguiente conjunto de datos estadsticos numricos:
13 12 12 11 10 12 14 14 11 12
12 11 11 12 13 13 14 12 10 16
13 13 12 12 12 14 14 14 13 14
11 11 12 12 14 12 12 11 10 12
x xi fi fac xi . fi
1,70 - 1,75 1,725 1 1 1.725
1,75 - 1,80 1,775 3 4 5.325
1,80 - 1,85 1, 825 4 8 7.3
1,85 - 1,90 1,875 8 16 15
1,90 - 1,95 1,925 5 21 9.625
1,95 - 2,00 1,975 2 23 3.95
n = 23 42.925
61
a. Construya una tabla de distribucin de frecuencias
b. Indique el nmero de atletas con un tiempo de 13 segundos __________________________
c. Indique el porcentaje de atletas con un tiempo de 13 segundos _______________________
d. Cuntos atletas recorren los 100 metros en un tiempo inferior a 13 segundos? _______
e. Cuntos atletas recorren los 100 metros en un tiempo superior a 13 segundos? ______
f. Qu porcentaje de los atletas recorre los 100 metros en un tiempo mximo de 13
segundos? ________________
g. Qu porcentaje de los atletas recorre los 100 metros en un tiempo mnimo de 13
segundos? ________________
h. Determine la moda del grupo de atletas ______________________
i. Cul es el tiempo promedio del grupo en los 100 metros? ___________________
j. El 25% del grupo hace los 100 metros en un tiempo inferior o igual a qu valor? _____
k. El 50% del grupo hace los 100 metros en un tiempo inferior o igual a qu valor? _____
l. El 75% del grupo hace los 100 metros en un tiempo inferior o igual a qu valor? _____
14. Una compaa requiere los servicios de un tcnico especializado. De los
expedientes presentados, se han seleccionado 2 candidatos: 1 y 2, los cuales
renen los requisitos mnimos requeridos. Para decidir cul de los 2 se va a
contratar, los miembros del Jurado deciden tomar 7 pruebas a cada uno de ellos.
Los resultados se entregan a continuacin:
Prueba
1 2 3 4 5 6 7
Candidato 1 57 55 54 52 62 55 59
Candidato 2 80 40 62 72 46 80 40
a) Halle e interprete la media, mediana y moda de los dos candidatos. b) Estadsticamente Cul de los candidatos debe ser contratado? Fundamente su
respuesta.
62
15. Las ventas realizadas en 10 das de uno de los meses por tres vendedores de
una compaa fueron las siguientes:
i. Ordena los datos y calcula las medidas de tendencia central para las ventas de cada uno
MEDIDAS ALEJANDRO BERNARDO DIEGO
MEDIA
MEDIANA
MODA
ii. Qu podras deducir de estos resultados?
Expresa brevemente tu deduccin:
iii. De acuerdo a los valores de tendencia central de Bernardo y Alejandro, Qu puedes decir de estos vendedores?
iv. Cul de los tres consideras que es ms consistente en sus ventas?
____________________________________________________________________
v. Considera a Alejandro y Diego Quin consideras que es ms consistente en sus ventas?
ALEJANDRO BERNARDO DIEGO
5 5 5
18 17 6
8 17 10
12 17 20
17 17 21
19 17 20
25 17 19
17 17 18
17 17 19
20 17 20
63
16. En una fbrica no se ha realizado debidamente el programa de mantenimiento
por lo que una mquina est fuera de operacin debido a las fallas que a
menudo se presentan. El tiempo de inactividad consecutivos en minutos
durante un ao se registran en la siguiente tabla. Esta informacin incluye el
tiempo inactividad de algunas mquinas cuya falla ocurre ms de una vez al
da.
32 63 52 62 35 34 74 53 64 80 51 55 48 60 76 51 35 44 45 54 33 45 61 53 21 68 85 60 77 61 42 67 34 53 45 47 52 68 52 69 73 61 55 65 62 54 41 59 53 50 26 58 82 74 41 70 38 50 47 35 36 67 43 28 56 79 84 49 36 65 82 22 62 55 72 68 40 37 78 43 65 73 57 39 46 57 56 60 50 88 45 56 75 40 51 70 74 76 48 59
i. Agrupa los datos en tabla de distribucin de frecuencias que contenga 17 intervalos.
ii. Calcula la Moda iii. Calcula la Mediana, y iv. Calcula la Media aritmtica
64
Antecedentes de la Unidad 4
Nombre Unidad Objetivos de aprendizaje de la Unidad
Sub-unidades
4.0 Medidas de Dispersin
El alumno (a) ser capaz de: 1. Aplicar el clculo de las
medidas de dispersin
en datos agrupados y
no agrupados.
2. Analizar el
comportamiento de las
medidas de dispersin
en ejercicios prcticos.
3. Evaluar el
comportamiento de las
medidas de dispersin
en situaciones
problemticas.
.
4.1 Sub Unidad 1: Rango y Desviacin Media 2.2 Sub Unidad 2: Varianza y Desviacin Estndar
65
Nombre de la Unidad 4: medidas de dispersin
4.1 Nombre de la Sub-unidad: Rango y Desviacin Media
Las medidas de dispersin nos indican la distancia promedio de los datos respecto a las medidas de tendencia central. As podremos diferenciar dos conjuntos de datos que poseen iguales medias, siendo los datos de uno ms dispersos del otro. Son indicadores estadsticos que muestran la distancia promedio que existe entre los datos y la media aritmtica. En este estudio daremos un vistazo a tres indicadores de dispersin:
1. Rango 2. Desviacin Media 3. Varianza, y 4. Desviacin estndar
Llamados tambin estadgrafos de dispersin, determinan como se agrupan o dispersan los datos alrededor de un promedio.
i. RANGO O RECORRIDO. ( R ) Es la ms sencilla de todas, y solamente tiene en cuenta
los valores extremos de los datos.
R = Xi mximo Xi mnimo. Ejemplo 1: Sean las observaciones: 28, 38. 70, 96, 48 Solucin: R = 96 28 = 68
R = 68
Ejemplo 2 : Rotary International entregar una beca para la Universidad, al alumno cuyo buen rendimiento se haya mantenido por mayor tiempo, en 4 medio. Para calcular el mejor promedio solo consideraron algunas asignaturas. Los mejores alumnos de la promocin fueron Miguel e Isabel. La media aritmtica de cada uno es 6,3. Quin se adjudicar la beca? Las calificaciones finales se muestran en la siguiente tabla:
LENGUAJE MATEMTICA H. Geo. Y Cs Soc. C. NATURALES
MIGUEL 6,2 6,8 5,8 6,4
ISABEL 6,9 5,0 7,0 6,3 Las calificaciones de Miguel son ms cercanas a la media aritmtica, que las notas de Isabel. Es decir, las calificaciones de Isabel se encuentran ms dispersas. Es suficiente este argumento para optar por Miguel, como un alumno que ha mantenido su buen rendimiento? Las medidas de dispersin nos permitirn realizar un anlisis ms certero.
66
Calculamos el Rango ( R ). ste nos indica cun dispersos se encuentran los datos entre los valores de los extremos. MIGUEL: R = 6,8 5,8 = 1,0 ISABEL: R = 7,0 5,0 = 2,0 Como el valor del rango de las notas de Miguel es menor que el de Isabel, podemos decir que sus calificaciones son menos dispersas. Por lo tanto, sera el ms apto para ganar el premio por mantener un buen rendimiento.
i. DESVIACIN MEDIA
Sirve para medir la distancia absoluta promedio entre cada uno de los datos (observaciones) y el parmetro caracterstico de la informacin; que generalmente es la media aritmtica.
Ejemplo: Desviacin media para datos no agrupados Calcular la desviacin media en base a la siguiente tabla sobre las calificaciones de un estudiante en 12 asignaturas evaluadas sobre 10.
CALIFICACIN N DE ASIGNATURAS
6 4
7 2
8 3
9 2
10 1
TOTAL 12
Desviacin Media (DM)
Equivale a la divisin de la sumatoria del valor absoluto de las distancias
existentes entre cada dato y su media aritmtica y el nmero total de datos.
___
DM = Xi X fi n
67
Solucin:
Ejemplo: Desviacin Media para datos agrupados Obtener la desviacin media del conjunto de datos mostrado en la tabla
edad (x) fi
45 2
46 1
47 3
48 3
49 5
50 6
51 2
52 4
53 2
68
Solucin: A la tabla deben agregarse 3 columnas
Solucin: A la tabla deben agregarse 3 columnas
69
=
=
= 49,357 Por lo tanto
DM = | |
DM =
= 1, 785
Esto significa que el promedio de alejamiento de todos los valores respecto de la media (de 49.357) es de 1.785.
LA DESVIACIN MEDIA CON TABLAS POR INTERVALOS Cuando los datos estn organizados en intervalos de clase, la desviacin media se obtiene con la misma frmula aplicada a la organizacin de frecuencias simples, solamente que x debe ser el punto medio del intervalo. Esto significa que al conjunto de datos original deben aadirse a la tabla ahora cuatro columnas: la primera encabezada con xi para sealar el punto medio de cada intervalo; la segunda encabezada con fx que servir para calcular la media aritmtica; la tercera encabezada con x x que servir para obtener la cuarta, y la cuarta con f x x que servir para obtener el numerador de la frmula luego de realizar su sumatoria. Ejemplo: Cien datos recolectados se organizaron en siete intervalos, los que se muestran en
la tabla. Calcular la desviacin media.
x fi
4- 10 12
10 - 16 11
16 - 22 13
22 - 28 19
28 - 34 21
34 - 40 16
40 - 46 8
70
Solucin: A la tabla deben agregrsele cuatro columnas:
i. la primera columna agregada se encabeza con x que representa el punto medio de
cada intervalo. Ver la tabla completa en la siguiente pgina.
ii. la segunda columna agregada se encabeza con fx.
Al concluir de llenar esta columna se debe efectuar la sumatoria f x para calcular la media aritmtica:
=
=
= 24,86
iii. la tercera columna agregada se encabeza con | |, donde que representa el
valor absoluto de la resta de cada punto medio x del intervalo menos la
media aritmtica obtenida en el paso anterior.
iv. la cuarta columna agregada se encabeza con | | que representa la multiplicacin de cada frecuencia f por el valor absoluto correspondiente
obtenido en la quinta columna. Al concluir el llenado de esta columna se
debe efectuar la suma
| |
x xi f f. xi
4 - 10 7 12 84 18,36 220,32
10 - 16 13 11 143 12,36 135,96
16 - 22 19 13 247 6,36 82,68
22 - 28 25 19 475 0,36 6,84
28 - 34 31 21 651 5,64 118,44
34 - 40 37 16 592 11,64 186,24
40 - 46 43 8 344 17,64 141,12
n = 100 2.536 891,6
71
DM = | |
DM =
= 8,916
Esto significa que el promedio de alejamiento de todos los valores respecto de la media, es de 8.916.
4.2 Nombre de la Sub-unidad: Varianza y Desviacin Estndar OBSERVACIN: Dos medidas de dispersin que se utilizan con frecuencia y que s toman en consideracin la forma en que se distribuyen los valores son la varianza y su raz cuadrada que se conoce como la desviacin estndar. Estas medidas establecen la forma en que los valores fluctan con respecto a la media.
ii. LA VARIANZA
La Varianza es el resultado de la divisin de las sumatorias de las distancias
existentes entre cada dato y su media aritmtica, elevadas al cuadrado y el
nmero total de datos
S2 = ( )
, donde xi representa los datos de la muestra
Determinar la varianza para datos no agrupados Ejemplo Determinar la varianza de las siguientes series de nmeros: 2, 3, 6, 8, 11
SOLUCIN
i. Calcular la media aritmtica.
72
=
=
= 6
ii. Determinar la varianza:
Aplico la frmula para su clculo
S2 = ( ) ( ) ( ) ( ) ( )
Por tanto la varianza es: 13,5
Determinar la varianza para datos agrupados Su frmula de clculo es:
S2 = ( )
Ejemplo: La altura de 23 bastones se muestra en la siguiente tabla:
ALTURA DE BASTONES CANTIDAD
1,70 - 1,75 1
1,75 - 1,80 3
1,80 - 1,85 4
1,85 - 1,90 8
1,90 - 1,95 5
1,95 - 2,00 2
n = 23
i. Calculamos la media aritmtica
ii. Ampliamos la tabla para clculo
73
ALTURA DE BASTONES xi fi xi . Fi
1,70 - 1,75 1,725 1 1,725 4,431025 4,431025
1,75 - 1,80 1,775 3 5,325 4,223025 12,669075
1,80 - 1,85 1,825 4 7,300 4,020025 16,0801
1,85 - 1,90 1,875 8 15,000 3,822025 30,5762
1,90 - 1,95 1,925 5 9,625 3,629025 18,145125
1,95 - 2,00 1,975 2 3,95 3,441025 6,88205
n = 23 42,925 88,783575
iii. Calculamos la varianza, segn la frmula
para datos agrupados
S2 = ( )
=
Esto quiere decir, que la altura de los bastones est por sobre y bajo la media en (4,035)2
Ventajas del uso de la varianza La varianza es siempre positiva o cero Si a los datos de la distribucin les sumamos una cantidad constante la varianza no se modifica. Desventajas del uso de la varianza
La varianza a veces no se interpreta claramente, ya que se mide en unidades cuadradas. Para evitar ese problema se define otra medida de dispersin, que es la desviacin estndar que se halla como la raz cuadrada positiva de la varianza.
En forma similar a la Desviacin Media, la Varianza se basa en la diferencia entre cada uno de los valores del conjunto de datos y la media del grupo. La diferencia con la Desviacin Media consiste en que antes de sumarlas se eleva al cuadrado cada una de las diferencias.
74
iii. LA DESVIACIN ESTNDAR
La desviacin estndar, llamada tambin desviacin tpica, equivale
a la raz cuadrada positiva de la Varianza
Para trabajo con poblaciones, se representa por el smbolo , si
trabajamos con muestras, se representa por S La desviacin estndar informa sobre la dispersin de los datos respecto al valor de la media; cuanto mayor sea su valor, ms dispersos estarn los datos.
( )
, para trabajar con una poblacin
S = ( )
, para trabajar con muestras y que
utilizaremos en nuestro trabajo
Determinar la desviacin estndar para datos no agrupados Ejemplo 1: Consideramos las edades de 5 jvenes, siendo estas: 16; 18; 20; 22 y 24. Calcule la desviacin estndar de ese conjunto de datos.
Solucin:
i. Calculamos la media aritmtica
=
=
= 20
ii. Calculamos la Varianza
S2 = ( ) ( ) ( ) ( ) ( )
iii. Finalmente, calculamos la desviacin estndar, que es la raz cuadrada de la
Varianza
75
S = ( )
Ejemplo 2: Hallar la desviacin estndar de los datos: 5, 8, 10, 12, 16.
i. Calculamos la media aritmtica
=
=
= 10,2
ii. Completamos la tabla, para ayudarnos en el clculo
S = ( )
=