Date post: | 28-Dec-2015 |
Category: |
Documents |
Upload: | ivan-serrano |
View: | 4 times |
Download: | 0 times |
Introducción y Estadística DescriptivaOrganización y Representación de Datos
Luceny Guzmán Acuña
22 de enero de 2013
Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 1 / 42
Organización de Datos
Tipos de datosA la información utilizada en estadística le llamamos datos, estos puedenclasificarse de la siguiente manera:
1 Datos cuantitativos: se refieren a información numérica (Representantodo lo que se puede contar o medir)
Los datos discretos son los obtenidos de un proceso de conteo.Los datos continuos son los obtenidos de un proceso de medición.
2 Datos cualitativos: se refieren a categorías o atributos que puedenclasificarse de acuerdo con determinado criterio.
1 Algunos datos cualitativos son expresados como números, porejemplo: los códigos de estudiantes y los grados de escolaridad.
2 Algunos datos se pueden representar de los dos tipos, por ejemploestatura y calificación.
Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 2 / 42
Organización de Datos
Tipos de datos
Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 3 / 42
Organización y Representación de Datos
Escalas de mediciónLas escalas de medición indican qué cálculos se pueden realizar pararesumir y presentar los datos y qué pruebas estadísticas pueden llevarse acabo.
1. Nominal: Se utilizan para datos cualitativos (tipos de autos,género, empresas de servicio de agua, etc.) Las observacionesse pueden clasificar o contar no existe un orden particularpara las clases o categorías, no se realizan operaciones nirelaciones matemáticas. ünica medida es la moda.
2. Ordinal: Son datos medidos en una escala nominal, pero,ordenada de alguna manera (calificaciones por letra,clasificación de productos, grados de escuela, etc). Se puedenestablecer relaciones de orden (mayor, menor) o contarelementos. Las operaciones matemáticas no tienen sentido.
Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 4 / 42
Organización y Representación de Datos
Escalas de medición3. De intervalo: Son datos medidos en una escala ordinal, perode tipo cuantitativo, la distancia entre valores tiene sentido.Se pueden realizar operaciones suma y resta. Esta escala nosiempre tiene un punto cero, que indique ausencia demedida. (temperatura (◦C), puntaje en un examen, etc), portanto este punto se puede considerar en cualquier posición.
4. De razón: Son datos medidos en una escala de intervalo,pero, la posición del valor cero no es arbitrario y este indicaausencia de medida. Se pueden establecer razones entrevalores (velocidad, tiempo, peso, dinero, etc).
Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 5 / 42
Organización y Representación de Datos
Tipos de tablas o distribuciones de frecuencia1 No agrupadas (Datos cualitativos y cuantitativos discretos cuando elrango de valores no es muy amplio).
2 Agrupadas (Cuantitativos continuos y discretos cuando el rango devalores es muy amplio)
3 Acumuladas (Cuantitativos).4 Bivariadas (Cualitativos)
Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 6 / 42
Organización y Representación de Datos
Tipos de gráficos1 Diagrama de barras univariados y bivariados, circular (Datoscualitativos y cuantitativos discretos de tablas no agrupadas)
2 Diagrama de puntos (Datos cuantitativos discretos de tablas noagrupadas)
3 Histograma (Datos cuantitativos de tablas agrupadas o no agrupadas)4 Polígono (Datos cuantitativos de tablas agrupadas o no agrupadas)5 Ojiva (Datos cuantitativos de tablas acumuladas)6 Diagrama de tallo y hojas (Datos cuantitativos)7 Diagrama de pareto (Datos cualitativos)8 Diagrama de cajas (Datos cuantitativos)
Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 7 / 42
Organización y Representación de Datos
Tabla o distribución de frecuencias no agrupadas
Ejemplo 1 (Datos cualitativos)Se pidió a un grupo de clientes de un banco clasificar la atención prestadacomo excelente (E), buena (B), regular (R) o mala (M), los resultados semuestran a continuación.
E R B B M R B BB B E B B M B BB B R R B E R RM M B B M R M BR E E M B R M R
construya una tabla de frecuencias no agrupadas.
Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 8 / 42
Organización y Representación de Datos
Tabla o distribución de frecuencias no agrupadas
Ejemplo 1 (Datos cualitativos)
Calificación f fr %
E 5 0, 125 12, 5
B 17 0, 425 42, 5
R 10 0, 25 25
M 8 0, 20 20
Total (n) 40 1 100
Donde: f : frecuencia absoluta o frecuencia representa el número de vecesque aparece un dato.fr : frecuencia relativa fr =
fn .
% : porcentaje, % = fr ∗ 100%.
Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 9 / 42
Organización y Representación de Datos
Ejemplo 1 (Diagrama de barras)
Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 10 / 42
Organización y Representación de Datos
Ejemplo 1 (Diagrama circular)Se considera que el número total de datos se distribuye de manerauniforme en un giro completo (360
◦),se determina qué ángulo ocupa
cada categoría.
Calificación f Angulo = 360∗fn = 9f
E 5 45
B 17 153
R 10 90
M 8 72
Total (n) 40 360
Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 11 / 42
Organización y Representación de Datos
Ejemplo 1 (Diagrama circular)
Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 12 / 42
Organización y Representación de Datos
Tabla o distribución de frecuencias no agrupadas
Ejemplo 2 (Datos cuantitativos discretos )Al final de un semestre se contabilizó el número de fallas de un grupo deestudiantes en una asignatura, los resultados se muestran a continuación:
7 4 3 0 9 3 5 3
0 0 2 2 7 3 0 3
1 2 0 4 0 4 0 4
5 3 4 4 0 0 2 0
6 4 1 5 4 1 3 0
construya una tabla de frecuencias no agrupadas.
Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 13 / 42
Organización y Representación de Datos
Tabla o distribución de frecuencias no agrupadas
Ejemplo 2 (Datos cuantitativos discretos )
# de fallas f fr %
0 11 0, 275 27, 5
1 3 0, 075 7, 5
2 4 0, 1 10
3 7 0, 175 17, 5
4 8 0, 2 20
5 3 0, 075 7, 5
6 1 0, 025 2, 5
7 2 0, 05 5
8 0 0 0
9 1 0, 025 2, 5
Total(n) 40 1 100
Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 14 / 42
Organización y Representación de Datos
Ejemplo 2 (Diagrama de puntos)
Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 15 / 42
Organización y Representación de Datos
Ejemplo 2 (Diagrama de barras)
Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 16 / 42
Organización y Representación de Datos
Ejemplo 2 (Histograma)
Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 17 / 42
Organización y Representación de Datos
Ejemplo 2 (Polígono de frecuencias o gráfico lineal)
Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 18 / 42
Organización y Representación de Datos
Tabla o distribución de frecuencias agrupadas (Datos cuantitativoscontinuos y discretos )
Ejemplo 3Los cálculos en millas por galón en 50 cargas del tanque de cierto tipo deautomóvil nuevo se resumen en la siguiente tabla. Construya una tabla defrecuencias absolutas, relativas, en porcentajes; una tabla de frecuenciasacumuladas (absoluta, relativa y en porcentaje)
20,5 26,5 27,6 28,3 28,7 28,9 29,2 30,0 30,4 31,5
23,7 26,6 27,8 28,4 28,7 28,9 29,2 30,2 30,5 31,9
25,8 26,6 28,1 28,4 28,7 29,0 29,3 30,3 30,8 32,0
26,3 27,1 28,3 28,4 28,8 29,2 29,3 30,3 31,2 32,6
26,4 27,4 28,3 28,5 28,8 29,2 29,5 30,3 31,5 38,6
Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 19 / 42
Organización y Representación de Datos
Ejemplo 31. Se determina el número de clases C a utilizar.
Acuerdos:Utilizar la Ley de Sturges: C = 3, 3 log n+ 1 y aproximar alentero más cercano. n es el número de datos a agrupar.Para n = 50, se obtiene C = 6, 606, C = 7.
2. Se calcula el rango R.
R = Dato mayor − Dato menor = 38,6− 20,5 = 18,1.
3. Se determina la precisión P, P = 0,1.
La precisión la determina el instrumento de medición.
4. Se calcula la amplitud A.
Acuerdo: Siempre vamos a aproximar por arriba, teniendo en cuenta laprecisiónA = R
C =18,17 = 2,58, A = 2,6.
Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 20 / 42
Organización y Representación de Datos
Ejemplo 35. Se calculan límites teóricos (Límites de clase) y límitesprácticos (Fronteras de clase) para las clases.
Los de la primera clase serán:Límite inferior: LI1 = Dato menor = 20,5.Límite superior: LS1 = LI1 +A− P = 20,5 + 2,6− 0,1 = 23.Frontera inferior:FI1 = LI1 − P
2 = 20,5− 0, 05 = 20,45.Frontera superior: FS1 = LS1 + P
2 = 23 + 0, 05 = 23,05Para las siguientes clases se tiene: LIi = LIi−1 +A, LSi = LSi−1 +A,FIi = FIi−1 +A, FSi = FSi−1 +A.
Características de las tablas agrupadas1 Uniformidad: Todas las clases deben tener la misma amplitud.2 Unicidad: Las clases no deben traslaparse.3 Completez: Cada dato debe pertenecer a alguna clase.Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 21 / 42
Organización y Representación de Datos
Ejemplo 3
Clase Límites Fronteras f fr % mi
1 20,5− 23,0 20,45− 23,05 1 0,02 2 21,75
2 23,1− 25,6 23,05− 25,65 1 0,02 2 24,35
3 25,7− 28,2 25,65− 28,25 11 0,22 22 26,95
4 28,3− 30,8 28,25− 30,85 30 0,60 60 29,55
5 30,9− 33,4 30,85− 33,45 6 0,12 12 32,15
6 33,5− 36,0 33,45− 36,05 0 0,00 0 34,75
7 36,1− 38,6 36,05− 38,65 1 0,02 2 37,35
Total 50 1 100
mi : Es el punto medio de cada clase, se denomina marca de clase.
Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 22 / 42
Organización y Representación de Datos
Ejemplo 3 (Histograma)
Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 23 / 42
Organización y Representación de Datos
Ejemplo 3 (Polígono)
Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 24 / 42
Organización y Representación de Datos
Tabla o distribución de frecuencias acumuladas
Ejemplo 2 (Número de fallas)
# de fallas f facum fr−acum = facum/n %acum = 100fr−acum≤ 0 11 11 0, 275 27, 5
≤ 1 3 14 0, 35 35
≤ 2 4 18 0, 45 45
≤ 3 7 25 0, 625 62, 5
≤ 4 8 33 0, 825 82, 5
≤ 5 3 36 0, 90 90
≤ 6 1 37 0, 925 92, 5
≤ 7 2 39 0, 975 97, 5
≤ 8 0 39 0, 975 97, 5
≤ 9 1 40 1 100
Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 25 / 42
Organización y Representación de Datos
Ojiva para Ejemplo 2 (Número de fallas)
Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 26 / 42
Organización y Representación de Datos
Tabla o distribución de frecuencias acumuladas
Ejemplo 3 (Rendimiento)
Fronteras f Frontera facum fr−acum =facum50 %acum
≤ 20,45 0 0,00 0
20,45− 23,05 1 ≤ 23,05 1 0,02 2
23,05− 25,65 1 ≤ 25,65 2 0,04 4
25,65− 28,25 11 ≤ 28,25 13 0,26 26
28,25− 30,85 30 ≤ 30,85 43 0,86 86
30,85− 33,45 6 ≤ 33,45 49 0,98 98
33,45− 36,05 0 ≤ 36,05 49 0, 98 98
36,05− 38,65 1 ≤ 38,65 50 1 100
Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 27 / 42
Organización y Representación de Datos
Ejemplo 3 (Rendimiento)
ojiva
Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 28 / 42
Organización y Representación de Datos
Ejemplo 4: Tabla o distribución de frecuencias bivariadasLa siguiente tabla muestra los resultados de una prueba de conocimientosa un grupo de empleados de tres compañías A,B,C, en el campo que sedesempeñan. Los resultados se clasificaron como excelente(E), bueno (B),regular (R), malo(M). Construya una tabla de frecuencias bivariadas.
Empleado 1 2 3 4 5 6 7 8 9 10
Calificación E B E M R M B B B E
Compañía A B A C A B B C C A
Empleado 11 12 13 14 15 16 17 18 19 20
Calificación B E R R B B M B B M
Compañía B B C C A B A C A B
Empleado 21 22 23 24 25 26 27 28 29 30
Calificación E E B M R E R E E B
Compañía B B A A B C A C B B
Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 29 / 42
Organización y Representación de Datos
Ejemplo 4
Compañía\Calificación E B R M TotalA 3 3 2 2 10
B 4 5 1 2 12
C 2 3 2 1 8
Total 9 11 5 5 Gran total 30
Calcular el porcentaje de los empleados
1 De la compañía C, que tienen un desempeño excelente.2 Con mal desempeño, que pertenece a la compañía B.3 Que tienen un desempeño excelente.4 Que son de la compañía C y tienen un desempeño bueno.
Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 30 / 42
Organización y Representación de Datos
Diagrama de barras bivariadas
Ejemplo 4 (Compañía-Calificación)
Compañía
Frec
uenc
iaDiagrama de Barras B ivariado
BEMR
0
1
2
3
4
5
A B C
Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 31 / 42
Organización y Representación de Datos
Diagrama de barras bivariadas
Ejemplo 4 (Compañía-Calificación)
Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 32 / 42
Organización y Representación de Datos
Ejemplo 5 (Diagrama de tallo y hojas)Una de las principales formas de medir la calidad del servicio queproporciona una organización es evaluar la rapidez con la que responde alas quejas de los clientes. Una empresa de teléfonos obtuvo 50 quejas elúltimo mes. Los datos siguientes representan el número de días entre elrecibimiento de la queja y su solución. Construya un diagrama de tallo yhojas.5 10 15 20 30 35 45 60 60 90
5 10 15 20 30 35 45 60 75 95
5 10 15 25 30 40 45 60 90 100
5 10 15 25 30 40 50 60 90 120
5 15 15 25 30 40 55 60 90 120
Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 33 / 42
Organización y Representación de Datos
Ejemplo 5 (Diagrama de tallo y hojas)
Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 34 / 42
Organización y Representación de Datos
Ejemplo 3 (Diagrama de tallo y hojas)
Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 35 / 42
Organización y Representación de Datos
Ejemplo 3 (Diagrama de tallo y hojas)
Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 36 / 42
Organización y Representación de Datos
Diagrama de paretoUna forma especial de gráfico de barras verticales de datos obtenidos sobreun problema, que separa las causas más importantes de las menosimportantes, estableciendo un orden de prioridades, se le conoce como laregla 80/20.Fue creado por el economista italiano Vilfredo Pareto, él observó que enitalia el 20% de los ciudadanos poseían el 80% de las propiedades. Elgráfico está sustentado sobre el principio según el cual un pequeñoporcentaje de las causas (∼ 20%) originan un alto porcentanje de lasveces que se presenta el problema (∼ 80%). El objetivo es de identificarese pequeño porcentaje de causas “vitales”para actuar prioritariamentesobre él.
Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 37 / 42
Organización y Representación de Datos
Diagrama de paretoLos pasos para realizar un diagrama de Pareto son:
1 Determinar el problema a estudiar.2 Investigar los factores o causas que provocan ese problema.3 Anotar la magnitud (unidades monetarias, número de defectos,volumen, etc.) de cada causa.
4 Si existen causas que tienen una magnitud muy pequeña comparadacon la de las otras causas se agrupan dentro de una categoría llamada“Otros”.
Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 38 / 42
Organización y Representación de Datos
Ejemplo 6 (Pareto)Un fabricante de computadores personales encontró un aumento dedisconformidad en los productos terminados . Se reunieron los datos y seclasificaron en áreas pertinentes, según muestra la tabla, Tapas malatornilladas (T), Regulador de excitación dañado (R), Tornillos faltantes(TF), Marco con raspaduras (M), Altavoz dañado (A),Unidad de disco duro dañada (UD), Unidad de disco dañada (U), Cubiertadañada (C). Realizar el diagrama de pareto.
Causa Frecuencia Causa FrecuenciaM 5 R 26
C 1 UD 3
T 30 U 2
TF 5 A 2
Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 39 / 42
Organización y Representación de Datos
Ejemplo 6(Pareto)
Problema: Disconformidad con el producto. Se observa que el 25% de lascausas (2 de 8 ) origina el 75,68% de las devoluciones.
Causa f facum % acum
T 30 30 40,54
R 26 56 75,68
TF 5 61 82,43
M 5 66 89,19
UD 3 69 93,24
A 2 71 95,95
U 2 73 98,65
C 1 74 100
Total 74
Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 40 / 42
Organización y Representación de Datos
Ejemplo 6 (Pareto)
Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 41 / 42
Organización y Representación de Datos
Diagrama de paretoUtilizar para tareas, proyectos, metas.
1 Meta: Aumentar rentabilidad80% de los ingresos provienen del 20% de los clientes.
2 Meta: Aumentar población de estudiantes80% de los estudiantes provienen del 20% de los colegios de laciudad.
3 Proyecto: Optimizar la productividad de una empresa.80% del éxito en la productividad es debida al 20% de las tareas.
Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 42 / 42