+ All Categories

datos

Date post: 28-Dec-2015
Category:
Upload: ivan-serrano
View: 4 times
Download: 0 times
Share this document with a friend
Description:
datos para
42
Introduccin y Estadstica Descriptiva Organizacin y Representacin de Datos Luceny GuzmÆn Acuæa 22 de enero de 2013 Luceny GuzmÆn Acuæa () Introduccin y Estadstica Descriptiva 22 de enero de 2013 1 / 42
Transcript
Page 1: datos

Introducción y Estadística DescriptivaOrganización y Representación de Datos

Luceny Guzmán Acuña

22 de enero de 2013

Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 1 / 42

Page 2: datos

Organización de Datos

Tipos de datosA la información utilizada en estadística le llamamos datos, estos puedenclasificarse de la siguiente manera:

1 Datos cuantitativos: se refieren a información numérica (Representantodo lo que se puede contar o medir)

Los datos discretos son los obtenidos de un proceso de conteo.Los datos continuos son los obtenidos de un proceso de medición.

2 Datos cualitativos: se refieren a categorías o atributos que puedenclasificarse de acuerdo con determinado criterio.

1 Algunos datos cualitativos son expresados como números, porejemplo: los códigos de estudiantes y los grados de escolaridad.

2 Algunos datos se pueden representar de los dos tipos, por ejemploestatura y calificación.

Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 2 / 42

Page 3: datos

Organización de Datos

Tipos de datos

Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 3 / 42

Page 4: datos

Organización y Representación de Datos

Escalas de mediciónLas escalas de medición indican qué cálculos se pueden realizar pararesumir y presentar los datos y qué pruebas estadísticas pueden llevarse acabo.

1. Nominal: Se utilizan para datos cualitativos (tipos de autos,género, empresas de servicio de agua, etc.) Las observacionesse pueden clasificar o contar no existe un orden particularpara las clases o categorías, no se realizan operaciones nirelaciones matemáticas. ünica medida es la moda.

2. Ordinal: Son datos medidos en una escala nominal, pero,ordenada de alguna manera (calificaciones por letra,clasificación de productos, grados de escuela, etc). Se puedenestablecer relaciones de orden (mayor, menor) o contarelementos. Las operaciones matemáticas no tienen sentido.

Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 4 / 42

Page 5: datos

Organización y Representación de Datos

Escalas de medición3. De intervalo: Son datos medidos en una escala ordinal, perode tipo cuantitativo, la distancia entre valores tiene sentido.Se pueden realizar operaciones suma y resta. Esta escala nosiempre tiene un punto cero, que indique ausencia demedida. (temperatura (◦C), puntaje en un examen, etc), portanto este punto se puede considerar en cualquier posición.

4. De razón: Son datos medidos en una escala de intervalo,pero, la posición del valor cero no es arbitrario y este indicaausencia de medida. Se pueden establecer razones entrevalores (velocidad, tiempo, peso, dinero, etc).

Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 5 / 42

Page 6: datos

Organización y Representación de Datos

Tipos de tablas o distribuciones de frecuencia1 No agrupadas (Datos cualitativos y cuantitativos discretos cuando elrango de valores no es muy amplio).

2 Agrupadas (Cuantitativos continuos y discretos cuando el rango devalores es muy amplio)

3 Acumuladas (Cuantitativos).4 Bivariadas (Cualitativos)

Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 6 / 42

Page 7: datos

Organización y Representación de Datos

Tipos de gráficos1 Diagrama de barras univariados y bivariados, circular (Datoscualitativos y cuantitativos discretos de tablas no agrupadas)

2 Diagrama de puntos (Datos cuantitativos discretos de tablas noagrupadas)

3 Histograma (Datos cuantitativos de tablas agrupadas o no agrupadas)4 Polígono (Datos cuantitativos de tablas agrupadas o no agrupadas)5 Ojiva (Datos cuantitativos de tablas acumuladas)6 Diagrama de tallo y hojas (Datos cuantitativos)7 Diagrama de pareto (Datos cualitativos)8 Diagrama de cajas (Datos cuantitativos)

Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 7 / 42

Page 8: datos

Organización y Representación de Datos

Tabla o distribución de frecuencias no agrupadas

Ejemplo 1 (Datos cualitativos)Se pidió a un grupo de clientes de un banco clasificar la atención prestadacomo excelente (E), buena (B), regular (R) o mala (M), los resultados semuestran a continuación.

E R B B M R B BB B E B B M B BB B R R B E R RM M B B M R M BR E E M B R M R

construya una tabla de frecuencias no agrupadas.

Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 8 / 42

Page 9: datos

Organización y Representación de Datos

Tabla o distribución de frecuencias no agrupadas

Ejemplo 1 (Datos cualitativos)

Calificación f fr %

E 5 0, 125 12, 5

B 17 0, 425 42, 5

R 10 0, 25 25

M 8 0, 20 20

Total (n) 40 1 100

Donde: f : frecuencia absoluta o frecuencia representa el número de vecesque aparece un dato.fr : frecuencia relativa fr =

fn .

% : porcentaje, % = fr ∗ 100%.

Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 9 / 42

Page 10: datos

Organización y Representación de Datos

Ejemplo 1 (Diagrama de barras)

Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 10 / 42

Page 11: datos

Organización y Representación de Datos

Ejemplo 1 (Diagrama circular)Se considera que el número total de datos se distribuye de manerauniforme en un giro completo (360

◦),se determina qué ángulo ocupa

cada categoría.

Calificación f Angulo = 360∗fn = 9f

E 5 45

B 17 153

R 10 90

M 8 72

Total (n) 40 360

Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 11 / 42

Page 12: datos

Organización y Representación de Datos

Ejemplo 1 (Diagrama circular)

Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 12 / 42

Page 13: datos

Organización y Representación de Datos

Tabla o distribución de frecuencias no agrupadas

Ejemplo 2 (Datos cuantitativos discretos )Al final de un semestre se contabilizó el número de fallas de un grupo deestudiantes en una asignatura, los resultados se muestran a continuación:

7 4 3 0 9 3 5 3

0 0 2 2 7 3 0 3

1 2 0 4 0 4 0 4

5 3 4 4 0 0 2 0

6 4 1 5 4 1 3 0

construya una tabla de frecuencias no agrupadas.

Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 13 / 42

Page 14: datos

Organización y Representación de Datos

Tabla o distribución de frecuencias no agrupadas

Ejemplo 2 (Datos cuantitativos discretos )

# de fallas f fr %

0 11 0, 275 27, 5

1 3 0, 075 7, 5

2 4 0, 1 10

3 7 0, 175 17, 5

4 8 0, 2 20

5 3 0, 075 7, 5

6 1 0, 025 2, 5

7 2 0, 05 5

8 0 0 0

9 1 0, 025 2, 5

Total(n) 40 1 100

Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 14 / 42

Page 15: datos

Organización y Representación de Datos

Ejemplo 2 (Diagrama de puntos)

Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 15 / 42

Page 16: datos

Organización y Representación de Datos

Ejemplo 2 (Diagrama de barras)

Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 16 / 42

Page 17: datos

Organización y Representación de Datos

Ejemplo 2 (Histograma)

Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 17 / 42

Page 18: datos

Organización y Representación de Datos

Ejemplo 2 (Polígono de frecuencias o gráfico lineal)

Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 18 / 42

Page 19: datos

Organización y Representación de Datos

Tabla o distribución de frecuencias agrupadas (Datos cuantitativoscontinuos y discretos )

Ejemplo 3Los cálculos en millas por galón en 50 cargas del tanque de cierto tipo deautomóvil nuevo se resumen en la siguiente tabla. Construya una tabla defrecuencias absolutas, relativas, en porcentajes; una tabla de frecuenciasacumuladas (absoluta, relativa y en porcentaje)

20,5 26,5 27,6 28,3 28,7 28,9 29,2 30,0 30,4 31,5

23,7 26,6 27,8 28,4 28,7 28,9 29,2 30,2 30,5 31,9

25,8 26,6 28,1 28,4 28,7 29,0 29,3 30,3 30,8 32,0

26,3 27,1 28,3 28,4 28,8 29,2 29,3 30,3 31,2 32,6

26,4 27,4 28,3 28,5 28,8 29,2 29,5 30,3 31,5 38,6

Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 19 / 42

Page 20: datos

Organización y Representación de Datos

Ejemplo 31. Se determina el número de clases C a utilizar.

Acuerdos:Utilizar la Ley de Sturges: C = 3, 3 log n+ 1 y aproximar alentero más cercano. n es el número de datos a agrupar.Para n = 50, se obtiene C = 6, 606, C = 7.

2. Se calcula el rango R.

R = Dato mayor − Dato menor = 38,6− 20,5 = 18,1.

3. Se determina la precisión P, P = 0,1.

La precisión la determina el instrumento de medición.

4. Se calcula la amplitud A.

Acuerdo: Siempre vamos a aproximar por arriba, teniendo en cuenta laprecisiónA = R

C =18,17 = 2,58, A = 2,6.

Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 20 / 42

Page 21: datos

Organización y Representación de Datos

Ejemplo 35. Se calculan límites teóricos (Límites de clase) y límitesprácticos (Fronteras de clase) para las clases.

Los de la primera clase serán:Límite inferior: LI1 = Dato menor = 20,5.Límite superior: LS1 = LI1 +A− P = 20,5 + 2,6− 0,1 = 23.Frontera inferior:FI1 = LI1 − P

2 = 20,5− 0, 05 = 20,45.Frontera superior: FS1 = LS1 + P

2 = 23 + 0, 05 = 23,05Para las siguientes clases se tiene: LIi = LIi−1 +A, LSi = LSi−1 +A,FIi = FIi−1 +A, FSi = FSi−1 +A.

Características de las tablas agrupadas1 Uniformidad: Todas las clases deben tener la misma amplitud.2 Unicidad: Las clases no deben traslaparse.3 Completez: Cada dato debe pertenecer a alguna clase.Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 21 / 42

Page 22: datos

Organización y Representación de Datos

Ejemplo 3

Clase Límites Fronteras f fr % mi

1 20,5− 23,0 20,45− 23,05 1 0,02 2 21,75

2 23,1− 25,6 23,05− 25,65 1 0,02 2 24,35

3 25,7− 28,2 25,65− 28,25 11 0,22 22 26,95

4 28,3− 30,8 28,25− 30,85 30 0,60 60 29,55

5 30,9− 33,4 30,85− 33,45 6 0,12 12 32,15

6 33,5− 36,0 33,45− 36,05 0 0,00 0 34,75

7 36,1− 38,6 36,05− 38,65 1 0,02 2 37,35

Total 50 1 100

mi : Es el punto medio de cada clase, se denomina marca de clase.

Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 22 / 42

Page 23: datos

Organización y Representación de Datos

Ejemplo 3 (Histograma)

Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 23 / 42

Page 24: datos

Organización y Representación de Datos

Ejemplo 3 (Polígono)

Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 24 / 42

Page 25: datos

Organización y Representación de Datos

Tabla o distribución de frecuencias acumuladas

Ejemplo 2 (Número de fallas)

# de fallas f facum fr−acum = facum/n %acum = 100fr−acum≤ 0 11 11 0, 275 27, 5

≤ 1 3 14 0, 35 35

≤ 2 4 18 0, 45 45

≤ 3 7 25 0, 625 62, 5

≤ 4 8 33 0, 825 82, 5

≤ 5 3 36 0, 90 90

≤ 6 1 37 0, 925 92, 5

≤ 7 2 39 0, 975 97, 5

≤ 8 0 39 0, 975 97, 5

≤ 9 1 40 1 100

Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 25 / 42

Page 26: datos

Organización y Representación de Datos

Ojiva para Ejemplo 2 (Número de fallas)

Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 26 / 42

Page 27: datos

Organización y Representación de Datos

Tabla o distribución de frecuencias acumuladas

Ejemplo 3 (Rendimiento)

Fronteras f Frontera facum fr−acum =facum50 %acum

≤ 20,45 0 0,00 0

20,45− 23,05 1 ≤ 23,05 1 0,02 2

23,05− 25,65 1 ≤ 25,65 2 0,04 4

25,65− 28,25 11 ≤ 28,25 13 0,26 26

28,25− 30,85 30 ≤ 30,85 43 0,86 86

30,85− 33,45 6 ≤ 33,45 49 0,98 98

33,45− 36,05 0 ≤ 36,05 49 0, 98 98

36,05− 38,65 1 ≤ 38,65 50 1 100

Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 27 / 42

Page 28: datos

Organización y Representación de Datos

Ejemplo 3 (Rendimiento)

ojiva

Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 28 / 42

Page 29: datos

Organización y Representación de Datos

Ejemplo 4: Tabla o distribución de frecuencias bivariadasLa siguiente tabla muestra los resultados de una prueba de conocimientosa un grupo de empleados de tres compañías A,B,C, en el campo que sedesempeñan. Los resultados se clasificaron como excelente(E), bueno (B),regular (R), malo(M). Construya una tabla de frecuencias bivariadas.

Empleado 1 2 3 4 5 6 7 8 9 10

Calificación E B E M R M B B B E

Compañía A B A C A B B C C A

Empleado 11 12 13 14 15 16 17 18 19 20

Calificación B E R R B B M B B M

Compañía B B C C A B A C A B

Empleado 21 22 23 24 25 26 27 28 29 30

Calificación E E B M R E R E E B

Compañía B B A A B C A C B B

Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 29 / 42

Page 30: datos

Organización y Representación de Datos

Ejemplo 4

Compañía\Calificación E B R M TotalA 3 3 2 2 10

B 4 5 1 2 12

C 2 3 2 1 8

Total 9 11 5 5 Gran total 30

Calcular el porcentaje de los empleados

1 De la compañía C, que tienen un desempeño excelente.2 Con mal desempeño, que pertenece a la compañía B.3 Que tienen un desempeño excelente.4 Que son de la compañía C y tienen un desempeño bueno.

Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 30 / 42

Page 31: datos

Organización y Representación de Datos

Diagrama de barras bivariadas

Ejemplo 4 (Compañía-Calificación)

Compañía

Frec

uenc

iaDiagrama de Barras  B ivariado

BEMR

0

1

2

3

4

5

A B C

Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 31 / 42

Page 32: datos

Organización y Representación de Datos

Diagrama de barras bivariadas

Ejemplo 4 (Compañía-Calificación)

Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 32 / 42

Page 33: datos

Organización y Representación de Datos

Ejemplo 5 (Diagrama de tallo y hojas)Una de las principales formas de medir la calidad del servicio queproporciona una organización es evaluar la rapidez con la que responde alas quejas de los clientes. Una empresa de teléfonos obtuvo 50 quejas elúltimo mes. Los datos siguientes representan el número de días entre elrecibimiento de la queja y su solución. Construya un diagrama de tallo yhojas.5 10 15 20 30 35 45 60 60 90

5 10 15 20 30 35 45 60 75 95

5 10 15 25 30 40 45 60 90 100

5 10 15 25 30 40 50 60 90 120

5 15 15 25 30 40 55 60 90 120

Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 33 / 42

Page 34: datos

Organización y Representación de Datos

Ejemplo 5 (Diagrama de tallo y hojas)

Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 34 / 42

Page 35: datos

Organización y Representación de Datos

Ejemplo 3 (Diagrama de tallo y hojas)

Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 35 / 42

Page 36: datos

Organización y Representación de Datos

Ejemplo 3 (Diagrama de tallo y hojas)

Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 36 / 42

Page 37: datos

Organización y Representación de Datos

Diagrama de paretoUna forma especial de gráfico de barras verticales de datos obtenidos sobreun problema, que separa las causas más importantes de las menosimportantes, estableciendo un orden de prioridades, se le conoce como laregla 80/20.Fue creado por el economista italiano Vilfredo Pareto, él observó que enitalia el 20% de los ciudadanos poseían el 80% de las propiedades. Elgráfico está sustentado sobre el principio según el cual un pequeñoporcentaje de las causas (∼ 20%) originan un alto porcentanje de lasveces que se presenta el problema (∼ 80%). El objetivo es de identificarese pequeño porcentaje de causas “vitales”para actuar prioritariamentesobre él.

Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 37 / 42

Page 38: datos

Organización y Representación de Datos

Diagrama de paretoLos pasos para realizar un diagrama de Pareto son:

1 Determinar el problema a estudiar.2 Investigar los factores o causas que provocan ese problema.3 Anotar la magnitud (unidades monetarias, número de defectos,volumen, etc.) de cada causa.

4 Si existen causas que tienen una magnitud muy pequeña comparadacon la de las otras causas se agrupan dentro de una categoría llamada“Otros”.

Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 38 / 42

Page 39: datos

Organización y Representación de Datos

Ejemplo 6 (Pareto)Un fabricante de computadores personales encontró un aumento dedisconformidad en los productos terminados . Se reunieron los datos y seclasificaron en áreas pertinentes, según muestra la tabla, Tapas malatornilladas (T), Regulador de excitación dañado (R), Tornillos faltantes(TF), Marco con raspaduras (M), Altavoz dañado (A),Unidad de disco duro dañada (UD), Unidad de disco dañada (U), Cubiertadañada (C). Realizar el diagrama de pareto.

Causa Frecuencia Causa FrecuenciaM 5 R 26

C 1 UD 3

T 30 U 2

TF 5 A 2

Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 39 / 42

Page 40: datos

Organización y Representación de Datos

Ejemplo 6(Pareto)

Problema: Disconformidad con el producto. Se observa que el 25% de lascausas (2 de 8 ) origina el 75,68% de las devoluciones.

Causa f facum % acum

T 30 30 40,54

R 26 56 75,68

TF 5 61 82,43

M 5 66 89,19

UD 3 69 93,24

A 2 71 95,95

U 2 73 98,65

C 1 74 100

Total 74

Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 40 / 42

Page 41: datos

Organización y Representación de Datos

Ejemplo 6 (Pareto)

Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 41 / 42

Page 42: datos

Organización y Representación de Datos

Diagrama de paretoUtilizar para tareas, proyectos, metas.

1 Meta: Aumentar rentabilidad80% de los ingresos provienen del 20% de los clientes.

2 Meta: Aumentar población de estudiantes80% de los estudiantes provienen del 20% de los colegios de laciudad.

3 Proyecto: Optimizar la productividad de una empresa.80% del éxito en la productividad es debida al 20% de las tareas.

Luceny Guzmán Acuña () Introducción y Estadística Descriptiva 22 de enero de 2013 42 / 42


Recommended