Tabulación y representación gráfica de datos
cualitativos y cuantitativos
Contenido
Reglas para tabular y graficar
Resúmenes de datos: – Cualitativos
Distribución de frecuencias
Gráficas de barra y pastel
– Cuantitativos Distribución de frecuencias
Gráfica de puntos
Histogramas, Diagrama acumulativo
Diagrama de tallo y hojas
– Dos variables Tabulaciones cruzadas
Gráficos de dispersión
Conceptos importantes
Población: es la totalidad de elementos del
universo.
Población
Infinita
Finita
Conceptos importantes
Característica de estudio: es la variable que
se va a estudiar, ejemplos: edad, sexo, peso,
altura, concentración, ph, rendimiento, etc…….
Conceptos importantes
Muestreo: es una parte de la población para
inferir en su característica de estudio.
Conceptos importantes
Cuándo usar muestras?
La población es infinita o muy grande.
La población es finita pero lo suficientemente
grande, entonces es difícil hacer todo el
estudio.
La unidad de estudio se transforma o se
destruye al ser examinado, ejemplo es
ensayos destructivos.
Conceptos importantes
Variable es la característica de interés a estudiar
Cuantitativa
Cualitativa
Variable
Continua
Discreta
Atributo
Color
Sabor
Aroma
Suavidad
Impacto
Cantidad
personas
Cantidad
de autos
Cantidad
de bolsas
Peso
Altura
Frecuencia
Estatura
Edad
Las variables cuantitativas requieren de un instrumento o medio
de medición.
Conceptos importantes
Experimento: Es cualquier
proceso que genera un
conjunto de datos.
Elemento: es el resultado
del espacio muestral.
Observación es cualquier
registro de información
numérico o categórico.
Conceptos importantes
Estadístico: Es la medida
de una característica de la
población que se calcula a
partir de los datos de una
muestra.
Tabulación
Es un ordenamiento de la información en filas y columnas
Una buena tabla debe tener: – Títulos y encabezamientos claros y completamente
definidos
– Incluir las unidades en que se expresa la medición
– Incluir la suficiente información que permita chequear la validez de los cálculos o argumentos
– Incluir fuente de datos cuando corresponda
Ejemplo de tabulación
Representaciones gráficas
Alternativa para mostrar la información obtenida o
generada
Los principios básicos son:
– Simplicidad
– Fidelidad (incremento de escalas)
– Representar una ayuda ( no son concluyentes)
– Deben responder al objetivo deseado
Regla
Partición de la Población. Cada observación
debe pertenecer a una, y sólo una clase o
categoría.
Para estudiar las características de una
variable se ordenan los valores observados
de la muestra en k clases denominadas c1,
c2, .. ck.
14
ANALISIS DE DATOS
Diseño de procedimientos eficientes que suministren datos confiables para su posterior análisis.
Planear la recolección de datos indicando entre otros aspectos tiempo (¿cuándo?, lugar (¿dónde?), responsabilidades (¿quién?), formatos y procedimientos (¿cómo?).
El registro y análisis de la información proveniente de muestras representativas tomadas de pruebas físicas y químicas se hacen a los productos con el fin de verificar su estado.
15
ANALISIS DE DATOS Datos deben ser veraces y reflejar las
condiciones del proceso, datos erróneos generan conclusiones erróneas.
El analista debe tener plena confianza en los datos para que el estudio sea válido.
Mínima desconfianza en los datos o en su procedencia obligan al analista a descartarlos.
Recolección de datos debe ser cuidadosamente planeada y programada asignado los recursos que sean necesarios para garantizar excelente calidad de datos.
16
ANALISIS DE DATOS
Acciones correctivas y preventivas, con las que se procurará reducir y si es posible eliminar los problemas.
Análisis y aproximaciones de los datos a distribuciones de probabilidad es necesario agruparlos de tal manera que se puedan visualizar comportamientos y tendencias históricas de los procesos que ayuden a interpretar los aspectos que pueden estar causando descontrol y por ende bajos niveles de calidad.
Distribución de Frecuencias
Datos No
Agrupados
n < 30
Datos
Agrupados
n ≥30
Tratamiento de datos, para conocer su comportamiento
Gráfico de barras:
– Representación gráfica de datos cualitativos que se han
resumido en una distribución de frecuencia.
– En el eje horizontal se especifican los indicadores o
nombres de cada clase y en el eje vertical una escala de
frecuencia
– Un caso particular lo constituye el gráfico de Pareto
desarrollado como una forma de incrementar la calidad.
Aquí las clases van ordenadas de izquierda a derecha de
mayor a menor frecuencia
Gráfico de pastel:
– Representación gráfica de frecuencias relativas o
porcentuales
– Para dibujarlo se traza un círculo y se divide según las
frecuencias.
Datos cualitativos
Ejemplo
Los empleados de una empresa electrónica moderna
tienen un sistema de horario flexible. Pueden comenzar
su jornada de trabajo a las 7:00, 7:30, 8:00, 8:30 o 9:00.
Los datos siguientes representan una muestra de las
horas de entrada que seleccionaron.
1.Resumir los datos formando una distribución de
frecuencias y graficarlos en barras y pastel
2.¿Que le dicen los resúmenes respecto a las
preferencias horarias?
Datos cualitativos
Horas de entrada
7:00 8:30 9:00 8:00 7:30
7:30 8:30 8:30 7:30 7:00
8:30 8:30 8:00 8:00 7:30
8:30 7:00 9:00 8:30 8:00
Datos cualitativos
Tabla de Frecuencia
Datos cualitativos
Clase F.Absoluta F.Relativa F.porcentual
7:00 3 0.15 15 %
7:30 4 0.2 2 %
8:00 4 0.2 2 %
8:30 7 0.35 35 %
9:00 2 0.1 10 %
Total 20 1 100 %
Gráfica de barras
Datos cualitativos
0
1
2
3
4
5
6
7
8
07:00 07:30 08:00 08:30 09:00
Horas
Fre
cu
en
cia
ab
so
luta
Entrada
Gráfico de pastel
Datos cualitativos
15%
20%
20%
35%
10%
07:00 07:30 08:00 08:30 09:00
Ejercicio La Organización Internacional de Normas, en Ginebra ha
desarrollado un conjunto de normas de calidad, las ISO. En todo el
mundo las empresas tratan de obtener la certificación. Una
encuesta solicito a un grupo de fabricantes sus planes para
obtener este nivel. Las respuestas se codificaron de acuerdo a
C= ya certificado
P= en vías de certificarse
W= le interesa el tema
N= no quiere certificarse
U = indeciso
Las repuestas fueron las siguientes:
Datos cualitativos
W P N N W P C W W N
N W U W P W P C N P
P N W W N W N W W N
C W P W N N C W P N
W W N W N U N W N W
Datos cualitativos
Forme una distribución de frecuencia absoluta y
porcentual para cada conjunto de datos
Una Consultora informó que menos del 1% de las
empresas estaban certificadas un año antes de la
encuesta. Comente la tendencia hacia la
certificación ISO
Datos cualitativos
Es un método o técnica de análisis de datos.
Consiste en el agrupamiento de un conjunto de
datos en intervalos, de tal manera que genera
una distribución o arreglo de datos.
El objetivo es proporcionar una perspectiva de
los datos
Esta distribución se puede comparar con las
distribuciones estadísticas teóricas y así inferir
soluciones al problema planteado.
DISTRIBUCIONES DE FRECUENCIAS
28
DISTRIBUCIONES DE FRECUENCIAS
Visualizar la posible distribución de datos
Cada dato pierde su identidad.
Distribuciones estadísticas teóricas o empíricas
para inferir hacia el problema.
Distribuciones de frecuencia de datos no
agrupados presentan una distribución que es muy
difícil de aproximar.
Cifras significativas de los datos
Selección de un número de clases que refleje una
adecuada distribución.
29
DISTRIBUCIONES DE FRECUENCIAS
Es conveniente que los datos se agrupen en un número de intervalos de clase que están entre 10 y 20. Queda a criterio del analista escoger este número, aunque existen reglas que podrían usarse como punto de partida.
Moya Marcos, Robles Natalia, 2010
Datos Agrupados
n ≥ 30
30
DISTRIBUCIONES DE FRECUENCIAS Datos agrupados
Criterio del Libro Estadístico un enfoque teórico y práctico, página 34 a la 38.
PREAMBULO
Muestreo: Recolectar los datos (xi) de acuerdo con el tamaño de muestra previamente calculado.
Ordenar los datos de menor a mayor.
31
DISTRIBUCIONES DE FRECUENCIAS Datos agrupados
Paso 1. Calcular el número apropiado de intervalos K.
Regla de Sturges: k = 1 + 3,3 log n, donde n es el tamaño de la muestra.
Otra opción es K = raíz(n)
Paso 2.
Calcular el rango:
R = ximáx - ximín
Paso 3. Calcular el intervalo de clase (C), así:
C = R/k
El valor de i debe ser redondeado siempre hacia arriba y a la misma cantidad de decimales que tienen los datos.
32
Paso 4. Calcular el nuevo rango (NR)
NR = C * k
Paso 5. Calcular los límites inferior y superior de la primera y última clase de la distribución, de la siguiente forma:
Observ menor = Xmin – (NR – R)/2
Observ mayor = Xmáx + (NR – R)/2
Paso 6. Construir la distribución de frecuencias
DISTRIBUCIONES DE FRECUENCIAS Datos agrupados
33
DISTRIBUCIONES DE FRECUENCIAS
Completar el cuadro de frecuencias de
datos agrupados.
Construir el histograma para observar
la distribución del conjunto de datos.
Frecuencia absoluta: Se llama frecuencia
absoluta de la clase ci al número total de individuos u
observaciones que pertenece a dicha clase y se
denota por ni. Como las clases c1, c2, ..... ck
Frecuencia relativa: Se llama frecuencia relativa
de la clase ci a la proporción de individuos que
pertenecen a la clase sobre el total de individuos o
tamaño de la muestra.
Frecuencia porcentual: Caso particular de
frecuencia relativa multiplicada por 100
Frecuencia absolutaFrecuencia relativa =
n
Frecuencia porcentual = Frecuencia relativa 100
Datos cualitativos
Distribución de frecuencia
Para los datos cuantitativos se deben :
– Determinar la cantidad de clases
– Determinar el ancho de cada clase
– Determinar los límites de clase
Datos cuantitativos
Cantidad de clases:
– Se forman al especificar intervalos de valores de datos que
se usan para agrupar los elementos de un conjunto
– Se recomienda usar entre 10 y 20 clases
– El objetivo final es mostrar la variación de los datos
Ancho de las clases:
– La regla es elegir igual ancho para todas las reglas
– Una mayor cantidad de clases se traduce en un menor
ancho
– Cálculo aproximado:
Valor maximo en los datos- Valor minimo en los datosAncho de clase =
Cantidad de clases
Datos cuantitativos
Límite de clases:
– Los límites se escogen para que cada valor de
dato sólo pertenezca a una clase
– Se asigna un valor mínimo y máximo para cada
clase
Punto medio de clase: corresponde al valor
promedio entre los límites inferior y superior
de clase
Datos cuantitativos
38
DISTRIBUCIONES DE FRECUENCIAS (EJEMPLO)
Se toman doce grupos de cinco
unidades de una máquina llenadora de
latas de pasta de tomate y se pesan,
originando los siguientes datos:
Construir una distribución de frecuencias
de datos agrupados.
A continuacion se presenta el
procedimiento para construir una
distribucion de frecuencias de datos
agrupados
40
Paso 1 Recolectar datos TABULAR DATOS
HOJA DE DATOS - DISTRIBUCION DE FRECUENCIAS
––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––
Artículo: Pasta de tomate Código: XY-987
Característica: Peso Especificación: 20,0 ± 2,5 decigramos
Operación: Llenado Máquina: Llenadora n=60
Operario: M. Matamoros Inspector: M. Coto Turno: 1
Fecha:02-12-84 Hora de inicio: 8 am Hoja: 1de 1
–––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––
# 1 2 3 4 5 6 7 8 9 10 11 12
–––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––
1 22,0 23,0 20,0 21,5 19,0 21,5 22,5 25,0 21,5 24,5 22,5 23,5
2 20,5 19,0 19,0 19,0 21,5 24,0 20,0 20,5 23,0 24,0 22,5 20,0
3 20,0 21,5 19,5 21,0 22,5 19,5 21,0 21,5 22,5 23,5 20,5 20,5
4 21,0 21,0 20,0 20,0 22,5 22,0 22,5 21,5 23,5 22,0 22,0 22,5
5 22,5 21,5 22,5 22,0 18,5 22,0 22,0 22,5 21,0 22,0 19,5 23,0
––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––-
41
SOLUCION
Paso 2: Ordenar datos de menor a mayor (es
opcional)
Paso 3: Fijar el número de clases (k)
Regla de Sturges: k = 1 + 3,3 log n, donde n es el tamano de la muestra.
k = 1 + 3,3 log 60 = 6,867, redondear a la próxima unidad
k =7
Paso 4: Determinar el Rango (R)
R = ximáx - ximín
R = 25,0 – 18,5 = 6,5
SOLUCION
Paso 5: Calcular el intervalo de clase (C) R 6,5 C = —— = ——— = 0,923 = 1,0 k 7 C = 1,0 El valor de C debe ser redondeado siempre hacia arriba y a la misma cantidad de decimales que tienen los datos. Paso 6: Calcular el Nuevo Rango (NR) NC = C * k = 1, 0 * 7 = 7,0
SOLUCION
Paso 5: Fijar los limites reales de clase (Li , Ls). Se les
reconoce por ser limites abiertos.
Li1 = ximín – (NR-R)/2 =
Li2 = Ls1 = XXXX
Ls2 = Li2 + C = y así sucesivamente hasta completar las k
clases
SOLUCION Paso 7: Completar el cuadro de frecuencias de datos
agrupados de la siguiente manera
a. Punto medio de clase o Marca de Clase (Xk)
Xk = Li + Ls o li + ls
2 2
b. Obtener la frecuencia absoluta de cada clase nk (conteo)
c. Obtener la frecuencoa absoluta acumulada (Nk)
d. Calcular la frecuencia relativa (fk)
fk = nk
n
e. Obtener la frecuencia relativa acumulada (Fk)
Fk = Nk
n
SOLUCION
Paso 8: Construir el histograma para observar la
distribucion del conjunto de datos
46
––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––
HOJA DE DATOS - DISTRIBUCION DE FRECUENCIAS
–––––––––––––––––––––––––––––––––––––––––––––––––––––––––––
Artículo: Pasta de tomate Código: XY-987
Característica: Peso Especificación: 20,0 ± 2,5 decigramos
Operación: Llenado Máquina: Llenadora n=60
Operario: M. Matamoros Inspector: M. Coto Turno: 1
Fecha:02-12-84 Hora de inicio: 8 am Hoja: 1 de 1
––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––
Li Ls CONTEO nk xk Nk fk Fk
––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––
18,25 19,25 ||||| 5 18,75 5 8,33 8,33
19,25 20,25 ||||||||| 9 19,75 14 15,00 23,33
20,25 21,25 |||||||| | 9 20,75 23 15,00 38,33
21,25 22,25 |||||||||||||||| 16 21,75 39 26,67 65,00
22,25 23,25 |||||||||||||| 14 22,75 53 23,33 88,33
23,25 24,25 ||||| 5 23,75 58 8,33 96,67
24,25 25,25 || 2 24,75 60 3,33 100
SOLUCION
Utilizando Minitab 16
2524232221201918
19
17
15
13
11
9
7
5
3
1
Peso
Fre
cu
en
cia
Media 21,54
Desv.Est. 1,485
N 60
Histograma de PesoNormal
Histogramas
Este gráfico se puede preparar con datos que han
sido resumido en una distribución de frecuencia
Se coloca la variable de interés en el eje horizontal y
la distribución de frecuencia el vertical
A diferencia del gráfico de barras no hay separación
entre los rectángulos formados por las clases
adyacentes, se completa con la línea vertical que
separa a cada uno de ellos
Cuando se traza un línea recta entre cada punto
medio de clase se construye un polígono de
frecuencia
Datos cuantitativos
10 15 20 25
Unidad de medición
Datos cuantitativos
Histograma y poligono de frecuencias
Diagrama acumulativo
Este tipo de resumen corresponde a la distribución de frecuencias acumuladas, en donde se emplean la cantidad de clases, anchos y límites definidos anteriormente
Esta distribución muestra la cantidad de elementos menores que, o iguales al límite superior de clase para cada clase
El último elemento de una frecuencia acumulada es siempre la cantidad de elementos
Una gráfica de una distribución acumulada se llama OJIVA. Los valores de los datos están en el eje horizontal y las frecuencias acumuladas en el eje vertical
Datos cuantitativos
Ejemplo
Considere la siguiente distribución de frecuencias:
Forme una distribución acumulada absoluta y relativa
Clase Frecuencia
10-19 10
20-29 14
30-39 17
40-49 7
50-59 2
Datos cuantitativos
Clase Frecuencia F.acumulada
absoluta
F.acumulada
porcentual
10-19 10 10 2%
20-29 14 24 48%
30-39 17 41 82%
40-49 7 48 96%
50-59 2 50 100%
Total 50 50 100%
Datos cuantitativos
Diagrama de tallo y hoja (Stem-and-Leaf)
Es dentro de las técnicas de análisis exploratorio de
datos una de más usadas ya que permite mostrar el
orden de rangos así como la forma de un conjunto de
datos en forma simultanea
Se caracteriza por ser fácil de construir y dar más
información que un histograma, debido a que
muestra los valores reales
No hay cantidad única de tallos ni hojas aún cuando
se recomienda seleccionar entre 5 a 20 tallos
Datos cuantitativos
Ejemplo Trace un diagrama de tallo y hoja para los siguientes datos.
70, 72, 75, 64, 58, 83, 80, 82, 76, 75, 68, 65, 57, 78, 85, 72
1.Ordenar en forma ascendente
2.Seleccionar rangos (ancho de clases) define tallos
3.Incorporar hojas
5 7 8
6 4 5 8
7 0 2 2 5 5 6 8
8 0 2 3 5
Hoja Tallo
Datos cuantitativos
Tabulaciones cruzadas
Es formato de tabulación se emplea para
examinar la relación entre dos variables
Se pueden considerar comparaciones entre
variables cuali o cuantitativa
Datos cuantitativos
n= 196 Precio por cubierto
Calificación de calidad $10-19 $20-29
Buena 42 40
Muy Buena 34 64
Excelente 2 14
Total 78 118
Gráficos de dispersión
Son una representación de la relación entre
dos variables cuantitativas
En este diagrama se grafican los puntos con
esas coordenadas
Pueden indicar relación positiva, negativa y
sin relación aparente
Datos cuantitativos
Resumen Objetivo Naturaleza Tipo de diagrama
Distribución de
frecuencia de una
variable
Cualitativa Circular, Barras Simples
Continua Histogramas, Polígonos de frecuencia
Distribución de
frecuencia de dos
variables
Cualitativa
Barras agrupadas
Continua Histogramas, Polígonos de frecuencia
Relación entre
dos variables
Cualitativa
Barras agrupadas y Barras
proporcionales
Continua Gráficos lineales y diagramas de
dispersión