Date post: | 08-Jul-2015 |
Category: |
Documents |
Upload: | elisabeth-herrera |
View: | 19 times |
Download: | 0 times |
5/10/2018 001apunte a Descriptivaprofflor Solis f 113607 - slidepdf.com
http://slidepdf.com/reader/full/001apunte-a-descriptivaprofflor-solis-f-113607 1/25
UNIVERSIDAD DE SANTIAGO DE CHILEFACULTAD DE ADMINISTRACIÓN Y ECONOMÍA
ESTADÍSTICA DESCRIPTIVA -- PROFESORA. FLOR SOLIS FLORES.
- 1 -
Estadística: Ciencia que trata de la recopilación, organización presentación, análisis e
interpretación de datos numéricos (estadísticas), con el fin de realizar una toma de decisionesmás efectiva.
Estadísticadescriptiva
Procedimientos estadísticos que sirven para organizar y resumirconjuntos de datos numéricos.
↑
ProbabilidadMide la incertidumbre, deduce las leyes que rigen a losfenómenos que se investigan.
↓ Estadística
Inferencial
Implica realizar inferencias acerca de la población a partir de
datos muestrales y requiere cálculo de probabilidades.
Población Conjunto de todos los posibles individuos, personas, objetos o mediciones de interésestadístico sobre el que estamos interesados en obtener conclusiones (hacer inferencia).Normalmente es demasiado grande para poder abarcarlo (Tamaño población: N)
A las medidas de resúmenes poblacionales como la media poblacional µ, desviación estándarσ,… se les denominan parámetros.
Parámetro: Característica numérica de la población. Un parámetro es un valor que describea toda una población.
Ejemplo: La edad "promedio" (µ) de los estudiantes de tercer año de Ingeniería Civil en ObrasCiviles.
Muestra: es un subconjunto de la población al que tenemos acceso y sobre el que realmentehacemos las observaciones (mediciones)
Debe ser “representativa” se denota Tamaño de la muestra: nEsta formado por miembros “seleccionados” de la población (individuos, unidadesexperimentales).
A las medidas de resúmenes muestrales como la media de la muestra “ x ”, desviación estándar de la
muestra “s”, se les denomina estadísticos.
Estadístico: Característica numérica de una muestra. Una estadística es un valor que describea una muestra. “ x ”, desviación estándar de la muestra “s”, …, se les denomina estadísticos.
Ejemplo: El tiempo "promedio" ( x ) calculada a partir de un conjunto de 80 tiempos máximos(minutos) de barras planas de un tipo de acero que soportan antes de fragmentarse, cuando sonsometidas a tensión. (n=80)
Unidad de observación: Cada uno de los elementos que componen la población en estudio
5/10/2018 001apunte a Descriptivaprofflor Solis f 113607 - slidepdf.com
http://slidepdf.com/reader/full/001apunte-a-descriptivaprofflor-solis-f-113607 2/25
UNIVERSIDAD DE SANTIAGO DE CHILEFACULTAD DE ADMINISTRACIÓN Y ECONOMÍA
ESTADÍSTICA DESCRIPTIVA -- PROFESORA. FLOR SOLIS FLORES.
- 2 -
Variable:Es una característica, atributo o propiedad que puede variar ( tomar diversos valores )
de una unidad de observación a otra y cuya variación es susceptible de medirse Notación:- En vez de escribir la variable en cada oportunidad, se emplean símbolos, letrasmayúsculas últimas del abecedario
Ejemplo: Variable peso = X y xi la observación i-ésima; cuando se tiene que reemplazar por unaobservación específica, se cambia el subíndice i por un número. Si en una familia cinco niños pesan20, 18, 13, 40 y 52 kilos: x1 =20; x2=18;x3=13;x4=40 y x5=52
¿ Qué significaría Xi-1 si i = 3? X2 = 18
Datos: Conjunto de valores de la variable, medidos a partir de cada uno de los elementos de
una población o muestra.
Observación estadística: Conjunto de datos correspondientes a varias variables identificadas ypertenecientes a un mismo individuo o elemento.
Ejemplo1:-Los siguientes valores expresan el número de veces que 22 consumidorescompraron una determinada marca de un producto en los dos últimos meses:
Construya la tabla que muestre estos datos en forma ordenada
0, 2, 5, 0, 3, 1, 8, 0, 3, 1, 1, 9 4, 0 2, 2, 9 , 3, 0, 1, 9, 8
Observe que la tabla tiene doscolumnas (valores y nº de veces quese compró determinada marca de unproduct , haciendo un total de 22consumidores.
RESPUESTAEJEMPLO 1
Valores Nºveces
0 5
1 4
2 3
3 3
4 1
5 1
6 27 3
Total 22
5/10/2018 001apunte a Descriptivaprofflor Solis f 113607 - slidepdf.com
http://slidepdf.com/reader/full/001apunte-a-descriptivaprofflor-solis-f-113607 3/25
UNIVERSIDAD DE SANTIAGO DE CHILEFACULTAD DE ADMINISTRACIÓN Y ECONOMÍA
ESTADÍSTICA DESCRIPTIVA -- PROFESORA. FLOR SOLIS FLORES.
- 3 -
Ejemplo 2:- En la universidad Z, se desea cuantificar el gasto semestral de la educación de los
alumnos de primer año. Uno de los gastos que hace un estudiante es la compra de sus libros de
estudio, insumos del computador, fotocopias. Para este efecto, se realiza una encuesta a los
alumnos de las carreras de Contador Auditor, Administración Pública, Ingeniería Comercial
Ingeniería Civil en Obras Civiles, se les pregunta sobre el gasto realizado en la compra de estos
ítems durante el semestre.
La población en estudio es…………………………………….
La muestra está constituida por………………………………
La variable en estudio es……………………………………..
La unidad de observación es………………………………….
Un ejemplo de dato es………………………………………..
Un ejemplo de observación estadística es……………………
La población en estudio es:Todos los estudiantes de la universidad Z de los alumnos de 1ª año
La muestra esta constituida por los estudiantes de las carreras deprimer año Contador Auditor , Administración Pública, IngenieríaComercial e Ingeniería Civil en Obras Civiles
La variable en estudio es: el gasto en $ de la compra de libros, insumoscomputacionales, fotocopias.
La unidad de observación es cada alumno de la universidad
Dato: el precio de un libro, el precio de un CD.
Observación estadística: Para el alumno Y, el gasto por comprar un
libro de Física, Matemática, Estadística , 50 CD, 300 fotocopias etc
RESPUESTAEJEMPLO 2
5/10/2018 001apunte a Descriptivaprofflor Solis f 113607 - slidepdf.com
http://slidepdf.com/reader/full/001apunte-a-descriptivaprofflor-solis-f-113607 4/25
UNIVERSIDAD DE SANTIAGO DE CHILEFACULTAD DE ADMINISTRACIÓN Y ECONOMÍA
ESTADÍSTICA DESCRIPTIVA -- PROFESORA. FLOR SOLIS FLORES.
- 4 -
Ejemplo 3:- Continuando con el mismo ejemplo, el Departamento de Finanzas desea evaluar el
gasto promedio en libros de todos los alumnos de la universidad; identificó a 50 estudiantes y
les solicitó que tomaran nota de sus gastos en libros y que informaran cuanto gastaron en
promedio.
El parámetro es………………………………..
La estadística es………………………………
II.- CLASIFICACIÓN DE VARIABLES
Según su naturaleza, las variables se clasifican en:
Variables cualitativas o categóricas, son aquellas que sólo pueden clasificarse pero no
medirse.
Variables cuantitativas, son aquellas cuyos valores se pueden expresar en cantidades
numéricas.
Según el recorrido, las variables se clasifican en:
Variables dicotómicas: sólo toma dos valores
Variables discretas, solo pueden tomar determinados valores, en general, números enteros
además el cero.
Variables continuas, son aquellas que pueden tomar cualquier valor dentro de un intervalo
dado.
El parámetro es el gasto promedio en libros de todoslos alumnos de la universidad de primer año
La estadística es el gasto promedio en libros de los 50estudiantes
5/10/2018 001apunte a Descriptivaprofflor Solis f 113607 - slidepdf.com
http://slidepdf.com/reader/full/001apunte-a-descriptivaprofflor-solis-f-113607 5/25
UNIVERSIDAD DE SANTIAGO DE CHILEFACULTAD DE ADMINISTRACIÓN Y ECONOMÍA
ESTADÍSTICA DESCRIPTIVA -- PROFESORA. FLOR SOLIS FLORES.
- 5 -
Ejemplo 4:- Identifique en cada caso si la variable de interés es cualitativa o cuantitativa.
Una empresa automotriz realiza un estudio de mercado para saber cual es la aceptación que
ha tenido un modelo específico de sus automóviles. Para ello se encuestó a 20 personas que
habían adquirido el vehículo , obteniéndose la siguiente información:
• Aceptación del vehículo (1 = excelente, 2 = bueno, 3 = regular y 4 = malo)
• Ingreso mensual en miles de pesos.
• Edad de las personas.
• Sexo de las personas (1 = masculino; 2 = femenino)
• Nº de meses que posee el vehículo.
• Kilómetros recorridos.
• Color del vehículo.
De acuerdo con su naturaleza, a las variables se les puede asignar una escala de medición,
es decir, son las clases, categorías o intervalos que se le puede asignar
Para las variables categóricas, las escalas son: nominal u ordinal
Para las variables cuantitativas, las escalas son: de intervalo y de razón
Escala nominal: Cuando se utiliza nombres para establecer categorías en las cuales se
clasifican exclusivamente los valores de las variables. Estas categorías no tienen orden lógico
ni una relación jerarquía.
Categorías mutuamente excluyentes, son aquellas en que una persona, objeto o medición se
incluye solamente en una categoría.
Escala ordinal: Se compone de distintas categorías en las que hay implícito un orden en
virtud de un determinado criterio.
Escala Intervalar: Al igual que los dos tipos de escalas anteriores, esta escala permite
establecer relaciones de igualdad /desigualdad y de orden entre los objetos que se miden.
Establece la distancia entre una medida y otra. Este tipo de escala carece de un cero absoluto.
Ejemplo: Los intervalos de la escala son iguales, se puede afirmar que la diferencia de
temperatura que existe entre 25 y 28 grados es la misma que existe entre 30 y 33 grados. Sin
embargo, dado que el punto 0 de la escala es arbitrario -no existe ausencia de temperatura-
no se puede afirmar, por ejemplo, que 20 grados es exactamente la mitad de 40 grados.
5/10/2018 001apunte a Descriptivaprofflor Solis f 113607 - slidepdf.com
http://slidepdf.com/reader/full/001apunte-a-descriptivaprofflor-solis-f-113607 6/25
UNIVERSIDAD DE SANTIAGO DE CHILEFACULTAD DE ADMINISTRACIÓN Y ECONOMÍA
ESTADÍSTICA DESCRIPTIVA -- PROFESORA. FLOR SOLIS FLORES.
- 6 -
Escala de Razón: Es la escala que permite el nivel más alto de medición. Además de las
operaciones que permiten las escalas anteriores, en una escala de razón existe el cero (0)empírico, por lo cual se puede efectuar cualquier operación aritmética con los números de la
escala.
El tiempo de reacción, por ejemplo es una variable medida en escala de razón. No sólo se
puede afirmar que la diferencia entre 3 y 6 segundos es la misma que entre 6 y 9 segundos
(afirmación válida también en la escala de intervalos), sino, además, que 6 seg. es el doble de 3
seg. Afirmación que es posible establecer gracias a que en la escala de tiempo de reacción
existe el cero absoluto: cero seg. Significa ausencia de tiempo de reacción.
En el esquema siguiente, se resume la clasificación de las variables
ORGANIZACIÓN Y REPRESENTACIÓN DE LOS DATOS.
Una vez que se dispone de los datos para cada individuo, la pregunta que surge es
¿como presentarlos de manera resumida?, es decir ¿cómo describir la información disponible
de una manera clara y concisa?
Una forma de describir los datos es mostrar la frecuencia con que se presentan o se
repite cada uno de los valores, los que se agrupan en intervalos (en el caso de datos
cuantitativos) o categorías (para datos cualitativos) de la o las variables consideradas.
Frecuencia absoluta: el número de individuos que pertenecen a cada categoría o el número
de veces que un mismo valor se presenta en el conjunto de datos. Se designa pori
n
5/10/2018 001apunte a Descriptivaprofflor Solis f 113607 - slidepdf.com
http://slidepdf.com/reader/full/001apunte-a-descriptivaprofflor-solis-f-113607 7/25
UNIVERSIDAD DE SANTIAGO DE CHILEFACULTAD DE ADMINISTRACIÓN Y ECONOMÍA
ESTADÍSTICA DESCRIPTIVA -- PROFESORA. FLOR SOLIS FLORES.
- 7 -
Frecuencia relativa: proporción de individuos que poseen la cualidad o que pertenecen a
dicha categoría. Se denota f i, y representa la posición relativa que ocupa cada categoría en el
total (n). f i = (ni / n)*100
Frecuencia absoluta acumulada Ni: es la suma de las frecuencias absolutas.
Frecuencia relativa acumulada Fi: es la suma de las frecuencias relativas.
Distribución de frecuencias de variables cuantitativas de nivel de medición de razón o de
recorrido continuo
Modelo general de una tabla de distribución de frecuencias
Nombre de lavariable (X)
FrecuenciaAbsoluta ni
FrecuenciaRelativa f i
FrecuenciaAbsoluta
Acumulada Ni
FrecuenciaRelativa
AcumuladaFi
k clases ocategorías, o elrecorrido de la
variable en
intervalos
n1 n2 ..
.nk
f 1 f 2 ..
.f k
N1 N2 ..
.Nk = n
F1 F2
.
.
.Fk = 1
Total n 1
ni = número de observaciones en la clase i ; Σni = n i=1,2,3,.........k
n = tamaño de la muestra
f i = ni /n proporción de datos en la clase i ; Σf i = n i = 1,2,3,.........k
Ni = Σni ; i = 1,2,3,.........k Fi = Σf i i = 1,2,3,........ .k
5/10/2018 001apunte a Descriptivaprofflor Solis f 113607 - slidepdf.com
http://slidepdf.com/reader/full/001apunte-a-descriptivaprofflor-solis-f-113607 8/25
UNIVERSIDAD DE SANTIAGO DE CHILEFACULTAD DE ADMINISTRACIÓN Y ECONOMÍA
ESTADÍSTICA DESCRIPTIVA -- PROFESORA. FLOR SOLIS FLORES.
- 8 -
PROF.:FLOR SOLIS F.
Ejemplo de tabla de frecuencias con variablecualitativa
En una gran empresa Constructora se registra el tipode procedimiento que realizan los trabajadores enel mes se clasifican en procedimiento :insuficiente
(DI) y suficiente (DS) de acuerdo a las labores
efectuadas.
Cómo se construiría una tabla de frecuenciascon esta información?
DSDIDIDIDIDIDIDS
DSDIDSDSDSDIDSDS
DSDSDSDSDSDSDSDS
PROF.:FLOR SOLIS F.
Respuesta
10024Total
1002433,38DI
66,71666,716DS
FiNifiniTipo de
procedimento(X)
5/10/2018 001apunte a Descriptivaprofflor Solis f 113607 - slidepdf.com
http://slidepdf.com/reader/full/001apunte-a-descriptivaprofflor-solis-f-113607 9/25
UNIVERSIDAD DE SANTIAGO DE CHILEFACULTAD DE ADMINISTRACIÓN Y ECONOMÍA
ESTADÍSTICA DESCRIPTIVA -- PROFESORA. FLOR SOLIS FLORES.
- 9 -
Al construir tablas de frecuencias con intervalos es necesario tener presente:
• Número de clases o intervalos
Una regla que puede ayudar a decidir el número de clases es la fórmula de Sturges: Número
de clases = [1 + 3,3· log n] (donde n = tamaño de la muestra)
• Amplitud de intervalo
Amplitud de intervalo
Valor máximo – Valor mínimo
Número de clases
Marca de clase: Es el punto medio de un intervalo. Se designa por ´'
ix
- de Tendencia central o de posiciónMEDIDAS DE RESUMEN - de Dispersión
- de Forma
I MEDIDAS DE TENDENCIA CENTRAL O DE POSICIÓN
Una de las características más sobresaliente de la distribución de datos es su
tendencia a acumularse hacia el centro de la misma. Esta característica se denominatendencia central.
Las medidas de tendencia central mas usuales son:
Media Aritmética o Promedio Aritmético 1.- Es una medida totalmente numérica o sea sólo puede calcularse en datos de características
cuantitativas.
2.- En su cálculo se toman en cuenta todos los valores de la variable.
3.- Es lógica desde el punto de vista algebraico.
4.- La media aritmética es altamente afectada por valores extremos.
5.- No puede ser calculada en distribuciones de frecuencia que tengan clases abiertas.
6.- El promedio de una variable X se denota X
La media es una medida apropiada de tendencia central para muchos conjuntos de datos.
La media de las observaciones X1, X2 , X3,...X n es el promedio aritmético de estas y se denota:
5/10/2018 001apunte a Descriptivaprofflor Solis f 113607 - slidepdf.com
http://slidepdf.com/reader/full/001apunte-a-descriptivaprofflor-solis-f-113607 10/2
UNIVERSIDAD DE SANTIAGO DE CHILEFACULTAD DE ADMINISTRACIÓN Y ECONOMÍA
ESTADÍSTICA DESCRIPTIVA -- PROFESORA. FLOR SOLIS FLORES.
- 10 -
x = ∑=
n
i 1xi /n (para datos sin tabular)
x = ∑=
k
i 1
xini/ n (para datos tabulados, con k = nº de intervalos)
A veces se asocia a los números X1 , X2, X3 , .... X n ciertos factores o pesos
W1, W2, ....Wn que dependen de la significación o importancia de cada uno de los números, a
esto se le llama media aritmética ponderada y se calcula:
X = ∑=
n
iwx
1 / ∑=
n
iw
1
Mediana (med(x): Es aquel valor que divide a la muestra en dos partes iguales dejando bajo y
sobre ella el 50% de las observaciones.
Si el número de observaciones es impar, la mediana es el valor central del conjunto
ordenado. Si el número de datos es par se considera la mediana como el promedio aritmético
de los valores centrales del conjunto ordenado. Alternativamente la mediana puede
determinarse a partir de la distribución acumulativa, es decir, la mediana es el percentil 50.
1.- En su cálculo no se incluyen todos los valores de la variable.
2.- La Mediana no es afectada por valores extremos.
3.- Puede ser calculada en distribuciones de frecuencia con clases abiertas.
4.- La variable de una variable X se denota: med(x)
La mediana se calcula de la siguiente forma:
Para un número impar de datos: Para un número par de datos:
n+1
2
( º de datos)=X Med n impar 1
2 2( º de datos)
2
n n
n par
X X
Med ++
=
indica la posición del valor
5/10/2018 001apunte a Descriptivaprofflor Solis f 113607 - slidepdf.com
http://slidepdf.com/reader/full/001apunte-a-descriptivaprofflor-solis-f-113607 11/2
UNIVERSIDAD DE SANTIAGO DE CHILEFACULTAD DE ADMINISTRACIÓN Y ECONOMÍA
ESTADÍSTICA DESCRIPTIVA -- PROFESORA. FLOR SOLIS FLORES.
- 11 -
Para datos tabulados:
−+=
−
J
J
i xn
N n
C Limed 1
)(2
Ejemplo 5:.- En una sucursal bancaria , el monto de cheques cobrados por clientes de empresaspor caja, en un día determinado, registran la siguiente distribución de frecuencia:
Monto en M$ (X) Nº de cheques ni Ni
0 - 200 10 10
200 - 500 13 23
500 - 600 17 40 N j-1
600 - 800 32 n j 72 N j
800 - 1000 18 90
total n=90
n/2 = 45
Determine el monto mediano de cheques cobrados por clientes de empresas por caja.R: $631.250
Moda
1.- En su cálculo no se incluyen todos los valores de la variable.
2.- El valor de la moda puede ser afectado grandemente por el método de designación de los
intervalos de clases.
La moda es el valor más frecuente de la variable . Para el caso de datos tabulados, la
moda es la marca de clases del intervalo de mayor frecuencia.
Hallar la moda en los siguientes datos16, 18, 15, 20, 16 Solución: moda = 16
CUARTILES, DECILES Y PERCENTILES
Percentiles: son los valores que dividen a los datos en cien partes iguales, es un porcentaje y
se define como:
−+= −
− j
1 j
j
'
1 jpn
NcxP 100
np
Li: límite inferior del intervalo medianoCi: amplitud del intervalon/2: mitad de la muestraN j-1: frecuencia absoluta acumulada anterior a N j n j : frecuencia absoluta en la posición J; J > n/2
5/10/2018 001apunte a Descriptivaprofflor Solis f 113607 - slidepdf.com
http://slidepdf.com/reader/full/001apunte-a-descriptivaprofflor-solis-f-113607 12/2
UNIVERSIDAD DE SANTIAGO DE CHILEFACULTAD DE ADMINISTRACIÓN Y ECONOMÍA
ESTADÍSTICA DESCRIPTIVA -- PROFESORA. FLOR SOLIS FLORES.
- 12 -
Los Percentiles Pp son los valores que dividen un conjunto de datos
ordenados de menor a mayor en 100 partes con igual (aproximadamente) númerode datos.
p% (100 - p)%| | |
x(1) Pp x(n) Mín. Máx.
Cuartil: es un valor que divide a los datos en cuatro partes iguales, y están representados por
Q1, Q2, Q3 se llaman primer, segundo y tercer cuartil respectivamente; el valor de Q2 es igual
a la mediana.
Decil: valores que dividen a los datos en diez partes iguales, y se representan por:
D1, D2, ......D9.
II MEDIDAS DE DISPERSIÓN
RangoEl rango de un conjunto de números es la diferencia entre el mayor y el menor de todos
ellos. Por ejemplo: el rango de los números 2,3,3,4,4,4,5,10,12 es 12-2=10R(x)= Xmax - Xmin
Rango intercuartílico
Se calcula este rango, cuando la distribución posee intervalos abiertos, no tienen límite
superior o bien no tienen límite inferior.
Q = Q3 – Q1
Rango semi-intercuartílico o desviación cuartilíca
Se define por: Q= (Q3 – Q1)/2
Varianza
La varianza de un conjunto de datos se define como el cuadrado de la desviación típica
o estándar, mide la dispersión que existe de los datos con respecto a su promedio, el resultado
de la varianza es en unidades cuadráticas, por lo tanto para linealizar un conjunto al medir su
5/10/2018 001apunte a Descriptivaprofflor Solis f 113607 - slidepdf.com
http://slidepdf.com/reader/full/001apunte-a-descriptivaprofflor-solis-f-113607 13/2
UNIVERSIDAD DE SANTIAGO DE CHILEFACULTAD DE ADMINISTRACIÓN Y ECONOMÍA
ESTADÍSTICA DESCRIPTIVA -- PROFESORA. FLOR SOLIS FLORES.
- 13 -
dispersión, le extraemos raíz cuadrada llamada desviación estándar, luego, para calcular la
varianza tenemos.
Para datos sin tabular: σ2(x) = ∑
=
n
i 1
(xi – µ)2 /N
Para datos tabulados: σ2(x) = ∑
=
n
i 1
(xi – µ)2ni /N
Desviación estándar
Es la raíz cuadrada de la varianza dada por: σ = σ
2
Es decir, dado un conjunto de datos x1, x2, ...., xn de una variable X con nivel de
medición en escala de intervalos o de razón, se define la desviación estándar o desviación
típica: como el promedio de las desviaciones de los puntos x i respecto a su promedio
aritmético.
La desviación estándar toma valores no negativos y mide la dispersión: a mayor
desviación estándar mayor dispersión.
El cuadrado de la desviación estándar se denomina varianza S2
Observación: S2 se llama varianza corregida (cuasivarianza), dividida por n – 1 se utiliza en inferencia
estadística como la estimación de la varianza poblacional (σσσσ2)
Coeficiente de variación
El coeficiente de variación es una medida que nos permite comparar dos o más distribuciones
con distintas unidades de medida. Diremos que mientras menor sea el coeficiente de variación la
distribución es más homogénea, es decir, los datos están menos dispersos con respecto al
promedio: ( ). *100 X X
C V X
σ =
5/10/2018 001apunte a Descriptivaprofflor Solis f 113607 - slidepdf.com
http://slidepdf.com/reader/full/001apunte-a-descriptivaprofflor-solis-f-113607 14/2
UNIVERSIDAD DE SANTIAGO DE CHILEFACULTAD DE ADMINISTRACIÓN Y ECONOMÍA
ESTADÍSTICA DESCRIPTIVA -- PROFESORA. FLOR SOLIS FLORES.
- 14 -
Ejemplo 6 .- En un centro de computación, el número de veces que el computador se detiene,por error de máquina, diariamente, fue recolectado por un período de 70 días. Los datosobtenidos fueron los siguientes.
( X ) Nº de detenciones del computador por día.1 0 2 0 0 0 3 3 0 0 1 0 0 0
1 7 5 0 0 4 3 0 6 2 0 2 3 0
0 3 1 1 0 1 0 1 7 0 2 2 1 0
2 2 0 4 0 1 2 1 2 0 0 5 2 1
0 1 6 4 3 3 1 2 4 0 2 1 0 4
6.1.- Tabule y grafique los datos adecuadamente.6.2.- ¿Cuál es la proporción de días en que ocurre por lo menos 2 detenciones6.3.- Calcule una medida de tendencia central apropiada. (Justifique su respuesta).
Ejemplo 7.- Con el propósito de estudiar si hay discriminación en el sueldo de losprofesionales hombres y mujeres en el área de la administración que entran a trabajar porprimera vez, se tomó una muestra en una gran empresa y se les consultó sobre sus sueldos. Lainformación obtenida se presenta en la siguiente tabla:
Sueldos M$ 400 - 500 500 - 600 600 - 700 700 - 800 800 - 900 900 - 1000 1000 - 1200Hombres 5 20 30 40 20 15 10
Mujeres 8 20 28 33 25 18 8
7.1.- Construya un gráfico que le permita comparar el sueldo de los profesionales, hombres ymujeres. ¿Qué puede concluir de él?
7.2.- ¿Qué porcentaje de los hombres tienen sueldo superior a $620.000?
7.3.- Se está estudiando dos alternativas para el próximo reajuste de sueldos a profesionales
mujeres.i) 4% de reajuste ,más un bono mensual de $10.000ii) 08% de reajuste
¿Con cuál de estas dos alternativas la distribución de sueldos reajustados resulta ser máshomogénea que la original? Responda aplicando solo propiedades.
5/10/2018 001apunte a Descriptivaprofflor Solis f 113607 - slidepdf.com
http://slidepdf.com/reader/full/001apunte-a-descriptivaprofflor-solis-f-113607 15/2
UNIVERSIDAD DE SANTIAGO DE CHILEFACULTAD DE ADMINISTRACIÓN Y ECONOMÍA
ESTADÍSTICA DESCRIPTIVA -- PROFESORA. FLOR SOLIS FLORES.
- 15 -
Tablas de contingencia o de asociación
Muestran la asociación entre dos o más variables; se recomienda que sean a lo más tres, parafacilitar la lectura de la tabla. Como hay más de un criterio de clasificación, se preferirácolocar aquel con mayor número de categorías en la columna. Cuando el número de intervaloso categorías es el mismo, se colocará el antecedente en la columna y el consecuente en la fila.
Ejemplo 8:- Se estudia el consumo diario (Y) en kwh de 180 consumidores de energía
eléctrica. Los consumidores se clasifican según tipo en tres grandes grupos: consumidoreshabitacionales, industriales y empresas comerciales. La información obtenida se muestra en la
siguiente tabla:
Tabla : Consumo diario de energía eléctrica (kwh) según tipo de consumidorConsumo
diario (kwh)Tipo de consumidor
Habitacional Industriales Empresascomerciales
Nº % Nº % Nº % Total
< 20 20 57,1 5 4,8 5 12,5 30
20-50 10 28,6 40 38,0 20 50,0 7050 y + 5 14,3 60 57,2 15 37,5 80
Total 35 100,0 105 100,0 40 100,0 180
Determine la medida de posición más adecuada. Interprete sus resultados.
REPRESENTACIÓN GRÀFICA
Gráficos: La presentación gráfica puede revelar de un vistazo las principales características de
un conjunto de datos.Los gráfico de barras y el de torta (o sectorial) son lo más usados para datos cualitativos.
Si la información se encuentra en una tabla de frecuencias con intervalos de clase, las
representaciones adecuadas son el histograma o el polígono de frecuencias, Diagrama de caja,
Tallo y hojas se utilizan en datos de variables cuantitativas contínuas.
Diagrama de Pareto
5/10/2018 001apunte a Descriptivaprofflor Solis f 113607 - slidepdf.com
http://slidepdf.com/reader/full/001apunte-a-descriptivaprofflor-solis-f-113607 16/2
UNIVERSIDAD DE SANTIAGO DE CHILEFACULTAD DE ADMINISTRACIÓN Y ECONOMÍA
ESTADÍSTICA DESCRIPTIVA -- PROFESORA. FLOR SOLIS FLORES.
- 16 -
Uso de celulares según m arca
3827
1510
5
010203040
N o k i a
S a m s u n g
S o n y
S i n
c e l u l a r
S a g e m
Marca de celular
N º
Histograma
índice de temor
86420
n º d e
p e r s o n a s
40
30
20
10
0
Este gráfico consiste en una serie debarras adyacentes cuyas superficiesson proporcionales a la frecuencia delintervalo sobre el cual se levantan.
Polígono de frecuencias
indice de temor
54 - 6147 - 5440 - 4733 - 4026 - 3319 - 2612-19
P o r c e n t a j e
60,00%
55,00%
50,00%
45,00%
40,00%
35,00%
30,00%
25,00%
20,00%
15,00%
10,00%
5,00%
0,00%
38,1%
32,1%
17,9%
4,8%4,8%
1,2%1,2%
Este gráfico consiste en una línea poligonalque resulta de unir los puntos medios omarcas de clases de la parte superior de losrectángulos del histograma
edad
928884807672686460565248444036322824201612840
n º d e
p e r s o n a s
25
20
15
10
5
0
edad
Media =44,21 Desviación típica =16,1N =84
% de uso de celulares según marca
38
27
15
10 5 Nokia
Samsung
Sony
Sin celular
Sagem
5/10/2018 001apunte a Descriptivaprofflor Solis f 113607 - slidepdf.com
http://slidepdf.com/reader/full/001apunte-a-descriptivaprofflor-solis-f-113607 17/2
UNIVERSIDAD DE SANTIAGO DE CHILEFACULTAD DE ADMINISTRACIÓN Y ECONOMÍA
ESTADÍSTICA DESCRIPTIVA -- PROFESORA. FLOR SOLIS FLORES.
- 17 -
DIAGRAMA DE PARETO
Sirve para mostrar actividades o categorías acumuladas; se usan con frecuencia en control de
calidad. Es un gráfico de barras simples ordenadas según frecuencias de mayor a menor, al
cual se le adiciona la frecuencia acumulada, como una manera de
saber donde se concentra el 50% de las actividades.
Diagrama de tallo y hojas (steam and leaf plot). Tukey 1977
Es un procedimiento semi-gráfico para variables cuantitativas continuas que permite obtener
simultáneamente una distribución de frecuencias de la variable y su representación gráfica.
Para construirlo basta separar en cada dato el último
Tiempo en minutos
Frecuencia tallo & hoja
2,00 0 . 785,00 1 . 02444
5,00 1 . 56899
4,00 2 . 0122
1,00 2 . 5
2,00 3 . 01
1,00 Extremes (>=41)
aceptacion del vehículo
maloregularbuenoexcelente
N º D E
P E R S O N A S
60
50
40
30
20
10
0
P or c en t a j e
100
50
0
7
12
1517
5/10/2018 001apunte a Descriptivaprofflor Solis f 113607 - slidepdf.com
http://slidepdf.com/reader/full/001apunte-a-descriptivaprofflor-solis-f-113607 18/25
UNIVERSIDAD DE SANTIAGO DE CHILEFACULTAD DE ADMINISTRACIÓN Y ECONOMÍA
ESTADÍSTICA DESCRIPTIVA -- PROFESORA. FLOR SOLIS FLORES.
- 18 -
DIAGRAMA DE CAJA(Box-Plot): La gráfica describe la distribución de un conjunto de datos
en referencia a los valores de los cuartiles como medidas de tendencia central y al valor del
rango intercuartílico como medida de variabilidad. Constituye un medio ideal para la
observación del grado de simetría de la distribución, es una de las principales técnicas del
análisis exploratorio de datos.
tiempo (minutos)
40
30
20
10
17
Medidas de resumen: Descripción numérica de una variable
Medidas de posición o Tendencia Central:
Media aritmética, Mediana y Moda - Percentiles
Medidas de Dispersión:
Varianza, Desviación Típica, Coeficiente de variación
Medidas de Forma (distribución): Asimetría, Curtosis
Descripción Estadística de una variable nominal
Tabla de frecuencias Gráficos (más ut ilizados) Medidas de resumen
Nombre de laVar.
Númerode
unidades
%
.
.
.
.
.
.
.
.
.
Total n 100
- Barras separadas- Sectorial- Diagrama de
Pareto
Moda
5/10/2018 001apunte a Descriptivaprofflor Solis f 113607 - slidepdf.com
http://slidepdf.com/reader/full/001apunte-a-descriptivaprofflor-solis-f-113607 19/25
UNIVERSIDAD DE SANTIAGO DE CHILEFACULTAD DE ADMINISTRACIÓN Y ECONOMÍA
ESTADÍSTICA DESCRIPTIVA -- PROFESORA. FLOR SOLIS FLORES.
- 19 -
Descripción Estadística de una variable ordinal
Tabla de frecuencias Gráficos (más ut ilizados) Medidas de resumen
NombreVar.
Núm. deunidades
Frec.Acum.
%
.
.
.
.
.
.
.
.n
.
.
.
Total n - 100
- Barras separadas- Sectorial- Diagrama de
Pareto
- Moda
- Mediana
- Percentiles
Descripción Estadística de una variable cuantitativa discreta
Tabla de frecuencias Gráficos (más
utilizados)
Medidas de resumen
NombreVar.
Núm. deunidades
Frec.Acum.
%
.
.
.
.
.
.
.
.n
.
.
.
Total n - 100
- Barrasseparadas
- Moda Tendencia
- Mediana central - Promedio Posición - Percentiles
- Rango- Rango Intercuartílico- Desv. estándardispersión
- Coef. de variación
Descripción Estadística de una variable cuantitativa contínuaTabla de frecuencias Gráficos (más
utilizados)
Medidas de resumen
NombreVar.
Núm. deunidades
Frec.Acum.
%
[ , ).
.
.
.
.
.n
.
.
.
Total n - 100
- Histograma- Polígono de
frec.
- Tallo - hojas- Diagrama de
caja- Otros
- Moda Tendencia
- Mediana central - Promedio Posición - Percentiles
- Rango- Rango Intercuartílico- Desv. estándardispersión
- Coef. de variación
X ≠ Mediana ⇒ asimetría, lo que sugiere heterogeneidad en los datos.
∴∴∴∴ La Mediana es la medida de tendencia central adecuada para resumir los datos.
cuandotengasentido
5/10/2018 001apunte a Descriptivaprofflor Solis f 113607 - slidepdf.com
http://slidepdf.com/reader/full/001apunte-a-descriptivaprofflor-solis-f-113607 20/2
UNIVERSIDAD DE SANTIAGO DE CHILEFACULTAD DE ADMINISTRACIÓN Y ECONOMÍA
ESTADÍSTICA DESCRIPTIVA -- PROFESORA. FLOR SOLIS FLORES.
- 20 -
Simétrica
X = Me = Mo
Asimetría positiva
Mo < Me < X
Asimetría Negativa
X < Me < Mo
Estadísticos de dispersión o variabilidad Observaciones
Rango valor máximo – valor mínimo
- La variable X debe ser por lomenos de intervalos.
- Defectos. No permite hacer unainterpretación precisa de unvalor dentro de una distribución.
- No interviene en relacionesmatemáticas importantes en lainferencia estadística.
Rangointercuartílico
RI = Q3 – Q1 = P75 – P25 Longitud del 50% central de ladistribución de datos
- La variable X debe ser por lo
menos de intervalos.- RI se usa con mayor frecuencia
acompañando a la medianacuando la presencia de valoresextremos hace pocorecomendable el uso delpromedio.
- No interviene en relacionesmatemáticas importantes en lainferencia estadística.
Varianza
n2
i2 i 1s
(x x)
n=
−=
∑
n
2i
2 i 1s
(x x)
n -1=
−= ∑
Varianza corregida (se utiliza cuandola muestra del estudio es aleatoriasimple)
Desviaciónestándar odesviacióntípica
n2
i
i =1
(x - x)
s =n
∑
n2
i
i =1
(x - x)
s =n-1
∑
x 32.5 27.5 22.5 17.5 12.5 7.5 2.5
10 8 6 4 2 0
X 32.5 27.5 22.5 17.5 12.5 7.5 2.5
10 8 6 4 2 0
X
32.57.52.517.512.57.5.5
10
8
6
4
0
5/10/2018 001apunte a Descriptivaprofflor Solis f 113607 - slidepdf.com
http://slidepdf.com/reader/full/001apunte-a-descriptivaprofflor-solis-f-113607 21/2
UNIVERSIDAD DE SANTIAGO DE CHILEFACULTAD DE ADMINISTRACIÓN Y ECONOMÍA
ESTADÍSTICA DESCRIPTIVA -- PROFESORA. FLOR SOLIS FLORES.
- 21 -
Ejemplo9:: Analizar si existe relación lineal entre peso y estatura
Gráfico adecuado: Diagrama de dispersión
Medida de resumen: Correlación lineal. Pearson
Correlaciones
1 ,821**
,000
250 250
,821** 1
,000
250 250
Correlación de Pearson
Sig. (bilateral)
N
Correlación de Pearson
Sig. (bilateral)
N
Peso
Estatura
Peso Estatura
La correlación es significativa al nivel 0,01 (bilateral).**.
DIAGRAMA DE DISPERSIÓN.
5/10/2018 001apunte a Descriptivaprofflor Solis f 113607 - slidepdf.com
http://slidepdf.com/reader/full/001apunte-a-descriptivaprofflor-solis-f-113607 22/2
UNIVERSIDAD DE SANTIAGO DE CHILEFACULTAD DE ADMINISTRACIÓN Y ECONOMÍA
ESTADÍSTICA DESCRIPTIVA -- PROFESORA. FLOR SOLIS FLORES.
- 22 -
FORMULAS DE INTERÉS
n
xn
1i
i
x∑
== ;
2n
in ni 12 2
i i2 i 1 i 1x
x
(x x) xn
n-1 n-1s
=
= =
− −
= =
∑∑ ∑
Sx = 2xS
n
xk
1i
i
x∑
==in
;
2k
ik k i 12 2
i i2 i 1 i 1x
x
(x x) xn
n-1 n-1
s
i
i i
n
n n=
= =
− −
= =
∑∑ ∑
; x
sCV x
x =
Cov(x,y) =1-n
n
yx
yx
1-n
)y-)(yx-(xn
1i
n
1ii
n
1ii
ii
n
1i
ii
xys∑
∑∑∑
=
==
=
−==
−+= −
− j
1 j
j
'
1 jpn
NcxP 100
np
yx
xy
ss s
r =
Medidas de Tendencia Central Medidas de Dispersión
Media Aritmética o Promedio Aritmético X Desviación Estándar o típica. σσσσ
Moda Mo Varianza Poblacional σσσσ2
Mediana Med Coeficiente de Variación X
X
σ
Frecuencia ni Rango Intercuartílico Q=Q3 – Q1
Percentiles P X
Cuartiles Q
Deciles D
5/10/2018 001apunte a Descriptivaprofflor Solis f 113607 - slidepdf.com
http://slidepdf.com/reader/full/001apunte-a-descriptivaprofflor-solis-f-113607 23/2
UNIVERSIDAD DE SANTIAGO DE CHILEFACULTAD DE ADMINISTRACIÓN Y ECONOMÍA
ESTADÍSTICA DESCRIPTIVA -- PROFESORA. FLOR SOLIS FLORES.
- 23 -
Clasificación de las variables
Distribución de
Frecuencias
Asociación entre
variables (dos omás)
Tamaño del recorrido Escala de Medición (una variable)
DiscretasNominal u ordinal
Barras Simples BarrasSubdivididas
Circular o de torta Barras agrupadas
ContinuasIntervalos o Razón
Histograma simple Lineal
Histograma ajustado Correlación
Polígono deFrecuencias
Resumen de algunas fórmulas.
Ley de Sturges (determinar nº de Intervalos) [1+3.3 Log n]
Corrección de la Amplitud
Histograma ajustado.
* ic
i
k nn
c=
Rango Intercuartílico RI = Q3 – Q1
Varianza σ2 =∑ (x - µ)2 ni
N
Desviación Estándar 2
X X σ σ =
Mediana1
( )2lim.inf . ( )
j
x i
j
n N
med cn
−−= +
Coeficiente de Correlación:
Ejemplo10: Para determinada tarea en una fábrica, donde se necesita mucha destreza, sequiere investigar si “la productividad en el trabajo debe ser mayor al aumentar los años deexperiencia”. Se seleccionaron al azar diez empleados de entre lo que tienen ese trabajo. Losdatos de años de experiencia y medición de productividad son los siguientes:
Realice el diagrama de dispersión y calcular el coeficiente r de Pearson. Interprete losresultados.
5/10/2018 001apunte a Descriptivaprofflor Solis f 113607 - slidepdf.com
http://slidepdf.com/reader/full/001apunte-a-descriptivaprofflor-solis-f-113607 24/2
UNIVERSIDAD DE SANTIAGO DE CHILEFACULTAD DE ADMINISTRACIÓN Y ECONOMÍA
ESTADÍSTICA DESCRIPTIVA -- PROFESORA. FLOR SOLIS FLORES.
- 24 -
El coeficiente de correlación nos permite analizar si existe una relación lineal entre dos
variables X e Y.
-1 < r(x,y) < 1
Y es a través del diagrama de dispersión, donde es más fácil apreciar, que tan correlacionados
se encuentran los datos.
2,5 5,0 7,5 10,0 12,5
años
80,0
82,5
85,0
87,5
90,0
p r o d u c t i v i d a d
Correlaciones
1 ,920**
10 10
,920** 1
Correlación de Pearson
n
Correlación de Pearson
años
productividad
años productividad
La correlación es significativa al nivel 0,01 (bilateral).**.
r = 0.9197 91.97%
Entre las variables existe una correlación positiva fuerte, se encuentran en relación directa, amayor años de experiencia mayor productividad o vice-versa
r (x,y) = Cov(x,y)
S x * Sy
Regresión lineal
2,5 5,0 7,5 10,0 12,5
años
80,0
82,5
85,0
87,5
90,0
p r o d u
c t i v i d a d
1productividad = 77,36 + 1,10 * años
R-cuadrado = 0,85
5/10/2018 001apunte a Descriptivaprofflor Solis f 113607 - slidepdf.com
http://slidepdf.com/reader/full/001apunte-a-descriptivaprofflor-solis-f-113607 25/2
UNIVERSIDAD DE SANTIAGO DE CHILEFACULTAD DE ADMINISTRACIÓN Y ECONOMÍA
ESTADÍSTICA DESCRIPTIVA -- PROFESORA. FLOR SOLIS FLORES.
- 25 -
La gráfica siguiente resume la fuerza y la relación del coeficiente de correlación.
CorrelaciónNegativaPerfecta
CorrelaciónPositivaPerfecta
CorrelaciónNegativaFuerte
Correlación PositivaCorrelación Negativa
CorrelaciónpositivaDébil
CorrelaciónNegativaModerada
CorrelaciónPositivaModerada
CorrelaciónPositivaFuerte
CorrelaciónNegativaDébil
No hayCorrelación
-1 0.50-0.5 1