+ All Categories
Home > Documents > 001apunte a Descriptivaprofflor Solis f 113607

001apunte a Descriptivaprofflor Solis f 113607

Date post: 08-Jul-2015
Category:
Upload: elisabeth-herrera
View: 19 times
Download: 0 times
Share this document with a friend
25
  UNIVERSIDAD DE SANTIAGO DE CHILE FACULTAD DE ADMINISTRACIÓN Y ECONOMÍA ESTADÍSTICA DESCRIPT IVA -- PROFESORA. FLOR SOLIS F LORES. - 1 -  Estadística: Ciencia que trata de la recopilación, organización presentación, análisis e interpretación de datos numéricos (estadísticas), con el fin de realizar una toma de decisiones más efectiva. Estadística descriptiva Procedimientos estadísticos que sirven para organizar y resumir conjuntos de datos numéricos.  Probabilidad Mide la incertidumbre, deduce las leyes que rigen a los fenómenos que se investigan.  Estadística Inferencial Implica realizar inferencias acerca de la población a partir de datos muestrales y requiere cálculo de probabilidades. Población Conjunto de todos los posibles individuos, personas, objetos o mediciones de interés estadístico sobre el que estamos interesados en obtene r conclusiones (hacer inferencia). Normalmente es demasiado grande para poder abarcarlo (Tamaño población: N) A las medidas de resúmenes poblacionales como la media poblacional µ, desviación estándar σ,… se les denominan parámetros. Parámetro: Característica numérica de la población. Un parámetro es un valor que describe a toda una población.  Ejemplo: La edad "promedio" ( µ) de los estudiantes de tercer año de Ingeniería Civil en Obras Civiles. Muestra: es un subconjunto de la población al que tenemos acceso y sobre el que realmente hacemos las observaciones (mediciones) Debe ser “representativa” se denota Tamaño de la muestra: n Esta formado por miembros “seleccionados” de la población (individuos, unidades experimentales). A las medidas de resúmenes muestrales como la media de la muestra “ x ”, desviación estándar de la muestra “s”, se les denomina estadísticos. Estadístico: Característica numérica de una muestra. Una estadística es un valor que describe a una muestra.  x ”, desviación estándar de la muestra “s”, …, se les denomina estadísticos.   Ejemplo: El tiempo "promedio" ( x ) calculada a partir de un conjunto de 80 tiempos máximos (minutos) de barras planas de un tipo de acero que soportan antes de fragmentarse, cuando son sometidas a tensión. (n=80) Unidad de observación: Cada uno de los elementos que componen la población en estudio
Transcript

5/10/2018 001apunte a Descriptivaprofflor Solis f 113607 - slidepdf.com

http://slidepdf.com/reader/full/001apunte-a-descriptivaprofflor-solis-f-113607 1/25

UNIVERSIDAD DE SANTIAGO DE CHILEFACULTAD DE ADMINISTRACIÓN Y ECONOMÍA

ESTADÍSTICA DESCRIPTIVA -- PROFESORA. FLOR SOLIS FLORES.

- 1 -

 

Estadística: Ciencia que trata de la recopilación, organización presentación, análisis e

interpretación de datos numéricos (estadísticas), con el fin de realizar una toma de decisionesmás efectiva.

Estadísticadescriptiva

Procedimientos estadísticos que sirven para organizar y resumirconjuntos de datos numéricos.

↑ 

ProbabilidadMide la incertidumbre, deduce las leyes que rigen a losfenómenos que se investigan.

↓ Estadística

Inferencial

Implica realizar inferencias acerca de la población a partir de

datos muestrales y requiere cálculo de probabilidades.

Población Conjunto de todos los posibles individuos, personas, objetos o mediciones de interésestadístico sobre el que estamos interesados en obtener conclusiones (hacer inferencia).Normalmente es demasiado grande para poder abarcarlo (Tamaño población: N)

A las medidas de resúmenes poblacionales como la media poblacional µ, desviación estándarσ,… se les denominan parámetros.

Parámetro: Característica numérica de la población. Un parámetro es un valor que describea toda una población.

 Ejemplo: La edad "promedio" (µ) de los estudiantes de tercer año de Ingeniería Civil en ObrasCiviles.

Muestra: es un subconjunto de la población al que tenemos acceso y sobre el que realmentehacemos las observaciones (mediciones)

Debe ser “representativa” se denota Tamaño de la muestra: nEsta formado por miembros “seleccionados” de la población (individuos, unidadesexperimentales).

A las medidas de resúmenes muestrales como la media de la muestra “ x ”, desviación estándar de la

muestra “s”, se les denomina estadísticos.

Estadístico: Característica numérica de una muestra. Una estadística es un valor que describea una muestra. “ x ”, desviación estándar de la muestra “s”, …, se les denomina estadísticos. 

 Ejemplo: El tiempo "promedio" ( x ) calculada a partir de un conjunto de 80 tiempos máximos(minutos) de barras planas de un tipo de acero que soportan antes de fragmentarse, cuando sonsometidas a tensión. (n=80)

Unidad de observación: Cada uno de los elementos que componen la población en estudio

5/10/2018 001apunte a Descriptivaprofflor Solis f 113607 - slidepdf.com

http://slidepdf.com/reader/full/001apunte-a-descriptivaprofflor-solis-f-113607 2/25

UNIVERSIDAD DE SANTIAGO DE CHILEFACULTAD DE ADMINISTRACIÓN Y ECONOMÍA

ESTADÍSTICA DESCRIPTIVA -- PROFESORA. FLOR SOLIS FLORES.

- 2 -

 Variable:Es una característica, atributo o propiedad que puede variar ( tomar diversos valores )

de una unidad de observación a otra y cuya variación es susceptible de medirse Notación:- En vez de escribir la variable en cada oportunidad, se emplean símbolos, letrasmayúsculas últimas del abecedario

 Ejemplo: Variable peso = X y xi la observación i-ésima; cuando se tiene que reemplazar por unaobservación específica, se cambia el subíndice i por un número. Si en una familia cinco niños pesan20, 18, 13, 40 y 52 kilos: x1 =20; x2=18;x3=13;x4=40 y x5=52

¿ Qué significaría Xi-1 si i = 3? X2 = 18

Datos: Conjunto de valores de la variable, medidos a partir de cada uno de los elementos de

una población o muestra.

Observación estadística: Conjunto de datos correspondientes a varias variables identificadas ypertenecientes a un mismo individuo o elemento.

 Ejemplo1:-Los siguientes valores expresan el número de veces que 22 consumidorescompraron una determinada marca de un producto en los dos últimos meses:

Construya la tabla que muestre estos datos en forma ordenada 

0, 2, 5, 0, 3, 1, 8, 0, 3, 1, 1, 9 4, 0 2, 2, 9 , 3, 0, 1, 9, 8

Observe que la tabla tiene doscolumnas (valores y nº de veces quese compró determinada marca de unproduct , haciendo un total de 22consumidores.

RESPUESTAEJEMPLO 1

Valores Nºveces

0 5

1 4

2 3

3 3

4 1

5 1

6 27 3

Total 22

5/10/2018 001apunte a Descriptivaprofflor Solis f 113607 - slidepdf.com

http://slidepdf.com/reader/full/001apunte-a-descriptivaprofflor-solis-f-113607 3/25

UNIVERSIDAD DE SANTIAGO DE CHILEFACULTAD DE ADMINISTRACIÓN Y ECONOMÍA

ESTADÍSTICA DESCRIPTIVA -- PROFESORA. FLOR SOLIS FLORES.

- 3 -

 

 Ejemplo 2:- En la universidad Z, se desea cuantificar el gasto semestral de la educación de los

alumnos de primer año. Uno de los gastos que hace un estudiante es la compra de sus libros de

estudio, insumos del computador, fotocopias. Para este efecto, se realiza una encuesta a los

alumnos de las carreras de Contador Auditor, Administración Pública, Ingeniería Comercial

Ingeniería Civil en Obras Civiles, se les pregunta sobre el gasto realizado en la compra de estos

ítems durante el semestre.

La población en estudio es…………………………………….

La muestra está constituida por………………………………

La variable en estudio es……………………………………..

La unidad de observación es………………………………….

Un ejemplo de dato es………………………………………..

Un ejemplo de observación estadística es……………………

La población en estudio es:Todos los estudiantes de la universidad Z de los alumnos de 1ª año

La muestra esta constituida por los estudiantes de las carreras deprimer año Contador Auditor , Administración Pública, IngenieríaComercial e Ingeniería Civil en Obras Civiles

La variable en estudio es: el gasto en $ de la compra de libros, insumoscomputacionales, fotocopias.

La unidad de observación es cada alumno de la universidad

Dato: el precio de un libro, el precio de un CD.

Observación estadística: Para el alumno Y, el gasto por comprar un

libro de Física, Matemática, Estadística , 50 CD, 300 fotocopias etc

RESPUESTAEJEMPLO 2

5/10/2018 001apunte a Descriptivaprofflor Solis f 113607 - slidepdf.com

http://slidepdf.com/reader/full/001apunte-a-descriptivaprofflor-solis-f-113607 4/25

UNIVERSIDAD DE SANTIAGO DE CHILEFACULTAD DE ADMINISTRACIÓN Y ECONOMÍA

ESTADÍSTICA DESCRIPTIVA -- PROFESORA. FLOR SOLIS FLORES.

- 4 -

 

 Ejemplo 3:- Continuando con el mismo ejemplo, el Departamento de Finanzas desea evaluar el

gasto promedio en libros de todos los alumnos de la universidad; identificó a 50 estudiantes y

les solicitó que tomaran nota de sus gastos en libros y que informaran cuanto gastaron en

promedio.

El parámetro es………………………………..

La estadística es………………………………

II.- CLASIFICACIÓN DE VARIABLES 

Según su naturaleza, las variables se clasifican en: 

Variables cualitativas o categóricas, son aquellas que sólo pueden clasificarse pero no

medirse.

Variables cuantitativas, son aquellas cuyos valores se pueden expresar en cantidades

numéricas.

Según el recorrido, las variables se clasifican en: 

Variables dicotómicas: sólo toma dos valores

Variables discretas, solo pueden tomar determinados valores, en general, números enteros

además el cero.

Variables continuas, son aquellas que pueden tomar cualquier valor dentro de un intervalo

dado.

El parámetro es el gasto promedio en libros de todoslos alumnos de la universidad de primer año

La estadística es el gasto promedio en libros de los 50estudiantes

5/10/2018 001apunte a Descriptivaprofflor Solis f 113607 - slidepdf.com

http://slidepdf.com/reader/full/001apunte-a-descriptivaprofflor-solis-f-113607 5/25

UNIVERSIDAD DE SANTIAGO DE CHILEFACULTAD DE ADMINISTRACIÓN Y ECONOMÍA

ESTADÍSTICA DESCRIPTIVA -- PROFESORA. FLOR SOLIS FLORES.

- 5 -

 Ejemplo 4:- Identifique en cada caso si la variable de interés es cualitativa o cuantitativa.

Una empresa automotriz realiza un estudio de mercado para saber cual es la aceptación que

ha tenido un modelo específico de sus automóviles. Para ello se encuestó a 20 personas que

habían adquirido el vehículo , obteniéndose la siguiente información:

•  Aceptación del vehículo (1 = excelente, 2 = bueno, 3 = regular y 4 = malo)

•  Ingreso mensual en miles de pesos.

•  Edad de las personas.

•  Sexo de las personas (1 = masculino; 2 = femenino)

•  Nº de meses que posee el vehículo.

•  Kilómetros recorridos.

•  Color del vehículo.

De acuerdo con su naturaleza, a las variables se les puede asignar una escala de medición,

es decir, son las clases, categorías o intervalos que se le puede asignar

Para las variables categóricas, las escalas son: nominal u ordinal 

Para las variables cuantitativas, las escalas son: de intervalo y de razón

Escala nominal: Cuando se utiliza nombres para establecer categorías en las cuales se

clasifican exclusivamente los valores de las variables. Estas categorías no tienen orden lógico

ni una relación jerarquía.

Categorías mutuamente excluyentes, son aquellas en que una persona, objeto o medición se

incluye solamente en una categoría.

Escala ordinal: Se compone de distintas categorías en las que hay implícito un orden en

virtud de un determinado criterio.

Escala Intervalar: Al igual que los dos tipos de escalas anteriores, esta escala permite

establecer relaciones de igualdad /desigualdad y de orden entre los objetos que se miden.

Establece la distancia entre una medida y otra. Este tipo de escala carece de un cero absoluto. 

 Ejemplo: Los intervalos de la escala son iguales, se puede afirmar que la diferencia de

temperatura que existe entre 25 y 28 grados es la misma que existe entre 30 y 33 grados. Sin

embargo, dado que el punto 0 de la escala es arbitrario -no existe ausencia de temperatura-

no se puede afirmar, por ejemplo, que 20 grados es exactamente la mitad de 40 grados.

5/10/2018 001apunte a Descriptivaprofflor Solis f 113607 - slidepdf.com

http://slidepdf.com/reader/full/001apunte-a-descriptivaprofflor-solis-f-113607 6/25

UNIVERSIDAD DE SANTIAGO DE CHILEFACULTAD DE ADMINISTRACIÓN Y ECONOMÍA

ESTADÍSTICA DESCRIPTIVA -- PROFESORA. FLOR SOLIS FLORES.

- 6 -

 

Escala de Razón: Es la escala que permite el nivel más alto de medición. Además de las

operaciones que permiten las escalas anteriores, en una escala de razón existe el cero (0)empírico, por lo cual se puede efectuar cualquier operación aritmética con los números de la

escala.

El tiempo de reacción,  por ejemplo es una variable medida en escala de razón. No sólo se

puede afirmar que la diferencia entre 3 y 6 segundos es la misma que entre 6 y 9 segundos

(afirmación válida también en la escala de intervalos), sino, además, que 6 seg. es el doble de 3

seg. Afirmación que es posible establecer gracias a que en la escala de tiempo de reacción

existe el cero absoluto: cero seg. Significa ausencia de tiempo de reacción.

En el esquema siguiente, se resume la clasificación de las variables

ORGANIZACIÓN Y REPRESENTACIÓN DE LOS DATOS.

Una vez que se dispone de los datos para cada individuo, la pregunta que surge es

¿como presentarlos de manera resumida?, es decir ¿cómo describir la información disponible

de una manera clara y concisa?

Una forma de describir los datos es mostrar la frecuencia con que se presentan o se

repite cada uno de los valores, los que se agrupan en intervalos (en el caso de datos

cuantitativos) o categorías (para datos cualitativos) de la o las variables consideradas. 

Frecuencia absoluta: el número de individuos que pertenecen a cada categoría o el número

de veces que un mismo valor se presenta en el conjunto de datos. Se designa pori

n  

5/10/2018 001apunte a Descriptivaprofflor Solis f 113607 - slidepdf.com

http://slidepdf.com/reader/full/001apunte-a-descriptivaprofflor-solis-f-113607 7/25

UNIVERSIDAD DE SANTIAGO DE CHILEFACULTAD DE ADMINISTRACIÓN Y ECONOMÍA

ESTADÍSTICA DESCRIPTIVA -- PROFESORA. FLOR SOLIS FLORES.

- 7 -

 

Frecuencia relativa: proporción de individuos que poseen la cualidad o que pertenecen a

dicha categoría. Se denota f i, y representa la posición relativa que ocupa cada categoría en el

total (n). f i = (ni / n)*100

Frecuencia absoluta acumulada Ni: es la suma de las frecuencias absolutas.

Frecuencia relativa acumulada  Fi: es la suma de las frecuencias relativas.

Distribución de frecuencias de variables cuantitativas de nivel de medición de razón o de

recorrido continuo

Modelo general de una tabla de distribución de frecuencias

Nombre de lavariable (X)

FrecuenciaAbsoluta ni

FrecuenciaRelativa f i

FrecuenciaAbsoluta

Acumulada Ni

FrecuenciaRelativa

AcumuladaFi

k clases ocategorías, o elrecorrido de la

variable en

intervalos

n1 n2 ..

.nk  

f 1 f 2 ..

.f k 

N1 N2 ..

.Nk = n

F1 F2

.

.

.Fk = 1

Total n 1

ni = número de observaciones en la clase i ; Σni = n i=1,2,3,.........k 

n = tamaño de la muestra

f i = ni /n proporción de datos en la clase i ; Σf i = n i = 1,2,3,.........k 

Ni = Σni ; i = 1,2,3,.........k Fi = Σf i i = 1,2,3,........ .k 

5/10/2018 001apunte a Descriptivaprofflor Solis f 113607 - slidepdf.com

http://slidepdf.com/reader/full/001apunte-a-descriptivaprofflor-solis-f-113607 8/25

UNIVERSIDAD DE SANTIAGO DE CHILEFACULTAD DE ADMINISTRACIÓN Y ECONOMÍA

ESTADÍSTICA DESCRIPTIVA -- PROFESORA. FLOR SOLIS FLORES.

- 8 -

 

PROF.:FLOR SOLIS F.

Ejemplo de tabla de frecuencias con variablecualitativa

En una gran empresa Constructora se registra el tipode procedimiento que realizan los trabajadores enel mes se clasifican en procedimiento :insuficiente

(DI) y suficiente (DS) de acuerdo a las labores

efectuadas.

Cómo se construiría una tabla de frecuenciascon esta información?

DSDIDIDIDIDIDIDS

DSDIDSDSDSDIDSDS

DSDSDSDSDSDSDSDS

 

PROF.:FLOR SOLIS F.

Respuesta

10024Total

1002433,38DI

66,71666,716DS

FiNifiniTipo de

procedimento(X)

 

5/10/2018 001apunte a Descriptivaprofflor Solis f 113607 - slidepdf.com

http://slidepdf.com/reader/full/001apunte-a-descriptivaprofflor-solis-f-113607 9/25

UNIVERSIDAD DE SANTIAGO DE CHILEFACULTAD DE ADMINISTRACIÓN Y ECONOMÍA

ESTADÍSTICA DESCRIPTIVA -- PROFESORA. FLOR SOLIS FLORES.

- 9 -

 

Al construir tablas de frecuencias con intervalos es necesario tener presente:

•  Número de clases o intervalos

Una regla que puede ayudar a decidir el número de clases es la fórmula de Sturges: Número

de clases = [1 + 3,3· log n] (donde n = tamaño de la muestra) 

•  Amplitud de intervalo

Amplitud de intervalo

Valor máximo – Valor mínimo

Número de clases 

Marca de clase: Es el punto medio de un intervalo. Se designa por ´'

ix  

- de Tendencia central o de posiciónMEDIDAS DE RESUMEN - de Dispersión

- de Forma 

I MEDIDAS DE TENDENCIA CENTRAL O DE POSICIÓN

Una de las características más sobresaliente de la distribución de datos es su

tendencia a acumularse hacia el centro de la misma. Esta característica se denominatendencia central.

Las medidas de tendencia central mas usuales son:

Media Aritmética o Promedio Aritmético 1.- Es una medida totalmente numérica o sea sólo puede calcularse en datos de características

cuantitativas.

2.- En su cálculo se toman en cuenta todos los valores de la variable.

3.- Es lógica desde el punto de vista algebraico.

4.- La media aritmética es altamente afectada por valores extremos.

5.- No puede ser calculada en distribuciones de frecuencia que tengan clases abiertas.

6.- El promedio de una variable X se denota    X

La media es una medida apropiada de tendencia central para muchos conjuntos de datos.

La media de las observaciones X1, X2 , X3,...X n es el promedio aritmético de estas y se denota:

5/10/2018 001apunte a Descriptivaprofflor Solis f 113607 - slidepdf.com

http://slidepdf.com/reader/full/001apunte-a-descriptivaprofflor-solis-f-113607 10/2

UNIVERSIDAD DE SANTIAGO DE CHILEFACULTAD DE ADMINISTRACIÓN Y ECONOMÍA

ESTADÍSTICA DESCRIPTIVA -- PROFESORA. FLOR SOLIS FLORES.

- 10 -

   x = ∑=

n

i 1xi /n (para datos sin tabular)

   x = ∑=

i 1

xini/ n (para datos tabulados, con k = nº de intervalos)

A veces se asocia a los números X1 , X2, X3 , .... X n  ciertos factores o pesos

W1, W2, ....Wn  que dependen de la significación o importancia de cada uno de los números, a

esto se le llama media aritmética ponderada y se calcula:

   X = ∑=

n

iwx

1  / ∑=

n

iw

Mediana (med(x): Es aquel valor que divide a la muestra en dos partes iguales dejando bajo y

sobre ella el 50% de las observaciones.

Si el número de observaciones es impar, la mediana es el valor central del conjunto

ordenado. Si el número de datos es par se considera la mediana como el promedio aritmético

de los valores centrales del conjunto ordenado. Alternativamente la mediana puede

determinarse a partir de la distribución acumulativa, es decir, la mediana es el percentil 50.

1.- En su cálculo no se incluyen todos los valores de la variable.

2.- La Mediana no es afectada por valores extremos.

3.- Puede ser calculada en distribuciones de frecuencia con clases abiertas.

4.- La variable de una variable X se denota: med(x)

La mediana se calcula de la siguiente forma:

Para un número impar de datos:  Para un número par de datos: 

n+1

2

( º de datos)=X Med n impar    1

2 2( º de datos)

2

n n

n par  

 X X 

 Med ++

=  

indica la posición del valor

5/10/2018 001apunte a Descriptivaprofflor Solis f 113607 - slidepdf.com

http://slidepdf.com/reader/full/001apunte-a-descriptivaprofflor-solis-f-113607 11/2

UNIVERSIDAD DE SANTIAGO DE CHILEFACULTAD DE ADMINISTRACIÓN Y ECONOMÍA

ESTADÍSTICA DESCRIPTIVA -- PROFESORA. FLOR SOLIS FLORES.

- 11 -

Para datos tabulados:

 

 

 

  −+=

 J 

 J 

i xn

 N n

C  Limed 1

)(2

 

 Ejemplo 5:.- En una sucursal bancaria , el monto de cheques cobrados por clientes de empresaspor caja, en un día determinado, registran la siguiente distribución de frecuencia:

Monto en M$ (X) Nº de cheques ni Ni

0 - 200 10 10

200 - 500 13 23

500 - 600 17 40 N j-1 

600 - 800 32 n j  72 N j 

800 - 1000 18 90

total n=90

n/2 = 45

Determine el monto mediano de cheques cobrados por clientes de empresas por caja.R: $631.250 

Moda

1.- En su cálculo no se incluyen todos los valores de la variable.

2.- El valor de la moda puede ser afectado grandemente por el método de designación de los

intervalos de clases.

La moda es el valor más frecuente de la variable . Para el caso de datos tabulados, la

moda es la marca de clases del intervalo de mayor frecuencia.

Hallar la moda en los siguientes datos16, 18, 15, 20, 16 Solución:  moda = 16 

CUARTILES, DECILES Y PERCENTILES

Percentiles: son los valores que dividen a los datos en cien partes iguales, es un porcentaje y

se define como: 

 

 

 

  −+= −

− j

1 j

 j

'

1 jpn

NcxP 100

np

 

Li: límite inferior del intervalo medianoCi: amplitud del intervalon/2: mitad de la muestraN j-1: frecuencia absoluta acumulada anterior a N j n j : frecuencia absoluta en la posición J; J > n/2

5/10/2018 001apunte a Descriptivaprofflor Solis f 113607 - slidepdf.com

http://slidepdf.com/reader/full/001apunte-a-descriptivaprofflor-solis-f-113607 12/2

UNIVERSIDAD DE SANTIAGO DE CHILEFACULTAD DE ADMINISTRACIÓN Y ECONOMÍA

ESTADÍSTICA DESCRIPTIVA -- PROFESORA. FLOR SOLIS FLORES.

- 12 -

Los Percentiles Pp son los valores que dividen un conjunto de datos

ordenados de menor a mayor en 100 partes con igual (aproximadamente) númerode datos.

p% (100 - p)%| | |

x(1) Pp x(n) Mín. Máx.

Cuartil: es un valor que divide a los datos en cuatro partes iguales, y están representados por 

Q1, Q2, Q3  se llaman primer, segundo y tercer cuartil respectivamente; el valor de Q2 es igual

a la mediana.

Decil: valores que dividen a los datos en diez partes iguales, y se representan por:

D1, D2, ......D9. 

II MEDIDAS DE DISPERSIÓN

RangoEl rango de un conjunto de números es la diferencia entre el mayor y el menor de todos

ellos. Por ejemplo: el rango de los números 2,3,3,4,4,4,5,10,12 es 12-2=10R(x)= Xmax - Xmin 

Rango intercuartílico

Se calcula este rango, cuando la distribución posee intervalos abiertos, no tienen límite

superior o bien no tienen límite inferior.

Q = Q3 – Q1

Rango semi-intercuartílico o desviación cuartilíca

Se define por: Q= (Q3 – Q1)/2 

Varianza

La varianza de un conjunto de datos se define como el cuadrado de la desviación típica

o estándar, mide la dispersión que existe de los datos con respecto a su promedio, el resultado

de la varianza es en unidades cuadráticas, por lo tanto para linealizar un conjunto al medir su

5/10/2018 001apunte a Descriptivaprofflor Solis f 113607 - slidepdf.com

http://slidepdf.com/reader/full/001apunte-a-descriptivaprofflor-solis-f-113607 13/2

UNIVERSIDAD DE SANTIAGO DE CHILEFACULTAD DE ADMINISTRACIÓN Y ECONOMÍA

ESTADÍSTICA DESCRIPTIVA -- PROFESORA. FLOR SOLIS FLORES.

- 13 -

dispersión, le extraemos raíz cuadrada llamada desviación estándar, luego, para calcular la

varianza tenemos.

Para datos sin tabular: σ2(x) = ∑

=

n

i 1

(xi – µ)2 /N

Para datos tabulados: σ2(x) = ∑

=

n

i 1

(xi – µ)2ni /N

Desviación estándar

Es la raíz cuadrada de la varianza dada por: σ = σ  

2

 

Es decir, dado un conjunto de datos x1, x2, ...., xn de una variable X con nivel de

medición en escala de intervalos o de razón, se define la desviación estándar o desviación

típica: como el promedio de las desviaciones de los puntos x i respecto a su promedio

aritmético.

La desviación estándar toma valores no negativos y mide la dispersión: a mayor

desviación estándar mayor dispersión.

El cuadrado de la desviación estándar se denomina varianza S2

Observación: S2 se llama varianza corregida (cuasivarianza), dividida por n – 1 se utiliza en inferencia

estadística como la estimación de la varianza poblacional (σσσσ2)

Coeficiente de variación

El coeficiente de variación es una medida que nos permite comparar dos o más distribuciones

con distintas unidades de medida. Diremos que mientras menor sea el coeficiente de variación la

distribución es más homogénea, es decir, los datos están menos dispersos con respecto al

promedio: ( ). *100 X  X 

C V  X 

σ  =  

5/10/2018 001apunte a Descriptivaprofflor Solis f 113607 - slidepdf.com

http://slidepdf.com/reader/full/001apunte-a-descriptivaprofflor-solis-f-113607 14/2

UNIVERSIDAD DE SANTIAGO DE CHILEFACULTAD DE ADMINISTRACIÓN Y ECONOMÍA

ESTADÍSTICA DESCRIPTIVA -- PROFESORA. FLOR SOLIS FLORES.

- 14 -

 Ejemplo 6 .- En un centro de computación, el número de veces que el computador se detiene,por error de máquina, diariamente, fue recolectado por un período de 70 días. Los datosobtenidos fueron los siguientes.

( X ) Nº de detenciones del computador por día.1 0 2 0 0 0 3 3 0 0 1 0 0 0

1 7 5 0 0 4 3 0 6 2 0 2 3 0

0 3 1 1 0 1 0 1 7 0 2 2 1 0

2 2 0 4 0 1 2 1 2 0 0 5 2 1

0 1 6 4 3 3 1 2 4 0 2 1 0 4

6.1.- Tabule y grafique los datos adecuadamente.6.2.- ¿Cuál es la proporción de días en que ocurre por lo menos 2 detenciones6.3.- Calcule una medida de tendencia central apropiada. (Justifique su respuesta).

  Ejemplo 7.- Con el propósito de estudiar si hay discriminación en el sueldo de losprofesionales hombres y mujeres en el área de la administración que entran a trabajar porprimera vez, se tomó una muestra en una gran empresa y se les consultó sobre sus sueldos. Lainformación obtenida se presenta en la siguiente tabla:

Sueldos M$ 400 - 500 500 - 600 600 - 700 700 - 800 800 - 900 900 - 1000 1000 - 1200Hombres 5 20 30 40 20 15 10

Mujeres 8 20 28 33 25 18 8

7.1.- Construya un gráfico que le permita comparar el sueldo de los profesionales, hombres ymujeres. ¿Qué puede concluir de él?

7.2.- ¿Qué porcentaje de los hombres tienen sueldo superior a $620.000?

7.3.- Se está estudiando dos alternativas para el próximo reajuste de sueldos a profesionales

mujeres.i)  4% de reajuste ,más un bono mensual de $10.000ii)  08% de reajuste

¿Con cuál de estas dos alternativas la distribución de sueldos reajustados resulta ser máshomogénea que la original? Responda aplicando solo propiedades. 

5/10/2018 001apunte a Descriptivaprofflor Solis f 113607 - slidepdf.com

http://slidepdf.com/reader/full/001apunte-a-descriptivaprofflor-solis-f-113607 15/2

UNIVERSIDAD DE SANTIAGO DE CHILEFACULTAD DE ADMINISTRACIÓN Y ECONOMÍA

ESTADÍSTICA DESCRIPTIVA -- PROFESORA. FLOR SOLIS FLORES.

- 15 -

Tablas de contingencia o de asociación

Muestran la asociación entre dos o más variables; se recomienda que sean a lo más tres, parafacilitar la lectura de la tabla. Como hay más de un criterio de clasificación, se preferirácolocar aquel con mayor número de categorías en la columna. Cuando el número de intervaloso categorías es el mismo, se colocará el antecedente en la columna y el consecuente en la fila.

  Ejemplo 8:- Se estudia el consumo diario (Y) en kwh de 180 consumidores de energía

eléctrica. Los consumidores se clasifican según tipo en tres grandes grupos: consumidoreshabitacionales, industriales y empresas comerciales. La información obtenida se muestra en la

siguiente tabla: 

Tabla : Consumo diario de energía eléctrica (kwh) según tipo de consumidorConsumo

diario (kwh)Tipo de consumidor

Habitacional Industriales Empresascomerciales

Nº % Nº % Nº % Total

< 20 20 57,1 5 4,8 5 12,5 30

20-50 10 28,6 40 38,0 20 50,0 7050 y + 5 14,3 60 57,2 15 37,5 80

Total 35 100,0 105 100,0 40 100,0 180

Determine la medida de posición más adecuada. Interprete sus resultados.

REPRESENTACIÓN GRÀFICA

Gráficos: La presentación gráfica puede revelar de un vistazo las principales características de

un conjunto de datos.Los gráfico de barras y el de torta (o sectorial) son lo más usados para datos cualitativos.

Si la información se encuentra en una tabla de frecuencias con intervalos de clase, las

representaciones adecuadas son el histograma o el polígono de frecuencias, Diagrama de caja,

Tallo y hojas se utilizan en datos de variables cuantitativas contínuas.

Diagrama de Pareto 

5/10/2018 001apunte a Descriptivaprofflor Solis f 113607 - slidepdf.com

http://slidepdf.com/reader/full/001apunte-a-descriptivaprofflor-solis-f-113607 16/2

UNIVERSIDAD DE SANTIAGO DE CHILEFACULTAD DE ADMINISTRACIÓN Y ECONOMÍA

ESTADÍSTICA DESCRIPTIVA -- PROFESORA. FLOR SOLIS FLORES.

- 16 -

Uso de celulares según m arca

3827

1510

5

010203040

     N    o     k     i    a

      S    a    m    s    u    n    g

      S    o    n    y

      S     i    n

    c    e     l    u     l    a    r

      S    a    g    e    m

Marca de celular

      N      º

 

Histograma

índice de temor

86420

  n   º   d  e

  p  e  r  s  o  n  a  s

40

30

20

10

0

 

Este gráfico consiste en una serie debarras adyacentes cuyas superficiesson proporcionales a la frecuencia delintervalo sobre el cual se levantan.

Polígono de frecuencias

indice de temor

54 - 6147 - 5440 - 4733 - 4026 - 3319 - 2612-19

      P     o     r     c     e     n      t     a      j     e

60,00%

55,00%

50,00%

45,00%

40,00%

35,00%

30,00%

25,00%

20,00%

15,00%

10,00%

5,00%

0,00%

38,1%

32,1%

17,9%

4,8%4,8%

1,2%1,2%

 

Este gráfico consiste en una línea poligonalque resulta de unir los puntos medios omarcas de clases de la parte superior de losrectángulos del histograma

edad

928884807672686460565248444036322824201612840

   n   º   d   e

   p   e   r   s   o   n   a   s

25

20

15

10

5

0

edad

Media =44,21 Desviación típica =16,1N =84

 

% de uso de celulares según marca

38

27

15

10 5 Nokia

Samsung

Sony

Sin celular

Sagem

 

5/10/2018 001apunte a Descriptivaprofflor Solis f 113607 - slidepdf.com

http://slidepdf.com/reader/full/001apunte-a-descriptivaprofflor-solis-f-113607 17/2

UNIVERSIDAD DE SANTIAGO DE CHILEFACULTAD DE ADMINISTRACIÓN Y ECONOMÍA

ESTADÍSTICA DESCRIPTIVA -- PROFESORA. FLOR SOLIS FLORES.

- 17 -

 DIAGRAMA DE PARETO

Sirve para mostrar actividades o categorías acumuladas; se usan con frecuencia en control de

calidad. Es un gráfico de barras simples ordenadas según frecuencias de mayor a menor, al

cual se le adiciona la frecuencia acumulada, como una manera de

saber donde se concentra el 50% de las actividades.

 Diagrama de tallo y hojas (steam   and leaf plot). Tukey 1977 

Es un procedimiento semi-gráfico para variables cuantitativas continuas que permite obtener

simultáneamente una distribución de frecuencias de la variable y su representación gráfica.

Para construirlo basta separar en cada dato el último 

Tiempo en minutos

Frecuencia tallo & hoja

2,00 0 . 785,00 1 . 02444

5,00 1 . 56899

4,00 2 . 0122

1,00 2 . 5

2,00 3 . 01

1,00 Extremes (>=41)

aceptacion del vehículo

maloregularbuenoexcelente

   N   º   D   E

   P   E   R   S   O   N   A   S

60

50

40

30

20

10

0

P  or   c  en t     a  j     e

100

50

0

7

12

1517

5/10/2018 001apunte a Descriptivaprofflor Solis f 113607 - slidepdf.com

http://slidepdf.com/reader/full/001apunte-a-descriptivaprofflor-solis-f-113607 18/25

UNIVERSIDAD DE SANTIAGO DE CHILEFACULTAD DE ADMINISTRACIÓN Y ECONOMÍA

ESTADÍSTICA DESCRIPTIVA -- PROFESORA. FLOR SOLIS FLORES.

- 18 -

 DIAGRAMA DE CAJA(Box-Plot): La gráfica describe la distribución de un conjunto de datos

en referencia a los valores de los cuartiles como medidas de tendencia central y al valor del

rango intercuartílico como medida de variabilidad. Constituye un medio ideal para la

observación del grado de simetría de la distribución, es una de las principales técnicas del

análisis exploratorio de datos. 

tiempo (minutos)

40

30

20

10

17

 

Medidas de resumen: Descripción numérica de una variable

Medidas de posición o Tendencia Central:

Media aritmética, Mediana y Moda - Percentiles

Medidas de Dispersión:

Varianza, Desviación Típica, Coeficiente de variación

Medidas de Forma (distribución): Asimetría, Curtosis 

Descripción Estadística de una variable nominal

Tabla de frecuencias Gráficos (más ut ilizados) Medidas de resumen

Nombre de laVar.

Númerode

unidades

%

.

.

.

.

.

.

.

.

.

Total n 100

-  Barras separadas-  Sectorial-  Diagrama de

Pareto

Moda

5/10/2018 001apunte a Descriptivaprofflor Solis f 113607 - slidepdf.com

http://slidepdf.com/reader/full/001apunte-a-descriptivaprofflor-solis-f-113607 19/25

UNIVERSIDAD DE SANTIAGO DE CHILEFACULTAD DE ADMINISTRACIÓN Y ECONOMÍA

ESTADÍSTICA DESCRIPTIVA -- PROFESORA. FLOR SOLIS FLORES.

- 19 -

Descripción Estadística de una variable ordinal 

Tabla de frecuencias Gráficos (más ut ilizados) Medidas de resumen

NombreVar.

Núm. deunidades

Frec.Acum.

%

.

.

.

.

.

.

.

.n

.

.

.

Total n - 100

-  Barras separadas-  Sectorial-  Diagrama de

Pareto 

- Moda

- Mediana

- Percentiles

Descripción Estadística de una variable cuantitativa discreta

Tabla de frecuencias Gráficos (más

utilizados)

Medidas de resumen

NombreVar.

Núm. deunidades

Frec.Acum.

%

.

.

.

.

.

.

.

.n

.

.

.

Total n - 100

-  Barrasseparadas 

- Moda Tendencia

- Mediana central - Promedio Posición - Percentiles

- Rango- Rango Intercuartílico- Desv. estándardispersión

- Coef. de variación

Descripción Estadística de una variable cuantitativa contínuaTabla de frecuencias Gráficos (más

utilizados)

Medidas de resumen

NombreVar.

Núm. deunidades

Frec.Acum.

%

[ , ).

.

.

.

.

.n

.

.

.

Total n - 100

-  Histograma-  Polígono de

frec.

-  Tallo - hojas-  Diagrama de

caja-  Otros

- Moda Tendencia

- Mediana central - Promedio Posición - Percentiles

- Rango- Rango Intercuartílico- Desv. estándardispersión

- Coef. de variación

 X  ≠ Mediana  ⇒ asimetría, lo que sugiere heterogeneidad en los datos.

∴∴∴∴ La Mediana  es la medida de tendencia central adecuada para resumir los datos.

cuandotengasentido

5/10/2018 001apunte a Descriptivaprofflor Solis f 113607 - slidepdf.com

http://slidepdf.com/reader/full/001apunte-a-descriptivaprofflor-solis-f-113607 20/2

UNIVERSIDAD DE SANTIAGO DE CHILEFACULTAD DE ADMINISTRACIÓN Y ECONOMÍA

ESTADÍSTICA DESCRIPTIVA -- PROFESORA. FLOR SOLIS FLORES.

- 20 -

Simétrica

 X = Me = Mo 

Asimetría positiva

Mo < Me <  X  

Asimetría Negativa

 X  < Me < Mo 

Estadísticos de dispersión o variabilidad Observaciones

Rango valor máximo – valor mínimo

-  La variable X debe ser por lomenos de intervalos.

-  Defectos. No permite hacer unainterpretación precisa de unvalor dentro de una distribución.

-  No interviene en relacionesmatemáticas importantes en lainferencia estadística. 

Rangointercuartílico

RI = Q3 – Q1 = P75 – P25 Longitud del 50% central de ladistribución de datos

-  La variable X debe ser por lo

menos de intervalos.-  RI se usa con mayor frecuencia

acompañando a la medianacuando la presencia de valoresextremos hace pocorecomendable el uso delpromedio.

-  No interviene en relacionesmatemáticas importantes en lainferencia estadística. 

Varianza

n2

i2 i 1s

(x x)

n=

−=

∑ 

n

2i

2 i 1s

(x x)

n -1=

−= ∑

 

Varianza corregida (se utiliza cuandola muestra del estudio es aleatoriasimple)

Desviaciónestándar odesviacióntípica

n2

i

i =1

(x - x)

s =n

∑ 

n2

i

i =1

(x - x)

s =n-1

∑ 

x 32.5 27.5 22.5 17.5 12.5 7.5 2.5 

10 8 6 4 2 0 

X 32.5 27.5 22.5 17.5 12.5 7.5 2.5 

10 8 6 4 2 0 

X

32.57.52.517.512.57.5.5

10

8

6

4

0

5/10/2018 001apunte a Descriptivaprofflor Solis f 113607 - slidepdf.com

http://slidepdf.com/reader/full/001apunte-a-descriptivaprofflor-solis-f-113607 21/2

UNIVERSIDAD DE SANTIAGO DE CHILEFACULTAD DE ADMINISTRACIÓN Y ECONOMÍA

ESTADÍSTICA DESCRIPTIVA -- PROFESORA. FLOR SOLIS FLORES.

- 21 -

 Ejemplo9:: Analizar si existe relación lineal entre peso y estatura

Gráfico adecuado: Diagrama de dispersión

Medida de resumen: Correlación lineal. Pearson

Correlaciones

1 ,821**

,000

250 250

,821** 1

,000

250 250

Correlación de Pearson

Sig. (bilateral)

N

Correlación de Pearson

Sig. (bilateral)

N

Peso

Estatura

Peso Estatura

La correlación es significativa al nivel 0,01 (bilateral).**.

DIAGRAMA DE DISPERSIÓN.

5/10/2018 001apunte a Descriptivaprofflor Solis f 113607 - slidepdf.com

http://slidepdf.com/reader/full/001apunte-a-descriptivaprofflor-solis-f-113607 22/2

UNIVERSIDAD DE SANTIAGO DE CHILEFACULTAD DE ADMINISTRACIÓN Y ECONOMÍA

ESTADÍSTICA DESCRIPTIVA -- PROFESORA. FLOR SOLIS FLORES.

- 22 -

FORMULAS DE INTERÉS 

n

xn

1i

i

x∑

==   ; 

2n

in ni 12 2

i i2 i 1 i 1x

x

(x x) xn

n-1 n-1s

=

= =

− −

= =

∑∑ ∑

  Sx = 2xS

n

xk 

1i

i

x∑

==in

  ; 

2k 

ik k i 12 2

i i2 i 1 i 1x

x

(x x) xn

n-1 n-1

s

i

i i

n

n n=

= =

− −

= =

∑∑ ∑

  ;  x

sCV   x

 x =  

Cov(x,y) =1-n

n

yx

yx

1-n

)y-)(yx-(xn

1i

n

1ii

n

1ii

ii

n

1i

ii

xys∑

∑∑∑

=

==

=

 

  

  

  

 

−==  

 

 

 

  −+= −

− j

1 j

 j

'

1 jpn

NcxP 100

np

 yx

xy

ss s

r =  

Medidas de Tendencia Central Medidas de Dispersión

Media Aritmética o Promedio Aritmético  X   Desviación Estándar o típica. σσσσ 

Moda Mo Varianza Poblacional σσσσ2 

Mediana Med Coeficiente de Variación X 

 X 

σ   

Frecuencia ni Rango Intercuartílico Q=Q3 – Q1 

Percentiles P X

Cuartiles Q

Deciles D

5/10/2018 001apunte a Descriptivaprofflor Solis f 113607 - slidepdf.com

http://slidepdf.com/reader/full/001apunte-a-descriptivaprofflor-solis-f-113607 23/2

UNIVERSIDAD DE SANTIAGO DE CHILEFACULTAD DE ADMINISTRACIÓN Y ECONOMÍA

ESTADÍSTICA DESCRIPTIVA -- PROFESORA. FLOR SOLIS FLORES.

- 23 -

Clasificación de las variables

Distribución de

Frecuencias

Asociación entre

variables (dos omás)

Tamaño del recorrido Escala de Medición (una variable)

DiscretasNominal u ordinal

Barras Simples BarrasSubdivididas

Circular o de torta Barras agrupadas

ContinuasIntervalos o Razón

Histograma simple Lineal

Histograma ajustado Correlación

Polígono deFrecuencias

Resumen de algunas fórmulas.

Ley de Sturges (determinar nº de Intervalos) [1+3.3 Log n]

Corrección de la Amplitud

Histograma ajustado.

* ic

i

k nn

c=  

Rango Intercuartílico RI = Q3 – Q1

Varianza σ2 =∑ (x - µ)2 ni 

Desviación Estándar 2

 X X σ σ  =  

Mediana1

( )2lim.inf . ( )

 j

 x i

 j

n N 

med cn

−−= +  

Coeficiente de Correlación:

Ejemplo10: Para determinada tarea en una fábrica, donde se necesita mucha destreza, sequiere investigar si “la productividad en el trabajo debe ser mayor al aumentar los años deexperiencia”. Se seleccionaron al azar diez empleados de entre lo que tienen ese trabajo. Losdatos de años de experiencia y medición de productividad son los siguientes:

Realice el diagrama de dispersión y calcular el coeficiente r de Pearson. Interprete losresultados.

5/10/2018 001apunte a Descriptivaprofflor Solis f 113607 - slidepdf.com

http://slidepdf.com/reader/full/001apunte-a-descriptivaprofflor-solis-f-113607 24/2

UNIVERSIDAD DE SANTIAGO DE CHILEFACULTAD DE ADMINISTRACIÓN Y ECONOMÍA

ESTADÍSTICA DESCRIPTIVA -- PROFESORA. FLOR SOLIS FLORES.

- 24 -

El coeficiente de correlación nos permite analizar si existe una relación lineal entre dos

variables X e Y. 

-1 < r(x,y) < 1

Y es a través del diagrama de dispersión, donde es más fácil apreciar, que tan correlacionados

se encuentran los datos. 

2,5 5,0 7,5 10,0 12,5

años

80,0

82,5

85,0

87,5

90,0

     p     r     o       d     u     c       t       i     v       i       d     a       d

 

Correlaciones

1 ,920**

10 10

,920** 1

Correlación de Pearson

n

Correlación de Pearson

años

productividad

años productividad

La correlación es significativa al nivel 0,01 (bilateral).**.

r = 0.9197 91.97%

Entre las variables existe una correlación positiva fuerte, se encuentran en relación directa, amayor años de experiencia mayor productividad o vice-versa 

r (x,y) = Cov(x,y)

S x * Sy 

Regresión lineal

2,5 5,0 7,5 10,0 12,5

años

80,0

82,5

85,0

87,5

90,0

      p      r      o        d      u

      c       t        i      v        i        d      a        d

1productividad = 77,36 + 1,10 * años

R-cuadrado = 0,85

 

5/10/2018 001apunte a Descriptivaprofflor Solis f 113607 - slidepdf.com

http://slidepdf.com/reader/full/001apunte-a-descriptivaprofflor-solis-f-113607 25/2

UNIVERSIDAD DE SANTIAGO DE CHILEFACULTAD DE ADMINISTRACIÓN Y ECONOMÍA

ESTADÍSTICA DESCRIPTIVA -- PROFESORA. FLOR SOLIS FLORES.

- 25 -

La gráfica siguiente resume la fuerza y la relación del coeficiente de correlación. 

CorrelaciónNegativaPerfecta

CorrelaciónPositivaPerfecta

CorrelaciónNegativaFuerte

Correlación PositivaCorrelación Negativa

CorrelaciónpositivaDébil

CorrelaciónNegativaModerada

CorrelaciónPositivaModerada

CorrelaciónPositivaFuerte

CorrelaciónNegativaDébil

No hayCorrelación

-1 0.50-0.5 1


Recommended