Post on 12-Jun-2015
description
transcript
Juan Moncada Herrera
Dpto. De Cs. Matemáticas y Físicas
Universidad Católica de Temuco
Introducción a la Estadística Descriptiva
Población
Página 2
Problema Conocer
IndividuoUnidad de observación
Observar
VariablesMuestra
Registro deobservación
EL CONTEXTO:
LOS ELEMENTOS DE BASE:
IndividuoUnidad de observación
Muestra
Variables
Cualitativas Cuantitativas
Página 3
IndividuoUnidad de observación
Muestra
Variables
Cualitativas Cuantitativas- Nominales
- Ordinales
- Discretas- Continuas
LOS ELEMENTOS DE BASE:
Página 4
Variables
Cualitativas Cuantitativas- Nominales
- Ordinales
- Discretas- Continuas
LOS ELEMENTOS DE BASE:
Indiv. X1 … Xp
1
…
n
Tabla de datos Materia prima delanálisis estadístico
Página 5
SU OBJETIVO: Análisis de la Tabla de Datos
Indiv. X1 … Xp
1
…
n
RESUMEN O SÍNTESIS
Lo más representativo Lo esencial Lo más típico
Lo más relevante La «forma» La «estructura» La «diversidad»
RETORNO A LOS DATOSPágina 6
SU OBJETIVO: Análisis de la Tabla de Datos
Indiv. X1 … Xp
1
…
n
RESUMEN O SÍNTESIS
NUMÉRICO GRÁFICO
Página 7
ANALIZANDO LA TABLA DE DATOS:
RESUMEN O SÍNTESIS
NUMÉRICO GRÁFICO
TENDENCIA CENTRALPromedio o mediaModa, mediana
DISPERSIÓNRangoDesviación estándar
Página 8
RESUMEN O SÍNTESIS
NUMÉRICO GRÁFICO
POSICIÓNValores extremosCuartiles, quintiles deciles
FORMASimetríaCurtosis
ANALIZANDO LA TABLA DE DATOS:
Página 9
RESUMEN O SÍNTESIS
NUMÉRICO GRÁFICO
Vestuario
Alimentación
Ocio
Transporte
Gráfico de sectores:Variables cualitativasFrecuencias
Informa de:Distribución
ANALIZANDO LA TABLA DE DATOS: Recursos gráficos
Página 10
RESUMEN O SÍNTESIS
NUMÉRICO GRÁFICO
Gráfico de barras:Variables cualitativasFrecuencias
Vestuario Alimentación Ocio Transporte
0
5
10
15
20
25
30
35
40
45
Informa de:Distribución
ANALIZANDO LA TABLA DE DATOS: Recursos gráficos
Página 11
RESUMEN O SÍNTESIS
NUMÉRICO GRÁFICO
0 0,3 0,6 0,9 1,2 1,5 1,8 2,1 2,4 2,7 3
Valores de la variable
0
4
8
12
16
20
24
28
32
36
Fre
cuen
cia
Histograma:Variables cuantitativas continuasGran cantidad de observaciones
Informa de:Forma, tendencia central
ANALIZANDO LA TABLA DE DATOS: Recursos gráficos
Página 12
RESUMEN O SÍNTESIS
NUMÉRICO GRÁFICO
Box-Plot:Variables cuantitativas continuas
Pes
o0
0,3
0,6
0,9
1,2
1,5
1,8
2,1
2,4
2,7
3
Val
ores
de
la v
aria
ble
Informa de:Forma, posición
ANALIZANDO LA TABLA DE DATOS: Recursos gráficos
Página 13
RESUMEN O SÍNTESIS
NUMÉRICO GRÁFICO
Lineas:Variables cuantitativas
1 2 3 4 5 6 7 8 9 10 11 121,0
1,2
1,4
1,6
1,8
2,0
2,2
2,4
2,6
2,8
3,0 Variación mensual del IPC
Mes del año
Informa de:Tendencia
ANALIZANDO LA TABLA DE DATOS: Recursos gráficos
Página 14
MEDIDAS NUMÉRICAS DE RESUMEN
Media:
Mediana:X0.5 = Valor central (promedio de valores centrales) de la serie
ordenada de X
Moda:Valor(es) más frecuente(s) de X (datos cuantitativos y cualitativos)
n
iixn
X1
1
Tendencia central:
ANALIZANDO LA TABLA DE DATOS: Recursos numéricos
Página 15
MEDIDAS NUMÉRICAS DE RESUMEN
Rango: R(X) = Max(X) – min(X)
Desviación estándar:
Coeficiente de variación:
2)(1
1xx
nS i
%100)(X
SXCV
Dispersión:
ANALIZANDO LA TABLA DE DATOS: Recursos numéricos
Página 16
MEDIDAS NUMÉRICAS DE RESUMEN
Posición:
0% 25% 50% 75% 100%| | | | |
Cantidad acumulada de información
min Q1 Q2 Q3 Max
Serie creciente de valores observados
Primer cuartil Segundo cuartil - mediana Tercer cuartil
ANALIZANDO LA TABLA DE DATOS: Recursos numéricos
Página 17
EL RETORNO A LOS DATOS
Regla empírica de Chebyshev:
Si la distribución de los datos es simétrica en torno de su media, entonces:
• Aproximadamente el 67% de los datos se encuentra a una distancia igual a una desviación típica de la media.
• Aproximadamente el 95% de los datos se encuentra a una distancia de dos desviaciones típicas de la media.
• Aproximadamente el 99% de los datos se encuentra a tres desviaciones típicas de la media.
ANALIZANDO LA TABLA DE DATOS: Recursos numéricos
Página 18
RECURSOS INFORMÁTICOS
Programa R
Programa SPSS
Planilla de OpenOffice
MS Excel
Calculadora conmodo estadístico
Programa PAST
ANALIZANDO LA TABLA DE DATOS: Recursos informáticos
Página 19
ALTERNATIVAS COMERCIALES ALTERNATIVAS GRATUITAS O LIBRES
SINTETIZANDO:
Numérico Gráfico
BarrasTablas de frecuencias
Pictogramas
Información cualitativa o discreta
Resumiendo …
El Resumen puede ser:
ModaCircular - Sectores
Página 20
SINTETIZANDO:
Numérico Gráfico
Dispersión HistogramaTendencia central Posición
Ojiva
Box-plot (Gráfico de Cajas)
Información Continua
Resumiendo …
El Resumen puede ser:
Media
Mediana
Moda
Rango
Varianza
D. estándar
Polígono de frecuenciasCuartiles
Quintiles
Deciles
C. Variación Percentiles
Página 21
ESTADÍSTICA DESCRIPTIVA: Mirando un conjunto de datos
UN EJEMPLO
Rendimiento de alumnos de primero de secundaria según tres niveles de autoestima
Nivel de autoestima
Nivel1 Nivel2 Nivel3 Nivel4
n 56 292 291 24
Min 4,3 3,87 3,67 4,27
Max 5,93 6,13 6,3 6,17
Mean 5,03446 5,0874 5,21608 5,18583
Variance 0,171756 0,207481 0,224896 0,345547
Stand. dev 0,414435 0,455501 0,474232 0,587833
Median 5,015 5,1 5,23 5,15
25 prcntil 4,7 4,77 4,93 4,69
75 prcntil 5,33 5,4225 5,57 5,5825
= 663 estudiantes
Rendimiento similar
Grupo Nivel 1 menos disperso
Mediana similar a media: Simetría
Página 22
ESTADÍSTICA DESCRIPTIVA: Mirando un conjunto de datos
UN EJEMPLO
Rendimiento de alumnos de primero de secundaria según tres niveles de autoestima
Rendimiento ligeramente “cargado” a valores superiores
3,2 3,6 4 4,4 4,8 5,2 5,6 6 6,4
Promedio en Nivel 3 de Autoestima
0
6
12
18
24
30
36
42
48
54
Fre
cuen
cia
Página 23
ESTADÍSTICA DESCRIPTIVA: Mirando un conjunto de datos
UN EJEMPLO
Rendimiento de alumnos de primero de secundaria según tres niveles de autoestima
Gráficos de caja permitiendo una lectura comparativa del rendimiento, según nivel de autoestima.
En Nivel 3 se observan dos “out liers” o valores atípicos.
Niv
el1
Niv
el2
Niv
el3
Niv
el4
3,2
3,6
4
4,4
4,8
5,2
5,6
6
6,4
Pro
med
ios
¿Qué grupo requiere intervención pedagógica?
Página 24
RECURSOS DE APOYO:
SUGERENCIAS BIBLIOGRÁFICAS:
Página 25
1. Webster A. (2000): Estadística aplicada a los negocios y la economía. McGraw-Hill, Colombia.
2. Lind, Marchal & Wathen (2008): Estadística aplicada a los negocios y la economía. McGraw-Hill, México.
3. Canavos G. (1988): Probabilidad y Estadística. Aplicaciones y métodos. McGraw-Hill, México.
4. Walpole, Myers, Myers & Ye (2007): Probabilidad y estadística para ingeniería y ciencias. Pearson-Prentice Hall, Octava edición, México.
SOFTWARE ESTADÍSTICOS GRATUÍTO O LIBRE:
1. Programa PAST. Website: http://folk.uio.no./ohammer/past/2. Programa R. Website: www.r-project.org3. Programa OpenOffice. Website: www.openoffice.org
Juan Moncada Herrera
Dpto. De Cs. Matemáticas y Físicas
Universidad Católica de Temuco
Introducción a la Estadística Descriptiva