Date post: | 08-Jan-2015 |
Category: |
Documents |
Upload: | francisca-pinedo |
View: | 21 times |
Download: | 2 times |
Instructor: Lic. Cristian R. Arroyo L.
Diplomado de Especialización en:Diplomado de Especialización en:
Los Datos
Elementos: son las entidades acerca de las cuales se reúnen los datos
Variables: es una característica de interés de los elementos.
Observaciones: es el conjunto de mediciones, reunido para cada elemento.
Datos Cualitativos y cuantitativos
Cuantitativos: Cuánto o cuantos, siempre son datos numéricos. Edad Ingreso Anual
Cualitativos: son atributos de cada elemento. Estado Civil Profesión
Fuentes de Información
Información procesada Superintendencia de Bancos Data Credit Registro Civil Otros...
Información no procesada Información histórica de los clientes Otras...
Estadística Descriptiva
Información procesada o resumida mediante: Tablas Gráficos Números
02468
1012141618
Porcenta
je
NYSE AMEX OTC
Casa de Bolsa
Operaciones Bursátiles de las Acciones de 25 Empresas
Distribución de Frecuencias
Es un resumen tabular de un conjunto de datos agrupados por clases que no se traslapan
Ejemplo 1 Ejemplo 2
Diagrama de Dispersión
Es una representación gráfica de la relación entre dos variables cuantitativas.
Diagrama de Disperción
0
10
20
30
40
50
60
70
0 1 2 3 4 5 6
Serie X
Se
rie
Y
Ejemplo 3
Media
Medida de localización central, conocida también como promedio, se obtiene sumando todos los datos y dividiendo el resultado entre la cantidad de valores.
Formula:
Ejemplo 4
nx
x i
Percentiles
Nos permite conocer como de distribuyen los valores sobre el intervalo seleccionado
Pasos:1. Ordenar los datos2. Calcular el índice i3. Redondear en caso de ser necesario
np
i
100
Percentiles
Medidas de Variabilidad
Permite conocer con más precisión el comportamiento de los datos y su efecto producto de la variabilidad de los datos
Rango Varianza Desviación Estándar Coeficiente de Variación
Rango
Se complementa con algún medida adicional por la escasez de datos
MínimoValor - máximoValor Rango Morosidad Cliente 1
1 4
2 45
3 7
4 16
5 1
6 30
Morosidad Cliente 2
1 1
2 4
3 18
4 25
5 3
6 5
Varianza
Emplea todos los datos Diferencia entre el dato y la media
Nxi
22
1
22
nxx
s i
Población Muestra
Varianza
Expresado en unidades al cuadrado Es una medida de variación
comparativa Es útil para comparar la dispersión o
variabilidad, de dos conjuntos de datos.
Desviación Estándar
De fácil interpretación Relaciona cuan dispersos están los
datos en relación con la media.
2ss 2 Población Muestra
Coeficiente de Variación
Análisis entre la volatilidad de los datos y la media.
100Media
EstándarDesviaciónVariacióndeeCoeficient
Resumen Gráfico y ejercicio
Practica No.1.docPractica No.1.xls
Medidas de localización relativa
s
xxz ii
s
xxz ii
xszx ii xszx ii
Regla Empírica “Teorema de Chebyshev”
99.9%
-3 395%
-2 268%
-1 1
Aplicaciones
Identificar un valores extremo Bajo pruebas de escenarios
determinar si tengo cobertura con el nivel de confianza establecido
Determinar los límites de mis intervalos de confianza
Medidas de Asociación entre dos variables
Permite conocer la relación entre dos variables. Covarianza Correlación Diagrama de dispersión
Diagrama de DispersiónDiagrama de dispersión Edad vrs. Atasos
0
5
10
15
20
25
30
35
40
45
0 1 2 3 4 5 6
No. Atrasos
Ed
ad
Covarianza
1
n
yyxx iixy
1
nyyxx ii
xy
Interpretación: El signo señala el tipo de relación, sin embargo no permite determinar con exactitud del nivel de asociación
Coeficiente de Correlación
Conocido también como el coeficiente de Person
Relación entre los datos Intensidad de la relación -100, 0, 100.
yx
xyxy ss
sr
yx
xyxy ss
sr
Ejemplo 9Ejemplo 9