Post on 26-Jun-2015
transcript
ProbabilidadesDEFINICIÓN
Probabilidad de un suceso es el número al que tiende la frecuencia relativa asociada al suceso a medida que el número de veces que se realiza el experimento crece.
La frecuencia relativa de un suceso A:
Fr (a)= número de veces que aparece ANúmero de veces que se realiza el experimento
1Curso : Modelación y
Simulación
ProbabilidadesDEFINICIÓN DE LAPLACE
En el caso de que todos los sucesos elementales del espacio muestral E sean equiprobables, Laplace define la probabilidad del suceso A como el cociente entre el número de resultados favorables a que ocurra el suceso A en el experimento y el número de resultados posibles del experimento.
Si E={x1,x2,…..,xk} y P(x1)=P(x2)=……=P(xk), entonces:
P(A)= número de casos favorables al suceso Anúmero de casos posibles
2Curso : Modelación y
Simulación
Probabilidades
Permutaciones
Una permutación es un arreglo de todo o parte de un conjunto de datos, el número de permutaciones de n objetos distintos es n!
el número de permutaciones de n objetos tomados de r a la vez es
Ejemplo 1
Considere las tres letras a,b y c, las permutaciones posibles son abc, acb, bac, bca, cab y cba
n !=3 !=1*2*3=6
)!(
!
rn
nPrn
3Curso : Modelación y
Simulación
Probabilidades
Ejemplo 2
Se sacan dos billetes de lotería de 20 para un primer y un segundo premios. Encuentre el número de puntos muéstrales en el espacio S.
Solución
)!(
!
rn
nPrn
38019*20)!220(
!20220
P
4Curso : Modelación y
Simulación
Probabilidades
Combinaciones
El número de combinaciones de n objetos distintos tomados de r a la vez es
Ejemplo
En una mano de póquer que consiste en cinco cartas, encuentre la probabilidad de tener 2 ases y tres sotas
)!(!
!
rnr
n
r
n
5Curso : Modelación y
Simulación
Probabilidades
Solución
El número de formas de tener dos ases de cuatro es:
y el número de formas de tener tres sotas de cuatro es:
Mediante la regla de multiplicación hay n=6*4=24 manos con dos ases y tres sotas.
6)!2(!2
!4
2
4
4)!1(!3
!4
3
4
6Curso : Modelación y
Simulación
Probabilidades
El número total de 5 manos de póquer de cinco cartas, las cuales son igualmente probables es
por tanto la probabilidad de obtener dos ases y tres sotas en una mano de póquer de cinco cartas es:
960.598.2)!47(!5
!52
5
52
N
5109,0960.598.2
24)( xxP
7Curso : Modelación y
Simulación
Probabilidades
Experimentos Aleatorios
Un experimento aleatorio es aquel que proporciona diferentes resultados aun cuando se repita siempre de la misma forma.
Espacio Muestral
Un conjunto de los posibles resultados de un experimento aleatorio recibe el nombre de espacio muestral del experimento
Evento
Un evento es un subconjunto del espacio muestral de un experimento aleatorio.
8Curso : Modelación y
Simulación
Probabilidades
Axiomas de Probabilidades
La probabilidad es un número que se asigna a cada miembro de una colección de eventos de un experimento aleatorio y que satisface las siguientes propiedades
1.- P(s) =1
2.-
3.- Para dos eventos E1 y E2
P(E1 U E2)= P(E1)+P(E2)-P(E1∩E2 )
con E1∩E2 =ø, P(E1 U E2)= P(E1)+P(E2)
1)(0 EP
9Curso : Modelación y
Simulación
Probabilidades
Probabilidad Condicional
La probabilidad condicional de un evento A dado un Evento B, denotada por P(A\B), es :
P(A\B)= P( A ∩ B) / P(B) si P(B)>0
Probabilidad Total
Sea A1,a2,… An, un sistema completo de sucesos tales que la probabilidad de cada uno de ellos es distinta de cero, y sea B un suceso cualquier del que se conocen las probabilidades condicionales P(B\Ai), entonces la probabilidad del suceso B viene dada por la expresión.
P(B)= P(A1)*P(B/A1)+P(A2)*P(B/A2)+…..+P(An)*P(B/An)
10Curso : Modelación y
Simulación
Probabilidades
Teorema de Bayes
Sea A1,A2,....An un sistema completo de sucesos, tales que la probabilidad de cada uno de ellos es distinta de cero, y sea B un suceso cualquier del que se conocen las probabilidades condicionales P(B/Ai), entonces la probabilidad P(Ai/B) viene dada por la expresión :
P(Ai/B)= P(Ai)* P(B/Ai)
P(A1)*P(B/A1)+ P(A2)*P(B/A2) +.....+ P(An)*P(B/An)
11Curso : Modelación y
Simulación
Solución
sea D = " La pieza es defectuosa", y N="La pieza no es defectuosa"La información del problema puede expresarse en el diagrama de árbol
a.- Para calcular la probabilidad de que la pieza elegida sea defectuosa, P(D) por la Propiedad de la probabilidad total,
P(D)= P(A)*P(D/A)+P(B)*P(D/B)+P(C)*P(D/C)
P(D)= 0,4*0,02+0,35*0,03+0,25*0,04P(D)= 0,0285
b.- Debemos calcular P(B/D). Por el teorema de Bayes
P(B/D)= P(B)*P(D/B)P(A)*P(D/A)+P(B)*P(D/B)+P(C)*P(D/C)
P(B/D)= 0,35*0,03 0,4*0,02+0,35*0,03+0,25*0,04
P(B/D)= 0,0105 0,0285
P(B/D)= 0,368
c.- Calculamos P(A/D) y P(C/D), comparándolas con el valor de P(B/D) ya calculado. Aplicando el teorema de Bayes , obtenemos
P(A/D)= 0,4*0,02 = 0,008 = 0,281 0,4*0,02+0,35*0,03+0,25*0,04 0,0285
P(C/D)= 0,25*0,04 = 0,01 = 0,351 0,4*0,02+0,35*0,03+0,25*0,04 0,0285
La línea de producción con mayor probabilidad de haber producido la pieza defectuosa es B
A
B
C
D
N
D
N
D
N
0,40
0,35
0,25
0.02
0.03
0.04
0.97
0.96
0.98
1.- Tres líneas de producción de ánodos, A, B, C producen el 40%, 35%, 25%, respectivamente, del total de la producción. Los porcentajes de ánodos defectuosos de estas líneas son del 2%, 3%, 4%.
12
Estadística: El campo de la Estadística tiene que ver con la
recopilación, presentación, análisis y uso de datos para tomar decisiones y resolver problemas.
La importancia de la estadística en la ingeniería, la ciencia y la administración ha sido subrayada por la participación en la industria en el aumento de la calidad. Muchas compañías se han dado cuenta de que la baja calidad de un producto (defectos de fabricación, baja confiabilidad en su rendimiento) tiene un efecto muy pronunciado en la productividad global de la Empresa. La estadística es un elemento decisivo en el incremento de la calidad, ya que las técnicas estadísticas pueden emplearse para describir y comprender la variabilidad.
13Curso : Modelación y
Simulación
Estadística Descriptiva
Media aritmética:
La media aritmética o media de un conjunto de N números x1,x2,x3,....,xn se representa por x y se define como
n
xj x = x1 + x2 +x3 +......+ xn = j=1__
N N
14Curso : Modelación y
Simulación
Mediana: Sean x1,x2,x3,.....,xn una muestra acomodada en orden creciente de magnitud,; esto es x1 denota la observación pequeña y xn denota la observación más grande. Entonces la mediana x se define como la parte media o la ( n+1 / 2)-ésima observación si n es impar, o el promedio entre las dos observaciones intermedias la (n / 2)-ésima y la ( n / 2)+1)-ésima si n es par. En términos matemáticos
___________________ 2
imparn 2/1
parnxnx 12/2
Estadística Descriptiva
15Curso : Modelación y
Simulación
Moda: La moda es la observación que se presenta con mayor frecuencia en la muestra. Esta puede no existir cuando los datos no están agrupados o ser bimodales, etc.
Estadística Descriptiva
16Curso : Modelación y
Simulación
Varianza muestral y desviación estándar muestral. Las medidas más importantes de variabilidad son la varianza muestral y la desviación estándar muestral. Si x1,x2,x3,.....,xn es una muestra de n observaciones, entonces la varianza muestral es:
La desviación estándar S es la raíz cuadrada positiva.
n
ii XXx
nS1
2_2
1
1
Estadística Descriptiva
17Curso : Modelación y
Simulación
Coeficiente de Variación: En ocasiones es deseable expresar la variación como una fracción de la Media. El coeficiente de variación es útil cuando se compara la variabilidad de dos o más conjuntos de datos que difieren de manera considerable en la magnitud de las observaciones. El coeficiente muestral es:
x
SCV
Estadística Descriptiva
18Curso : Modelación y
Simulación
Error estándar: El error estándar de una estadística es la desviación estándar de su distribución de muestreo. Si el error estándar involucra parámetros desconocidos cuyos valores pueden estimarse, la sustitución de estas estimaciones en el error estándar da como resultado un error estándar estimado.
El error estándar da alguna idea sobre la precisión de la estimación. Si no se sabe que valor tiene pero se sustituye la desviación estándar muestral S en la ecuación anterior, entonces el error estándar estimado de x es
nx
nSx
Estadística Descriptiva
19Curso : Modelación y
Simulación
Rango de la Muestra: Una medida muy sencilla de variabilidad es el rango de la muestra, definido como la diferencia entre las observaciones más grande y más pequeña. r = máx (xi) - min (xi)
Estadística Descriptiva
20Curso : Modelación y
Simulación
Coeficiente de Asimetría: El coeficiente de simetría que mide el grado de asimetría o falta de simetría de una distribución. Y se define por
3
1)2)(1(
n
i
SXXi
nnn
Estadística Descriptiva
21Curso : Modelación y
Simulación
Curtosis: El coeficiente de curtosis es una medida de achatamiento de un histograma con respecto al modelo teórico de Gauss. El coeficiente de curtosis se define por
Se puede demostrar que: E 0 histograma más puntiagudo que la ley de Gauss (leptocúrtica) E 0 histograma más achatado que la ley de Gauss (platicúrtica) E 0 histograma sin achatamiento (mesocúrtica)
)3)(2()1(3
)3)(2)(1(
)1( 2
1
4
nnn
SXXi
nnn
nnk
n
i
Estadística Descriptiva
22Curso : Modelación y
Simulación
Histograma
Un histograma o histograma de frecuencias consiste en una serie de
rectángulos que tienen:
1.- Sus bases sobre un eje horizontal con centros en las marcas de clase y
longitud igual al tamaño de los intervalos de clase.
2.- Superficie proporcionales a las frecuencias de clase, el número de
observaciones en una clase recibe el nombre de frecuencia de clase. La
marca de clase es el punto medio del intervalo de clase y se obtiene
sumando los límites inferior y superior de la clase y dividiendo por 2.
3.- Un polígono de frecuencia es un gráfico de línea trazado sobre las
marcas de clase.
Estadística Descriptiva
23Curso : Modelación y
Simulación
Reglas generales para formar la distribución de frecuencias
1.- Determinar el mayor y el menor entre los datos registrados y así encontrar
el rango.
2.- Dividir el rango en un número conveniente de intervalos de clase del
mismo tamaño, el número de clases que se emplea para clasificar los datos
en un conjunto dependen del total de observaciones en éste. Si el número de
observaciones es relativamente pequeño, el número de clase a emplear será
cercano a cinco, pero generalmente nunca menor que este valor. Si existe
una cantidad sustancial de datos, el número de clases debe encontrarse entre
ocho y doce y generalmente no existirán mas de 15 clases. Un número muy
pequeño de clases puede ocultar la distribución real del conjunto de datos,
mientras que un número muy grande puede dejar sin observaciones o
lagunas de las clase, limitando de esta forma su uso.
Estadística Descriptiva
24Curso : Modelación y
Simulación
Criterio de Sturguess
Es usado ampliamente , ya que entrega la dimensión del intervalo de
clase que permite la mejor definición de la forma real de la distribución en
estudio. Para estimar el intervalo de clase Sturguess planteó la siguiente
expresión.
Raíz cuadrada del número de observaciones
)log(322,31minmax
n
xxIC
nIC
Estadística Descriptiva
25Curso : Modelación y
Simulación
Estadística Descriptiva Desviación estandar 12,05147 Mínimo 10
Media 36,53264 Varianza de la muestra 145,238 Máximo 69,9
Error Típico 0,163652 curtosis -0,39836 Suma 198116,5
Mediana 36 coeficiente de asimetría 0,291128 Cuenta 5423
Moda 45,5 Rango 59,9
Histograma Grupal vacios<4
0
100
200
300
400
500
600
Velocidad [Km/h]
Fre
cu
en
cia
0
0,005
0,01
0,015
0,02
0,025
0,03
0,035
Frcuencia
normal
26Curso : Modelación y
Simulación
Histograma Sturges vacios<4
0
100
200
300
400
500
600
700
800
10,00 14,47 18,9423,41 27,88 32,35 36,83 41,3045,77 50,24 54,71 59,18 63,65
Velocidad [Km/h]
Frecuencia
0
0,005
0,01
0,015
0,02
0,025
0,03
0,035
Frecuencia
normal
Histograma raiz de (n) vacios <4
0
20
40
60
80
100
120
140
160
180
200
Velocidad [Km/h]
Fre
cu
en
cia
0
0,005
0,01
0,015
0,02
0,025
0,03
0,035
Frecuencia
normal
27Curso : Modelación y
Simulación
Distribución de Poisson Es una distribución de probabilidad discreta con un parámetro λ < 0 cuya función de
masa para sucesos es
Aquí e significa el número e y x! significa el factorial de x. Se prefiere su uso por sobre una distribución binominal cuando los valores de p < 0.10 y (p * n) < 10 ", donde p es la probabilidad de acierto y n es el numero de eventos. La distribución de Poisson describe el número de sucesos en una unidad de tiempo de un proceso de Poisson. Muchos fenómenos se modelan como un proceso de Poisson, por ejemplo las llamadas telefónicas en una empresa o los accidentes en una carrera. El valor esperado y la varianza de una variable aleatoria X de distribución Poisson son E[X] = V[X] = λ
28Curso : Modelación y
Simulación
Distribución de Poisson
Ejemplo Un número promedio de camiones tanque que llega cada día a cierta ciudad portuaria es 10. Las instalaciones en el puerto pueden manejar a lo más 15 camiones tanque por día. ¿ Cuál es la probabilidad de que en un día dado los camiones se tengan que regresar? Solución Sea X el número de camiones tanque que llegan cada día.Entonces con el uso de la tabla de poisson tenemos
P(x>15)= 1- P(X15)=1-
15
0
)10;(x
xp = 1-0,9513= 0,0487
!10
15)15(
1015 exP
29Curso : Modelación y
Simulación
Distribución BinomialEn estadística la distribución binomial es una distribución probabilidad discreta describiendo el numero de éxitos de n experimentos independientes con probabilidad p de un éxito. Su función de densidad es
Eso es por que en n experimentos (o eventos) hay n sobre x (el coeficiente binomial) posibilidades para un numero de x éxitos (o aciertos) (probabilidad pk) y n − x no-éxitos ((1 − p)n − x). El valor esperado de una variable aleatoria de probabilidad binominal es E[x] = np y su varianza V[x] = np(1 − p).
30Curso : Modelación y
Simulación
Distribución BinomialLa probabilidad de que cierta clase de componente sobreviva a una prueba de choque dada es 3/4 . Encuentre la probabilidad de que sobrevivan exactamente dos de los siguientes cuatro componentes que se prueben.
Solución
Suponga que las pruebas son independientes y como p=3/4 para cada una de las 4 pruebas tenemos
128/274
3
¡2¡2
¡4)4/1(4/3
2
44
222
2
x
xB(2;4,3/4)= =0,2109
31Curso : Modelación y
Simulación
Distribución Normal Esta distribución es frecuentemente utilizada en las aplicaciones
estadísticas. Su propio nombre indica su extendida utilización, justificada
por la frecuencia o normalidad con la que ciertos fenómenos tienden a
parecerse en su comportamiento a esta distribución.
Muchas variables aleatorias continuas presentan una función de densidad
cuya gráfica tiene forma de campana.
En resumen, la importancia de la distribución normal se debe
principalmente a que hay muchas variables asociadas a fenómenos
naturales que siguen el modelo de la normal32
Curso : Modelación y Simulación
Distribución Normal
Representación gráfica de esta función de densidad
• Sin lugar a dudas, la distribución más utilizada para modelar experimentos aleatorios es la distribución normal
33Curso : Modelación y
Simulación
Distribución Normal
F(x) es el área sombreada de esta gráfica
34Curso : Modelación y
Simulación
Distribución Normal
TIPIFICACIÓN
Por tanto su función de densidad es
y su función de distribución es
35Curso : Modelación y
Simulación
Distribución Normalsiendo la representación gráfica de esta función
a la variable Z se la denomina variable tipificada de X, y a la curva de su función de densidad curva normal tipificada.
36Curso : Modelación y
Simulación
Manejo de tablas, casos más frecuentes
La distribución de la variable z se encuentra tabulada
37Curso : Modelación y
Simulación
Manejo de tablas, casos más frecuentes
38Curso : Modelación y
Simulación
Manejo de tablas, casos más frecuentes
39Curso : Modelación y
Simulación
Manejo de tablas, casos más frecuentes
40Curso : Modelación y
Simulación
EJERCICIO Tipificamos: La probabilidad de obtener puntuación entre 70 y 90
es:P(70≤X≤90)=p(-1,67≤X≤1,67)z1=(70-80)/6=-1,66666667z2=(90-80)/6=1,666666670,0478 0,9522+0,9522-0,0478=0,9044
y el número esperado de individuos que la obtienen es:
n=0,9044*200=180,883859n= 181 La probabilidad de que una persona tenga
puntuación superior a 90 es:
P(X>90)=P(Z>1,67)=1- 0,9522 =0,0478 Y para dos personas: p= 0,0478*0,0478 =0,00228484
Los resultados de una prueba objetiva de selección pasada a 200 personas indicaron que la distribución de puntuaciones era normal, con media de 80 puntos y desviación típica de 6 puntos. Calcular cuántos examinados han obtenido una puntuación entre 70 y 90 puntos. Si se eligen al azar dos de esas 200 personas, calcular la probabilidad de que ambas personas tengan puntuación superior a 90.
41Curso : Modelación y
Simulación
EJERCICIO
Los resultados de una prueba objetiva de selección pasada a 200 personas indicaron que la distribución de puntuaciones era normal, con media 60 puntos y desviación típica de 6 puntos. Cada prueba se puntuó con 0 ó 1 puntos. Calcular cuántos examinados han obtenido una puntuación entre 30 y 40 puntos, y cuál es la mínima puntuación por debajo de la cual están el 75 % de los examinados.
Tipifiquemos la variable con los valores extremos dados:
z1=(30-60)/6 -5
z1=(40-60)/6 -3,33333333
0,0000 0,0004
con lo cual no hay ningún examinado con una puntuación entre 30 y 40
Por otro lado , la mínima puntuación por debajo de la cual está el 75 % de los examinados
z normal0,67 0,74860,68 0,7517
se realiza una interpolación
0,01 0,0031
valor buscado 0,0014Luego
x=(0,0014*0,01)/0,0031 0,00451613
Zx=0,67+0,0045 0,6745
x1=6*zx+60 6*0,6745+60 64
La mínima puntuación por debajo de la cual está el 75 % de los examinados es 64
La probabilidad de obtener puntuación entre 30 y 40 es:
42Curso : Modelación y
Simulación
Distribución Normal
Media Aritmética
Mediana La mediana de un conjunto de observaciones se
ordenan de manera creciente, la mitad de éstas es menor que este valor y la otra mitad mayor
Moda La moda de un conjunto de observaciones es el
valor de la observación que ocurre con mayor frecuencia en un conjunto
n
iix x
n 1
1
43Curso : Modelación y
Simulación
Distribución Normal Desviación Estándar
Coeficiente de Simetría
Esta función caracteriza el grado de asimetría de una distribución con respecto a su media. La asimetría positiva indica una distribución unilateral que se extiende hacia valores más positivos. La asimetría negativa indica una distribución unilateral que se extiende hacia los valores más negativos
n
ixix x
n 1
2)(1
n
ixix
nmqueen
m
1
33
)(1
33
44Curso : Modelación y
Simulación
Distribución Normal
Curtosis
La curtosis representala elevación o achatamiento de una distribución , Una curtosis positiva indica una distribución relativamente elevada, mientras que una curtosis negativa indica una distribución relativamente plana.
n
ixix
nmqueen
m
1
44
)(1
44
45Curso : Modelación y
Simulación
Distribución Ji Cuadrado (2 )
•Es una distribución asimétrica.
• Solo toma valores positivos y es asintótica con respecto al eje de las x positivas (0 < 2 < +).
• Está caracterizada por un único parámetro llamado: grados de libertad (g.l.)
• El área comprendida entre la curva y el eje de las x es 1 o 100%.
46Curso : Modelación y
Simulación
Gráfico de la distribución Ji Cuadrado
1 -
Región de aceptación
Región de rechazo
2 gl,
47Curso : Modelación y
Simulación
Distribución Ji Cuadrado
220
( )i i
i
E
E
48Curso : Modelación y
Simulación
Ejercicio Chi - Cuadrado
12 2
4
6
8
54
2 2
0
25
1
49Curso : Modelación y
Simulación
Ejercicio Chi-cuadradoai bi Fi
Marca Clase Fi*MC (xi-x) ^2 fi*(xi-x)^2
1,18 1,22 1 1,2 1,2 0,07002639 0,07002639
1,22 1,27 2 1,245 2,49 0,04823514 0,09647028
1,27 1,32 2 1,295 2,59 0,02877264 0,05754528
1,32 1,37 4 1,345 5,38 0,01431014 0,05724056
1,37 1,42 6 1,395 8,37 0,00484764 0,02908584
1,42 1,47 8 1,445 11,56 0,00038514 0,00308113
1,47 1,52 5 1,495 7,475 0,00092264 0,0046132
1,52 1,57 4 1,545 6,18 0,00646014 0,02584056
1,57 1,62 2 1,595 3,19 0,01699764 0,03399528
1,62 1,67 3 1,645 4,935 0,03253514 0,09760542
1,67 1,72 1 1,695 1,695 0,05307264 0,05307264
1,72 1,8 2 1,76 3,52 0,08724639 0,17449278
40 suma 58,585 suma 0,70306938
media 1,464625 varianza 0,01802742
desviación 0,1342662350
Ejercicio Chi-cuadrado
ajuste bueno, es una distribución normal
3,32chiv9 ,5=
16,93chi v9,95=
v=k-1-m=12-1-2=9
chi calculado =9,43
0,1347s
9,429921004097,6309961,4646x
1,50187,50925,00022,259799,360997,10122,4901,8961,801,72
0,37490,93722,50013,468197,101293,63311,8961,5251,721,67
0,27322,04897,50036,068693,633187,56451,5251,1531,671,62
3,640818,20405,00029,266687,564578,29791,1530,7821,621,57
0,55135,512710,000412,347978,297965,95000,7820,4111,571,52
0,27633,454012,500514,358565,950051,59150,4110,0401,521,47
1,474129,481720,000814,570351,591537,02120,040-0,3311,471,42
0,29334,399815,000612,902437,021224,1188-0,331-0,7021,421,37
0,00010,000910,00049,970524,118814,1483-0,702-1,0741,371,32
0,59422,97095,00026,723614,14837,4246-1,074-1,4451,321,27
0,21771,08865,00023,95677,42463,4680-1,445-1,8161,271,22
0,23220,58062,50011,73803,46801,7299-1,816-2,1131,221,18
ej f*100/40ojN(yc2)*100N(yc1)*100(bi-x)/s(ai-x)/sbiai
(oj-ej)^2/ej
(oj-ej)^2fre en %
frecuenciaarea2-area1area2area1
ajuste bueno, es una distribución normal
3,32chiv9 ,5=
16,93chi v9,95=
v=k-1-m=12-1-2=9
chi calculado =9,43
0,1347s
9,429921004097,6309961,4646x
1,50187,50925,00022,259799,360997,10122,4901,8961,801,72
0,37490,93722,50013,468197,101293,63311,8961,5251,721,67
0,27322,04897,50036,068693,633187,56451,5251,1531,671,62
3,640818,20405,00029,266687,564578,29791,1530,7821,621,57
0,55135,512710,000412,347978,297965,95000,7820,4111,571,52
0,27633,454012,500514,358565,950051,59150,4110,0401,521,47
1,474129,481720,000814,570351,591537,02120,040-0,3311,471,42
0,29334,399815,000612,902437,021224,1188-0,331-0,7021,421,37
0,00010,000910,00049,970524,118814,1483-0,702-1,0741,371,32
0,59422,97095,00026,723614,14837,4246-1,074-1,4451,321,27
0,21771,08865,00023,95677,42463,4680-1,445-1,8161,271,22
0,23220,58062,50011,73803,46801,7299-1,816-2,1131,221,18
ej f*100/40ojN(yc2)*100N(yc1)*100(bi-x)/s(ai-x)/sbiai
(oj-ej)^2/ej
(oj-ej)^2fre en %
frecuenciaarea2-area1area2area1
51
Ejercicio Chi-cuadrado
Límite Límite Frecuencia Frecuencia PorcentajeInferior Superior Acumulada
1,18 1,22 1 1 2,51,22 1,27 2 3 7,51,27 1,32 2 5 12,51,32 1,37 4 9 22,51,37 1,42 6 15 37,51,42 1,47 8 23 57,51,47 1,52 5 28 70,01,52 1,57 4 32 80,01,57 1,62 2 34 85,01,62 1,67 3 37 92,51,67 1,72 1 38 95,01,72 1,80 2 40 100,0
52Curso : Modelación y
Simulación
1200
1010
105
20
90 53Curso : Modelación y
Simulación
Ejercicio Chi-cuadrado
114
56
172
245
263
156
67
23
3
0
25
50
75
100
125
150
175
200
225
250
275
300
1
54Curso : Modelación y
Simulación
Ejercicio Chi-cuadrado
ai bi Fi Marca Clase Fi*MC (x-X)**2 Fi*(x-X)**227,5 31,5 1 29,5 29,5 331,677 331,67731,5 35,5 14 33,5 469 201,981 2827,73335,5 39,5 56 37,5 2100 104,285 5839,95739,5 43,5 172 41,5 7138 38,589 6637,29843,5 47,5 245 45,5 11147,5 4,893 1198,77147,5 51,5 263 49,5 13018,5 3,197 840,79651,5 55,5 156 53,5 8346 33,501 5226,14755,5 59,5 67 57,5 3852,5 95,805 6418,93159,5 63,5 23 61,5 1414,5 190,109 4372,50663,5 67,5 3 65,5 196,5 316,413 949,239
1000 suma 47712 suma 34643,056media 47,71 varianza 34,678
desviacion 5,889
55Curso : Modelación y
Simulación
Ejercicio Chi-cuadrado area1 area2
area2-area1 frecuencia fre en % (oj-ej)^2
(oj-ej)^2/ej
ai bi (ai-x)/s (bi-x)/s N(yc1)*100 N(yc2)*100 oj ej f*100/1000
27,5 31,5 -3,434 -2,754 0,0297 0,2940 0,2642 1 0,1 0,0270 0,270
31,5 35,5 -2,754 -2,075 0,2940 1,9001 1,6062 14 1,4 0,0425 0,030
35,5 39,5 -2,075 -1,395 1,9001 8,1474 6,2473 56 5,6 0,4190 0,075
39,5 43,5 -1,395 -0,716 8,1474 23,7113 15,5638 172 17,2 2,6770 0,156
43,5 47,5 -0,716 -0,036 23,7113 48,5634 24,8521 245 24,5 0,1240 0,005
47,5 51,5 -0,036 0,644 48,5634 74,0077 25,4443 263 26,3 0,7322 0,028
51,5 55,5 0,644 1,323 74,0077 90,7113 16,7036 156 15,6 1,2179 0,078
55,5 59,5 1,323 2,003 90,7113 97,7400 7,0287 67 6,7 0,1080 0,016
59,5 63,5 2,003 2,682 97,7400 99,6345 1,8945 23 2,3 0,1644 0,071
63,5 67,5 2,682 3,362 99,6345 99,9613 0,3268 3 0,3 0,0007 0,002
x 47,712 1000 0,732
s 5,886
chi calculado =0,7315 chi v7,95= 14,1
v=k-1-m=10-1-2=7 chiv7 ,5= 2,17
ajuste muy bueno 56
Curso : Modelación y Simulación
Ejercicio Chi-cuadrado
Límite Frecuencia Frecuencia Porcentaje
Superior Acumulada
31,5 1 1 0,1
35,5 14 15 1,5
39,5 56 71 7,1
43,5 172 243 24,3
47,5 245 488 48,8
51,5 263 751 75,1
55,5 156 907 90,7
59,5 67 974 97,4
63,5 23 997 99,7
67,5 3 1000 100,0
57Curso : Modelación y
Simulación
Curva tonelaje vs leyFormulasCalculo de área: Ocupando la normal reducida
Ley media
Curso : Modelación y Simulación 58
Xc
Yc
)()%( YcXc
)(*
2)(
2
2
Yc
eXc
Yc
Curva tonelaje vs leyEjemploµ=47,712 =5,886 Xc=40
Ley media
Curso : Modelación y Simulación 59
31,1886,5
712,4740
Xc
Yc
%49,909049,00951,01)()%( YcXc
385,539049,0
*14,3*2
886,5712,47
)(*
2)(
2
)31,1(
2
22
e
Yc
eXc
Yc
Curva tonelaje vs ley
Curso : Modelación y Simulación 60
Tonelaje Total =100.000 toneladas 100.000
% XC (ai-x)/s Normal %(+Xc) Tonelaje n exp Ley
25 -3,859 0,000 1,000 99994,3 -7,445 0,001 47,7130 -3,009 0,001 0,999 99869,1 -4,528 0,011 47,7435 -2,160 0,015 0,985 98460,5 -2,332 0,097 47,9440 -1,310 0,095 0,905 90494,8 -0,858 0,424 48,8145 -0,461 0,322 0,678 67751,8 -0,106 0,899 50,8350 0,389 0,651 0,349 34873,7 -0,076 0,927 53,9655 1,238 0,892 0,108 10781,5 -0,767 0,465 57,8360 2,088 0,982 0,018 1841,1 -2,179 0,113 62,14
x 47,712s 5,8858
R2pi 2,50659769
)(
*2
2
2
Yc
eXc
Yc
9049,0
*14,3*2
886,5712,4740
2
)31,1( 2
e
Curva tonelaje vs ley
Curso : Modelación y Simulación 61
Coeficiente de correlación El coeficiente de correlación se define por :
La correlación es nula si rxy=0
11
:
*
xy
yx
xyxy
r
donde
SS
Sr
62Curso : Modelación y
Simulación
Línea de Regresión La linea de regresión se define por:
yxx
S
Sry
y
xxy
63Curso : Modelación y
Simulación
Producción Coston x y X-x Y-y (X-x)^2 (Y-y)^2 (X-x)(Y-y)1 1,5 2,5 -1,45 -1,01 2,103 1,020 1,46452 2,0 3,1 -0,95 -0,41 0,903 0,168 0,38953 3,0 3,8 0,05 0,29 0,002 0,084 0,01454 1,5 2,1 -1,45 -1,41 2,103 1,988 2,04455 3,5 4,3 0,55 0,79 0,303 0,624 0,43456 3,0 3,2 0,05 -0,31 0,002 0,096 -0,01557 4,5 4,8 1,55 1,29 2,403 1,664 1,99958 4,0 3,9 1,05 0,39 1,103 0,152 0,40959 4,0 4,4 1,05 0,89 1,103 0,792 0,934510 2,5 3,0 -0,45 -0,51 0,203 0,260 0,2295
Suma 29,5 35,1 10,225 6,849 7,905Media 2,95 3,51Varianza 1,136 0,761Desviación Sta 1,066 0,872Covarianza 0,878Coeficiente correlación 0,945 0,77310513
2,280660151,22933985
Y=1,229+0,77*X
0,0
1,0
2,0
3,0
4,0
5,0
6,0
0,0 1,0 2,0 3,0 4,0 5,0 6,0
Datos
Recta
Lineal (Recta)
yxx
S
Sry
y
xx y
64
Regresión Lineal Múltiple
Supongamos que la variable Y depende de las variables X1,X2,X3, por analogía con el modelo lineal simple se puede formular el modelo siguiente
321320 1 XXXY iiii
En que X1,X2;x3 son los valores de las variable independientes en el experimento i, siendo Yi, la respuesta correspondiente. Debido a la presencia de más de dos variables , este modelo se llama regresión lineal múltiple. Para estimar los parámetros 0 , 1, 2, 3 se utiliza el método de los mínimos cuadrados, minimizando la cantidad:
)321( 2
13210 XXXYD iii
i
n
i
65Curso : Modelación y
Simulación
Regresión Lineal Múltiple
al derivar parcialmente D con respecto a parámetros 0, 1, 2, 3, se llega al sistema de ecuaciones siguientes, llamado sistema normal
YXXXXXXX
YXXXXXXX
YXXXXXXX
YXXXn
332322311303
233222211202
133122112
101
3322110
Coeficiente de determinación r2 que corresponde al índice de ajuste lineal, siendo r el coeficiente de correlación múltiple
66Curso : Modelación y
Simulación
Regresión Lineal Múltiple
Ejemplo Montgomery y Peck (1992) describen el uso de un modelo de regresión para relacionar la cantidad de tiempo que requiere un vendedor para dar servicio a una máquina expendedora de refrescos, con el número de envases contenidos en la máquina y la distancia del vehículo de servicio al sitio donde se encuentra la máquina . Este modelo fue utilizado para diseñar la ruta , los horarios y la salida de vehículos, La tabla presenta 25 observaciones del tiempo de suministro tomadas del mismo estudio descrito por Montgomery y Peck.
67Curso : Modelación y
Simulación
Regresión Lineal MúltipleY x1 x2 x1*x1 x1*x2 x1*y x2*x2 x2*y
1 9,95 2,00 50,00 4,00 100,00 19,90 2500 497,52 24,45 8,00 110,00 64,00 880,00 195,60 12100 2689,53 31,75 11,00 120,00 121,00 1320,00 349,25 14400 38104 35,00 10,00 550,00 100,00 5500,00 350,00 302500 192505 25,02 8,00 295,00 64,00 2360,00 200,16 87025 7380,96 16,86 4,00 200,00 16,00 800,00 67,44 40000 33727 14,38 2,00 375,00 4,00 750,00 28,76 140625 5392,58 9,60 2,00 52,00 4,00 104,00 19,20 2704 499,29 24,35 9,00 100,00 81,00 900,00 219,15 10000 2435
10 27,50 8,00 300,00 64,00 2400,00 220,00 90000 825011 17,08 4,00 412,00 16,00 1648,00 68,32 169744 7036,9612 37,00 11,00 400,00 121,00 4400,00 407,00 160000 1480013 41,95 12,00 500,00 144,00 6000,00 503,40 250000 2097514 11,66 2,00 360,00 4,00 720,00 23,32 129600 4197,615 21,65 4,00 205,00 16,00 820,00 86,60 42025 4438,2516 17,89 4,00 400,00 16,00 1600,00 71,56 160000 715617 69,00 20,00 600,00 400,00 12000,00 1380,00 360000 4140018 10,30 1,00 585,00 1,00 585,00 10,30 342225 6025,519 34,93 10,00 540,00 100,00 5400,00 349,30 291600 18862,220 46,59 15,00 250,00 225,00 3750,00 698,85 62500 11647,521 44,88 15,00 290,00 225,00 4350,00 673,20 84100 13015,222 54,12 16,00 510,00 256,00 8160,00 865,92 260100 27601,223 56,23 17,00 590,00 289,00 10030,00 955,91 348100 33175,724 22,13 6,00 100,00 36,00 600,00 132,78 10000 221325 21,15 5,00 400,00 25,00 2000,00 105,75 160000 8460
Ysuma 725,42 206 8294 2396 77177 8001,67 3531848 274580,71
Ecuaciones 1 B0*n+B1*X1+B2*X2=Y2 B0*X1+B1*X1*X1+B2*X1*X2=X1*Y3 B0*X2+B1*X1*X2+B2*X2*X2=X2*Y
Y=B0+B1*x1+B2*X2
68
Regresión Lineal MúltipleEcuaciones 1 25*B0 +206*B1 +8294*B2 =725,42 *206
2 206*B0 +2396*B1 +77177*B2 =8001,67 *253 8294*B0 +77177*B1 +3531848*B2 =274580,71
5150 42436 1708564 149436,525150 59900 1929425 200041,75
0 17464 220861 50605,23 12,64664453
B1 = 2,89768839 -12,646644*B2
6942,861377 -30301,36028 223634,8967 -976030,0846
206 46875,64 1058,81 *82948294 2555817,92 50945,82 *206
1708564 388786558 8781770,141708564 526498492 10494838,92
0 137711933 1713068,78
B2 = 0,012439509 57,73041402 B1= 2,740370335 475,6986021 2,309216515 B0= 2,309216561
Y=2,3092+2,7403*X1+0,0124*X2
69Curso : Modelación y
Simulación
Regresión Lineal MúltipleY= 2,31 + 2,740 X1 0,0124 X2
Y Ys ei Y-YM Ys-YsM (Y-YM)^2 (Ys-YsM)^2 (Y-YM)*(Ys-YsM)1 9,95 8,4098 1,54 -19,07 -20,59 363,543 424,084 392,6482 24,45 25,5956 -1,15 -4,57 -3,41 20,856 11,611 15,5613 31,75 33,9405 -2,19 2,73 4,94 7,470 24,378 13,4954 35,00 36,5322 -1,53 5,98 7,53 35,799 56,687 45,0485 25,02 27,8896 -2,87 -4,00 -1,11 15,974 1,240 4,4506 16,86 15,7504 1,11 -12,16 -13,25 147,788 175,634 161,1107 14,38 12,4398 1,94 -14,64 -16,56 214,236 274,343 242,4348 9,60 8,4346 1,17 -19,42 -20,57 377,012 423,063 399,3749 24,35 28,2119 -3,86 -4,67 -0,79 21,779 0,626 3,692
10 27,50 27,9516 -0,45 -1,52 -1,05 2,301 1,106 1,59511 17,08 18,3792 -1,30 -11,94 -10,62 142,487 112,867 126,81512 37,00 37,4125 -0,41 7,98 8,41 63,731 70,718 67,13413 41,95 41,3928 0,56 12,93 12,39 167,268 153,505 160,23914 11,66 12,2538 -0,59 -17,36 -16,75 301,259 280,539 290,71415 21,65 15,8124 5,84 -7,37 -13,19 54,270 173,994 97,17316 17,89 18,2304 -0,34 -11,13 -10,77 123,806 116,051 119,86617 69,00 64,5552 4,44 39,98 35,55 1598,656 1263,952 1421,48718 10,30 12,3035 -2,00 -18,72 -16,70 350,319 278,877 312,56319 34,93 36,4082 -1,48 5,91 7,41 34,966 54,836 43,78820 46,59 46,5137 0,08 17,57 17,51 308,817 306,621 307,71721 44,88 47,0097 -2,13 15,86 18,01 251,641 324,238 285,64222 54,12 52,478 1,64 25,10 23,47 630,171 551,071 589,29523 56,23 56,2103 0,02 27,21 27,21 740,558 740,232 740,39524 22,13 19,991 2,14 -6,89 -9,01 47,428 81,218 62,06525 21,15 20,9707 0,18 -7,87 -8,03 61,887 64,519 63,189
SUMA 725,42 725,08 6084,021 5966,009 5967,491MEDIA 29,0168 29,00 253,501 248,584 248,645
15,922 15,767
Coeficiente de correlación múltiple r 0,99049999Coeficiente de determinación r^2 0,98109023
70Curso : Modelación y
Simulación
Regresión Lineal Múltiple Matricial
Sean K: Número de variables de Regresión n: número de observaciones en la
forma ((Xi1;Xi2;Xi3;…..;Xik);Yi) con i=1,2,3,…n)
Y el modelo de regresión
Yi= Bo+i
k
jijj X
1
71Curso : Modelación y
Simulación
Regresión Lineal Múltiple Matricial
Este Modelo es un sistema de n ecuaciones que puede expresarse en forma matricial como
nknknn
k
k
n
y
XXX
XXX
XXX
X
Y
Y
Y
Y
..
......1
.
......1
......1
.2
1
1
0
21
22221
11211
2
1
72Curso : Modelación y
Simulación
Regresión Lineal Múltiple Matricial
Se desea encontrar el vector de estimadores de minimos cuadrados que es:
L=´= (y-Xβ)´(y-Xβ)
Al derivar en forma parcial nos queda X´Xβ=X´y
El estimador de mínimos cuadrados es:
YXXX tT 1ˆ
73Curso : Modelación y
Simulación
Regresión Lineal Múltiple Matricial En el ejemplo : x1 x2
9,95 1 2 5024,45 1 8 11031,75 1 11 12035,00 1 10 55025,02 1 8 29516,86 1 4 20014,38 1 2 375
y 9,60 X 1 2 5224,35 1 9 10027,50 1 8 30017,08 1 4 41237,00 1 11 40041,95 1 12 50011,66 1 2 36021,65 1 4 20517,89 1 4 40069,00 1 20 60010,30 1 1 58534,93 1 10 54046,59 1 15 25044,88 1 15 29054,12 1 16 51056,23 1 17 59022,13 1 6 10021,15 1 5 400
74Curso : Modelación y
Simulación
Regresión Lineal Múltiple Matricial
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 502 8 11 10 8 4 2 2 9 8 4 11 12 2 4 4 20 1 10 15 15 16 17 6 5 1 8 110
50 110 120 550 295 200 375 52 100 300 412 400 500 360 205 400 600 585 540 250 290 510 590 100 400 1 11 1201 10 550
25 206 8294 1 8 295206 2396 77177 1 4 200
8294 77177 3531848 1 2 3751 2 52
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 9 1002 8 11 10 8 4 2 2 9 8 4 11 12 2 4 4 20 1 10 15 15 16 17 6 5 1 8 300
50 110 120 550 295 200 375 52 100 300 412 400 500 360 205 400 600 585 540 250 290 510 590 100 400 1 4 4121 11 400
725,42 9,95 1 12 5008001,67 24,45 1 2 360
274580,71 31,75 1 4 20535,00 1 4 400
25 206 8294 -1 725,42 25,02 1 20 600206 2396 77177 8001,67 16,86 1 1 585
8294 77177 3531848 274581 14,38 1 10 5409,60 1 15 250
0,2146526 -0,0074909 -0,0003404 725,42 24,35 1 15 290-0,0074909 0,0016708 -0,0000189 8001,67 27,50 1 16 510-0,0003404 -0,0000189 0,0000015 274581 17,08 1 17 590
37,00 1 6 10041,95 1 5 400
2,309200429 11,662,740369424 21,650,012439581 17,89
69,00Y=2,3092+2,74037*X1+0,01244*X2 10,30
34,9346,5944,8854,1256,2322,1321,15
75Curso : Modelación y
Simulación
Estimación Puntual Propiedades de los estimadores
Insesgadez : Es mínimo cuando . Y de este modo,el Error Cuadrático Medio es la varianza del estimador.
Eficiencia: Dado un tamaño de muestra fijo, se busca, entre los estimadores, el que menor varianza tenga.
2ˆ)ˆ( EECM
)ˆ(E
76Curso : Modelación y
Simulación
Estimación PuntualConsistencia: Nos dice que, cuando el tamaño de las muestra se incrementa, el estimador puntual debe estar próximo al parámetro con probabilidad alta.
Suficiencia: El estimador puntual debe resumir la información proporcionada por la muestra aleatoria Además no debe haber pérdida de ésta.
Invarianza: Si es el estimador de , esta propiedad nos dice que g() tiene como estimador a g( ).
Robustez: Se presenta cuando la distribución del estimador no se ve seriamente afectada por violaciones en los supuestos.
77Curso : Modelación y
Simulación
Consistencia: Nos dice que, cuando el tamaño de las muestra se incrementa, el estimador puntual debe estar próximo al parámetro con probabilidad alta.
Suficiencia: El estimador puntual debe resumir la información proporcionada por la muestra aleatoria Además no debe haber pérdida de ésta.
Invarianza: Si es el estimador de , esta propiedad nos dice que g() tiene como estimador a g( ).
Robustez: Se presenta cuando la distribución del estimador no se ve seriamente afectada por violaciones en los supuestos.
78Curso : Modelación y
Simulación
Ley de los Grandes Números
Como caso especial, cuando es , la media muestral, tenemos que E( ) = y converge a .
De la misma manera, s2 converge a
2 cuando n tiende a infinito.
Z x
x
x
79Curso : Modelación y
Simulación
Teorema del Límite central Sea x1, x2, ..., xn una muestra aleatoria de observaciones tomadas de la misma distribución y sea E(Xi)= y Var(Xi)= 2.
Entonces la distribución muestral de la variable aleatoria
converge a la normal standard cuando n tiende a infinito.
)(
xn
Zn
80Curso : Modelación y
Simulación
Teorema central del Límite
El TCL es una herramienta muy poderosa porque se cumple aún cuando la distribución desde la que se toman las observaciones no sea normal. Esto significa que si nosotros nos aseguramos que el tamaño de la muestra es grande, entonces podemos usar la variable Zn para responder preguntas acerca de la población de la cual provienen las observaciones.
81Curso : Modelación y
Simulación
Estos dos conceptos anteriores sirven para prepararnos para dos objetivos básicos de cualquier estudio empírico: la estimación de parámetros desconocidos que nos interesan y la prueba de hipótesis
82Curso : Modelación y
Simulación
Cálculo del tamaño de la muestra
El tamaño de la muestra para un diseño de encuestas basado en una muestra aleatoria simple, puede calcularse por la siguiente fórmula
pqZNE
pqNZn
22
2
83Curso : Modelación y
Simulación
Cálculo del tamaño de la muestra
Donde: n es el tamaño de la muestra Z es el nivel de confianza del 95%, y es igual a 1,96 según la tabla de
distribución normal es decir: P(-1,96<z<1,96)=0,95
p es la variabilidad positiva, es decir la probabilidad con que se acepta la hipótesis que se quiere investigar, con un valor de 0,5.
q es la variabilidad negativa, es decir, la probabilidad con que se rechaza la hipótesis que se quiere investigar, con un valor de 0,5.
N es el tamaño de la población, de 684 individuos.
E es la precisión o el error, con un valor del 5 % de error.
individuosxxx
xxxxn 246
5,05,096,105,0684
6845,05,05,096,122
2
84Curso : Modelación y
Simulación
Cálculo del tamaño de la muestra
otra Forma: El tamaño de la muestra para un diseño de encuestas basado en una muestra aleatoria simple, puede calcularse por la siguiente fórmula
n= tamaño de la muestra requeridoT= nivel de fiabilidad (95 % = 1,96)P=probabilidad de ocurrenciam=margen de error( 5%=0.05)
2
2 )1(*
m
pptn
85Curso : Modelación y
Simulación
Ejemplo
Se ha determinado que en una población cerca del 30 %(0.3) de los niños están desnutridos.Este datos de basa en estadísticas nacionales . Determine con una 95 % de confianza el tamaño de la muestra requerido
n=322,72 323Se considera un efecto de diseño 2 luego el número de muestreas es : n*d=323X2=646Corrección por imprevistos aumenta en un 5 % como errores N=646x1,05=690 niños
2
2
05.0
)3.01(3.0*96,1 n
86Curso : Modelación y
Simulación