clase 1 probabilidades distribuciones

transcript

ProbabilidadesDEFINICIÓN

Probabilidad de un suceso es el número al que tiende la frecuencia relativa asociada al suceso a medida que el número de veces que se realiza el experimento crece.

La frecuencia relativa de un suceso A:

Fr (a)= número de veces que aparece ANúmero de veces que se realiza el experimento

1Curso : Modelación y

Simulación

ProbabilidadesDEFINICIÓN DE LAPLACE

En el caso de que todos los sucesos elementales del espacio muestral E sean equiprobables, Laplace define la probabilidad del suceso A como el cociente entre el número de resultados favorables a que ocurra el suceso A en el experimento y el número de resultados posibles del experimento.

Si E={x1,x2,…..,xk} y P(x1)=P(x2)=……=P(xk), entonces:

P(A)= número de casos favorables al suceso Anúmero de casos posibles

Simulación

Probabilidades

Permutaciones

Una permutación es un arreglo de todo o parte de un conjunto de datos, el número de permutaciones de n objetos distintos es n!

el número de permutaciones de n objetos tomados de r a la vez es

Ejemplo 1

Considere las tres letras a,b y c, las permutaciones posibles son abc, acb, bac, bca, cab y cba

n !=3 !=1*2*3=6

Simulación

Probabilidades

Ejemplo 2

Se sacan dos billetes de lotería de 20 para un primer y un segundo premios. Encuentre el número de puntos muéstrales en el espacio S.

Solución

38019*20)!220(

!20220

Simulación

Probabilidades

Combinaciones

El número de combinaciones de n objetos distintos tomados de r a la vez es

Ejemplo

En una mano de póquer que consiste en cinco cartas, encuentre la probabilidad de tener 2 ases y tres sotas

Simulación

Probabilidades

Solución

El número de formas de tener dos ases de cuatro es:

y el número de formas de tener tres sotas de cuatro es:

Mediante la regla de multiplicación hay n=6*4=24 manos con dos ases y tres sotas.

6)!2(!2

4)!1(!3

Simulación

Probabilidades

El número total de 5 manos de póquer de cinco cartas, las cuales son igualmente probables es

por tanto la probabilidad de obtener dos ases y tres sotas en una mano de póquer de cinco cartas es:

960.598.2)!47(!5

5109,0960.598.2

24)( xxP

Simulación

Probabilidades

Experimentos Aleatorios

Un experimento aleatorio es aquel que proporciona diferentes resultados aun cuando se repita siempre de la misma forma.

Espacio Muestral

Un conjunto de los posibles resultados de un experimento aleatorio recibe el nombre de espacio muestral del experimento

Evento

Un evento es un subconjunto del espacio muestral de un experimento aleatorio.

Simulación

Probabilidades

Axiomas de Probabilidades

La probabilidad es un número que se asigna a cada miembro de una colección de eventos de un experimento aleatorio y que satisface las siguientes propiedades

1.- P(s) =1

3.- Para dos eventos E1 y E2

P(E1 U E2)= P(E1)+P(E2)-P(E1∩E2 )

con E1∩E2 =ø, P(E1 U E2)= P(E1)+P(E2)

1)(0 EP

Simulación

Probabilidades

Probabilidad Condicional

La probabilidad condicional de un evento A dado un Evento B, denotada por P(A\B), es :

P(A\B)= P( A ∩ B) / P(B) si P(B)>0

Probabilidad Total

Sea A1,a2,… An, un sistema completo de sucesos tales que la probabilidad de cada uno de ellos es distinta de cero, y sea B un suceso cualquier del que se conocen las probabilidades condicionales P(B\Ai), entonces la probabilidad del suceso B viene dada por la expresión.

P(B)= P(A1)*P(B/A1)+P(A2)*P(B/A2)+…..+P(An)*P(B/An)

Simulación

Probabilidades

Teorema de Bayes

Sea A1,A2,....An un sistema completo de sucesos, tales que la probabilidad de cada uno de ellos es distinta de cero, y sea B un suceso cualquier del que se conocen las probabilidades condicionales P(B/Ai), entonces la probabilidad P(Ai/B) viene dada por la expresión :

P(Ai/B)= P(Ai)* P(B/Ai)

P(A1)*P(B/A1)+ P(A2)*P(B/A2) +.....+ P(An)*P(B/An)

Simulación

Solución

sea D = " La pieza es defectuosa", y N="La pieza no es defectuosa"La información del problema puede expresarse en el diagrama de árbol

a.- Para calcular la probabilidad de que la pieza elegida sea defectuosa, P(D) por la Propiedad de la probabilidad total,

P(D)= P(A)*P(D/A)+P(B)*P(D/B)+P(C)*P(D/C)

P(D)= 0,4*0,02+0,35*0,03+0,25*0,04P(D)= 0,0285

b.- Debemos calcular P(B/D). Por el teorema de Bayes

P(B/D)= P(B)*P(D/B)P(A)*P(D/A)+P(B)*P(D/B)+P(C)*P(D/C)

P(B/D)= 0,35*0,03 0,4*0,02+0,35*0,03+0,25*0,04

P(B/D)= 0,0105 0,0285

P(B/D)= 0,368

c.- Calculamos P(A/D) y P(C/D), comparándolas con el valor de P(B/D) ya calculado. Aplicando el teorema de Bayes , obtenemos

P(A/D)= 0,4*0,02 = 0,008 = 0,281 0,4*0,02+0,35*0,03+0,25*0,04 0,0285

P(C/D)= 0,25*0,04 = 0,01 = 0,351 0,4*0,02+0,35*0,03+0,25*0,04 0,0285

La línea de producción con mayor probabilidad de haber producido la pieza defectuosa es B

1.- Tres líneas de producción de ánodos, A, B, C producen el 40%, 35%, 25%, respectivamente, del total de la producción. Los porcentajes de ánodos defectuosos de estas líneas son del 2%, 3%, 4%.

Estadística: El campo de la Estadística tiene que ver con la

recopilación, presentación, análisis y uso de datos para tomar decisiones y resolver problemas.

La importancia de la estadística en la ingeniería, la ciencia y la administración ha sido subrayada por la participación en la industria en el aumento de la calidad. Muchas compañías se han dado cuenta de que la baja calidad de un producto (defectos de fabricación, baja confiabilidad en su rendimiento) tiene un efecto muy pronunciado en la productividad global de la Empresa. La estadística es un elemento decisivo en el incremento de la calidad, ya que las técnicas estadísticas pueden emplearse para describir y comprender la variabilidad.

Simulación

Estadística Descriptiva

Media aritmética:

La media aritmética o media de un conjunto de N números x1,x2,x3,....,xn se representa por x y se define como

xj x = x1 + x2 +x3 +......+ xn = j=1__

Simulación

Mediana: Sean x1,x2,x3,.....,xn una muestra acomodada en orden creciente de magnitud,; esto es x1 denota la observación pequeña y xn denota la observación más grande. Entonces la mediana x se define como la parte media o la ( n+1 / 2)-ésima observación si n es impar, o el promedio entre las dos observaciones intermedias la (n / 2)-ésima y la ( n / 2)+1)-ésima si n es par. En términos matemáticos

___________________ 2

imparn 2/1

parnxnx 12/2

Simulación

Moda: La moda es la observación que se presenta con mayor frecuencia en la muestra. Esta puede no existir cuando los datos no están agrupados o ser bimodales, etc.

Simulación

Varianza muestral y desviación estándar muestral. Las medidas más importantes de variabilidad son la varianza muestral y la desviación estándar muestral. Si x1,x2,x3,.....,xn es una muestra de n observaciones, entonces la varianza muestral es:

La desviación estándar S es la raíz cuadrada positiva.

ii XXx

Simulación

Coeficiente de Variación: En ocasiones es deseable expresar la variación como una fracción de la Media. El coeficiente de variación es útil cuando se compara la variabilidad de dos o más conjuntos de datos que difieren de manera considerable en la magnitud de las observaciones. El coeficiente muestral es:

Simulación

Error estándar: El error estándar de una estadística es la desviación estándar de su distribución de muestreo. Si el error estándar involucra parámetros desconocidos cuyos valores pueden estimarse, la sustitución de estas estimaciones en el error estándar da como resultado un error estándar estimado.

El error estándar da alguna idea sobre la precisión de la estimación. Si no se sabe que valor tiene pero se sustituye la desviación estándar muestral S en la ecuación anterior, entonces el error estándar estimado de x es

Simulación

Rango de la Muestra: Una medida muy sencilla de variabilidad es el rango de la muestra, definido como la diferencia entre las observaciones más grande y más pequeña. r = máx (xi) - min (xi)

Simulación

Coeficiente de Asimetría: El coeficiente de simetría que mide el grado de asimetría o falta de simetría de una distribución. Y se define por

1)2)(1(

Simulación

Curtosis: El coeficiente de curtosis es una medida de achatamiento de un histograma con respecto al modelo teórico de Gauss. El coeficiente de curtosis se define por

Se puede demostrar que: E 0 histograma más puntiagudo que la ley de Gauss (leptocúrtica) E 0 histograma más achatado que la ley de Gauss (platicúrtica) E 0 histograma sin achatamiento (mesocúrtica)

)3)(2()1(3

)3)(2)(1(

Simulación

Histograma

Un histograma o histograma de frecuencias consiste en una serie de

rectángulos que tienen:

1.- Sus bases sobre un eje horizontal con centros en las marcas de clase y

longitud igual al tamaño de los intervalos de clase.

2.- Superficie proporcionales a las frecuencias de clase, el número de

observaciones en una clase recibe el nombre de frecuencia de clase. La

marca de clase es el punto medio del intervalo de clase y se obtiene

sumando los límites inferior y superior de la clase y dividiendo por 2.

3.- Un polígono de frecuencia es un gráfico de línea trazado sobre las

marcas de clase.

Simulación

Reglas generales para formar la distribución de frecuencias

1.- Determinar el mayor y el menor entre los datos registrados y así encontrar

el rango.

2.- Dividir el rango en un número conveniente de intervalos de clase del

mismo tamaño, el número de clases que se emplea para clasificar los datos

en un conjunto dependen del total de observaciones en éste. Si el número de

observaciones es relativamente pequeño, el número de clase a emplear será

cercano a cinco, pero generalmente nunca menor que este valor. Si existe

una cantidad sustancial de datos, el número de clases debe encontrarse entre

ocho y doce y generalmente no existirán mas de 15 clases. Un número muy

pequeño de clases puede ocultar la distribución real del conjunto de datos,

mientras que un número muy grande puede dejar sin observaciones o

lagunas de las clase, limitando de esta forma su uso.

Simulación

Criterio de Sturguess

Es usado ampliamente , ya que entrega la dimensión del intervalo de

clase que permite la mejor definición de la forma real de la distribución en

estudio. Para estimar el intervalo de clase Sturguess planteó la siguiente

expresión.

Raíz cuadrada del número de observaciones

)log(322,31minmax

Simulación

Estadística Descriptiva Desviación estandar 12,05147 Mínimo 10

Media 36,53264 Varianza de la muestra 145,238 Máximo 69,9

Error Típico 0,163652 curtosis -0,39836 Suma 198116,5

Mediana 36 coeficiente de asimetría 0,291128 Cuenta 5423

Moda 45,5 Rango 59,9

Histograma Grupal vacios<4

Velocidad [Km/h]

Frcuencia

normal

Simulación

Histograma Sturges vacios<4

10,00 14,47 18,9423,41 27,88 32,35 36,83 41,3045,77 50,24 54,71 59,18 63,65

Velocidad [Km/h]

Frecuencia

normal

Histograma raiz de (n) vacios <4

Velocidad [Km/h]

Frecuencia

normal

Simulación

Distribución de Poisson Es una distribución de probabilidad discreta con un parámetro λ < 0 cuya función de

masa para sucesos es

Aquí e significa el número e y x! significa el factorial de x. Se prefiere su uso por sobre una distribución binominal cuando los valores de p < 0.10 y (p * n) < 10 ", donde p es la probabilidad de acierto y n es el numero de eventos. La distribución de Poisson describe el número de sucesos en una unidad de tiempo de un proceso de Poisson. Muchos fenómenos se modelan como un proceso de Poisson, por ejemplo las llamadas telefónicas en una empresa o los accidentes en una carrera. El valor esperado y la varianza de una variable aleatoria X de distribución Poisson son E[X] = V[X] = λ

Simulación

Distribución de Poisson

Ejemplo Un número promedio de camiones tanque que llega cada día a cierta ciudad portuaria es 10. Las instalaciones en el puerto pueden manejar a lo más 15 camiones tanque por día. ¿ Cuál es la probabilidad de que en un día dado los camiones se tengan que regresar? Solución Sea X el número de camiones tanque que llegan cada día.Entonces con el uso de la tabla de poisson tenemos

P(x>15)= 1- P(X15)=1-

)10;(x

xp = 1-0,9513= 0,0487

15)15(

1015 exP

Simulación

Distribución BinomialEn estadística la distribución binomial es una distribución probabilidad discreta describiendo el numero de éxitos de n experimentos independientes con probabilidad p de un éxito. Su función de densidad es

Eso es por que en n experimentos (o eventos) hay n sobre x (el coeficiente binomial) posibilidades para un numero de x éxitos (o aciertos) (probabilidad pk) y n − x no-éxitos ((1 − p)n − x). El valor esperado de una variable aleatoria de probabilidad binominal es E[x] = np y su varianza V[x] = np(1 − p).

Simulación

Distribución BinomialLa probabilidad de que cierta clase de componente sobreviva a una prueba de choque dada es 3/4 . Encuentre la probabilidad de que sobrevivan exactamente dos de los siguientes cuatro componentes que se prueben.

Solución

Suponga que las pruebas son independientes y como p=3/4 para cada una de las 4 pruebas tenemos

128/274

¡2¡2

¡4)4/1(4/3

xB(2;4,3/4)= =0,2109

Simulación

Distribución Normal Esta distribución es frecuentemente utilizada en las aplicaciones

estadísticas. Su propio nombre indica su extendida utilización, justificada

por la frecuencia o normalidad con la que ciertos fenómenos tienden a

parecerse en su comportamiento a esta distribución.

Muchas variables aleatorias continuas presentan una función de densidad

cuya gráfica tiene forma de campana.

En resumen, la importancia de la distribución normal se debe

principalmente a que hay muchas variables asociadas a fenómenos

naturales que siguen el modelo de la normal32

Curso : Modelación y Simulación

Distribución Normal

Representación gráfica de esta función de densidad

• Sin lugar a dudas, la distribución más utilizada para modelar experimentos aleatorios es la distribución normal

Simulación

F(x) es el área sombreada de esta gráfica

Simulación

TIPIFICACIÓN

Por tanto su función de densidad es

y su función de distribución es

Simulación

Distribución Normalsiendo la representación gráfica de esta función

a la variable Z se la denomina variable tipificada de X, y a la curva de su función de densidad curva normal tipificada.

Simulación

Manejo de tablas, casos más frecuentes

La distribución de la variable z se encuentra tabulada

Simulación

EJERCICIO Tipificamos: La probabilidad de obtener puntuación entre 70 y 90

es:P(70≤X≤90)=p(-1,67≤X≤1,67)z1=(70-80)/6=-1,66666667z2=(90-80)/6=1,666666670,0478 0,9522+0,9522-0,0478=0,9044

y el número esperado de individuos que la obtienen es:

n=0,9044*200=180,883859n= 181 La probabilidad de que una persona tenga

puntuación superior a 90 es:

P(X>90)=P(Z>1,67)=1- 0,9522 =0,0478 Y para dos personas: p= 0,0478*0,0478 =0,00228484

Los resultados de una prueba objetiva de selección pasada a 200 personas indicaron que la distribución de puntuaciones era normal, con media de 80 puntos y desviación típica de 6 puntos. Calcular cuántos examinados han obtenido una puntuación entre 70 y 90 puntos. Si se eligen al azar dos de esas 200 personas, calcular la probabilidad de que ambas personas tengan puntuación superior a 90.

Simulación

EJERCICIO

Los resultados de una prueba objetiva de selección pasada a 200 personas indicaron que la distribución de puntuaciones era normal, con media 60 puntos y desviación típica de 6 puntos. Cada prueba se puntuó con 0 ó 1 puntos. Calcular cuántos examinados han obtenido una puntuación entre 30 y 40 puntos, y cuál es la mínima puntuación por debajo de la cual están el 75 % de los examinados.

Tipifiquemos la variable con los valores extremos dados:

z1=(30-60)/6 -5

z1=(40-60)/6 -3,33333333

0,0000 0,0004

con lo cual no hay ningún examinado con una puntuación entre 30 y 40

Por otro lado , la mínima puntuación por debajo de la cual está el 75 % de los examinados

z normal0,67 0,74860,68 0,7517

se realiza una interpolación

0,01 0,0031

valor buscado 0,0014Luego

x=(0,0014*0,01)/0,0031 0,00451613

Zx=0,67+0,0045 0,6745

x1=6*zx+60 6*0,6745+60 64

La mínima puntuación por debajo de la cual está el 75 % de los examinados es 64

La probabilidad de obtener puntuación entre 30 y 40 es:

Simulación

Media Aritmética

Mediana La mediana de un conjunto de observaciones se

ordenan de manera creciente, la mitad de éstas es menor que este valor y la otra mitad mayor

Moda La moda de un conjunto de observaciones es el

valor de la observación que ocurre con mayor frecuencia en un conjunto

Simulación

Distribución Normal Desviación Estándar

Coeficiente de Simetría

Esta función caracteriza el grado de asimetría de una distribución con respecto a su media. La asimetría positiva indica una distribución unilateral que se extiende hacia valores más positivos. La asimetría negativa indica una distribución unilateral que se extiende hacia los valores más negativos

ixix x

nmqueen

Simulación

Curtosis

La curtosis representala elevación o achatamiento de una distribución , Una curtosis positiva indica una distribución relativamente elevada, mientras que una curtosis negativa indica una distribución relativamente plana.

nmqueen

Simulación

Distribución Ji Cuadrado (2 )

•Es una distribución asimétrica.

• Solo toma valores positivos y es asintótica con respecto al eje de las x positivas (0 < 2 < +).

• Está caracterizada por un único parámetro llamado: grados de libertad (g.l.)

• El área comprendida entre la curva y el eje de las x es 1 o 100%.

Simulación

Gráfico de la distribución Ji Cuadrado

Región de aceptación

Región de rechazo

Simulación

Distribución Ji Cuadrado

( )i i

Simulación

Ejercicio Chi - Cuadrado

Simulación

Ejercicio Chi-cuadradoai bi Fi

Marca Clase Fi*MC (xi-x) ^2 fi*(xi-x)^2

1,18 1,22 1 1,2 1,2 0,07002639 0,07002639

1,22 1,27 2 1,245 2,49 0,04823514 0,09647028

1,27 1,32 2 1,295 2,59 0,02877264 0,05754528

1,32 1,37 4 1,345 5,38 0,01431014 0,05724056

1,37 1,42 6 1,395 8,37 0,00484764 0,02908584

1,42 1,47 8 1,445 11,56 0,00038514 0,00308113

1,47 1,52 5 1,495 7,475 0,00092264 0,0046132

1,52 1,57 4 1,545 6,18 0,00646014 0,02584056

1,57 1,62 2 1,595 3,19 0,01699764 0,03399528

1,62 1,67 3 1,645 4,935 0,03253514 0,09760542

1,67 1,72 1 1,695 1,695 0,05307264 0,05307264

1,72 1,8 2 1,76 3,52 0,08724639 0,17449278

40 suma 58,585 suma 0,70306938

media 1,464625 varianza 0,01802742

desviación 0,1342662350

Ejercicio Chi-cuadrado

ajuste bueno, es una distribución normal

3,32chiv9 ,5=

16,93chi v9,95=

v=k-1-m=12-1-2=9

chi calculado =9,43

0,1347s

9,429921004097,6309961,4646x

1,50187,50925,00022,259799,360997,10122,4901,8961,801,72

0,37490,93722,50013,468197,101293,63311,8961,5251,721,67

0,27322,04897,50036,068693,633187,56451,5251,1531,671,62

3,640818,20405,00029,266687,564578,29791,1530,7821,621,57

0,55135,512710,000412,347978,297965,95000,7820,4111,571,52

0,27633,454012,500514,358565,950051,59150,4110,0401,521,47

1,474129,481720,000814,570351,591537,02120,040-0,3311,471,42

0,29334,399815,000612,902437,021224,1188-0,331-0,7021,421,37

0,00010,000910,00049,970524,118814,1483-0,702-1,0741,371,32

0,59422,97095,00026,723614,14837,4246-1,074-1,4451,321,27

0,21771,08865,00023,95677,42463,4680-1,445-1,8161,271,22

0,23220,58062,50011,73803,46801,7299-1,816-2,1131,221,18

ej f*100/40ojN(yc2)*100N(yc1)*100(bi-x)/s(ai-x)/sbiai

(oj-ej)^2/ej

(oj-ej)^2fre en %

frecuenciaarea2-area1area2area1

ajuste bueno, es una distribución normal

3,32chiv9 ,5=

16,93chi v9,95=

v=k-1-m=12-1-2=9

chi calculado =9,43

0,1347s

9,429921004097,6309961,4646x

1,50187,50925,00022,259799,360997,10122,4901,8961,801,72

0,37490,93722,50013,468197,101293,63311,8961,5251,721,67

0,27322,04897,50036,068693,633187,56451,5251,1531,671,62

3,640818,20405,00029,266687,564578,29791,1530,7821,621,57

0,55135,512710,000412,347978,297965,95000,7820,4111,571,52

0,27633,454012,500514,358565,950051,59150,4110,0401,521,47

1,474129,481720,000814,570351,591537,02120,040-0,3311,471,42

0,29334,399815,000612,902437,021224,1188-0,331-0,7021,421,37

0,00010,000910,00049,970524,118814,1483-0,702-1,0741,371,32

0,59422,97095,00026,723614,14837,4246-1,074-1,4451,321,27

0,21771,08865,00023,95677,42463,4680-1,445-1,8161,271,22

0,23220,58062,50011,73803,46801,7299-1,816-2,1131,221,18

ej f*100/40ojN(yc2)*100N(yc1)*100(bi-x)/s(ai-x)/sbiai

(oj-ej)^2/ej

(oj-ej)^2fre en %

frecuenciaarea2-area1area2area1

Límite Límite Frecuencia Frecuencia PorcentajeInferior Superior Acumulada

1,18 1,22 1 1 2,51,22 1,27 2 3 7,51,27 1,32 2 5 12,51,32 1,37 4 9 22,51,37 1,42 6 15 37,51,42 1,47 8 23 57,51,47 1,52 5 28 70,01,52 1,57 4 32 80,01,57 1,62 2 34 85,01,62 1,67 3 37 92,51,67 1,72 1 38 95,01,72 1,80 2 40 100,0

Simulación

90 53Curso : Modelación y

Simulación

ai bi Fi Marca Clase Fi*MC (x-X)**2 Fi*(x-X)**227,5 31,5 1 29,5 29,5 331,677 331,67731,5 35,5 14 33,5 469 201,981 2827,73335,5 39,5 56 37,5 2100 104,285 5839,95739,5 43,5 172 41,5 7138 38,589 6637,29843,5 47,5 245 45,5 11147,5 4,893 1198,77147,5 51,5 263 49,5 13018,5 3,197 840,79651,5 55,5 156 53,5 8346 33,501 5226,14755,5 59,5 67 57,5 3852,5 95,805 6418,93159,5 63,5 23 61,5 1414,5 190,109 4372,50663,5 67,5 3 65,5 196,5 316,413 949,239

1000 suma 47712 suma 34643,056media 47,71 varianza 34,678

desviacion 5,889

Simulación

Ejercicio Chi-cuadrado area1 area2

area2-area1 frecuencia fre en % (oj-ej)^2

(oj-ej)^2/ej

ai bi (ai-x)/s (bi-x)/s N(yc1)*100 N(yc2)*100 oj ej f*100/1000

27,5 31,5 -3,434 -2,754 0,0297 0,2940 0,2642 1 0,1 0,0270 0,270

31,5 35,5 -2,754 -2,075 0,2940 1,9001 1,6062 14 1,4 0,0425 0,030

35,5 39,5 -2,075 -1,395 1,9001 8,1474 6,2473 56 5,6 0,4190 0,075

39,5 43,5 -1,395 -0,716 8,1474 23,7113 15,5638 172 17,2 2,6770 0,156

43,5 47,5 -0,716 -0,036 23,7113 48,5634 24,8521 245 24,5 0,1240 0,005

47,5 51,5 -0,036 0,644 48,5634 74,0077 25,4443 263 26,3 0,7322 0,028

51,5 55,5 0,644 1,323 74,0077 90,7113 16,7036 156 15,6 1,2179 0,078

55,5 59,5 1,323 2,003 90,7113 97,7400 7,0287 67 6,7 0,1080 0,016

59,5 63,5 2,003 2,682 97,7400 99,6345 1,8945 23 2,3 0,1644 0,071

63,5 67,5 2,682 3,362 99,6345 99,9613 0,3268 3 0,3 0,0007 0,002

x 47,712 1000 0,732

s 5,886

chi calculado =0,7315 chi v7,95= 14,1

v=k-1-m=10-1-2=7 chiv7 ,5= 2,17

ajuste muy bueno 56

Curso : Modelación y Simulación

Límite Frecuencia Frecuencia Porcentaje

Superior Acumulada

31,5 1 1 0,1

35,5 14 15 1,5

39,5 56 71 7,1

43,5 172 243 24,3

47,5 245 488 48,8

51,5 263 751 75,1

55,5 156 907 90,7

59,5 67 974 97,4

63,5 23 997 99,7

67,5 3 1000 100,0

Simulación

Curva tonelaje vs leyFormulasCalculo de área: Ocupando la normal reducida

Ley media

Curso : Modelación y Simulación 58

)()%( YcXc

Curva tonelaje vs leyEjemploµ=47,712 =5,886 Xc=40

Ley media

31,1886,5

712,4740

%49,909049,00951,01)()%( YcXc

385,539049,0

*14,3*2

886,5712,47

)31,1(

Curva tonelaje vs ley

Tonelaje Total =100.000 toneladas 100.000

% XC (ai-x)/s Normal %(+Xc) Tonelaje n exp Ley

25 -3,859 0,000 1,000 99994,3 -7,445 0,001 47,7130 -3,009 0,001 0,999 99869,1 -4,528 0,011 47,7435 -2,160 0,015 0,985 98460,5 -2,332 0,097 47,9440 -1,310 0,095 0,905 90494,8 -0,858 0,424 48,8145 -0,461 0,322 0,678 67751,8 -0,106 0,899 50,8350 0,389 0,651 0,349 34873,7 -0,076 0,927 53,9655 1,238 0,892 0,108 10781,5 -0,767 0,465 57,8360 2,088 0,982 0,018 1841,1 -2,179 0,113 62,14

x 47,712s 5,8858

R2pi 2,50659769

9049,0

*14,3*2

886,5712,4740

)31,1( 2

Curva tonelaje vs ley

Coeficiente de correlación El coeficiente de correlación se define por :

La correlación es nula si rxy=0

Simulación

Línea de Regresión La linea de regresión se define por:

Simulación

Producción Coston x y X-x Y-y (X-x)^2 (Y-y)^2 (X-x)(Y-y)1 1,5 2,5 -1,45 -1,01 2,103 1,020 1,46452 2,0 3,1 -0,95 -0,41 0,903 0,168 0,38953 3,0 3,8 0,05 0,29 0,002 0,084 0,01454 1,5 2,1 -1,45 -1,41 2,103 1,988 2,04455 3,5 4,3 0,55 0,79 0,303 0,624 0,43456 3,0 3,2 0,05 -0,31 0,002 0,096 -0,01557 4,5 4,8 1,55 1,29 2,403 1,664 1,99958 4,0 3,9 1,05 0,39 1,103 0,152 0,40959 4,0 4,4 1,05 0,89 1,103 0,792 0,934510 2,5 3,0 -0,45 -0,51 0,203 0,260 0,2295

Suma 29,5 35,1 10,225 6,849 7,905Media 2,95 3,51Varianza 1,136 0,761Desviación Sta 1,066 0,872Covarianza 0,878Coeficiente correlación 0,945 0,77310513

2,280660151,22933985

Y=1,229+0,77*X

0,0 1,0 2,0 3,0 4,0 5,0 6,0

Lineal (Recta)

Regresión Lineal Múltiple

Supongamos que la variable Y depende de las variables X1,X2,X3, por analogía con el modelo lineal simple se puede formular el modelo siguiente

321320 1 XXXY iiii

En que X1,X2;x3 son los valores de las variable independientes en el experimento i, siendo Yi, la respuesta correspondiente. Debido a la presencia de más de dos variables , este modelo se llama regresión lineal múltiple. Para estimar los parámetros 0 , 1, 2, 3 se utiliza el método de los mínimos cuadrados, minimizando la cantidad:

)321( 2

13210 XXXYD iii

Simulación

al derivar parcialmente D con respecto a parámetros 0, 1, 2, 3, se llega al sistema de ecuaciones siguientes, llamado sistema normal

YXXXXXXX

332322311303

233222211202

133122112

3322110

Coeficiente de determinación r2 que corresponde al índice de ajuste lineal, siendo r el coeficiente de correlación múltiple

Simulación

Ejemplo Montgomery y Peck (1992) describen el uso de un modelo de regresión para relacionar la cantidad de tiempo que requiere un vendedor para dar servicio a una máquina expendedora de refrescos, con el número de envases contenidos en la máquina y la distancia del vehículo de servicio al sitio donde se encuentra la máquina . Este modelo fue utilizado para diseñar la ruta , los horarios y la salida de vehículos, La tabla presenta 25 observaciones del tiempo de suministro tomadas del mismo estudio descrito por Montgomery y Peck.

Simulación

Regresión Lineal MúltipleY x1 x2 x1*x1 x1*x2 x1*y x2*x2 x2*y

1 9,95 2,00 50,00 4,00 100,00 19,90 2500 497,52 24,45 8,00 110,00 64,00 880,00 195,60 12100 2689,53 31,75 11,00 120,00 121,00 1320,00 349,25 14400 38104 35,00 10,00 550,00 100,00 5500,00 350,00 302500 192505 25,02 8,00 295,00 64,00 2360,00 200,16 87025 7380,96 16,86 4,00 200,00 16,00 800,00 67,44 40000 33727 14,38 2,00 375,00 4,00 750,00 28,76 140625 5392,58 9,60 2,00 52,00 4,00 104,00 19,20 2704 499,29 24,35 9,00 100,00 81,00 900,00 219,15 10000 2435

10 27,50 8,00 300,00 64,00 2400,00 220,00 90000 825011 17,08 4,00 412,00 16,00 1648,00 68,32 169744 7036,9612 37,00 11,00 400,00 121,00 4400,00 407,00 160000 1480013 41,95 12,00 500,00 144,00 6000,00 503,40 250000 2097514 11,66 2,00 360,00 4,00 720,00 23,32 129600 4197,615 21,65 4,00 205,00 16,00 820,00 86,60 42025 4438,2516 17,89 4,00 400,00 16,00 1600,00 71,56 160000 715617 69,00 20,00 600,00 400,00 12000,00 1380,00 360000 4140018 10,30 1,00 585,00 1,00 585,00 10,30 342225 6025,519 34,93 10,00 540,00 100,00 5400,00 349,30 291600 18862,220 46,59 15,00 250,00 225,00 3750,00 698,85 62500 11647,521 44,88 15,00 290,00 225,00 4350,00 673,20 84100 13015,222 54,12 16,00 510,00 256,00 8160,00 865,92 260100 27601,223 56,23 17,00 590,00 289,00 10030,00 955,91 348100 33175,724 22,13 6,00 100,00 36,00 600,00 132,78 10000 221325 21,15 5,00 400,00 25,00 2000,00 105,75 160000 8460

Ysuma 725,42 206 8294 2396 77177 8001,67 3531848 274580,71

Ecuaciones 1 B0*n+B1*X1+B2*X2=Y2 B0*X1+B1*X1*X1+B2*X1*X2=X1*Y3 B0*X2+B1*X1*X2+B2*X2*X2=X2*Y

Y=B0+B1*x1+B2*X2

Regresión Lineal MúltipleEcuaciones 1 25*B0 +206*B1 +8294*B2 =725,42 *206

2 206*B0 +2396*B1 +77177*B2 =8001,67 *253 8294*B0 +77177*B1 +3531848*B2 =274580,71

5150 42436 1708564 149436,525150 59900 1929425 200041,75

0 17464 220861 50605,23 12,64664453

B1 = 2,89768839 -12,646644*B2

6942,861377 -30301,36028 223634,8967 -976030,0846

206 46875,64 1058,81 *82948294 2555817,92 50945,82 *206

1708564 388786558 8781770,141708564 526498492 10494838,92

0 137711933 1713068,78

B2 = 0,012439509 57,73041402 B1= 2,740370335 475,6986021 2,309216515 B0= 2,309216561

Y=2,3092+2,7403*X1+0,0124*X2

Simulación

Regresión Lineal MúltipleY= 2,31 + 2,740 X1 0,0124 X2

Y Ys ei Y-YM Ys-YsM (Y-YM)^2 (Ys-YsM)^2 (Y-YM)*(Ys-YsM)1 9,95 8,4098 1,54 -19,07 -20,59 363,543 424,084 392,6482 24,45 25,5956 -1,15 -4,57 -3,41 20,856 11,611 15,5613 31,75 33,9405 -2,19 2,73 4,94 7,470 24,378 13,4954 35,00 36,5322 -1,53 5,98 7,53 35,799 56,687 45,0485 25,02 27,8896 -2,87 -4,00 -1,11 15,974 1,240 4,4506 16,86 15,7504 1,11 -12,16 -13,25 147,788 175,634 161,1107 14,38 12,4398 1,94 -14,64 -16,56 214,236 274,343 242,4348 9,60 8,4346 1,17 -19,42 -20,57 377,012 423,063 399,3749 24,35 28,2119 -3,86 -4,67 -0,79 21,779 0,626 3,692

10 27,50 27,9516 -0,45 -1,52 -1,05 2,301 1,106 1,59511 17,08 18,3792 -1,30 -11,94 -10,62 142,487 112,867 126,81512 37,00 37,4125 -0,41 7,98 8,41 63,731 70,718 67,13413 41,95 41,3928 0,56 12,93 12,39 167,268 153,505 160,23914 11,66 12,2538 -0,59 -17,36 -16,75 301,259 280,539 290,71415 21,65 15,8124 5,84 -7,37 -13,19 54,270 173,994 97,17316 17,89 18,2304 -0,34 -11,13 -10,77 123,806 116,051 119,86617 69,00 64,5552 4,44 39,98 35,55 1598,656 1263,952 1421,48718 10,30 12,3035 -2,00 -18,72 -16,70 350,319 278,877 312,56319 34,93 36,4082 -1,48 5,91 7,41 34,966 54,836 43,78820 46,59 46,5137 0,08 17,57 17,51 308,817 306,621 307,71721 44,88 47,0097 -2,13 15,86 18,01 251,641 324,238 285,64222 54,12 52,478 1,64 25,10 23,47 630,171 551,071 589,29523 56,23 56,2103 0,02 27,21 27,21 740,558 740,232 740,39524 22,13 19,991 2,14 -6,89 -9,01 47,428 81,218 62,06525 21,15 20,9707 0,18 -7,87 -8,03 61,887 64,519 63,189

SUMA 725,42 725,08 6084,021 5966,009 5967,491MEDIA 29,0168 29,00 253,501 248,584 248,645

15,922 15,767

Coeficiente de correlación múltiple r 0,99049999Coeficiente de determinación r^2 0,98109023

Simulación

Regresión Lineal Múltiple Matricial

Sean K: Número de variables de Regresión n: número de observaciones en la

forma ((Xi1;Xi2;Xi3;…..;Xik);Yi) con i=1,2,3,…n)

Y el modelo de regresión

Yi= Bo+i

jijj X

Simulación

Este Modelo es un sistema de n ecuaciones que puede expresarse en forma matricial como

nknknn

......1

Simulación

Se desea encontrar el vector de estimadores de minimos cuadrados que es:

L=´= (y-Xβ)´(y-Xβ)

Al derivar en forma parcial nos queda X´Xβ=X´y

El estimador de mínimos cuadrados es:

YXXX tT 1ˆ

Simulación

Regresión Lineal Múltiple Matricial En el ejemplo : x1 x2

9,95 1 2 5024,45 1 8 11031,75 1 11 12035,00 1 10 55025,02 1 8 29516,86 1 4 20014,38 1 2 375

y 9,60 X 1 2 5224,35 1 9 10027,50 1 8 30017,08 1 4 41237,00 1 11 40041,95 1 12 50011,66 1 2 36021,65 1 4 20517,89 1 4 40069,00 1 20 60010,30 1 1 58534,93 1 10 54046,59 1 15 25044,88 1 15 29054,12 1 16 51056,23 1 17 59022,13 1 6 10021,15 1 5 400

Simulación

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 502 8 11 10 8 4 2 2 9 8 4 11 12 2 4 4 20 1 10 15 15 16 17 6 5 1 8 110

50 110 120 550 295 200 375 52 100 300 412 400 500 360 205 400 600 585 540 250 290 510 590 100 400 1 11 1201 10 550

25 206 8294 1 8 295206 2396 77177 1 4 200

8294 77177 3531848 1 2 3751 2 52

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 9 1002 8 11 10 8 4 2 2 9 8 4 11 12 2 4 4 20 1 10 15 15 16 17 6 5 1 8 300

50 110 120 550 295 200 375 52 100 300 412 400 500 360 205 400 600 585 540 250 290 510 590 100 400 1 4 4121 11 400

725,42 9,95 1 12 5008001,67 24,45 1 2 360

274580,71 31,75 1 4 20535,00 1 4 400

25 206 8294 -1 725,42 25,02 1 20 600206 2396 77177 8001,67 16,86 1 1 585

8294 77177 3531848 274581 14,38 1 10 5409,60 1 15 250

0,2146526 -0,0074909 -0,0003404 725,42 24,35 1 15 290-0,0074909 0,0016708 -0,0000189 8001,67 27,50 1 16 510-0,0003404 -0,0000189 0,0000015 274581 17,08 1 17 590

37,00 1 6 10041,95 1 5 400

2,309200429 11,662,740369424 21,650,012439581 17,89

69,00Y=2,3092+2,74037*X1+0,01244*X2 10,30

34,9346,5944,8854,1256,2322,1321,15

Simulación

Estimación Puntual Propiedades de los estimadores

Insesgadez : Es mínimo cuando . Y de este modo,el Error Cuadrático Medio es la varianza del estimador.

Eficiencia: Dado un tamaño de muestra fijo, se busca, entre los estimadores, el que menor varianza tenga.

2ˆ)ˆ( EECM

Simulación

Estimación PuntualConsistencia: Nos dice que, cuando el tamaño de las muestra se incrementa, el estimador puntual debe estar próximo al parámetro con probabilidad alta.

Suficiencia: El estimador puntual debe resumir la información proporcionada por la muestra aleatoria Además no debe haber pérdida de ésta.

Invarianza: Si es el estimador de , esta propiedad nos dice que g() tiene como estimador a g( ).

Robustez: Se presenta cuando la distribución del estimador no se ve seriamente afectada por violaciones en los supuestos.

Simulación

Consistencia: Nos dice que, cuando el tamaño de las muestra se incrementa, el estimador puntual debe estar próximo al parámetro con probabilidad alta.

Suficiencia: El estimador puntual debe resumir la información proporcionada por la muestra aleatoria Además no debe haber pérdida de ésta.

Invarianza: Si es el estimador de , esta propiedad nos dice que g() tiene como estimador a g( ).

Robustez: Se presenta cuando la distribución del estimador no se ve seriamente afectada por violaciones en los supuestos.

Simulación

Ley de los Grandes Números

Como caso especial, cuando es , la media muestral, tenemos que E( ) = y converge a .

De la misma manera, s2 converge a

2 cuando n tiende a infinito.

Simulación

Teorema del Límite central Sea x1, x2, ..., xn una muestra aleatoria de observaciones tomadas de la misma distribución y sea E(Xi)= y Var(Xi)= 2.

Entonces la distribución muestral de la variable aleatoria

converge a la normal standard cuando n tiende a infinito.

Simulación

Teorema central del Límite

El TCL es una herramienta muy poderosa porque se cumple aún cuando la distribución desde la que se toman las observaciones no sea normal. Esto significa que si nosotros nos aseguramos que el tamaño de la muestra es grande, entonces podemos usar la variable Zn para responder preguntas acerca de la población de la cual provienen las observaciones.

Simulación

Estos dos conceptos anteriores sirven para prepararnos para dos objetivos básicos de cualquier estudio empírico: la estimación de parámetros desconocidos que nos interesan y la prueba de hipótesis

Simulación

Cálculo del tamaño de la muestra

El tamaño de la muestra para un diseño de encuestas basado en una muestra aleatoria simple, puede calcularse por la siguiente fórmula

Simulación

Donde: n es el tamaño de la muestra Z es el nivel de confianza del 95%, y es igual a 1,96 según la tabla de

distribución normal es decir: P(-1,96<z<1,96)=0,95

p es la variabilidad positiva, es decir la probabilidad con que se acepta la hipótesis que se quiere investigar, con un valor de 0,5.

q es la variabilidad negativa, es decir, la probabilidad con que se rechaza la hipótesis que se quiere investigar, con un valor de 0,5.

N es el tamaño de la población, de 684 individuos.

E es la precisión o el error, con un valor del 5 % de error.

individuosxxx

xxxxn 246

5,05,096,105,0684

6845,05,05,096,122

Simulación

otra Forma: El tamaño de la muestra para un diseño de encuestas basado en una muestra aleatoria simple, puede calcularse por la siguiente fórmula

n= tamaño de la muestra requeridoT= nivel de fiabilidad (95 % = 1,96)P=probabilidad de ocurrenciam=margen de error( 5%=0.05)

2 )1(*

Simulación

Ejemplo

Se ha determinado que en una población cerca del 30 %(0.3) de los niños están desnutridos.Este datos de basa en estadísticas nacionales . Determine con una 95 % de confianza el tamaño de la muestra requerido

n=322,72 323Se considera un efecto de diseño 2 luego el número de muestreas es : n*d=323X2=646Corrección por imprevistos aumenta en un 5 % como errores N=646x1,05=690 niños

)3.01(3.0*96,1 n

Simulación

clase 1 probabilidades distribuciones

Documents