Post on 26-Jan-2020
transcript
Fue descubierta y publicada por primera
vez en 1733
por Abraham de Moivre (1667-1754)
Karl F. Gauss (1777-1855)
Distribución normalo gaussiana o de Laplace- Gauss
Pierre Simon Laplace
(1745-1827)
Caracteres fisiológicos
ej: efecto de una misma dosis de un fármaco.
Caracteres morfológicos de individuos
(personas, animales, plantas,...)
de una especie (tallas, pesos, diámetros, perímetros,...).
Caracteres sociológicos
ej: consumo de cierto producto por un mismo grupo de
individuos, puntuaciones de examen
Errores cometidos al medir ciertas magnitudes.
Y en general cualquier característica que se obtenga
como suma de muchos factores.
Distribución binomial a la Normal:
con np ≥ 5 y n(1-p) ≥ 5.
Distribución de Poisson a la Normal: λ ≥ 10
Razones principales para su estudio
Numerosos
fenómenos
se
aproximan
con esta
distribución
Aproxima
distribuciones
de variables
discretas
Proporciona
la base de la
inferencia
estadística
por su
relación con
el TLC
Distribución Normal
Se dice que x que toma todos los valores reales, tiene una distribución normal, si su fdp está dada por:
21
21f(x) con - < x <
2
0
x
e
y
Notación
21
21f(x) con - < x <
2
0
x
e
y
Ejercicio: verificar que es una fdp legítima.
2
21 1
2 21 1
2 2
xt
e dx e dt
21
2
nosepuedeobtenerde forma finita Integral de Poisson
1 12 1
2 2
t
e dt
x~ N (µ, σ) <=> su fdp está dada por
Principales características de la
distribución Normal
• Es una curva uniforme con ordenadas siempre positivas,
definida para todo real x.
•Tiene forma de campana, es decir, es monótona creciente
hacia ambos lados del máximo, y es asintótica al eje de las
abscisas
•Es simétrica con respecto de la recta x= donde coinciden
la mediana (Me) y la moda (Mo ).
Para x tendiendo a , el límite f(x) =0.
•La función tiene un máximo en x = . Los puntos de inflexión
tienen como abscisas los valores . Verificar estas
propiedades.
Características numéricas
Demostrar que:
2( ) ( )E x y V x
La esperanza se puede interpretar como un factor de
traslación.
Interpretación geométrica
La desviación
estándar
es un
factor
de escala
0
0.4
0.8
1.2
-2.50 -1.50 -0.50 0.50 1.50 2.50x
0.25
0.5
1
f(x)
Teorema
)a;N(a~zbaxzy ),( N~Si 222 bx
1)N(0;~zzy ),( N~Si 2
xx
Demostrar el Teorema y el Corolario
Corolario
Si Z tiene una distribución normal con Esperanza cero y
varianza 1, se dice que Z tiene una distribución normal
estandarizada.
La forma estandarizada de cualquier distribución
normal se puede obtener aplicando el corolario de este
teorema
Ejemplos
N(100;16)~x
Verificar que:
a) P(90 < x < 105) = 0,8882
b) P(x<104) = 0,8413
c) P( x>95) = 0,8944
d) Si P(x<a) = 0,42 entonces a = 99,2
Cálculo de la probabilidad de desviación prefijada. Regla de las 3 sigmas.
2. 1
Si dos variables aleatorias
están normalmente
distribuidas con igual
esperanza, entonces la
probabilidad de tomar
un valor en el intervalo
es mayor para la
variable de menor
varianza.
,
xPxPx 2,N~
1
xP
9973,0132
Esto significa que es
prácticamente cierto el
suceso 3x 33 xPSi
Esencia de la regla de las tres sigmas
Si una variable aleatoria está distribuida normalmente, entonces
la desviación respecto de la esperanza matemática, en valor absoluto, es menor que el triple de la
dispersión.
En la práctica esto significa que si la distribución de una variable no se conoce, pero se cumple la
condición
3x
Se puede suponer que dicha variable está
distribuida normalmente.
Si S es la suma de un gran número de variables aleatorias x1
x2,…,xn independientes, entonces bajo ciertas
restricciones leves, referidas al aporte de los sumandos ,
la función de densidad de probabilidad de la variable
aleatoria S se distribuye normalmente.
El valor de este teorema es que no requiere
condiciones para las distribuciones de las variables
aleatorias individuales que se suman.
Teorema Central del Límite
1
2
1
~ 0,1
n
i
i
n
i
i
S
z N1
n
i
i
S x
2
1 1 1
2
1 1 1
( )
( )
i i i i
n n n
i i i
i i i
n n n
i i i
i i i
E x V x
E S E x E x
V S V x V x
Por ser las xi independientes
TCL
Es decir, si
Si las xi NO están
idénticamente distribuidas:
(No son I.I.D)
Si las xi están idénticamente
distribuidas (I.I.D):
1 1
( ) .
i
n n
i i
i i
E x
E S E x E x n
2
2
1 1
( ) .
i
n n
i i
i i
V x
V S V x V x n
Por ser las xi independientes
~ 0,1
.
S nz N
n
Con xi
I.I.D
Con xi
NO
I.I.D
Supóngase que un proceso de fabricación produce lavadoras de
las cuales, alrededor del 5% son defectuosas. Si se inspeccionan
100 lavadoras ¿Cuál es la probabilidad de que haya entre 2 y 6
lavadoras defectuosas?
0,4977
2 6 3 ( 4) ( 5)P x P x P x P x
3 97 4 96 5 95100 100 100
0,05 .0,95 0,05 .0,95 0,05 .0,953 4 5
Comparemos el resultado del cálculo directo con el
cálculo aproximado, es decir, aplicando el TCL:
Problema
0,4659
1 1
2 2Si a x b a x b
5,5 5 2,5 52,5 5,5
4,75 4,75
0,23 1,15 0,591 0,1251
P x
Aplicamos el TCL con la corrección por continuidad para variables discretas
1) Calculamos E(x)=np=100.0,05=5
2) V(x)= np(1-p)=100.0,05.0,95= 4,75
3) “Trabajamos con el igual”, es decir, si 2<x<6, 3 ≤x≤ 5
El resultado
exacto es 0,4977
Una fábrica de productos alimenticios produce carne enlatada,
con un peso medio de 250 grs y una varianza de 900 grs
cuadrados por lata. Si los pesos de las latas son
estadísticamente independientes. Las cajas contienen 60
latas. Se elige una al azar, hallar la probabilidad de que:
a) El peso de la caja sea a lo sumo 14,5 kg.
b) El peso de la caja sea al menos 15,3 kg.
Problema
: es el peso de cada lata S: es el peso de la cajaix
2( ) 250 . ( ) 30i iE x grs V x grs
60 60 60
1 1 1
( ) 60.250 15.000 15 .i i i
i i i
S x E S E x E x grs kg
60 60
2
1 1
( ) 60.900 54.000
( ) 60.900 60.30 232,38 0,23238
i i
i i
V S V x V x grs
S grs kg
Solución
14,5 15) 14,5 2,15 0,0158
0,23238a P S
15,3 15) 15,3 1 1 1,29
0,23238
1 0,9015 0,0985
b P S
a) El peso de la caja sea a lo sumo 14,5 kg.
b) El peso de la caja sea al menos 15,3 kg.
Calculamos las probabilidades
pedidas
• El n que se requiere para aplicar el teorema central del límite en gran parte depende de la forma de la distribución de las variables
aleatorias individuales que se suman
•Si los sumandos están normalmente distribuidos , al aplicar el
teorema central del límite, las probabilidades obtenidas son
exactas. No importa n.
•Si no se conoce la distribución de los sumandos, para n mayor o
igual que 25, se obtienen buenas aproximaciones.
•Si las variables aleatorias se distribuyen binomialmente, n >10
si
p 0,5
tambien si p 0 ó 1 n debe ser bastante mayor.
Consideraciones finales
2
2
1; 1-
11-
P x k k ók
P x kk
La probabilidad de que una variable aleatoria
X asuma un valor que está dentro de las k
dispersiones de su esperanza, es por lo menos2
11 0k
k
2
1la P x k
k
O también
por ser sucesos contrarios
Con esperanza y
varianza finitas
Desigualdad de Tchebyshev
2) El significado de esta desigualdad reside en su completa
universalidad, ya que puede ser aplicada a cualquier variable
aleatoria
3) Si conocemos la distribución de probabilidades de una variable
aleatoria discreta o continua, podemos calcular, si existen,
E(x) y V(x).
11
01
122
ky
k1)1 kSi
La recíproca no es cierta, pero podemos dar una cota superior o
inferior de dicha probabilidad
Consideraciones
Ley de los grandes números
Teorema de Bernoulli
Cuando el número de repeticiones de un experimento aleatorio
aumenta, la fA converge en sentido probabilístico a la probabilidad
teórica P(A)( ) para Af P A n
En una sucesión de pruebas de Bernoulli
dado un número positivo arbitrario,
1 0lim An
P f p
0 0lím An
P f p
En toda
sucesión de
pruebas de
Bernoulli, la
frecuencia
relativa
converge en
sentido
probabilístico
a p.
Dado un experimento y un suceso A asociado a dicho experimento,
consideramos n repeticiones independientes del experimento, x
es el número de veces que ocurre A en las n repeticiones, además P(A) = P
en cada repetición.
X es una variable aleatoria binomial
A
xf
n 1E x np y V x np p
1 1
.A
xE f E E x n p p
n n n
2 2
11 1. 1A
p pxV f V V x n p p
n n n n
Demostración
0
2
11AP f p k
k
Como
2
11
1
AP f pn
p p
2 2
1 1p p p pk k
n n
2
11A
p pP f p
n
2
1 11A
p pP f p k
n k
2
11 1A
n n
p pP f p
nlím lím
1An
P f plím
Aplicamos la desigualdad de
Tchebyshev
Dada una muestra aleatoria, es decir: una sucesión de v.a. x1, x2, x3, x4,…..xn
0
El límite, en probabilidad, de la media muestral para n
es igual a la media de la población de la que se extrajo la
muestra
1 0n n
P x ó P xlím lím
Teorema de Bernoulli generalizado
1 2 3, , ,..... nx x x x
Son variables aleatorias independientes,
con2( ) ( )i iE x y V x
1
ni
i
xx
n
Es una función de
1 2 3, , ,..... nx x x x
Por lo tanto, la media muestral es otra variable aleatoria
1 1
1 1. .
n ni
i
i i
xE x E E x n
n n n
2
2
2 21 1
1 1. .
n ni
i
i i
xV x V V x n
n n n n
1 2 3, , ,..... nx x x x
Demostración
Consideramos 22
2.
nk k
n
2
1. 1-P x k
kn
2
2
1. 1-P x k
nn
2
2. 1-P x k
nn
2
2< ó P x
n
Aplicamos la desigualdad de Tchebyshev