1
Tema 1. Probabilidad y modelos probabilısticos
En este tema:
• Probabilidad
• Variables aleatorias
• Modelos de variables aleatorias mas comunes
• Vectores aleatorios
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
2
Tema 1. Probabilidad y modelos probabilısticos
• Probabilidad:• Experimentos aleatorios, espacio muestral, sucesos.• Interpretaciones de la probabilidad.• Propiedades de la probabilidad.• Probabilidad condicionada.• Sucesos Independientes.• Teoremas fundamentales del calculo de probabilidades: regla de lamultiplicacion, th. de la probabilidad total y th. de Bayes.
• Variables aleatorias:• Concepto de variable aleatoria.• Variables aleatorias discretas: funcion de probabilidad, funcion dedistribucion, momentos.
• Variables aleatorias continuas: funcion de densidad, funcion dedistribucion, momentos.
• Algunas propiedades de la esperanza y la varianza.
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
3
Tema 1. Probabilidad y modelos probabilısticos
• Modelos de variables aleatorias mas comunes:• Distribucion Bernoulli• Distribucion Binomial• Distribucion de Poisson• Distribucion uniforme continua• Distribucion exponencial• Distribucion normal• Teorema Central del Lımite• Distribuciones asociadas a la normal (Tema 4. Introduccion a la Inferencia Estadıstica)
• Vectores aleatorios:• Concepto de vector aleatorio.• Vectores aleatorios discretos: distribucion conjunta, distribucionesmarginales, distribuciones condicionadas, independencia.
• Vectores aleatorios continuos: distribucion conjunta, distribucionesmarginales, distribuciones condicionadas, independencia.
• Covarianza, correlacion y esperanza condicionada.• Algunas propiedades de la esperanza y la varianza
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
4
Conceptos basicos
• Experimento aleatorio: proceso de observar un fenomeno del que seconocen de antemano todos sus posibles resultados, pero a partir de lascondiciones iniciales no puede predecirse exactamente cual de estosresultados se producira.
• Espacio muestral: es el conjunto de todos los posibles resultados de unexperimento aleatorio.Se denota por Ω = e1, e2, . . . , en, . . . y cada uno de sus elementos sedenomina suceso elemental o punto muestral.
• Un espacio muestral (correspondiente a un determinado experimentoaleatorio) tiene asociada una coleccion F no vacıa de subconjuntos de Ω.Los elementos de F se denominan sucesos y se denotan por las letrasA,B ,C , . . ..
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
5
Conceptos basicos: ejemplos• Experimento aleatorio: lanzamiento de un dado
• Espacio muestral finito: Ω = 1, 2, 3, 4, 5, 6• Sucesos elementales (o puntos muestrales): 1, 2,3,4, 5 y 6• Sucesos aleatorios: A =“obtener una puntuacion par”= 2, 4, 6,B =“obtener una puntuacion superior a 3”= 4, 5, 6.
• Exp. aleatorio: numero de accesos a la pagina web de la universidad elproximo lunes
• Espacio muestral infinito numerable: Ω = 0, 1, 2, . . . , n, . . . = N ∪ 0• Sucesos elementales: 0, 1, 2, 3, . . .• Sucesos aleatorios: A =“se reciben al menos 100 accesos”= 100, 101, . . .y B =“se reciben menos de 500 accesos”= 0, 1, . . . , 499.
• Exp. aleatorio: precio de una cierta accion al cierre de sesion del proximolunes
• Espacio muestral infinito no numerable: Ω = (0,+∞), o siendo realistas,Ω = (0,M)
• Sucesos elementales: x ∈ (0,M)• Sucesos aleatorios: A =“el precio de cierre es superior a 5 euros”= (5,M)y B =“precio de cierre entre 3 y 8 euros”= (3, 8).
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
6
Sucesos: conceptos basicosSucesos triviales• Suceso seguro: siempre se verifica despues del experimento aleatorio. Elpropio espacio muestral Ω
• Suceso imposible: nunca se verifica como resultado del experimentoaleatorio. El conjunto vacıo ∅ ⊆ Ω
Suceso complementario o contrario a un suceso A: suceso que se verificacuando no se verifica A. Es el conjunto de todos los sucesos elementales de Ωque no estan en A. Se suele denotar por Ac o A
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
7
Operaciones basicas con sucesos aleatorios
Interseccion de sucesos: Si A y B son dos sucesos del espacio muestral Ω,entonces el suceso interseccion, A ∩ B , es el conjunto de todos los elementosde Ω que estan en A y en B a la vez.
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
8
Operaciones basicas con sucesos aleatorios
A y B son sucesos incompatibles si no tienen ningun suceso elemental encomun, i.e., el suceso interseccion es el suceso imposible, A ∩ B = ∅
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
9
Operaciones basicas con sucesos aleatorios
Union de sucesos: Si A y B son dos sucesos de un espacio muestral Ω,entonces el suceso union, A ∪ B , es el conjunto de todos los sucesoselementales de Ω que pertenecen a cualquiera de los dos, A o B .
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
10
Operaciones basicas con sucesos aleatorios
Diferencia de sucesos: Si A y B son dos sucesos de un espacio muestral Ω,entonces el suceso diferencia, A \ B , es el conjunto de todos los sucesoselementales de Ω que pertenecen a A pero no a B .
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
11
Operaciones basicas con sucesos aleatorios
Leyes de Morgan
Relacion entre la union, interseccion y suceso complementario
A ∪ B = A ∩ B
A ∩ B = A ∪ B
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
12
Ejemplo: lanzamiento de un dado
Consideremos el experimento aleatorio “resultado observado al lanzar undado”:
• suceso elemental: el 1, el 2, el 3, el 4, el 5, el 6
• espacio muestral: Ω = 1, 2, 3, 4, 5, 6• suceso: A = 2, 4, 6 B = 4, 5, 6
El suceso A es “sale un numero par”.El suceso B es “sale un numero mayor que tres”.
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
13
Ejemplo: lanzamiento de un dado
Ω = 1, 2, 3, 4, 5, 6 A = 2, 4, 6 B = 4, 5, 6
• Complementario:A = 1, 3, 5 B = 1, 2, 3
• Interseccion:A ∩ B = 4, 6 A ∩ B = 1, 3
• Union:A ∪ B = 2, 4, 5, 6 A ∪ B = 1, 2, 3, 5
A ∪ A = 1, 2, 3, 4, 5, 6 = Ω
• Sucesos incompatibles:A ∩ A = ∅
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
14
Probabilidad. Intuicion
La probabilidad es una medida subjetiva sobre la incertidumbre de que sucedacierto suceso.
Al tirar un dado:• la probabilidad de que salga un 1 es mas pequena que la probabilidad deque salga un numero mayor que uno
• la probabilidad de que salga un 4 es igual que la probabilidad de que salgaun 6.
• la probabilidad de que salga un 7 es mınima, igual a la probabilidad delsuceso imposible
• la probabilidad de que salga un numero positivo es maxima, igual a laprobabilidad del suceso seguro
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
15
Tres enfoques/interpretaciones
Probabilidad clasica (regla de Laplace): Considera un experimento para elque todos los sucesos elementales son equiprobables. Si A es un sucesoformado por n(A) puntos muestrales, entonces se define la probabilidad de A
como
P(A) =numero de casos favorables a A
numero de casos posibles=
n(A)
n(Ω).
Enfoque frecuentista: Si repetieramos el experimento muchas veces, lafrecuencia con que ocurre el suceso serıa una aproximacion de la probabilidad.
Probabilidad – el valor lımite de la frecuencia
Probabilidad subjetiva: Depende de la informacion que tengamos en esemomento.
Probabilidad – creencia o certeza de que ocurra
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
16
Propiedades de la probabilidad
Definicion Sea F la coleccion no vacıa de todos los sucesos de Ω. Laprobabilidad es una aplicacion P : F → [0, 1], que asigna a cada suceso A ∈ Fun valor numerico P(A), verificando:
• P(A) ≥ 0, para todo suceso A ∈ F• P(Ω) = 1
• Probabilidad de la union de sucesos disjuntos: si A y B son incompatibles,entonces P(A ∪ B) = P(A) + P(B).
Propiedades
• Probabilidad del complementario: P(A) = 1− P(A).
• P(∅) = 0.
• Si A ⊆ B ⇒ P(A) ≤ P(B)
• Si A = e1, . . . , en finito (o infinito numerable) ⇒ P(A) =∑n
i=1 P(ei )
• Probabilidad de la union: P(A ∪ B) = P(A) + P(B)− P(A ∩ B).
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
17
Ejemplo: lanzamiento de un dado
• Probabilidad de un suceso elemental: P(ei ) =16
• Probabilidad de que salga par: A = 2, 4, 6, luego
P(A) = P(”2”) + P(”4”) + P(”6”) =1
6+
1
6+
1
6=
1
2=
n(A)
n(Ω)
• Probabilidad de que salga mayor que 3: B = 4, 5, 6, luego
P(B) = P(”4”) + P(”5”) + P(”6”) =1
6+
1
6+
1
6=
1
2=
n(B)
n(Ω)
• Probabilidad de que salga impar
P(A) = 1− P(A) = 1− 1
2=
1
2
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
18
Ejemplo: lanzamiento de un dado
• Probabilidad de que salga par o mayor que tres
P(A ∪ B) = P(A) + P(B)− P(A ∩ B)
Como A ∩ B = 4, 6, entonces P(A ∩ B) = 26 = 1
3 = n(A∩B)n(Ω)
P(A ∪ B) =1
2+
1
2− 1
3=
4
6=
2
3=
n(A ∪ B)
n(Ω)
• Probabilidad de que salga par o igual a uno.Los sucesos A = 2, 4, 6 y C = 1 son incompatibles (A ∩ C = ∅) portanto
P(A ∪ C ) = P(A) + P(C ) =1
2+
1
6=
4
6=
2
3=
n(A ∪ C )
n(Ω)
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
19
Probabilidad condicionada: ejemploSe clasifica un grupo de 100 ejecutivos de acuerdo a su peso y a si sufren o node hipertension. La tabla muestra el numero de ejecutivos en cada categorıa.
Insuficiente Normal Sobrepeso Total
Hipertenso 2 8 10 20Normal 20 45 15 80
Total 22 53 25 100
• Experimento aleatorio: seleccionar al azar a uno de esos 100 ejecutivospara medir su tension y su peso.
• Espacio muestral: Ω = (H, I ), (H,N), (H, S), (N, I ), (N,N), (N, S)• Si se elige un ejecutivo al azar, ¿cual es la probabilidad de que tengahipertension?
P(H) =20
100= 0, 2 6= n(H)
n(Ω)
• Si se elige a una persona al azar, y se descubre que tiene sobrepeso, ¿cuales la probabilidad de que tenga hipertension? ¿Es la misma que antes?
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
20
Probabilidad condicionada: ejemplo
Probabilidad de que sea hipertenso, sabiendo que tiene sobrepeso:
P(H|S)
Para calcularla, nos fijamos solo en los ejecutivos con sobrepeso:
P(H|S) = 10
25= 0, 4 > 0, 2 = P(H)
La probabilidad de un suceso depende de la mayor o menor informacion quetengamos
La probabilidad condicionada, (o probabilidad condicional) es la probabi-lidad de que ocurra un suceso, dado que sabemos que ha ocurrido otrosuceso.
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
21
Probabilidad condicionada. Sucesos Independientes
Probabilidad condicionadaSean dos sucesos A y B , la probabilidad de A condicionada por el suceso B es:
P(A|B) = P(A ∩ B)
P(B)
Para que tenga sentido: P(B) > 0.
Sucesos Independientes• Intuitivamente: la ocurrencia de uno de ellos no nos dice nada nuevo
sobre la ocurrencia del otro
• Definicion: se dice que dos sucesos A y B son independientes si
P(A ∩ B) = P(A)P(B).
• Propiedad: dos sucesos A y B son independientes si, y solo si,P(A|B) = P(A) y P(B |A) = P(B).
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
22
Teoremas fundamentales del calculo de probabilidades
Regla de la multiplicacion o formula de las probabilidadescompuestas
Es util para calcular la probabilidad de la ocurrencia simultanea de variossucesos cuando las probabilidades condicionadas son faciles de calcular.
• P(A ∩ B) = P(A|B)P(B), siempre que P(B > 0).
• P(A ∩ B ∩ C ) = P(A)P(B |A)P(C |A ∩ B), siempre que P(A ∩ B) > 0.
• Se generaliza al calculo de la probabilidad de la interseccion de n sucesosA1, . . . ,An.
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
23
Regla de la multiplicacion: ejemplo
Se extraen dos cartas de una baraja espanola. Probabilidad de que:
• la primera carta sea copa: P(A) = 1248 .
• la segunda sea copa, sabiendo que la primera lo fue: P(B |A) = 1147 .
• las dos cartas sean copas: P(A ∩ B) = P(B |A)P(A) = 1147
1248 .
Se lanzan dos dados. Probabilidad de que:
• en el primer dado salga un 1: P(C ) = 16 .
• en el segundo dado salga un 1, sabiendo que en el primero salio 1:P(D|C ) = P(D) = 1
6 .
• en el primer dado salga un uno, si en el segundo salio uno:P(C |D) = P(C ) = 1
6 .
• en los dos dados salga uno:P(C ∩ D) = P(D|C )P(C ) = P(D)P(C ) = 1
616 (sucesos independientes)
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
24
Teoremas fundamentales: teorema de la probabilidad totalUn conjunto de sucesos B1,B2, . . . ,Bk son mutuamente excluyentes si
Bi ∩ Bj = ∅, ∀i 6= j .
Si ademas de eso cumplen
Ω = B1 ∪ B2 ∪ . . . ∪ Bk ,
se dice que forman una particion del espacio muestral.
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
25
Teoremas fundamentales: teorema de la probabilidad total
Si B1,B2, . . . ,Bk es una particion del espacio muestral tal que P(Bi ) 6= 0,i = 1, . . . , k , y A es un suceso cualquiera, entonces
P(A) = P(A ∩ B1) + P(A ∩ B2) + . . .+ P(A ∩ Bk) =
= P(A|B1)P(B1) + P(A|B2)P(B2) + . . .+ P(A|Bk)P(Bk).
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
26
Teorema de la probabilidad total: ejemplo
En una fabrica se embalan galletas en cuatro cadenas de montaje: A1, A2, A3,y A4. El 35% de la produccion total se embala en la cadena A1, el 20%, 24%y 21% en las cadenas A2, A3 y A4 respectivamente.Los datos indican que no se embalan correctamente un porcentaje pequeno delas cajas: el 1% en la cadena de montaje A1, el 3% en A2, el 2.5% en A3 y el2% en A4.¿Cual es la probabilidad de que una caja elegida al azar de la produccion totalsea defectuosa (suceso D)?
P(D) = P(D ∩ A1) + P(D ∩ A2) + P(D ∩ A3) + P(D ∩ A4)
= P(D|A1)P(A1) + P(D|A2)P(A2) + P(D|A3)P(A3) + P(D|A4)P(A4)
= 0′01× 0′35 + 0′03× 0′20 + 0′025× 0′24 + 0′02× 0′21 = 0′0197.
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
27
Teoremas fundamentales: teorema de Bayes
Para dos sucesos A y B se tiene que
P(A|B) = P(B |A)P(A)P(B)
Ejemplo: (continuacion del anterior) Supongamos que descubrimos una cajadefectuosa, ¿cual es la probabilidad de que la caja haya sido embalada en lacadena de montaje A1?
P(A1|D) =P(D|A1)P(A1)
P(D)=
=0.01× 0.35
0.0197= 0.17766
donde la probabilidad de que una caja elegida al azar sea defectuosa P(D) seha calculado aplicando el teorema de la probabilidad total.
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
28
Teoremas fundamentales: teorema de Bayes
Dada una particion del espacio muestral, B1,B2, . . . ,Bk , tal que P(Bi ) 6= 0,i = 1, . . . , k , y dado un suceso A, se tiene que
P(Bj |A) =P(A|Bj)P(Bj)
P(A|B1)P(B1) + P(A|B2)P(B2) + . . .+ P(A|Bk)P(Bk)
para todo j = 1 . . . , k
• Probabilidades a priori: p(B1), . . . , p(Bk)
• Probabilidades a posteriori: p(B1|A), . . . , p(Bk |A)• Verosimilitudes: p(A|B1), . . . , p(A|Bk)
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
29
Teoremas fundamentales: utilidad
La aplicacion del teorema de la probabilidad total y del teorema de Bayes esespecialmente util cuando:
• El experimento aleatorio se puede separar en 2 etapas
• Es sencillo dar una particion de todo el espacio muestral Ω mediantesucesos B1, . . . ,Bk correspondientes a resultados en la primera etapa.
• Son conocidas, o facilmente calculables, las probabilidades a priori,p(B1), . . . , p(Bk).
• Son conocidas, o facilmente calculables, las verosimilitudes:p(A|B1), . . . , p(A|Bk), donde A es un suceso correspondiente a resultadosde la segunda etapa.
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
30
Variables aleatorias
• Variable aleatoria: definicion
• Variables aleatorias discretas:
• Funcion de probabilidad
• Funcion de distribucion
• Momentos
• Variables aleatorias continuas:
• Funcion de densidad
• Funcion de distribucion
• Momentos
• Algunas propiedades de la esperanza y la varianza
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
31
Variables aleatoria: definicion
Sea Ω el espacio muestral asociado a cierto experimento aleatorio y F elcorrespondiente conjunto de sucesos.
Se denomina variable aletoria (v.a.) a una funcion X : Ω→ R, que a cadaelemento ei ∈ Ω le asigna un valor numerico X (ei ) = xi ∈ R.
Intuitivamente, una variable aleatoria es una medida o cantidad que varıa enfuncion del resultado concreto ei que se observa al realizar el experimentoaleatorio.
La v.a. se denota con letras mayusculas, mientras que las letras minusculasindican el valor concreto que toma la v.a. cuando se evalua en un puntomuestral.
Ejemplo:Lanzar un dado una vez. Considerar la v.a. X =“resultado de la tirada”.¿Cuantos sucesos elementales hay? ¿Que valores puede tomar X?
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
32
Variables aleatoria: ejemplo
• Experimento aleatorio: lanzamiento de 3 dados
• Espacio muestral: Ω = 111, 112, . . . , 665, 666, de cardinaln(Ω) = 63 = 216
• Variable aleatoria X = numero de unos
X : Ω→ R
X (abc) = 0, ∀a, b, c = 2, 3, . . . , 6
X (1ab) = X (a1b) = X (ab1) = 1, ∀a, b = 2, 3, . . . , 6
X (a11) = X (1a1) = X (11a) = 2, ∀a = 2, 3, . . . , 6
X (111) = 3
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
33
Variables aleatorias: tipos
V.a. discretaSi X toma valores sobre un conjunto S ⊆ R finito o infinito numerable, se diceque X es una variable aleatoria discreta.
V.a. continua
Si X toma valores sobre un conjunto S ⊆ R infinito no numerable (porejemplo, en intervalo o una union de intervalos), se dice que X es una variablealeatoria continua.
El conjunto S ⊆ R se denomina soporte de la variable aleatoria X .
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
34
Variables aleatorias: ejemplos
Variables aleatorias discretas• “resultado al tirar un dado”, con soporte S = 1, 2, 3, 4, 5, 6 finito
• “numero de 1’s obtenidos al lanzar 3 dados”, con soporte S = 0, 1, 2, 3finito
• “numero de coches que pasan por cierto peaje en una semana”, consoporte S = 0, 1, 2, . . . = N ∪ 0 infinito numerable.
Variables aleatorias continuas• “altura de una persona”, puede considerarse S = [0,+∞).
• “el tiempo de reaccion a cierto medicamento”, puede considerarseS = [0,+∞).
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
35
Variables aleatorias discretas
Funcion de probabilidad
Sea X una variable aleatoria discreta que toma valores en el conjuntoS = x1, x2, . . ., finito o infinito numerable, con probabilidadesp1 = P(X = x1), p2 = P(X = x2), . . . .
Se define la funcion de probabilidad de X o funcion de masa de X como
P(X = x) =
pi , si x = xi ∈ S ,0, si x /∈ S .
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
36
Variables aleatorias discretasEjemploX =“numero de 1’s obtenidos al lanzar 3 dados”. ¿Como calculamosprobabilidades de X?
La probabilidad P : F → R definida sobre los elementos de Ω se transmite a X
P(X = 0) = P(abc / a, b, c = 2, . . . , 6) =5
6·5
6·5
6= 0.5787
P(X = 1) = P(1ab ∪ a1b ∪ ab1, a, b = 2, . . . , 6) = 3 ·1
6·5
6·5
6= 0.3472
P(X = 2) = P(a11 ∪ 1a1 ∪ 11a, a = 2, . . . , 6) = 3 ·1
6·1
6·5
6= 0.0695
P(X = 3) = P(111) =1
6·1
6·1
6= 0.0046
x 0 1 2 3P(X = x) 0.5787 0.3472 0.0695 0.0046
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
37
Variables aleatorias discretas
Funcion de probabilidad. Propiedades
X variable aleatoria discreta que toma valores en el conjunto S = x1, x2, . . .con probabilidades p1 = P(X = x1), p2 = P(X = x2), . . . .
• 0 ≤ P(X = x) ≤ 1, para todo x ∈ R.
•
∑
x∈S
P(X = x) =∑
i
P(X = xi ) =∑
i
pi = 1.
• P(X ∈ A) =∑
x∈A
P(X = x).
• P(X ≤ x) = P(X ∈ (−∞, x ]) =∑
i,xi≤x
P(X = xi ) =∑
i,xi≤x
pi .
• P(X > x) = 1− P(X ≤ x).
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
38
Variables aleatorias discretas
Funcion de probabilidad. Representacion grafica
La funcion de probabilidad se representa mediante un diagrama de barras
Ejemplo
X =“numero de 1’s obtenidos al lanzar 3 dados”
X P(x)
0 0,5787037
1 0,3472222
2 0,0694444
3 0,0046296
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0 1 2 3
Función de probabilidad
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
39
Variables aleatorias discretas
Funcion de distribucionLa funcion de distribucion o funcion de probabilidad acumulada de una variablealeatoria X es una aplicacion F : R→ [0, 1], que a cada valor x ∈ R le asignala probabilidad F (x) = P(X ≤ x) = P(X ∈ (−∞, x ]).
Atencion! F (x) esta definida para todo x ∈ R y no solo para los x ∈ S .
Propiedades
• 0 ≤ F (x) ≤ 1 para todo x ∈ R.
• F (y) = 0 para todo y < min S . Por tanto, F (−∞) = limx→infty = 0.
• F (y) = 1 para todo y ≥ max S . Por tanto, F (∞) = limx→infty = 1.
• Si x1 ≤ x2, entonces F (x1) ≤ F (x2), es decir, F (x) es monotona nodecreciente.
• Para todo a, b ∈ R,P(a < X ≤ b) = P(X ∈ (a, b]) = P((X ∈ (−∞, b]) \ (X ∈ (−∞, a])) =P(X ∈ (−∞, b])− P(X ∈ (−∞, a]) = F (b)− F (a).
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
40
Variables aleatorias discretas
Funcion de distribucion: ejemplo
X =“numero de 1’s al lanzar 3 dados”.
F (x) =
0, si x < 0,
0.5787, si 0 ≤ x < 1,
0.5787 + 0.3472 = 0.9259, si 1 ≤ x < 2,
0.5787 + 0.3472 + 0.0695 = 0.9954, si 2 ≤ x < 3,
0.5787 + 0.3472 + 0.0695 + 0.0046 = 1, si x ≥ 3.
OJO! valores x /∈ S pueden tomar valores F (x) > 0.
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
41
Variables aleatorias discretas
Funcion de distribucion: representacion grafica
Si X es una v.a. discreta, su funcion de distribucion es de tipo escalon(discontinuidades de salto).
Cada escalon corresponde a un xi ∈ S y el salto correspondiente es laprobabilidad P(X = xi ) = pi .
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
42
Momentos de una variable aleatoria discreta
Los momentos sirven para resumir alguna informacion sobre la variablealeatoria
Sea X una v.a. discreta con soporte S = x1, x2, . . . , y funcion deprobabilidad p1 = P(X = x1), p2 = P(X = x2), . . . .
Esperanza de X : momento de primer orden
E (X ) = µ =∑
x∈S
xP(X = x) =∑
i
xiP(X = xi ) =∑
i
xipi
Es una medida de localizacion
En general, se define el momento de orden k como
E (X k) =∑
x∈S
xkP(X = x) =∑
i
xki P(X = xi ) =∑
i
xki pi
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
43
Momentos de una variable aleatoria discreta
X =“numero de 1’s al lanzar 3 dados”, con soporte S = 0, 1, 2, 3El numero esperado de 1’s al lanzar 3 dados equilibrados es:
E (X ) = 0P(X = 0) + 1P(X = 1) + 2P(X = 2) + 3P(X = 3) =
= 0.3472 + 0.139 + 0.0138 = 0.5
X =“resultado de lanzar un dado”, con soporte S = 1, 2, 3, 4, 5, 6, y funcionde probabilidad
x 1 2 3 4 5 6
P(X = x) 16
16
16
16
16
16
Su valor esperado es:
E (X ) =∑
x∈S
x P(X = x) = 1 · 16+ 2 · 1
6+ 3 · 1
6+ 4 · 1
6+ 5 · 1
6+ 6 · 1
6=
=1 + 2 + 3 + 4 + 5 + 6
6=
21
6= 3.5
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
44
Momentos de una variable aleatoria discretaSea X una v.a. discreta con soporte S = x1, x2, . . . , y funcion deprobabilidad p1 = P(X = x1), p2 = P(X = x2), . . . .
Varianza: momento centrado de segundo orden
V (X ) = σ2 = E [(X − E (X ))2] =∑
x∈S
(x − µ)2P(X = x) =∑
i
(xi − µ)2P(X = xi ) =
=∑
i
(xi − µ)2pi =∑
i
x2i pi − µ2 = E (X 2)− E (X )2
Desviacion tıpica: σ =√σ2 =
√
E [(X − µ)2]
Son medidas de dispersion (alrededor del valor esperado)
En general, se define el momento centrado de orden k como
E ((X−µ)k) =∑
x∈S
(x−µ)kP(X = x) =∑
i
(xi−µ)kP(X = xi ) =∑
i
(xi−µ)kpi
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
45
Momentos de una variable aleatoria discreta
X =“numero de 1’s al lanzar 3 dados”, con soporte S = 0, 1, 2, 3. Suvarianza es:
V (X ) = E((X − µ)2) = (0− 0.5)2 · P(X = 0) + (1− 0.5)2 · P(X = 1)+
+ (2− 0.5)2 · P(X = 2) + (3− 0.5)2 · P(X = 3) =
= 0.25 · 0.5787 + 0.25 · 0.3472 + 2.25 · 0.0695 + 6.25 · 0.0046 = 0.4167
X =“resultado de lanzar un dado”, con soporte S = 1, 2, 3, 4, 5, 6. Suvarianza es:
V (X ) = E((X − µ)2) = E(X 2)− µ2 =∑
x∈S
x2P(X = x)− µ2 =
=1
6
(
1 + 22 + 32 + 42 + 52 + 62)
− 3.52 =91
6− 12.25 = 2.9167
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
46
Esperanza y varianza de una variable aleatoria discreta
Ejemplo
X =“numero de caras al tirar una moneda dos veces”.
El espacio muestral asociado al experimento aleatorio “lanzamiento de dosmonedas” es Ω = (cara, cara), (cara, cruz), (cruz , cara), (cruz , cruz). Lavariable X toma valores en S = 0, 1, 2 con probabilidades P(X = 0) = 1/4,P(X = 1) = 1/4 + 1/4 = 1/2, P(X = 2) = 1/4.
Por tanto, la funcion de probabilidad de X es
x 0 1 2
P(X = x) 14
12
14
Calculamos su esperanza y varianza:
E (X ) =∑
x∈S
x P(X = x) = 01
4+ 1
1
2+ 2
1
4= 1,
V (X ) =∑
x∈S
(x − E (X ))2P(X = x) = (0−1)2
1
4+(1−1)2
1
2+(2−1)2
1
4=
1
2.
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
47
Variables aleatorias continuas
Funcion de densidadLas probabilidades de una variable aleatoria continua se calculan a partir deuna funcion f : R→ [0,+∞) denominada funcion de densidad.
Propiedades
• f (x) ≥ 0 para todo x ∈ R.
•∫∞
−∞f (x) dx = 1, es decir, el area total de la funcion de densidad es 1.
• Para todo a, b ∈ R, P(a ≤ X ≤ b) = P(X ∈ [a, b]) =∫ b
af (x) dx es el
area que determina la funcion de densidad de X sobre el intervalo [a, b].
• Los intervalos [a, b], (a, b), (a, b] y [a, b) tienen la misma probabilidad.
• Soporte de X : S = x ∈ R / f (x) > 0Atencion! La funcion de densidad juega el mismo papel que la funcion deprobabilidad para v.a. discretas.
Solo tiene sentido calcular probabilidades de intervalos: P(X = x) = 0 paratodo x ∈ R .Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
48
Variables aleatorias continuas
Funcion de distribucionPara una v.a. continua X , la funcion de distribucion se define como la funcionF (x) = P(X ≤ x) = P(X ∈ (−∞, x ]) =
∫ x
−∞f (t) dt, para todo x ∈ R.
Igual que en el caso discreto, la funcion F (x) da las probabilidades acumuladashasta el punto x ∈ R, pero ahora se trata de una funcion continua y no de tipoescalon. Dos ejemplos son:
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
49
Variables aleatorias continuas
Propiedades
• 0 ≤ F (x) ≤ 1, para todo x ∈ R.
• F (−∞) = 0.
• F (∞) = 1.
• Si x1 ≤ x2, entonces F (x1) ≤ F (x2), es decir, F (x) es no decreciente.
• Para todo a, b ∈ R, P(a ≤ X ≤ b) = F (b)− F (a).
• La funcion de densidad de X se obtiene derivando la funcion dedistribucion, es decir, f (x) = F ′(x).
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
50
Variables aleatorias continuas
Ejemplo
Una variable aleatoria X tiene funcion de densidad
f (x) =
3 x2, si x ∈ (0, 1),0, si x /∈ (0, 1)
¿Como es la grafica de la funcion de densidad de X?
Indicar cual es el area asociada a la probabilidad P(X > 1/2).
Calcular la probabilidad P(X > 1/2).
Obtener la funcion de distribucion de X .
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
51
Variables aleatorias continuas
Ejemplo
Una variable aleatoria X tiene funcion de densidad
f (x) =
12x2(1− x), si 0 < x < 1,0, en otro caso.
P(X ≤ 0.5) =
∫ 0.5
−∞
f (u)du =
∫ 0.5
0
12u2(1− u)du = 0.3125
P(0.2 ≤ X ≤ 0.5) =
∫ 0.5
0.2
f (u)du =
∫ 0.5
0.2
12u2(1− u)du = 0.2853
F (x) = P(X ≤ x) =
∫ x
−∞
f (u)du =
0, si x ≤ 0,
12(
x3
3 − x4
4
)
, si 0 < x ≤ 1,
1, si x > 1.
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
52
Momentos de una variable aleatoria continua
Sea X una v.a. continua con soporte S ⊆ R, y funcion de densidad f .
Esperanza de X : momento de primer orden
E (X ) = µ =
∫
S
xf (x)dx
Es una medida de localizacion
En general, se define el momento de orden k como
E (X k) =
∫
S
xk f (x)dx
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
53
Momentos de una variable aleatoria continua
Ejemplo
Una variable aleatoria X tiene funcion de densidad
f (x) =
12x2(1− x), si 0 < x < 1,0, en otro caso.
Calculamos su esperanza:
E (X ) =
∫
R
x · f (x)dx =
∫ 1
0
x · 12x2(1− x)dx
=
∫ 1
0
12(x3 − x4)dx = 12(x4
4− x5
5
)∣
∣
∣
1
0= 12
(
1
4− 1
5
)
=3
5
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
54
Momentos de una variable aleatoria continua
Sea X una v.a. continua con soporte S ⊆ R, y funcion de densidad f .
Varianza: momento centrado de segundo orden
V (X ) = σ2 = E [(X − E (X ))2] =
∫
S
(x − µ)2f (x)dx =
= E (X 2)− E (X )2 =
∫
S
x2f (x)dx − µ2
Desviacion tıpica: σ =√σ2 =
√
E [(X − µ)2]
Son medidas de dispersion (alrededor del valor esperado)
En general, se define el momento centrado de orden k como
E ((X − µ)k) =
∫
S
(x − µ)k f (x)dx
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
55
Momentos de una variable aleatoria continua
Ejemplo
f (x) =
12x2(1− x), si 0 < x < 1,0, en otro caso.
Calculamos su varianza:
var(X ) = E [(X − E (X ))2]
=∫
R(x − E (X ))
2 · f (x)dx
=∫ 1
0
(
x − 35
)2 · 12x2(1− x)dx
=∫ 1
012
(
−x5 + 115 x
4 − 3925x
3 + 925x
2)
dx
= 12(
− 16x
6 + 115
15x
5 − 3925
14x
4 + 925
13x
3)∣
∣
10
= 12(
− 16 + 11
515 − 39
2514 + 9
2513
)
= 0.04
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
56
Ejemplo de repaso: distribucion uniforme en (3,5)
Algunas probabilidades
Una variable aleatoria X que sigue una distribucion uniforme en el intervalo(3, 5) tiene funcion de densidad
f (x) =
15−3 = 1
2 , si x ∈ (3, 5)
0, si x /∈ (3, 5).
dist. uniforme
Calculamos algunas probabilidades:
P(X ≤ 0.5) =∫ 0.5
−∞f (u)du = 0
P(X ≤ 4) =∫ 4
−∞f (u)du =
∫ 4
312du = 1
2u|43 = 12
P(3.5 ≤ X ≤ 4.5) =∫ 4.5
3.5f (u)du =
∫ 4.5
3.512du = 1
2
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
57
Ejemplo de repaso: distribucion uniforme en (3,5)
Funcion de distribucion
F (x) = P(X ≤ x) =
∫ x
−∞
f (u)du = . . .
• Si x ≤ 3 entonces F (x) = P(X ≤ x) = 0.
• Si 3 ≤ x < 5 entonces F (x) = P(X ≤ x) =∫ x
312du = u
2 |x3 = x−32 .
• Si x ≥ 5 entonces F (x) = P(X ≤ x) =∫ 5
312du = u
4
∣
∣
53 = 5−3
2 = 1.
F (x) =
0, si x ≤ 3,x−32 , si 3 < x < 5,
1, si x ≥ 5.
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
58
Ejemplo de repaso: distribucion uniforme en (3,5)
Esperanza
E (X ) =∫
Rx · f (x)dx =
∫ 5
3x · 12dx = x2
4
∣
∣
∣
5
3= 52−32
4 = 4
Varianza
var(X ) =∫
Rx2 · f (x)dx − E 2[X ]
=∫ 5
3x2
2 dx − 42 = x3
6
∣
∣
∣
5
3− 16 = 0.33
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
59
Esperanza de una transformacionSea X una variable aleatoria y sea g(X ) una transformacion de X . Entonces:
E (g(X )) =
∑
x∈S
g(x)P(X = x), si X v.a. discreta
∫
S
g(x)f (x)dx , si X v.a. continua
Ejemplo: si tomamos g(X ) = kX , con k ∈ R constante, entonces
E (kX ) =
∑
x∈S
kxP(X = x) = kE (X ), si X v.a. discreta
∫
S
kxf (x)dx = kE (X ), si X v.a. continua
Para la varianza tenemos,
V (kX ) =
∑
x∈S
(kx − kµ)2P(X = x) = k2V (X ), si X v.a. discreta
∫
S
(kx − kµ)2f (x)dx = k2V (X ), si X v.a. continua
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
60
Algunos modelos probabilısticos
Variables aleatorias discretas mas comunes• Ensayos de Bernoulli
• Distribucion Binomial
• Distribucion de Poisson
Variables aleatorias continuas mas comunes• Distribucion uniforme continua
• Distribucion exponencial
• Distribucion normal
• Teorema Central del Lımite
• Distribuciones asociadas a la normal (Tema 4. Introduccion a la Inferencia Estadıstica)
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
61
Ensayos de Bernoulli
Descripcion / Definicion
Es una forma de modelar estadısticamente cualquier experimento aleatorio quetenga solamente dos resultados posibles, mutuamente excluyentes, que suelenllamarse exito y fracaso, con la condicion de que la probabilidad de estos dosresultados se mantenga constante en cada realizacion del experimento(experimentos o ensayos de Bernoulli).
Si la probabilidad de exito es p (por tanto, la de fracaso es 1− p), se define lavariable aleatoria de Bernoulli como
X =
1, si se observa un exito,0, si se observa un fracaso.
Soporte de X : S = 0, 1, con probabilidades P(X = 0) = 1− p = q,P(X = 1) = p.
Para denotar que X sigue una distribucion Bernoulli de parametro p
escribiremos X ∼ Ber(p).
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
62
Ensayos de Bernoulli
Ejemplo
Resultado de lanzar una moneda al aire
X =
1, sale cara,0, si sale cruz.
Es un ensayo Bernoulli, donde se ha considerado como exito el observar unacara. X sigue una distribucion Bernoulli de parametro 1/2 (si la moneda noesta trucada).
Ejemplo
Una lınea aerea estima que los pasajeros que compran un billete no sepresentan al embarque con una probabilidad de 0.05.Definimos
Y =
1, si el pasajero se presenta,0, si el pasajero no se presenta.
Y sigue una distribucion Bernoulli con parametro 0.95.
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
63
Ensayos de Bernoulli
Funcion de Probabilidad:
P(X = 0) = 1− p P(X = 1) = p
Funcion de distribucion:
F (x) =
0, si x < 01− p, si 0 ≤ x < 11, si x ≥ 1
Propiedades
• E (X ) = 0P(X = 0) + 1P(X = 1) = 0 (1− p) + 1 p = p
• E (X 2) = 02 P(X = 0) + 12 P(X = 1) = 02 (1− p) + 12 p = p
• V (X ) = E (X 2)− E (X )2 = p − p2 = p(1− p) = pq
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
64
Distribucion Binomial
Descripcion / Definicion
Se realizan n ensayos de Bernoulli independientes con la misma probabilidad deexito p. La v.a. X que cuenta el numero de exitos observados en estos nensayos se dice que sigue una distribucion Binomial de parametros n y p y seescribe X ∼ B(n, p).
La v.a. X toma valores en S = 0, 1, 2, . . . , n y su funcion de probabilidadviene dada por la formula
P(X = x) =(n
x
)
px (1− p)n−x , x = 0, 1, . . . , n, 0 ≤ p ≤ 1,
donde(
nx
)
= n!x!(n−x)! , para 0 ≤ x ≤ n. Recordad que, por convenio, 0! = 1.
Propiedades
E (X ) = np, V (X ) = np(1− p) = npq.
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
65
Distribucion Binomial
Ejemplo
La lınea aerea del ejemplo anterior ha vendido 80 billetes para un vuelo. Laprobabilidad de que un pasajero no se presente al embarque es de 0.05.Definimos X = numero de pasajeros que se presentan al embarque. Entonces(suponiendo independencia)
X ∼ B(80, 0.95)
• La probabilidad de que los 80 pasajeros se presenten es
P(X = 80) =
(
80
80
)
0.9580 × (1− 0.95)80−80 = 0.0165
• La probabilidad de que al menos un pasajero no se presente es
P(X < 80) = 1− P(X = 80) = 1− 0.0165 = 0.9835
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
66
Distribucion Binomial: funcion de probabilidadLa funcion de probabilidad de X ∼ B(80, 0.95) es
68 70 72 74 76 78 80
0.0
00
.05
0.1
00
.15
0.2
0
Binomial Distribution: Trials = 80, Probability of success = 0.95
Number of Successes
Pro
ba
bili
ty M
ass
Cambiando la probabilidad de exito:
25 30 35 40 45 50 55
0.0
00
.02
0.0
40
.06
0.0
8
Binomial Distribution: Trials = 80, Probability of success = 0.5
Number of Successes
Pro
ba
bili
ty M
ass
5 10 15
0.0
00
.05
0.1
00
.15
Binomial Distribution: Trials = 80, Probability of success = 0.1
Number of Successes
Pro
ba
bili
ty M
ass
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
67
Distribucion de Poisson: sucesos raros
Descripcion / Definicion
Cuenta el numero de sucesos raros que ocurren en una determinada unidad detiempo o de espacio. Por ejemplo, llamadas de telefono en una hora, erratas enuna pagina, accidentes de trafico a la semana, . . .
Una v.a. X sigue una distribucion de Poisson de parametro λ, y se denotarapor X ∼ Pois(λ), si su funcion de probabilidad es
P(X = x) = e−λ λx
x!, para x = 0, 1, 2, . . .
Observad que X toma valores en S = 0, 1, 2, . . . = N ∪ 0.
Propiedades
E (X ) = λ, V (X ) = λ.
λ representa el numero medio de sucesos que se producen por unidad detiempo o de espacio.
Exponencial
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
68
Distribucion de Poisson: sucesos raros
Propiedad de la Poisson
Si X ∼ Pois(λ) y representa el numero de sucesos raros en una unidad detiempo o de espacio, e Y es una variable aleatoria que representa el numero dedichos sucesos raros en s unidades, se tiene que:
Y ∼ Pois(sλ)
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
69
Distribucion de Poisson: sucesos raros
Ejemplo
El numero medio de erratas por transparencias es de 0.2. Sea X es la v.a. quecuenta el numero de erratas por transparencia, entonces
X ∼ Pois(0.2)
¿Cual es la probabilidad de que en una transparencia no haya erratas?
P(X = 0) = e−0.2 0.20
0!= e−0.2 = 0.8187.
¿Cual es la probabilidad de que en 4 transparencias haya exactamente unaerrata?Sea Y la v.a. que cuenta el numero de erratas en 4 transparencias. Entonces:
Y ∼ Pois(0.2 · 4) = Pois(0.8)
P(Y = 1) = e−0.8 0.81
1!= e−0.8 0.8 = 0.3595.
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
70
Distribucion uniforme
Descripcion / Definicion
Se dice que una variable X sigue una distribucion uniforme en el intervalo(a, b), y se denota por X ∼ U(a, b), si su funcion de densidad es
f (x) =
1b−a
, si x ∈ (a, b),
0, si x /∈ (a, b).
Esta v.a. queda definida por los extremos del intervalo, es decir, a y b son susparametros.
Propiedades
E (X ) = a+b2 , V (X ) = (b−a)2
12 .
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
71
Distribucion uniforme
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
72
Distribucion exponencial
Descripcion / Definicion
La distribucion exponencial es aquella que modela el tiempo transcurrido entredos sucesos que se producen de forma independiente, separada y uniforme enel tiempo.
Se dice que una v.a. X sigue una distribucion exponencial de parametro λ, yse denota por X ∼ exp(λ), si su funcion de densidad es
f (x) = λ e−λx , para x ≥ 0.
Observad que X toma valores en el conjunto S = [0,+∞).
Ejemplos• Tiempo entre llegadas de camiones al punto de descarga.
• Tiempo entre llamadas de emergencia.
• Tiempo de vida de una bombilla.
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
73
Distribucion exponencial
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
74
Distribucion exponencial
Propiedades
• E (X ) = 1λ
• V (X ) = 1λ2
• Funcion de distribucion:
F (x) =
1− e−λx , si x ≥ 0,0, si x < 0.
• Esta relacionada con la distribucion de Poisson. Poisson
• λ es el numero medio de ocurrencias del suceso por unidad de tiempo.
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
75
Distribucion exponencial
Ejemplo
Hemos observado que en cierta provincia se producen, en promedio, 50incendios serios cada ano. Suponemos que estos incendios se producen deforma independiente y decidimos modelar el numero de incendios por anomediante una distribucion Poisson.
• ¿Cual es el tiempo medio que transcurre entre dos incendios consecutivos?
• Si acaba de ocurrir un incendio ¿cual es la probabilidad de que el proximose produzca al cabo de dos semanas?
Sabemos que:
• El numero de incendios por ano N ∼ Pois(λ) con λ = 50.
• El tiempo entre dos incendios X ∼ exp(λ) con λ = 50.
• El tiempo medio entre dos incendios E (X ) = 1λ= 1/50 anos, 7.3 dıas.
• Dos semanas, en anos son: 2·7365 = 0.03836,
• P[X > 0.03836] = 1− P[X ≤ 0.03836] = 1− (1− e−50·0.03836) = 0.147.
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
76
Distribucion normal
Descripcion / Definicion
La distribucion normal describe una variable aleatoria “ideal”. Se trata de unmodelo teorico que aproxima bien muchas situaciones reales.La inferencia estadıstica se fundamenta basicamente en la distribucion normaly en distribuciones que se derivan de ella.
Se dice que una v.a. X sigue una distribucion normal o gausiana conparametros µ y σ, y se denota por X ∼ N (µ, σ), si su funcion de densidad es
f (x) =1
σ√2π
exp
− 1
2σ2(x − µ)2
Propiedades
E (X ) = µ, V (X ) = σ2.
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
77
Distribucion normal
Funcion de densidad para 3 valores distintos de µ y σ
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
78
Distribucion normal
Propiedad
Si X ∼ N (µ, σ), entonces:
• P(µ− σ < X < µ+ σ) ≈ 0.683
• P(µ− 2σ < X < µ+ 2σ) ≈ 0.955
• P(µ− 3σ < X < µ+ 3σ) ≈ 0.997
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
79
Distribucion normal
Transformacion lineal
Y = a+ b X ∼ N (a+ bµ, |b|σ)
Estandarizacion o Tipificacion
Si X ∼ N (µ, σ), considero
Z =X − µ
σ∼ N (0, 1)
Se llama distribucion normal estandar.
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
80
Distribucion normal: EjemploSea Z ∼ N(0, 1). Calculemos algunas probabilidades:
P(Z < 1.5) = 0.9332 = DISTR.NORM(1.5;0;1;VERDADERO)
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
81
Distribucion normal: Ejemplo (cont.)
P(Z > −1.5) = P(Z < 1.5) = 0.9332 ¿por que?
P(Z < −1.5) = P(Z > 1.5) = 1− P(Z < 1.5) =
= 1− 0.9332 = 0.0668 ¿por que no ≤ ?
P(−1.5 < Z < 1.5) = P(Z < 1.5)− P(Z < −1.5) =
= DISTR.NORM(1.5;0;1;VERDADERO)− DISTR.NORM(-1.5;0;1;VERDADERO)
= 0.9332− 0.0668 = 0.8664
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
82
Distribucion normal: Ejemplo
Sea X ∼ N(µ = 2, σ = 3). Para calcular P(X < 4), si no tenemos ordenador,hay que recurrir a las tablas de la distribucion normal estandar. Para ello,tipificamos la variable original:
P(X < 4) = P
(
X − 2
3<
4− 2
3
)
= P(
Z < 0.666)
≈ 0.7454
donde Z ∼ N(0, 1)
¿Cual es P(−1 < X < 3.5)?
P(−1 < X < 3.5) = P(−1− 2 < X − 2 < 3.5− 2) =
P
(−1− 2
3<
X − 2
3<
3.5− 2
3
)
= P(−1 < Z < 0.5) =
P(Z < 0.5)− P(Z < −1) = 0.6915− 0.1587 = 0.5328
donde Z ∼ N(0, 1)
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
83
Distribucion normal: Ejemplo (cont.)
Sea X ∼ N(µ = 2, σ = 3). Si usamos Excel no hace falta tipificar X .Directamente calculamos
P(X < 4) = DISTR.NORM(4;2;3;VERDADERO) = 0.7475
P(−1 < X < 3.5) = P(X < 3.5)− P(X < −1) =
= DISTR.NORM(3.5;2;3;VERDADERO)− DISTR.NORM(-1;2;3;VERDADERO) =
= 0.6915− 0.1587 = 0.5328
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
84
Distribucion normal: otro ejemplo
Es difıcil etiquetar la carne empaquetada con su peso correcto debido a losefectos de perdida de lıquido (definido como porcentaje del peso original de lacarne). Supongamos que la perdida de lıquido en un paquete de pechuga depollo puede modelarse mediante una distribucion normal con media 4% ydesviacion tıpica 1%.Sea X la perdida de lıquido de un paquete de pechuga de pollo elegido al azar.
• ¿Cual es la probabilidad de que 3% < X < 5%?
• ¿Cual es el valor de x para que un 90% de paquetes tengan perdidas delıquido menores que x?
• En una muestra de 4 paquetes, hallar la probabilidad de que todos tenganperdidas de peso de entre 3% y 5%.
Sexauer, B. (1980) Drained-Weight Labelling for Meat and Poultry: An Economic
Analysis of a Regulatory Proposal, Journal of Consumer Affairs, 14, 307-325.
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
85
Distribucion normal: otro ejemplo (cont.)
La variable aleatoria X sigue una distribucion N(4, 1). Entonces:
P(3 < X < 5) = P(X < 5)− P(X < 3) =
= DISTR.NORM(5;4;1;VERDADERO)− DISTR.NORM(3;4;1;VERDADERO) =
= 0.8413− 0.1587 = 0.6827
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
86
Distribucion normal: otro ejemplo (cont.)
Queremos encontrar el valor de x0 para el que P(X < x0) = 0.9. Tenemos quecalcular la funcion inversa de la funcion de distribucion de X . En Excel
x0 = DISTR.NORM.INV(0,9;4;1) = 5.2816
Conclusion: un 90% de los paquetes tienen perdidas de menos del 5.28%.
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
87
Distribucion normal: otro ejemplo (cont.)
Todas las probabilidades normales anteriores se pueden obtener a partir de lanormal estandar como sigue.
P(3 < X < 5) = P
(
3− 4
1<
X − 4
1<
5− 4
1
)
= P(−1 < Z < 1)
= P(Z < 1)− P(Z < −1) = 0.8413− 0.1587 = 0.6827
Queremos P(X < x) = 0.9. Entonces
P
(
X − 4
1<
x − 4
1
)
= P(Z < x − 4) = 0.9
Mirando las tablas, tenemos x − 4 ≈ 1.28 que implica que un 90% de laspaquetes tienen perdidas de menos de x = 5.28%.
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
88
Distribucion normal: otro ejemplo (cont.)
binomial
Y = numero de paquetes en la muestra que tienen perdidas de entre 3% y 5%.Y ∼ B(4, p), siendo
p = P(exito) = P(perdida de peso entre 3% y 5%) = P(3 < X < 5) = 0.6827
Entonces,
P(Y = 4) =
(
44
)
0.68274(1− 0.6827)4 = 0.2172
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
89
Teorema Central del Lımite (TCL)El siguiente teorema nos habla de la distribucion de la media de un conjuntode v.a. independientes e identicamente distribuidas (i.i.d.), es decir, todas conla misma ley de probabilidad,
X =1
n
n∑
i=1
Xi
y nos dice que, para n grande, la media de v.a. independientes e igualmentedistribuidas es normal, sea cual sea la distribucion de las v.a.De aquı el papel “central” que juega la distribucion normal o de Gauss.
Teorema
Sean X1,X2, . . . ,Xn v.a. i.i.d. con media µ y desviacion tıpica σ (ambasfinitas). Si n es suficientemente grande, se tiene que
X − µ
σ/√n∼ N (0, 1)
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
90
Aproximaciones
Binomial (Teorema de De Moivre-Laplace)
Si X ∼ B(n, p) con n suficientemente grande
X − np√
np(1− p)∼ N (0, 1)
Poisson
Si X ∼ Pois(λ) con λ suficientemente grande
X − λ√λ
∼ N (0, 1)
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
91
TCL y aproximaciones: EjemploSea X ∼ B(100, 1/3). Estimar P(X < 40).
binomial propiedades
Calculamos primero la media y varianza de X .
E (X ) = 100× 1
3= 33.3
var(X ) = 100× 1
3× 2
3= 22.2
D.T .(X ) =√
22.2 = 4.714
Usamos la aproximacion normal
P(X < 40) = P
(
X − 33.3
4.714<
40− 33.3
4.714
)
≈ P (Z < 1.414) ≈ 0.921,
donde Z ∼ N(0, 1).
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
92
Vectores aleatorios
• Concepto de vector aleatorio.
• Vectores aleatorios discretos: distribucion conjunta, distribucionesmarginales, distribuciones condicionadas, independencia.
• Vectores aleatorios continuos: distribucion conjunta, distribucionesmarginales, distribuciones condicionadas, independencia.
• Covarianza, correlacion y esperanza condicionada.
• Algunas propiedades de la esperanza y la varianza
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
93
Concepto de vector aleatorio
¿Que relacion hay entre el precio de las acciones y los tipos de interes?
¿Que relacion hay entre los anos de escolarizacion y el salario medio por hora?
¿Como influye en los habitos de consumo la cantidad de tarjetas de credito de
las que se dispone?
Para contestar a estas preguntas necesitamos estudiar conjuntamente estascaracterısticas, ¿como?
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
94
Concepto de vector aleatorio
Se denomina vector aleatorio (o v.a. multidimensional) a una funcion(X1, . . . ,Xn) : Ω→ R
n, que a cada elemento ei ∈ Ω le asigna un vectornumerico (X1, . . . ,Xn)(ei ) = (X1(e1), . . . ,Xn(ei )) ∈ R
n.
X1(e1), . . . ,Xn(ei ) representan las n caracterısticas que queremos analizarconjuntamente.
Para ganar claridad nos restringiremos al caso n = 2,
Denotaremos los vectores aleatorios por las letras mayusculas (X ,Y ).
Las letras minusculas (x , y) indican el valor concreto que toma el vectoraleatorio cuando se evalua en un punto muestral.
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
95
Vectores aleatorios: tipos
Vector aleatorio discreto
Un vector aleatorio (X ,Y ) es discreto cuando solo puede tomar un numerofinito o numerable de valores.
Vector aleatorio continuo
Un vector aleatorio (X ,Y ) es continuo cuando los posibles valores que puedetomar son todos los puntos de R
2, o del cuadrante [0,+∞)× [0,+∞), o deun cuadrado, o de un triangulo etc.
El conjunto de valores S ⊆ R2 que puede tomar se denomina soporte del
vector aleatorio (X ,Y ).
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
96
Vectores aleatorios: ejemplos
Vectores aleatorios discretos• “numero de 1’s y 2’s obtenidos al lanzar 3 dados”, con soporteS ⊆ 0, 1, 2, 3 × S = 0, 1, 2, 3 finito
• “numero de coches que pasan por cierto peaje en un dıa y dıa de lasemana de que se trata”, con soporte S = 0, 1, 2, . . . × 1, . . . , 7,donde 1 = lunes, . . . , 7 =domingo.
• “numero de tarjetas de credito y numero de compras que se realizan a lasemana”, con soporte S = 0, 1, 2, . . . ,M1 × 0, 1, . . . ,M2
Vectores aleatorios continuos• “altura y peso de una persona”
• “anos de escolarizacion y salario medio por hora de una persona”
• “ındice compuesto S&P 500 (1941-1943=10) y tipo (%) de las Letras delTesoro estadounidense a tres anos en un ano”
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
97
Vectores aleatorios discretos: distribucion conjuntaFuncion de probabilidad (o de masa) conjunta de (X ,Y )Determina el modelo de probabilidad conjunta de un vector aleatorio discreto.Nos da la probabilidad de cada uno de los posibles valores que puede tomar:
p(xi , yj) = P(X = xi ,Y = yj), (xi , yj) ∈ S = x1, . . . , xm × y1, . . . , ynRepresentacion
y1 · · · yj · · · yn
x1...
......
xi · · · · · · P(X = xi ,Y = yj) · · · · · ·...
...
xm...
Propiedades• 0 ≤ p(xi , yj) ≤ 1 para todo i = 1, . . . ,m, j = 1, . . . , n.
•∑m
i=1
∑nj=1 p(xi , yj) = 1.
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
98
Vectores aleatorios discretos: distribucion conjuntaSe clasifica un grupo de 100 ejecutivos de acuerdo a su peso y a si sufren o node hipertension. La tabla muestra el numero de ejecutivos en cada categorıa.
Insuficiente Normal Sobrepeso Total
Hipertenso 2 8 10 20Normal 20 45 15 80
Total 22 53 25 100
• Experimento aleatorio: seleccionar al azar a uno de esos 100 ejecutivospara medir su tension y su peso.
• (X ,Y ) : Ω→ 0, 1 × 0, 1, 2, siendo Ω el conjunto de los 100ejecutivos, definido por
(X ,Y )(ei ) = (0, 0), si el individuo ei es Hipertenso y de peso Insuf.
(X ,Y )(ei ) = (0, 1), si ei es Hipertenso y de peso Normal
(X ,Y )(ei ) = (0, 0), si ei es Hipertenso y tiene Sobrepeso
(X ,Y )(ei ) = (1, 0), si ei tiene la tension Normal y es de peso Insuf.
(X ,Y )(ei ) = (1, 1), si ei tiene la tension Normal y es de peso Normal
(X ,Y )(ei ) = (1, 0), si ei tiene la tension Normal y tiene Sobrepeso
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
99
Vectores aleatorios discretos: distribucion conjunta
La funcion de de probabilidad (o de masa) conjunta es:
X \ Y 0 1 20 0.02 0.08 0.11 0.2 0.45 0.15
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
100
Vectores aleatorios discretos: distribuciones marginales
Las distribuciones marginales de un vector aleatorio (X ,Y ) son las que seobtienen al considerar cada caracterıstica por separado (como si la otra noexistiera). En el caso discreto tenemos:
• Distribucion marginal de X : v.a. discreta con funcion de probabilidad
pX (xi ) = P(X = xi ) =
n∑
j=1
P(xi , yj), i = 1, . . .m
• Distribucion marginal de Y : v.a. discreta con funcion de probabilidad
pY (yj) = P(Y = yj) =
m∑
i=1
P(xi , yj), j = 1, . . . n
Las distribuciones marginales de X e Y son simplemente v.a. unidimensionalesdiscretas. Podemos obtener su media, su varianza, etc.
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
101
Vectores aleatorios discretos: distribuciones marginales
En el ejemplo anterior las distribuciones marginales de X e Y son:
X \ Y 0 1 2 pX0 0.02 0.08 0.1 0.21 0.2 0.45 0.15 0.8
pY 0.22 0.53 0.25
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
102
Vectores aleatorios discretos: distribuciones condicionadas
La distribucion de la v.a. X , condicionada por un valor fijo yj de la v.a. Y talque P(Y = yj) > 0, viene dada por la funcion de probabilidad
P(X = xi |Y = yj) =P(X = xi ,Y = yj)
P(Y = yj)=
p(xi , yj)
pY (yj), i = 1, . . . ,m
La distribucion de Y condicionada por X = xi (con PX (xi ) > 0) se define deforma analoga
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
103
Vectores aleatorios discretos: distribuciones condicionadas
Volviendo al ejemplo:
X \ Y 0 1 2 pX
0 0.02 0.08 0.1 0.21 0.2 0.45 0.15 0.8
pY 0.22 0.53 0.25
• Distribucion de X condicionada a que el individuo tiene sobrepeso:
X 0 1
p(X = xi |Y = 2) 0.10.25 = 0.4 0.15
0.25 = 0.6
• Distribucion de Y condicionada a que el individuo tiene hipertension:
Y 0 1 2
p(Y = xj |X = 0) 0.020.2 = 0.1 0.08
0.2 = 0.4 0.10.2 = 0.5
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
104
Vectores aleatorios discretos: independencia
Intuitivamente: no hay relacion entre X e Y
Definicion: dos variables aleatorias discretas, X e Y , son independientescuando
p(xi , yj) = P(X = xi ,Y = yj) = P(X = xi )P(Y = yj) = pX (xi )pY (yj), ∀i , ∀j
Propiedades: Si X e Y son independientes, las distribuciones condicionadascoinciden con las marginales correspondientes
P(X = xi |Y = yj) =P(X = xi ,Y = yj)
P(Y = yj)=
p(xi , yj)
pY (yj)=
pX (xi )pY (yj)
pY (yj)= pX (xi )
para todo i = 1, . . . ,m, y para todo valor yj con P(Yj = yj) > 0.En el ejemplo, X e Y no son independientes.
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
105
Vectores aleatorios discretos: ejemplo
Lanzamos 3 veces una moneda equilibrada y consideramos el vector aleatorio(X ,Y ) que se obtiene definiendo:X =”numero de caras”Y =”diferencia, en valor absoluto, entre numero de caras y de cruces
• Determina el espacio muestral del experimento y define la aplicacioncorrespondiente al vector aleatorio (X ,Y )
• Calcula la funcion de probabilidad conjunta de (X ,Y )
• Obten las distribuciones marginales a partir de la distribucion conjunta
• Si estamos interesados en conocer la probabilidad de obtener un numerodeterminado de caras cuando la diferencia entre caras y cruces es 1, ¿quedistribucion tenemos que obtener? obtenla.
• ¿Son independientes X e Y ?
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
106
Vectores aleatorios continuos: distribucion conjunta
Funcion de densidad conjunta de (X ,Y )Determina el modelo de probabilidad conjunta de un vector aleatorio continuo.Se trata de una funcion f : R2 → R
2 verificando:
• f (x , y) ≥ 0 para todo (x , y) ∈ R2.
• El volumen total bajo la funcion de densidad es 1:
∫
R2
f (x , y) dx dy =
∫ ∞
−∞
∫ ∞
−∞
f (x , y) dx dy = 1
La probabilidad de cualquier suceso A ⊆ R2 se obtiene resolviendo la integral
correspondiente:
P(A) =
∫
A
f (x , y) dx dy
Nota. No se exigira que se sepan resolver integrales dobles. No se pediracalcular probabilidades de sucesos A en R
2
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
107
Vectores aleatorios continuos: distribuciones marginales
Las distribuciones marginales de un vector aleatorio (X ,Y ) son las que seobtienen al considerar cada caracterıstica por separado (como si la otra noexistiera). En el caso continuo tenemos:
• Distribucion marginal de X : v.a. continua con funcion de densidad
fX (x) =
∫
R
f (x , y)dy , ∀ x ∈ R
• Distribucion marginal de Y : v.a. continua con funcion de densidad
fY (y) =
∫
R
f (x , y)dx , ∀ y ∈ R
Las distribuciones marginales de X e Y son simplemente v.a. unidimensionalescontinuas. Podemos obtener su media, su varianza, etc.
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
108
Vectores aleatorios discretos: distribuciones marginalesNota. Al integrar con respecto a una de las dos variables, la otra actua comouna constante.Sea (X ,Y ) el vector aleatorio con soporte S = [0, 1]× [0, 1] y funcion dedensidad conjunta
f (x , y) =
x + y , si 0 ≤ x ≤ 1, 0 ≤ y ≤ 1,
0, en otro caso.
• La densidad marginal de X es:
fX (x) =
∫ 1
0
(x + y)dy =
[
xy +y2
2
]y=1
y=0
= x +1
2, 0 ≤ x ≤ 1
En la integral anterior x actua como una constante.• La densidad marginal de Y es:
fY (y) =
∫ 1
0
(x + y)dx =
[
x2
2+ xy
]x=1
x=0
=1
2+ y , 0 ≤ y ≤ 1
En la integral anterior y actua como una constante.Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
109
Vectores aleatorios continuos: distribuciones condicionadas
La distribucion de la v.a. X , condicionada por un valor fijo y0 de la v.a. Y talque fY (y0) > 0, viene dada por la funcion de densidad
f (x |Y = y0) =f (x , y0)
fY (y0), ∀x ∈ R
La distribucion de Y condicionada por X = x0 (con fX (x0) > 0) se define deforma analogaVolviendo al ejemplo:
f (x |Y = 0.2) =f (x , 0.2)
fY (0.2)=
x + 0.2
0.7, 0 ≤ x ≤ 1
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
110
Vectores aleatorios discretos: independencia
Intuitivamente: no hay relacion entre X e Y
Definicion: dos variables aleatorias continuas, X e Y , son independientescuando
f (x , y) = fX (x)fY (y), ∀ x ∈ R, y ∈ R
Propiedades: Si X e Y son independientes, las distribuciones condicionadascoinciden con las marginales correspondientes
f (x |Y = y0) =f (x , y0)
fY (y0)= fX (x), ∀ x ∈ R
En el ejemplo, X e Y no son independientes:
f (x , y) = x + y 6= (x +1
2)(1
2+ y)
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
111
Covarianza, correlacion y esperanza condicionadaSe define la covarianza entre X e Y como
Cov(X ,Y ) = σXY = E [(X − E [X ])(Y − E [Y ])] = E [XY ]− E [X ]E [Y ]
• Si X e Y son v.a. discretas, entonces
Cov(X ,Y ) =m∑
i=1
n∑
j=1
(xi − E [X ])(yj − E [Y ])p(xi , yj) =
=m∑
i=1
n∑
j=1
xiyjp(xi , yj)− E [X ]E [Y ]
• Si X e Y son v.a. continuas, entonces
Cov(X ,Y ) =
∫
R2
(x − E [X ])(y − E [Y ])f (x , y) dx dy =
=
∫
R2
xyf (x , y) dx dy − E [X ]E [Y ]
En este caso, no se pedira que se calculen covarianzas, dado que implican laintegracion en R2
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
112
Covarianza, correlacion y esperanza condicionadaLa covarianza es una medida de asociacion lineal
Cuando Cov(X ,Y ) = 0 se dice que X e Y estan incorreladasSean X e Y variables aleatorias, la correlacion entre X e Y es
Cor(X ,Y ) = rxy =Cov(X ,Y )
σxσy
donde σX =√
V (X ) y σY =√
V (Y ) denotan, respectivamente, lasdesviaciones tıpicas de las distribuciones marginales X e Y .Propiedades
• Si X e Y son independientes, entonces X e Y estn incorreladas
• En general, Cov(X ,Y ) = 0 no implica independencia.
• Si X e Y son normales y Cov(X ,Y ) = 0, entonces son independientes
• −1 ≤ Cor(X ,Y ) ≤ 1
• Cor(X ,Y ) > 0 ⇒ las variables son dependientes positivamente
• Cor(X ,Y ) < 0 ⇒ las variables son dependientes negativamente
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
113
Covarianza, correlacion y esperanza condicionadaDado le vector aleatorio (X ,Y ), las variables aleatorias:
• X , condicionada por un valor fijo y0 de la v.a. Y potencialmente
observable
• Y , condicionada por un valor fijo x0 de la v.a. X potencialmente
observable
son variables aleatorias unidimensionales continuas o discretas dependiendo dela naturaleza de X e Y . Podemos calcular sus medias y varianzas.Se define la esperanza condicionada de X a un valor de Y como
E (X |Y = y0) =
∑mi=1 xiP(X = xi |Y = y0), si (X ,Y ) es discreto,
∫
Rxf (x |Y = y0) dx , si (X ,Y ) es continuo
Para cada valor fijo y0 de Y , la esperanza condicionada es un numeroSe puede definir la funcion esperanza condicionada:
E (X |Y ) : Sop(Y ) → R
y0 → E (X |Y = y0)
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
114
Algunas propiedades de la esperanza y la varianza
Como ya vimos en el caso unidimensional, la esperanza de cualquier funciong(X ,Y ) se obtiene como
E [g(X ,Y )] =m∑
i=1
n∑
j=1
g(xi , yj)p(xi , yj) si (X ,Y ) es discreto
E [g(X ,Y )] =
∫
R2
g(x , y) · f (x , y)dxdy si (X ,Y ) es continuo
Ejemplo Esperanza del producto
E [XY ] =
∑mi=1
∑nj=1 xiyjp(xi , yj), si (X ,Y ) es discreto,
∫
R2 xyf (x , y) dx dy , si (X ,Y ) es continuo.
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1
115
Algunas propiedades de la esperanza y la varianza
Esperanza y varianza de funciones lineales
• E [X + Y ] = E [X ] + E [Y ]
• E [X − Y ] = E [X ]− E [Y ]
• V [X ± Y ] = V [X ] + V [Y ]± 2 · Cov(X ,Y )
Si Cov(X ,Y ) = 0V [X ± Y ] = V [X ] + V [Y ]
• E [X1 + X2 + . . .+ Xn] = E [X1] + E [X2] + . . .+ E [Xn]
• V [X1 + X2 + . . .+ Xn] = V [X1] + V [X2] + . . .+ V [Xn]
si la covarianza entre cada par de variables es 0
Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1