Probabilidad IITema 1: Espacios de probabilidad
Jose R. Berrendero
Departamento de MatematicasUniversidad Autonoma de Madrid
Estructura de este tema
Algebras, σ-algebras.
Espacios de probabilidad.
Propiedades elementales.
Lımites de sucesiones de conjuntos.
π-sistemas, λ-sistemas. Teorema de Dynkin.
Funcion de distribucion.
Probabilidad condicionada.
Variables y vectores aleatorios.
σ-algebra generada por una variable aleatoria.
σ-algebras
Sea Ω un conjunto no vacıo.
Un algebra F es una clase de subconjuntos de Ω que verifica
Ω ∈ F .
Si A ∈ F , entonces Ac ∈ F , donde Ac := Ω− A.
Si A,B ∈ F , entonces A ∪ B ∈ F .
Una σ-algebra F es una clase de subconjuntos de Ω que verifica
Ω ∈ F .
Si A ∈ F , entonces Ac ∈ F .
Si An ∈ F , n ≥ 1, entonces ∪∞n=1An ∈ F .
σ-algebras
Ejemplos
El conjunto de las partes de Ω, F = P(Ω).
F = ∅,Ω.F = ∅,Ω,A,Ac, donde A ⊂ Ω.
F = A ⊂ R : A numerable⋃A ⊂ R : Ac numerable.
Observacion: La interseccion de σ-algebras es una σ-algebra. En generalla union de σ-algebras no es una σ-algebra.
σ-algebra generada por una clase de conjuntosSea C ⊂ P(Ω). Se define la σ-algebra generada por C como la interseccionde todas las σ-algebras que contienen a C (la “mınima” σ-algebra quecontiene a C).
σ-algebra de Borel
σ-algebra de BorelSea (Ω, τ) un espacio topologico. La σ-algebra de Borel B := B(Ω) es lagenerada por los conjuntos abiertos de Ω.
σ-algebra de Borel en R
B(R) =σ((a, b], a, b ∈ R) = σ((a, b), a, b ∈ R) = σ([a, b), a, b ∈ R)
=σ((−∞, b], b ∈ R) = σ((−∞, b), b ∈ R)
=σ((a,∞], a ∈ R) = σ([a,∞), a ∈ R).
Espacio de probabilidad
Un espacio de probabilidad es una terna (Ω,F ,P), donde Ω es unconjunto no vacıo, F es una σ-algebra de subconjuntos de Ω y P es unamedida de probabilidad sobre F , es decir, P : F → [0, 1] tal que
P(Ω) = 1.
Si A1,A2, . . . son sucesos en F tales que Ai ∩Aj = ∅ si i 6= j , entonces
P
( ∞⋃n=1
An
)=∞∑n=1
P(An).
Propiedades elementales
Paso al complementario: P(Ac) = 1− P(A).
Probabilidad del vacıo: P(∅) = 0.
Monotonıa: Si A ⊂ B, entonces P(A) ≤ P(B).
Subaditividad:
P
( ∞⋃n=1
An
)≤∞∑n=1
P(An).
Formula de inclusion-exclusion:
P
(n⋃
i=1
Ai
)=
n∑i=1
P(Ai )−∑i<j
P(Ai ∩ Aj)
+∑
i<j<k
P(Ai ∩ Aj ∩ Ak)− · · ·+ (−1)n+1P(A1 ∩ · · · ∩ An).
Lımites de sucesiones de conjuntos
Lımite inferior de una sucesion de conjuntos:
lim inf An =∞⋃n=1
∞⋂k=n
Ak .
Lımite superior de una sucesion de conjuntos:
lim supAn =∞⋂n=1
∞⋃k=n
Ak .
Comprueba lim inf An ⊂ lim supAn.
Expresa de forma alternativa (lim inf An)c y (lim supAn)c .
Lımites de sucesiones de conjuntos
Lımite de una sucesion de conjuntosLa sucesion An tiene lımite A (An → A) si lim inf An = lim supAn = A.
Lımites de sucesiones monotonas
Si A1 ⊂ A2 ⊂ · · · , entonces An ↑ A = ∪∞n=1An.
Si A1 ⊃ A2 ⊃ · · · , entonces An ↓ A = ∩∞n=1An.
Continuidad para sucesiones monotonasSi An ↑ A, entonces P(An) ↑ P(A). Si An ↓ A, entonces P(An) ↓ P(A).
Relacion entre la probabilidad del lımite inferior y superior
P(lim inf An) ≤ lim inf P(An) ≤ lim sup P(An) ≤ P(lim supAn).
ContinuidadSi An → A, entonces P(An)→ P(A).
π-sistemas y λ-sistemas
Un π-sistema C es una clase de subconjuntos de Ω tal que si A,B ∈ C,entonces A ∩ B ∈ C.
Un λ-sistema es una clase L de subconjuntos de Ω tal que:(a) Ω ∈ L, (b) si A ∈ L, entonces Ac ∈ L, (c) si An ∈ L, n ≥ 1, yAi ∩ Aj = ∅ para i 6= j , entonces ∪∞n=1An ∈ L.
Observaciones
Un algebra es un π-sistema.
Una σ-algebra es un λ-sistema.
C es una σ-algebra si y solo si C es π-sistema y λ-sistema.
Teorema de Dynkin
Teorema de DynkinSea C un π-sistema y L un λ-sistema. Si C ⊂ L entonces σ(C) ⊂ L.
Aplicacion habitual de este teoremaSupongamos que L contiene los conjuntos que satisfacen cierta propiedad.Para demostrar que la propiedad se cumple para todos los conjuntos deuna σ-algebra (σ(C) ⊂ L) basta probarla para los conjuntos de unπ-sistema que la genera (C ⊂ L).
Teorema de Dynkin: esquema de la demostracion
Basta demostrar que el mınimo λ-sistema que contiene a C, λ(C), esun π-sistema.
Dado A ⊂ Ω, definimos GA := B ⊂ Ω : A ∩ B ∈ λ(C).
Si A ∈ λ(C), entonces GA es λ-sistema.
Si A ∈ C, entonces λ(C) ⊂ GA. Para esto basta ver que C ⊂ GA.(Por tanto, si A ∈ C y B ∈ λ(C), entonces A ∩ B ∈ λ(C)).
Cambiando los papeles de A y B tenemos que si A ∈ λ(C), entoncesC ⊂ GA. Como consecuencia, λ(C) ⊂ GA y hemos terminado.
Funcion de distribucion
Sea P una medida de probabilidad sobre (R,B), donde B es la σ-algebrade Borel. La funcion de distribucion F : R→ [0, 1] correspondiente a Pse define como
F (x) = P((−∞, x ]), x ∈ R.
Observaciones
(a) Una funcion de distribucion F tiene las tres propiedades siguientes:
Es continua por la derecha.Es monotona no decreciente.F (∞) := limx→∞ F (x) = 1; F (−∞) := limx→−∞ F (x) = 0.
(b) Si F es una funcion de distribucion, Cont(F )c es numerable, dondeCont(F ) es el conjunto de puntos en los que F es continua.
(c) Si F1 y F2 son dos funciones de distribucion tales que F1(x) = F2(x),para todo x ∈ Cont(F1) ∩ Cont(F2), entonces F1(x) = F2(x), paratodo x ∈ R.
Extension de medidas
TeoremaSea F : R→ [0, 1] una funcion continua por la derecha, monotona nodecreciente, con F (∞) = 1, F (−∞) = 0. DefinamosP((a, b]) = F (b)− F (a), para a < b. Existe una unica medida deprobabilidad que extiende P a B(R).
Teorema de extension de CaratheodorySea µ una medida σ-finita sobre un algebra F0 ⊂ P(Ω). Entonces existeuna extension unica de µ a la σ-algebra F generada por F0.
La unicidad se puede deducir directamente de:TeoremaSean P1 y P2 medidas de probabilidad sobre σ(C), donde C es unπ-sistema. Si P1(A) = P2(A) para todo A ∈ C, entonces P1(A) = P2(A)para todo A ∈ σ(C).
Probabilidad condicionada
Sea (Ω,F ,P) un espacio de probabilidad y A, B ∈ F con P(B) > 0.
Se llama probabilidad de A condicionada a B a
P(A|B) :=P(A ∩ B)
P(B).
La aplicacion:
P(·|B) : F −→ [0, 1]
A 7−→ P(A|B)
es una medida de probabilidad sobre (Ω,F).
Probabilidad condicionada
Formula del productoSi A1, . . . ,An ∈ F con P(A1 ∩ · · · ∩ An) > 0, se tiene
P(A1 ∩ · · · ∩ An) = P(A1)P(A2|A1)P(A3|A1 ∩ A2) · · ·P(An|A1 ∩ · · · ∩ An−1).
Una coleccion de sucesos disjuntos Ai∞i=1 ⊂ F es una particion de Ω si:
(a) P(Ai ) > 0, i ≥ 1.
(b) Ω = ∪∞i=1Ai .
Formula de la probabilidad totalSea (Ω,F ,P) un espacio de probabilidad y Ai∞i=1 ⊂ F una particion.Entonces, para cualquier B ∈ F ,
P(B) =∞∑i=1
P(Ai )P(B|Ai ).
Probabilidad condicionada
Formula de BayesSea (Ω,F ,P) un espacio de probabilidad, Ai∞i=1 ⊂ F una particion yB ∈ F con P(B) > 0, entonces
P(Aj |B) =P(Aj)P(B|Aj)∑∞i=1 P(Ai )P(B|Ai )
.
P(An) se llaman probabilidades a prioriP(An|B) se llaman probabilidades a posteriori
Variables aleatorias
Una variable aleatoria sobre un espacio de probabilidad (Ω,F ,P) es unafuncion X : Ω→ R medible respecto a F y la σ-algebra de Borel B(R).
X−1(B) ∈ F , para todo B ∈ B(R).
Intuitivamente, X (ω) representa una cantidad numerica relacionadacon el resultado ω ∈ Ω de un experimento aleatorio.
Queremos calcular probabilidades de sucesos de la forma
a < X ≤ b := ω : a < X (ω) ≤ b = X−1(a, b].
Es necesario X−1(a, b] ∈ F , para todo a, b ∈ R, lo que implicaX−1(B) ∈ F para todo B ∈ B(R).
A veces hace falta considerar v.a. extendidas X : Ω→ R, dondeR = [−∞,∞]. Aquı, B(R) es generada por intervalos (a, b], con−∞ ≤ a < b ≤ ∞ y [−∞, b], con −∞ ≤ b ≤ ∞.
Distribucion inducida por una v.a.
Una variable aleatoria X induce una medida de probabilidad PX sobre(R,B):
PX (B) := P(X ∈ B) = Pω : X (ω) ∈ B, B ∈ B.
Es facil comprobar que PX es en efecto una medida de probabilidadsobre (R,B).
La funcion de distribucion de una v.a. X es la funcion de distribucionde la medida de probabilidad PX :
FX (x) = PX ((−∞, x ]) = P(X ≤ x), x ∈ R.
Dada una funcion F monotona no decreciente y continua por laderecha con F (∞) = 1 y F (−∞) = 0, siempre existe una v.a. X talque F = FX .
Observaciones
Si X1, . . . ,Xn son v.a. y g : Rn → R es medible (Borel), entoncesg(X1, . . . ,Xn) es una v.a. Por ejemplo: X1 + . . .+ Xn es una v.a.
Si X1,X2, · · · son v.a. entonces supn Xn e infn Xn son v.a.
Si X1,X2, · · · son v.a. entonces lim supn Xn y lim infn Xn son v.a.
Si X1,X2, · · · son v.a. tales que Xn(ω) converge para todo ω ∈ Ω,entonces limn Xn es una v.a.
Algunos tipos de variables aleatorias
(1) Una v.a. X es degenerada en c ∈ R si P(X = c) = 1. ¿Cual es sufuncion de distribucion?
(2) Una v.a. X es discreta si el conjunto de valores que toma X es finitoo numerable.
(3) Una v.a. X es absolutamente continua si existe una funcion medible(Borel) y no negativa f : R→ R tal que FX (x) =
∫ x−∞ f (t)dt. Se
dice que f es la funcion de densidad de X . Se verifica:∫∞−∞ f (t)dt = 1.
P(X ∈ B) =∫Bf (t)dt, para todo B ∈ B.
(4) Una v.a. X es singular si existe B ∈ B tal que λ(B) = 0 yPX (B) = 1, donde λ es la medida de Lebesgue.
Vectores aleatorios
Un vector aleatorio sobre un espacio de probabilidad (Ω,F ,P) es unafuncion X : Ω→ Rn medible respecto a F y la σ-algebra de Borel B(Rn).
ObservacionX = (X1, . . . ,Xn) es un vector aleatorio si y solo si Xi es una variablealeatoria para todo i = 1, . . . , n.
Distribucion y funcion de distribucion de un vector aleatorioDistribucion:
PX (B) := P(X ∈ B) = Pω : X (ω) ∈ B, B ∈ B(Rn).
Funcion de distribucion: F : Rn → R tal que
FX (x) = F (x1, . . . , xn) := P(Xi ≤ xi , i = 1, . . . , n).
Las funciones de distribucion de las v.a. Xi , i = 1, . . . , n se llamanfunciones de distribucion marginales.
Vectores aleatorios absolutamente continuos
Una vector aleatorio X es absolutamente continuo si existe una funcionmedible (Borel) y no negativa f : Rn → R tal que
FX (x1, . . . , xn) =
∫ xn
−∞· · ·∫ x1
−∞f (t1, . . . , tn)dt1 · · · dtn.
Se dice que f es la funcion de densidad de X . Se verifica:
P(X ∈ B) =
∫Bf (t1, . . . , tn)dt1 · · · dtn, para todo B ∈ B(Rn).
σ-algebra generada por una variable aleatoria
Sea X : (Ω,F)→ (R,B) una v.a. La clase de conjuntos
σ(X ) := X−1(B) : B ∈ B
es una sub σ-algebra de F denominada σ-algebra generada por X .
σ(X ) es la mınima σ-algebra que hace medible a X .
Determina σ(X ) para las siguientes v.a.:
X (ω) = a para todo ω ∈ Ω.
X = IA, donde A ∈ F .
X es una v.a. simple, es decir, X toma un numero finito de valoresa1, . . . , ak ⊂ R.
σ-algebra generada por una variable aleatoria
Intuitivamente, σ(X ) recoge la informacion que se obtiene al observar lav.a. X .
Dada una familia de v.a. Xi : i ∈ I, se define σ(Xi , i ∈ I ) como lamınima σ-algebra que hace medibles a todas las Xi simultaneamente, esdecir,
σ(Xi , i ∈ I ) := σ
(⋃i∈Iσ(Xi )
).
Un proceso en un intervalo de tiempo [0,T ], determina una familia de v.a.Xt : t ∈ [0,T ]. Entonces, σ(Xt , t ∈ [0,T ]) representa la informacionobtenida al observar el proceso.
σ-algebra generada por una variable aleatoria
ProposicionSi X es una v.a. y C es una clase de subconjuntos de R
X−1[σ(C)] = σ[X−1(C)].
Demostracion:
X−1[σ(C)] ⊃ σ[X−1(C)] ya que X−1[σ(C)] es σ-algebra que contienea X−1(C).
A = B ⊂ R : X−1(B) ∈ σ[X−1(C)] es una σ-algebra tal queC ⊂ A. Por tanto σ(C) ⊂ A.
Esta inclusion implica X−1[σ(C)] ⊂ σ[X−1(C)] por definicion de A.
Corolarioσ(X ) = σ(X ≤ x : x ∈ R) = σ(X−1((−∞, x ]) : x ∈ R).