Tema 2: VARIABLE ALEATORIA UNIDIMENSIONAL
Carlos Alberola López
Lab. Procesado de Imagen, ETSI Telecomunicación
Despacho 2D014
[email protected], [email protected],http://www.lpi.tel.uva.es/sar
Concepto de VA unidimensional• Supóngase que se envía una señal pulsada de
dos posibles valores ( voltios) y se mide la tensión recibida cada cierto tiempo.
• Si la señal es como la de la figura adjunta, nuestras lectura serán números que responden a fenómenos aleatorios, de forma que lo normal es que no coincidan con los valores que cabría esperar.
• Tales números constituyen los valores que puede tomar la variable aleatoria tensión observada.
• Las conclusiones a las que podremos llegar en relación con tales variables serán sólo probabilísticas.
1±
Concepto de VA unidimensional• Una VA se define formalmente mediante la aplicación
donde asumiremos que se cumplen dos condiciones:
1.
2.
• No escribiremos la dependencia explícita con el resultado del experimento aleatorio
• Emplearemos letras mayúsculas para denotar las variables y letras minúsculas para denotar valores particulares que puedan tomar éstas.
( ) RaSaRS∈→∈
→
XX :
Sa∈
Concepto de VA unidimensional• Distinguiremos tres tipos de VAs
1. Discretas: los valores que toman se pueden indexar mediante un índice entero.
2. Continuas: los valores que toman pertenecen a un rango continuo.
3. Mixtas: se mezclan ambas tipos de comportamiento.
Caracterización de VA unidimensional
• La caracterización de una VA consiste en la información necesaria para poder hacer cálculos probabilísticos sobre los valores de la misma.
• La caracterización de una VA es pues el enunciado de la ley de asignación de probabilidades a los valores de la misma.
• Esta caracterización se puede realizar de forma unificada para todo tipo de variables.
• No obstante es mucho más sencillo considerar casos separados según el tipo de VA.
• Caso de VAs discretas. Necesitamos conocer:
1. Los valores que pueden tomar.
2. Las probabilidades
Por ejemplo: VA X que pueden tomar cualquier valor entero con probabilidad pi. Calcular probabilidad de que tome valores entre -2 y 2 (ambos incluidos)
( )ii xPp == Xix
Caracterización de VA unidimensional
• Caso de VAs continuas: Función de distribución. Se define de la forma
un ejemplo de la cual sería
Caracterización de VA unidimensional
• Comportamiento por la izquierda:
• Comportamiento por la derecha
• Función acotada
• Función no decreciente:
Por este motivo a esta función se le denomina también función de probabilidad acumulada (o cdf de cumulative distribution function)
Función de distribución. Propiedades
pues
si ya que
• Uso adicional de la función de distribución:
• Podemos escribir el suceso
• Entonces
• Por lo que
• Así pues un intervalo donde esta función es constante es un intervalo de probabilidad nula.
Función de distribución
• Finalmente, podemos escribir:
• Lo cual lleva a
Función de distribución
a b c
ap
bp
cpba pp +
cba ppp ++1
( )xFX
x
Función de distribución: variables discretas• Suponer X variable
discreta que puede tomar los valores a, b y c con probabilidades respectivas pa, pb y pc.
• Calculamos su función de distribución dando respuesta a la probabilidad
( ) ( )xPxF ≤= XX
• Luego esta expresión se puede escribir:
• Y por tanto NO ES INFORMATIVA pues no añade nada con respecto a lo que ya sabíamos. Simplemente es introducir la información de partida en una estructura de funciones escalón.
• El caso general sería
Función de distribución: variables discretas
• Este tipo de variables presentan comportamientos continuos y discretos.
• Este hecho debe reflejarse en la función de distribución, la cual debe una cantidad numerable de discontinuidades finitas. Por ejemplo:
Función de distribución: variables mixtas
Función de distribución: discontinuidades
a b c
ap
bp
cpba pp +
cba ppp ++1
( )xFX
x
• Valor que toma la función en un punto: valor que toma a su inmediatamente a su derecha
Función de distribución: discontinuidades
a b c
ap
bp
cpba pp +
cba ppp ++1
( )xFX
x
• Probabilidad asociada a un valor concreto:
• Zona continua: prob. nula de esos valores.
0x
Función de distribución: discontinuidades
a b c
ap
bp
cpba pp +
cba ppp ++1
( )xFX
x
• Probabilidad asociada a un valor concreto:
• Zona continua: prob. nula de esos valores.
• Probabilidad en puntos de discontinuidad: altura de discontinuidad
Función de distribución: VA continua
1
( )xFX
x
• Probabilidad asociada a un valor concreto:
• En una VA continua todos sus valores tienen probabilidad nula.
• Sólo tiene sentido hablar pues de intervalos de valores de la variable.
Función de densidad de probabilidad
• Se define a partir de la función de distribución
• Ello lleva a:
Función de densidad de probabilidad
• Esta función debe cumplir varias propiedades:
• Ser no negativa pues
• El área bajo ella deber ser unitaria pues
• La probabilidad en un intervalo es sencilla de calcular:
dxxfxdFxx
∫∫ ∞−∞−= )()( XX dxxfxdF
x
x
x
x ∫∫ =2
1
2
1
)()( XX
( )2112 )()( xxPxFxF ≤<=− XXX dxxfx
x∫=2
1
)(X
Función de densidad de probabilidad
• ¿Por qué motivo recibe este nombre?:
• Podemos escribir
• Y dado que la derivada es el límite de un cociente incremental
• Por ello, esta función es el cociente entre la probabilidad de un intervalo y su longitud, cuando ésta tiende a cero. Es pues, dimensionalmente, una densidad de probabilidad (prob/longitud)
Función de densidad de probabilidad
• ¿Qué sucede con las variables discretas y mixtas?:
• Recordemos que cada punto de probabilidad no nula venía acompañado de una discontinuidad en la función de distribución:
• Por ello, su derivada presentará impulsos en aquellos lugares donde tengamos una discontinuidad:
Algunos ejemplos de Vas (1: Continuas)
• Variable Uniforme
( )xfX
xba
k ab−=
1
Algunos ejemplos de Vas (1: Continuas)
( )xfX
xba
( ) dxxfdxxxP )(XX =+≤<
1x 2x 3x 4x
( )abxxdxxfxxP
x
x −−
==≤< ∫ 1221
2
1
)(XX
( )abxxdxxfxxP
x
x −−
==≤< ∫ 3443
4
3
)(XX
ab −=
Δ
ab −=
Δ
Δ Δk ab−=
1
TODOS LOS “PUNTOS” EN SON EQUIPROBABLES ( )ba,
Algunos ejemplos de Vas (1: Continuas)
• Función de distribución:
( )xFX
xba
( ) ( ) ττ dfxFx
∫∞−
= XX
axdx
<== ∫∞−
,00 τ
bxaabaxd
ab
x
a
<≤−−
=−
= ∫ ,1 τ
bxababd
ab
b
a
≥=−−
=−
= ∫ ,11 τ
Algunos ejemplos de Vas (1: Continuas)
• Variable Gaussiana
Algunos ejemplos de Vas (1: Continuas)
• Influencia del segundo parámetro
Algunos ejemplos de Vas (1: Continuas)• Función de distribución
Algunos ejemplos de Vas (1: Continuas)
• Uso práctico de la Función de distribución:
• La integral no tiene primitiva. Debe pues acudirse a integración numérica o bien emplear como soporte otras funciones más comunes (función erf, por ejemplo).
• Lo normal para trabajar con “lápiz y papel” es acudir a tablas.
• Las tablas, típicamente:
• Se dan sólo para variables normal estándar (a=0, b=1)
• Se dan sólo para abscisas no negativas.
• ¿Cómo conseguir generalidad en las mismas?
Algunos ejemplos de Vas (1: Continuas)
• Partimos de:
• Y buscamos:
• Si hacemos el cambio
• Llegamos a:
ba−
=τα
( ) ( )⇒>=−≤ xXPxXP
• Por otra parte dada la simetría de la función de densidad de la normal estándar respecto de x=0, se verifica que:
( ) ( )xGxG −=− 1
Algunos ejemplos de Vas (1: Continuas)
Algunos ejemplos de Vas (1: Continuas)
• Variable exponencial
( )xfX
x
( ) 0,)( >= − λλ λ xuexf xX
Algunos ejemplos de Vas (2: Discretas)
• Variable de Bernoulli
(de parámetro p)
• Variable Binomial
(de parámetros N y p)
• Variable de Poisson
(de parámetro a)
• Variable geométrica
(de parámetro p)
( )( )⎩
⎨⎧
==
===
pPqP
1100
XX
X
( )⎪⎩
⎪⎨⎧
⎟⎟⎠
⎞⎜⎜⎝
⎛==
== −kNkqp
kN
kP
Nkk
XX,,2,1,0 L
( )⎪⎩
⎪⎨⎧
==
≥= −
!
0
kaekP
kkk
aXX
( )⎩⎨⎧
==
≥=
pqkPkk
kXX
0
( )pN,B~X
Funciones condicionadas
• Se plantea cómo incluir más información en las funciones de caracterización total de las variables aleatorias una vez que se sabe que un determinado suceso se ha verificado.
• A tales funciones se les denomina funciones condicionadas, y se representan:
donde B es un suceso de probabilidad no nula.
( )( )Bxf
BxF
X
X
Funciones condicionadas
• Las funciones se definen de forma coherente con lo ya conocido. En concreto:
• La función de distribución es una probabilidad, luego la función de distribución condicionada es una probabilidad condicionada.
• La función de densidad es la derivada de la función de distribución, luego sucede lo propio con la función de densidad condicionada:
Funciones condicionadas
• Ejemplo: ; hallar { }baB ≤<= X ( ) ( )( )BP
BxPBxF I≤=
XX
{ } ∅=≤ Bx IX{ } { }xaBx ≤<=≤ XX I
xba
( )BxFX
{ } BBx =≤ IX
Funciones condicionadasFunciones condicionadas
• Entonces: { }baB ≤<= X
{ } ∅=≤ Bx IX{ } { }xaBx ≤<=≤ XX I
xba
( )BxFX
{ } BBx =≤ IX
Teoremas de la Prob. Total y Bayes
• Si los sucesos Ai constituyen una partición del espacio muestral, recordando el Teorema de la Probabilidad Total
podemos escribir: (haciendo que )
y derivando
{ }xB ≤= X
0H
1H
0a
1a
X( )00H
b,aN~0
X
( )11Hb,aN~
1X
Teoremas de la Prob. Total y Bayes
0H
1H
0a
1a
X( )00H
b,aN~0
X
( )11Hb,aN~
1X
Teoremas de la Prob. Total y Bayes
30 −=a 31 =a
• Recordando que
y que
y definiendo , entonces
es decir
expresión del Teorema de Bayes
Teoremas de la Prob. Total y Bayes
{ }xB ≤= X
( ) { }( )( )
( ) ( )( )xP
APAxPxP
xAPxAP iiii ≤
≤=
≤≤
=≤X
XX
XX I
Caso de partición continua• Si ahora hacemos que
entonces
Con el objetivo de calcular un límite de un cociente incremental renombremos
y obtenemos
{ }21 xxB ≤<= X
xxxxx
Δ+=
=
2
1
Caso de partición continua• Si ahora convertimos esta expresión
en un cociente de cocientes incrementales
al calcular el límite llegamos a
Caso de partición continua• Hemos obtenido pues que
Si pasamos el denominador al primer miembro tenemos
e integrando
expresión del Teorema de la Probabilidad Total para partición continua.
( ) ( )( ) ( )APxfAxf
xAPX
XX ==
Ejemplo:
0H
1H
0a
1a
X( )00H
b,aN~0
X
( )11Hb,aN~
1X
• Supongamos que se observa el valor x=0.5; se pide que se indique qué símbolo de los dos es más probable que haya sido enviado en estas circunstancias.
30 −=a 31 =a
Caracterización parcial de VA• Las funciones de densidad o distribución constituyen la
fuente de caracterización total de una VA.
• Sin embargo, en un problema real para poder aproximar estas funciones hace falta un número elevado de observaciones de la variable en cuestión.
• Existen otros parámetros de caracterización de las Vas
• Tales parámetros no permiten calcular probabilidades, pero proporcionan una idea aproximada de cómo se comportan las variables. En particular:
• Alrededor de qué valor se obtienen observaciones de la VA.Tal valor es el valor medio.
• Qué dispersión tienen las observaciones de la VA alrededor de ese valor. La dispersión se cuantifica a través de la desviación típica y/o la varianza.
Media de una VA• Mide el valor promedio.
• Por ejemplo, el valor medio de un expediente académico no caracteriza completamente un alumno, pero da una idea de su rendimiento académico.
• ¿Cómo se calcula? Como la suma de todas las notas dividida por el número de ellas.
• Esto sería una media aritmética.
• Si se quiere dar más peso a calificaciones de asignaturas de más créditos se multiplicaría cada nota por el número de créditos de la asignatura y se dividiría por el número total de créditos cursados.
• Eso sería una media ponderada.
Media de una VA• Supongamos que X es una VA discreta. Su media se
define como media ponderada de los valores que puede tomar esta VA.
• Supongamos que:
• El valor medio se define como:
• Y se denota de la forma
( )⎩⎨⎧
==→
ii
i
xPpx
XX
( ) ii
iii
i pxxPx ∑∑ ==X
ii
i px∑=Xη
Media de una VA• El operador para el cálculo de la media en un caso
general se llama operador esperanza matemática (o, simplemente, esperanza) aplicado sobre los valores de la VA. Así pues, para un caso general:
• Si X es discreta su función de densidad es
por lo que
{ } ( )dxxfxE XX X ∫∞
∞−==η
Moda y mediana de una VA• La moda de una VA se define como la abscisa donde la
función de densidad es máxima, esto es
• La mediana se define como aquella abscisa que deja a su izquierda la misma probabilidad que deja a su derecha, es decir
Moda y mediana de una VA• La moda de una VA se define como la abscisa donde la
función de densidad es máxima, esto es
• La mediana se define como aquella abscisa que deja a su izquierda la misma probabilidad que deja a su derecha, es decir
MODAx MEx
Varianza de una VA• Se trata de medir dispersión con respecto de la media.
• La dispersión se puede definir como
• No obstante si se calcula la esperanza de la dispersión (esto, es la dispersión promedio) resulta:
XX η−
{ } ( ) ( )( ) ( )
{ } ( )0=−=
−=
−=
−=−
∫∫ ∫∫
XX
XX
XXX
XXX
X
X
ηηη
η
ηη
dxxfE
dxxfdxxxf
dxxfxE
Varianza de una VA• Por este motivo se trabaja con las dispersiones
cuadráticas con respecto de la media, es decir.
• y de esa magnitud se calcula su esperanza, dando lugar a la varianza de X:
• La desviación típica se define como la raíz cuadrada (con signo positivo) de la varianza:
( )2XX η−
( ){ } ( ) ( )∫ −=−= dxxfxE XXXX X 222 ηησ
( ) 2XX σσ +=
Varianza de una VA• El operador esperanza matemática es un operador
lineal dado que es la integral de una función (el argumento del operador esperanza) multiplicada por la función de densidad de la variable. Ello permite escribir:
• La magnitud se denomina valor cuadrático medio de la VA X.
{ }2XE
Varianza de una VA• Para el caso de una variable discreta la varianza se
define de la misma manera, esto es, como el promedio ponderado de la desviaciones cuadráticas con respecto a la media. Esto se traduce en:
y si operamos a partir de aquí obtenemos
con el VCM de la VA discreta. { } ∑=i
ipxE 21
2X
Varianza de una VA• ¿Cuál sería la media y la varianza de una constante?
• Una constante es una VA (digamos X) degenerada que sólo puede tomar un valor (el suyo) con probabilidad 1.
• Por ello si la constante es igual a podemos escribir
y
Es decir, una constante es un caso particular de VA con media igual a la constante y varianza nula.
a
aapx ii
i =⋅== ∑ 1Xη
( ) ( ) 01222 =⋅−=−= ∑ aapx ii
i XX ησ
Desigualdad de Tchebycheff• Imaginemos que NO conocemos la función de densidad
de una VA pero que nos interesaría tener una aproximación a la probabilidad de un determinado suceso de esa variable, en concreto:
es decir
Desigualdad de Tchebycheff• Podemos obtener una COTA a dicha probabilidad con
sólo la varianza. Para ello, partimos de la definición de varianza
y aproximamos
¿Cómo es la cota provista?
• Es una cota bastante conservadora, es decir, no aquilata mucho los valores.
• Supongamos que . Si nos interesa un radio igual a el cálculo exacto sería
• Y la cota sería:
( )ση,N~Xσε 3=
Transformación de VA• Recordemos cómo se definía una VA
• Ahora definimos una función sobre la misma
• Por lo que el resultado neto es
• Objetivo: caracterizar Y a partir de la caracterización de X (y de la transformación, naturalmente).
Transformación de VA: caso discreto• Suponer X discreta que pueda tomar los valores xi,
i=1,…,5.
• Suponer transformación Y=g(X)
• El objetivo es caracterizar la VA destino Y.
• La mecánica para llevar esto a cabo es una simple inspección y un recuento de posibilidades.
• Hay que ver qué valores yiresultan de la transformación.
• Y qué valores xi se transforman en cada yi.
Transformación de VA: caso discreto
Caso general: obtención de • Suponer X continua; la figura muestra Y=g(X)
• Se trata de caracterizar Y a partir de la función de distribución de X.
• El procedimiento consiste en barrer el eje vertical e ir dando solución a la probabilidad del suceso para cada valor de y bajo estudio.
( )yFY
{ }y≤Yy
Caso general: obtención de ( )yFY
minyy <
y
( ) 0=yFY
y
maxyy > ( ) 1=yFY
Caso general: obtención de ( )xFX
2y
{ } { }22 xy >=≤ XY ( ) ( ) ( ) ( )2222 1 xFxPyPyF XY XY −=>=≤=
Caso general: obtención de ( )xFX
1y
{ } { } { }1312111 xxxy ><≤=≤ XXY U( ) ( ) ( )
( ) ( ) ( )131112
1312111
1 xFxFxFxPxxPyF
XXX
Y XX−+−=
>+<≤=
( )xfX
x
21
−21
x
( )xgy =
1x 2x
y( ) ( )21 xxPyP ≤<=≤ XY
( ) ( )yyPyP ≤<−=≤ XY
41
Casos particulares de importancia
{ } { }211 xxy ≤<== XY
( ) ( ) ( )121 xFxFyP XXY −==
VARIABLE MIXTA!!!!
Casos particulares de importancia
VARIABLE DISCRETA!!!!
Casos particulares de importancia
ZONA DE PROBABILIDAD NULA!!!!
Teorema Fundamental • Se trata de obtener ahora de forma directa la función de
densidad de la variable Y
• Esto se hace a través de una expresión cerrada conocida como el Teorema Fundamental.
{ } 321 RRRdyyy UU=+≤< Y
3R2R1R
Teorema Fundamental
{ }( )
UyN
iiRdyyy
1=
=+≤< Y
3R2R1R
( ) ( ) ( )( )
∑=
==+≤<yN
iii dxxfdyyfdyyyP
1XYY
• Retomando la expresión
Si ahora despejamos obtenemos
Teorema Fundamental
( ) ( ) ( )( )
∑=
==+≤<yN
iii dxxfdyyfdyyyP
1XYY
( ) ( )( )
∑=
=yN
i
ii dy
dxxfyf
1XY
( ) ( )( ) ( )( )
ixx
yN
i
yN
i
i
i
dxdy
xf
dxdy
xfyf
=
==∑∑ ==
11
XXY
( )( )
( )
ixx
yN
i xgxf
==∑=
1 'X
• El teorema, por tanto dice que:
lo cual significa que:
1. Podemos obtener la fdp de Y en base a la superposición de N(y) contribuciones.
2. Debe expresarse tal función en términos de y, no de x, luego se tendrá que invertir la función y=g(x).
3. Debe indicarse los rangos de validez de las expresiones.
4. Debe emplearse el teorema sólo para variables continuas (o para mixtas, en su zona de comportamiento continuo) y para funciones derivables.
Teorema Fundamental
( ) ( )( )
( )
ixx
yN
i xgxfyf
==∑=
1 'X
Y
( )xfX
x
21
−21
x
( )xgy =
1x2x
y41
Casos particulares de importancia
{ } { }211 xxy <≤== XY
( ) ( ) ( )121 xFxFyP XXY −==
VARIABLE MIXTA!!!!
Casos particulares de importancia
TEOREMA FUNDAMENTAL
( ) ( )yhyf =Y ( ) ( )11 yyyP −=+ δY
Casos particulares de importancia
VARIABLE DISCRETA!!!!
Casos particulares de importancia
( ) ( ) ( ) ( ) ( ) ( ) ( )332211 yyyPyyyPyyyPyf −=+−=+−== δδδ YYYY
( ) ( )11 xPyP ≤== XY ( ) ( )212 xxPyP ≤<== XY ( ) ( )23 xPyP >== XY
Casos particulares de importancia
ZONA DE PROBABILIDAD NULA!!!!
Casos particulares de importancia
TEOREMA FUNDAMENTAL
( )yfY
y
Casos particulares de importancia
( )xgy =
x
Transformación no derivable en puntos aislados: IGNORAR!!!
• Hemos visto cómo obtener las funciones de caracterización (total) de la variable transformada.
• Ahora cabe preguntarse: ¿y si sólo nos interesan parámetros de caracterización parcial de la VA?
• Un camino obvio es:
• La cuestión es: ¿podemos evitar el camino completo?
Caracterización parcial de ( )XY g=
( )XY g= ( )yfY { } { } 22 ,, YYY σEE( )xfX
Caracterización parcial de ( )XY g=• Buscamos calcular, por ejemplo, el valor medio:
• Por otra parte sabemos que:
• Entonces:
{ } ( )dyyyfE ∫∞
∞−= YY
{ }( )
UyN
iiRdyyy
1=
=+≤< Y
( ) ( ) ( )( )
∑=
==+≤<yN
iii dxxfdyyfdyyyP
1XYY
( ) ( ) ( )( )
∑=
=yN
iiii dxxfxgdyyyf
1XY
3R2R1R
Caracterización parcial de ( )XY g=• Ahora no vamos a relacionar ambos diferenciales
mediante la derivada luego no hace falta que pongamos el valor absoluto en los diferenciales de las x:
• Si ahora barremos el eje vertical, barremos de forma acorde el eje horizontal, resultando:
• Así pues, en general
( ) ( ) ( )( )
∑=
=yN
iiii dxxfxgdyyyf
1XY
{ } ( ) ( ) ( ) ( ){ }∫∫∞
∞−
∞
∞−=== XY XY gEdxxfxgdyyyfE
( ){ } ( ) ( ) ( )( ) ( ) ( )( ){ }XY XY ghEdxxfxghdyyfyhhE === ∫∫∞
∞−
∞
∞−
Caracterización parcial de ( )XY g=• En concreto:
• VCM:
• Varianza:
{ } ( )( ){ } ( ) ( )∫∞
∞−=== dxxfxggEE XXY 222
( ){ } ( ) ( ){ }( ){ }( ) ( ){ }( ) ( )∫
∞
∞−=−=
−=−=
dxxfgExggEgEE
X
YY
XXXY
2
222 ησ
Caracterización parcial de ( )XY g=• Transformación lineal: es fácil ver que si
entonces:
• Media:
• Varianza:
ba += XY
( ){ } { }( ){ }{ }( )( ){ } { }( ){ } 22222
222
X
YY
XXXXXXY
σησ
aEEaEaEbaEbaEE
=−=−=
+−+=−=
{ } { } { } baEbaEE +=+= XXY
Momentos de una VA• Constituyen el conjunto de parámetros de
caracterización parcial de una VA.
• Se dividen en
• No centrales:
• Centrales:
• El parámetro n suele ser un número entero positivo, pero también se habla de momentos de orden fraccionario.
• Momentos condicionados: usar f.d.p. condicionada
Momentos de una VA• Es interesante ver que:
• Los momentos centrales de orden impar de distribuciones simétricas son nulos IMPAR
PAR
Momentos de una VA• Es interesante ver que:
• Los momentos centrales de distribuciones simétricas son nulos
• Los momentos están relacionados entre sí. En particular:
IMPARPAR
Momentos de una VA• Es interesante ver que:
• Los momentos centrales de distribuciones simétricas son nulos
• Los momentos están relacionados entre sí. En particular: