Tema 2: VARIABLE ALEATORIA UNIDIMENSIONAL · Tema 2: VARIABLE ALEATORIA UNIDIMENSIONAL Carlos...

Tema 2: VARIABLE ALEATORIA UNIDIMENSIONAL

Carlos Alberola López

Lab. Procesado de Imagen, ETSI Telecomunicación

Despacho 2D014

[email protected], [email protected],http://www.lpi.tel.uva.es/sar

Concepto de VA unidimensional• Supóngase que se envía una señal pulsada de

dos posibles valores ( voltios) y se mide la tensión recibida cada cierto tiempo.

• Si la señal es como la de la figura adjunta, nuestras lectura serán números que responden a fenómenos aleatorios, de forma que lo normal es que no coincidan con los valores que cabría esperar.

• Tales números constituyen los valores que puede tomar la variable aleatoria tensión observada.

• Las conclusiones a las que podremos llegar en relación con tales variables serán sólo probabilísticas.

1±

Concepto de VA unidimensional• Una VA se define formalmente mediante la aplicación

donde asumiremos que se cumplen dos condiciones:

1.

2.

• No escribiremos la dependencia explícita con el resultado del experimento aleatorio

• Emplearemos letras mayúsculas para denotar las variables y letras minúsculas para denotar valores particulares que puedan tomar éstas.

( ) RaSaRS∈→∈

→

XX :

Sa∈

Concepto de VA unidimensional• Distinguiremos tres tipos de VAs

1. Discretas: los valores que toman se pueden indexar mediante un índice entero.

2. Continuas: los valores que toman pertenecen a un rango continuo.

3. Mixtas: se mezclan ambas tipos de comportamiento.

Caracterización de VA unidimensional

• La caracterización de una VA consiste en la información necesaria para poder hacer cálculos probabilísticos sobre los valores de la misma.

• La caracterización de una VA es pues el enunciado de la ley de asignación de probabilidades a los valores de la misma.

• Esta caracterización se puede realizar de forma unificada para todo tipo de variables.

• No obstante es mucho más sencillo considerar casos separados según el tipo de VA.

• Caso de VAs discretas. Necesitamos conocer:

1. Los valores que pueden tomar.

2. Las probabilidades

Por ejemplo: VA X que pueden tomar cualquier valor entero con probabilidad pi. Calcular probabilidad de que tome valores entre -2 y 2 (ambos incluidos)

( )ii xPp == Xix


• Caso de VAs continuas: Función de distribución. Se define de la forma

un ejemplo de la cual sería


• Comportamiento por la izquierda:

• Comportamiento por la derecha

• Función acotada

• Función no decreciente:

Por este motivo a esta función se le denomina también función de probabilidad acumulada (o cdf de cumulative distribution function)

Función de distribución. Propiedades

pues

si ya que

• Uso adicional de la función de distribución:

• Podemos escribir el suceso

• Entonces

• Por lo que

• Así pues un intervalo donde esta función es constante es un intervalo de probabilidad nula.

Función de distribución

• Finalmente, podemos escribir:

• Lo cual lleva a

Función de distribución

a b c

ap

bp

cpba pp +

cba ppp ++1

( )xFX

x

Función de distribución: variables discretas• Suponer X variable

discreta que puede tomar los valores a, b y c con probabilidades respectivas pa, pb y pc.

• Calculamos su función de distribución dando respuesta a la probabilidad

( ) ( )xPxF ≤= XX

• Luego esta expresión se puede escribir:

• Y por tanto NO ES INFORMATIVA pues no añade nada con respecto a lo que ya sabíamos. Simplemente es introducir la información de partida en una estructura de funciones escalón.

• El caso general sería

Función de distribución: variables discretas

• Este tipo de variables presentan comportamientos continuos y discretos.

• Este hecho debe reflejarse en la función de distribución, la cual debe una cantidad numerable de discontinuidades finitas. Por ejemplo:

Función de distribución: variables mixtas

Función de distribución: discontinuidades

a b c

ap

bp

cpba pp +

cba ppp ++1

( )xFX

x

• Valor que toma la función en un punto: valor que toma a su inmediatamente a su derecha


a b c

ap

bp

cpba pp +

cba ppp ++1

( )xFX

x

• Probabilidad asociada a un valor concreto:

• Zona continua: prob. nula de esos valores.

0x


a b c

ap

bp

cpba pp +

cba ppp ++1

( )xFX

x


• Zona continua: prob. nula de esos valores.

• Probabilidad en puntos de discontinuidad: altura de discontinuidad

Función de distribución: VA continua

1

( )xFX

x


• En una VA continua todos sus valores tienen probabilidad nula.

• Sólo tiene sentido hablar pues de intervalos de valores de la variable.

Función de densidad de probabilidad

• Se define a partir de la función de distribución

• Ello lleva a:


• Esta función debe cumplir varias propiedades:

• Ser no negativa pues

• El área bajo ella deber ser unitaria pues

• La probabilidad en un intervalo es sencilla de calcular:

dxxfxdFxx

∫∫ ∞−∞−= )()( XX dxxfxdF

x

x

x

x ∫∫ =2

1

2

1

)()( XX

( )2112 )()( xxPxFxF ≤<=− XXX dxxfx

x∫=2

1

)(X


• ¿Por qué motivo recibe este nombre?:

• Podemos escribir

• Y dado que la derivada es el límite de un cociente incremental

• Por ello, esta función es el cociente entre la probabilidad de un intervalo y su longitud, cuando ésta tiende a cero. Es pues, dimensionalmente, una densidad de probabilidad (prob/longitud)


• ¿Qué sucede con las variables discretas y mixtas?:

• Recordemos que cada punto de probabilidad no nula venía acompañado de una discontinuidad en la función de distribución:

• Por ello, su derivada presentará impulsos en aquellos lugares donde tengamos una discontinuidad:

Algunos ejemplos de Vas (1: Continuas)

• Variable Uniforme

( )xfX

xba

k ab−=

1


( )xfX

xba

( ) dxxfdxxxP )(XX =+≤<

1x 2x 3x 4x

( )abxxdxxfxxP

x

x −−

==≤< ∫ 1221

2

1

)(XX

( )abxxdxxfxxP

x

x −−

==≤< ∫ 3443

4

3

)(XX

ab −=

Δ

ab −=

Δ

Δ Δk ab−=

1

TODOS LOS “PUNTOS” EN SON EQUIPROBABLES ( )ba,


• Función de distribución:

( )xFX

xba

( ) ( ) ττ dfxFx

∫∞−

= XX

axdx

<== ∫∞−

,00 τ

bxaabaxd

ab

x

a

<≤−−

=−

= ∫ ,1 τ

bxababd

ab

b

a

≥=−−

=−

= ∫ ,11 τ


• Variable Gaussiana


• Influencia del segundo parámetro

Algunos ejemplos de Vas (1: Continuas)• Función de distribución


• Uso práctico de la Función de distribución:

• La integral no tiene primitiva. Debe pues acudirse a integración numérica o bien emplear como soporte otras funciones más comunes (función erf, por ejemplo).

• Lo normal para trabajar con “lápiz y papel” es acudir a tablas.

• Las tablas, típicamente:

• Se dan sólo para variables normal estándar (a=0, b=1)

• Se dan sólo para abscisas no negativas.

• ¿Cómo conseguir generalidad en las mismas?


• Partimos de:

• Y buscamos:

• Si hacemos el cambio

• Llegamos a:

ba−

=τα

( ) ( )⇒>=−≤ xXPxXP

• Por otra parte dada la simetría de la función de densidad de la normal estándar respecto de x=0, se verifica que:

( ) ( )xGxG −=− 1



• Variable exponencial

( )xfX

x

( ) 0,)( >= − λλ λ xuexf xX

Algunos ejemplos de Vas (2: Discretas)

• Variable de Bernoulli

(de parámetro p)

• Variable Binomial

(de parámetros N y p)

• Variable de Poisson

(de parámetro a)

• Variable geométrica

(de parámetro p)

( )( )⎩

⎨⎧

==

===

pPqP

1100

XX

X

( )⎪⎩

⎪⎨⎧

⎟⎟⎠

⎞⎜⎜⎝

⎛==

== −kNkqp

kN

kP

Nkk

XX,,2,1,0 L

( )⎪⎩

⎪⎨⎧

==

≥= −

!

0

kaekP

kkk

aXX

( )⎩⎨⎧

==

≥=

pqkPkk

kXX

0

( )pN,B~X

Funciones condicionadas

• Se plantea cómo incluir más información en las funciones de caracterización total de las variables aleatorias una vez que se sabe que un determinado suceso se ha verificado.

• A tales funciones se les denomina funciones condicionadas, y se representan:

donde B es un suceso de probabilidad no nula.

( )( )Bxf

BxF

X

X


• Las funciones se definen de forma coherente con lo ya conocido. En concreto:

• La función de distribución es una probabilidad, luego la función de distribución condicionada es una probabilidad condicionada.

• La función de densidad es la derivada de la función de distribución, luego sucede lo propio con la función de densidad condicionada:


• Ejemplo: ; hallar { }baB ≤<= X ( ) ( )( )BP

BxPBxF I≤=

XX

{ } ∅=≤ Bx IX{ } { }xaBx ≤<=≤ XX I

xba

( )BxFX

{ } BBx =≤ IX

Funciones condicionadasFunciones condicionadas

• Entonces: { }baB ≤<= X

{ } ∅=≤ Bx IX{ } { }xaBx ≤<=≤ XX I

xba

( )BxFX

{ } BBx =≤ IX

Teoremas de la Prob. Total y Bayes

• Si los sucesos Ai constituyen una partición del espacio muestral, recordando el Teorema de la Probabilidad Total

podemos escribir: (haciendo que )

y derivando

{ }xB ≤= X

0H

1H

0a

1a

X( )00H

b,aN~0

X

( )11Hb,aN~

1X


0H

1H

0a

1a

X( )00H

b,aN~0

X

( )11Hb,aN~

1X


30 −=a 31 =a

• Recordando que

y que

y definiendo , entonces

es decir

expresión del Teorema de Bayes


{ }xB ≤= X

( ) { }( )( )

( ) ( )( )xP

APAxPxP

xAPxAP iiii ≤

≤=

≤≤

=≤X

XX

XX I

Caso de partición continua• Si ahora hacemos que

entonces

Con el objetivo de calcular un límite de un cociente incremental renombremos

y obtenemos

{ }21 xxB ≤<= X

xxxxx

Δ+=

=

2

1

Caso de partición continua• Si ahora convertimos esta expresión

en un cociente de cocientes incrementales

al calcular el límite llegamos a

Caso de partición continua• Hemos obtenido pues que

Si pasamos el denominador al primer miembro tenemos

e integrando

expresión del Teorema de la Probabilidad Total para partición continua.

( ) ( )( ) ( )APxfAxf

xAPX

XX ==

Ejemplo:

0H

1H

0a

1a

X( )00H

b,aN~0

X

( )11Hb,aN~

1X

• Supongamos que se observa el valor x=0.5; se pide que se indique qué símbolo de los dos es más probable que haya sido enviado en estas circunstancias.

30 −=a 31 =a

Caracterización parcial de VA• Las funciones de densidad o distribución constituyen la

fuente de caracterización total de una VA.

• Sin embargo, en un problema real para poder aproximar estas funciones hace falta un número elevado de observaciones de la variable en cuestión.

• Existen otros parámetros de caracterización de las Vas

• Tales parámetros no permiten calcular probabilidades, pero proporcionan una idea aproximada de cómo se comportan las variables. En particular:

• Alrededor de qué valor se obtienen observaciones de la VA.Tal valor es el valor medio.

• Qué dispersión tienen las observaciones de la VA alrededor de ese valor. La dispersión se cuantifica a través de la desviación típica y/o la varianza.

Media de una VA• Mide el valor promedio.

• Por ejemplo, el valor medio de un expediente académico no caracteriza completamente un alumno, pero da una idea de su rendimiento académico.

• ¿Cómo se calcula? Como la suma de todas las notas dividida por el número de ellas.

• Esto sería una media aritmética.

• Si se quiere dar más peso a calificaciones de asignaturas de más créditos se multiplicaría cada nota por el número de créditos de la asignatura y se dividiría por el número total de créditos cursados.

• Eso sería una media ponderada.

Media de una VA• Supongamos que X es una VA discreta. Su media se

define como media ponderada de los valores que puede tomar esta VA.

• Supongamos que:

• El valor medio se define como:

• Y se denota de la forma

( )⎩⎨⎧

==→

ii

i

xPpx

XX

( ) ii

iii

i pxxPx ∑∑ ==X

ii

i px∑=Xη

Media de una VA• El operador para el cálculo de la media en un caso

general se llama operador esperanza matemática (o, simplemente, esperanza) aplicado sobre los valores de la VA. Así pues, para un caso general:

• Si X es discreta su función de densidad es

por lo que

{ } ( )dxxfxE XX X ∫∞

∞−==η

Moda y mediana de una VA• La moda de una VA se define como la abscisa donde la

función de densidad es máxima, esto es

• La mediana se define como aquella abscisa que deja a su izquierda la misma probabilidad que deja a su derecha, es decir

Moda y mediana de una VA• La moda de una VA se define como la abscisa donde la

función de densidad es máxima, esto es

• La mediana se define como aquella abscisa que deja a su izquierda la misma probabilidad que deja a su derecha, es decir

MODAx MEx

Varianza de una VA• Se trata de medir dispersión con respecto de la media.

• La dispersión se puede definir como

• No obstante si se calcula la esperanza de la dispersión (esto, es la dispersión promedio) resulta:

XX η−

{ } ( ) ( )( ) ( )

{ } ( )0=−=

−=

−=

−=−

∫∫ ∫∫

XX

XX

XXX

XXX

X

X

ηηη

η

ηη

dxxfE

dxxfdxxxf

dxxfxE

Varianza de una VA• Por este motivo se trabaja con las dispersiones

cuadráticas con respecto de la media, es decir.

• y de esa magnitud se calcula su esperanza, dando lugar a la varianza de X:

• La desviación típica se define como la raíz cuadrada (con signo positivo) de la varianza:

( )2XX η−

( ){ } ( ) ( )∫ −=−= dxxfxE XXXX X 222 ηησ

( ) 2XX σσ +=

Varianza de una VA• El operador esperanza matemática es un operador

lineal dado que es la integral de una función (el argumento del operador esperanza) multiplicada por la función de densidad de la variable. Ello permite escribir:

• La magnitud se denomina valor cuadrático medio de la VA X.

{ }2XE

Varianza de una VA• Para el caso de una variable discreta la varianza se

define de la misma manera, esto es, como el promedio ponderado de la desviaciones cuadráticas con respecto a la media. Esto se traduce en:

y si operamos a partir de aquí obtenemos

con el VCM de la VA discreta. { } ∑=i

ipxE 21

2X

Varianza de una VA• ¿Cuál sería la media y la varianza de una constante?

• Una constante es una VA (digamos X) degenerada que sólo puede tomar un valor (el suyo) con probabilidad 1.

• Por ello si la constante es igual a podemos escribir

y

Es decir, una constante es un caso particular de VA con media igual a la constante y varianza nula.

a

aapx ii

i =⋅== ∑ 1Xη

( ) ( ) 01222 =⋅−=−= ∑ aapx ii

i XX ησ

Desigualdad de Tchebycheff• Imaginemos que NO conocemos la función de densidad

de una VA pero que nos interesaría tener una aproximación a la probabilidad de un determinado suceso de esa variable, en concreto:

es decir

Desigualdad de Tchebycheff• Podemos obtener una COTA a dicha probabilidad con

sólo la varianza. Para ello, partimos de la definición de varianza

y aproximamos

¿Cómo es la cota provista?

• Es una cota bastante conservadora, es decir, no aquilata mucho los valores.

• Supongamos que . Si nos interesa un radio igual a el cálculo exacto sería

• Y la cota sería:

( )ση,N~Xσε 3=

Transformación de VA• Recordemos cómo se definía una VA

• Ahora definimos una función sobre la misma

• Por lo que el resultado neto es

• Objetivo: caracterizar Y a partir de la caracterización de X (y de la transformación, naturalmente).

Transformación de VA: caso discreto• Suponer X discreta que pueda tomar los valores xi,

i=1,…,5.

• Suponer transformación Y=g(X)

• El objetivo es caracterizar la VA destino Y.

• La mecánica para llevar esto a cabo es una simple inspección y un recuento de posibilidades.

• Hay que ver qué valores yiresultan de la transformación.

• Y qué valores xi se transforman en cada yi.

Transformación de VA: caso discreto

Caso general: obtención de • Suponer X continua; la figura muestra Y=g(X)

• Se trata de caracterizar Y a partir de la función de distribución de X.

• El procedimiento consiste en barrer el eje vertical e ir dando solución a la probabilidad del suceso para cada valor de y bajo estudio.

( )yFY

{ }y≤Yy

Caso general: obtención de ( )yFY

minyy <

y

( ) 0=yFY

y

maxyy > ( ) 1=yFY

Caso general: obtención de ( )xFX

2y

{ } { }22 xy >=≤ XY ( ) ( ) ( ) ( )2222 1 xFxPyPyF XY XY −=>=≤=

Caso general: obtención de ( )xFX

1y

{ } { } { }1312111 xxxy ><≤=≤ XXY U( ) ( ) ( )

( ) ( ) ( )131112

1312111

1 xFxFxFxPxxPyF

XXX

Y XX−+−=

>+<≤=

( )xfX

x

21

−21

x

( )xgy =

1x 2x

y( ) ( )21 xxPyP ≤<=≤ XY

( ) ( )yyPyP ≤<−=≤ XY

41

Casos particulares de importancia

{ } { }211 xxy ≤<== XY

( ) ( ) ( )121 xFxFyP XXY −==

VARIABLE MIXTA!!!!


VARIABLE DISCRETA!!!!


ZONA DE PROBABILIDAD NULA!!!!

Teorema Fundamental • Se trata de obtener ahora de forma directa la función de

densidad de la variable Y

• Esto se hace a través de una expresión cerrada conocida como el Teorema Fundamental.

{ } 321 RRRdyyy UU=+≤< Y

3R2R1R

Teorema Fundamental

{ }( )

UyN

iiRdyyy

1=

=+≤< Y

3R2R1R

( ) ( ) ( )( )

∑=

==+≤<yN

iii dxxfdyyfdyyyP

1XYY

• Retomando la expresión

Si ahora despejamos obtenemos

Teorema Fundamental

( ) ( ) ( )( )

∑=

==+≤<yN

iii dxxfdyyfdyyyP

1XYY

( ) ( )( )

∑=

=yN

i

ii dy

dxxfyf

1XY

( ) ( )( ) ( )( )

ixx

yN

i

yN

i

i

i

dxdy

xf

dxdy

xfyf

=

==∑∑ ==

11

XXY

( )( )

( )

ixx

yN

i xgxf

==∑=

1 'X

• El teorema, por tanto dice que:

lo cual significa que:

1. Podemos obtener la fdp de Y en base a la superposición de N(y) contribuciones.

2. Debe expresarse tal función en términos de y, no de x, luego se tendrá que invertir la función y=g(x).

3. Debe indicarse los rangos de validez de las expresiones.

4. Debe emplearse el teorema sólo para variables continuas (o para mixtas, en su zona de comportamiento continuo) y para funciones derivables.

Teorema Fundamental

( ) ( )( )

( )

ixx

yN

i xgxfyf

==∑=

1 'X

Y

( )xfX

x

21

−21

x

( )xgy =

1x2x

y41


{ } { }211 xxy <≤== XY

( ) ( ) ( )121 xFxFyP XXY −==

VARIABLE MIXTA!!!!


TEOREMA FUNDAMENTAL

( ) ( )yhyf =Y ( ) ( )11 yyyP −=+ δY


VARIABLE DISCRETA!!!!


( ) ( ) ( ) ( ) ( ) ( ) ( )332211 yyyPyyyPyyyPyf −=+−=+−== δδδ YYYY

( ) ( )11 xPyP ≤== XY ( ) ( )212 xxPyP ≤<== XY ( ) ( )23 xPyP >== XY


ZONA DE PROBABILIDAD NULA!!!!


TEOREMA FUNDAMENTAL

( )yfY

y


( )xgy =

x

Transformación no derivable en puntos aislados: IGNORAR!!!

• Hemos visto cómo obtener las funciones de caracterización (total) de la variable transformada.

• Ahora cabe preguntarse: ¿y si sólo nos interesan parámetros de caracterización parcial de la VA?

• Un camino obvio es:

• La cuestión es: ¿podemos evitar el camino completo?

Caracterización parcial de ( )XY g=

( )XY g= ( )yfY { } { } 22 ,, YYY σEE( )xfX

Caracterización parcial de ( )XY g=• Buscamos calcular, por ejemplo, el valor medio:

• Por otra parte sabemos que:

• Entonces:

{ } ( )dyyyfE ∫∞

∞−= YY

{ }( )

UyN

iiRdyyy

1=

=+≤< Y

( ) ( ) ( )( )

∑=

==+≤<yN

iii dxxfdyyfdyyyP

1XYY

( ) ( ) ( )( )

∑=

=yN

iiii dxxfxgdyyyf

1XY

3R2R1R

Caracterización parcial de ( )XY g=• Ahora no vamos a relacionar ambos diferenciales

mediante la derivada luego no hace falta que pongamos el valor absoluto en los diferenciales de las x:

• Si ahora barremos el eje vertical, barremos de forma acorde el eje horizontal, resultando:

• Así pues, en general

( ) ( ) ( )( )

∑=

=yN

iiii dxxfxgdyyyf

1XY

{ } ( ) ( ) ( ) ( ){ }∫∫∞

∞−

∞

∞−=== XY XY gEdxxfxgdyyyfE

( ){ } ( ) ( ) ( )( ) ( ) ( )( ){ }XY XY ghEdxxfxghdyyfyhhE === ∫∫∞

∞−

∞

∞−

Caracterización parcial de ( )XY g=• En concreto:

• VCM:

• Varianza:

{ } ( )( ){ } ( ) ( )∫∞

∞−=== dxxfxggEE XXY 222

( ){ } ( ) ( ){ }( ){ }( ) ( ){ }( ) ( )∫

∞

∞−=−=

−=−=

dxxfgExggEgEE

X

YY

XXXY

2

222 ησ

Caracterización parcial de ( )XY g=• Transformación lineal: es fácil ver que si

entonces:

• Media:

• Varianza:

ba += XY

( ){ } { }( ){ }{ }( )( ){ } { }( ){ } 22222

222

X

YY

XXXXXXY

σησ

aEEaEaEbaEbaEE

=−=−=

+−+=−=

{ } { } { } baEbaEE +=+= XXY

Momentos de una VA• Constituyen el conjunto de parámetros de

caracterización parcial de una VA.

• Se dividen en

• No centrales:

• Centrales:

• El parámetro n suele ser un número entero positivo, pero también se habla de momentos de orden fraccionario.

• Momentos condicionados: usar f.d.p. condicionada

Momentos de una VA• Es interesante ver que:

• Los momentos centrales de orden impar de distribuciones simétricas son nulos IMPAR

PAR


• Los momentos centrales de distribuciones simétricas son nulos

• Los momentos están relacionados entre sí. En particular:

IMPARPAR


• Los momentos centrales de distribuciones simétricas son nulos

• Los momentos están relacionados entre sí. En particular:

Date post:	04-Jan-2020
Category:	Documents
Upload:	others
View:	21 times
Download:	0 times

Tema 2: VARIABLE ALEATORIA UNIDIMENSIONAL · Tema 2: VARIABLE ALEATORIA UNIDIMENSIONAL Carlos...

Documents