Flores, J. (2013) . Estadística. EGGLL PUCP

Estadıstica

Estudios Generales Letras

Jose Flores Delgado

Marzo de 2013

Prologo

Este trabajo corresponde a la septima edicion de las notas de clases del curso de

Estadıstica impartidas por el autor a los alumnos de la Facultad de Estudios Generales

Letras de la Pontificia Universidad Catolica del Peru.

En esta edicion se han corregido los errores encontrados y mejorado algunos ejemplos y

ejercicios propuestos. Se han mantenido enumerados los capıtulos y secciones. Tambien se

trata brevemente de la funcion generadora de momentos. Sin embargo, considero todavıa

inconcluso el trabajo y continuare la tarea de revision del texto.

Este texto incluye topicos de economıa y administracion, como el estudio de la

desigualdad de los ingresos —a traves de la curva de Lorenz y el indicador de Gini— y

los modelos binomial y de Black-Scholes —muy conocidos en el area de finanzas—.

Agradezco a mi colega Richard Chavez por su valiosa ayuda y comentarios sobre los

temas de finanzas aquı tratados.

Tambien agradezco a la seccion de Matematicas por las facilidades brindadas para la

elaboracion de este texto, a la Facultad de Estudios Generales Letras por promover este

tipo de trabajos, a la Oficina de Publicaciones para la docencia de nuestra Universidad, a la

doctora Kathia Hanza, ex-directora de estudios de la Facultad de Estudios Generales Letras,

por el apoyo brindado en la primera edicion, y al profesor Luis Vargas por la revision de la

primera version del texto.

Me permito tambien felicitar a ustedes, alumnos, por su madurez demostrada al optar

por esta Universidad, sabiendo de su exigencia y prestigio reconocidos; los invito a que

contribuyan a mantenerlos, como lo han hecho los que los precedieron.

Finalmente, quiero advertir a los alumnos que este texto no debe sustituir a los principales

manuales del tema, ni a las clases, ni a sus propios apuntes, que espero ahora puedan hacer

en mejores condiciones. La lectura de la bibliografıa sobre el tema es necesaria y valiosa para

un mejor aprendizaje.

Jose Flores Delgado.

Lima, marzo de 2013.

Indice

1. Probabilidad 7

1.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

1.2. Definicion y propiedades de la probabilidad . . . . . . . . . . . . . . . . . . . 9

1.3. Propiedades de la probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . 10

1.4. Probabilidad condicional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

La regla del producto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

La regla de la probabilidad total . . . . . . . . . . . . . . . . . . . . . . . . . 15

La regla de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

1.5. Independencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

1.6. Probabilidad clasica y combinatoria . . . . . . . . . . . . . . . . . . . . . . . 21

1.7. Probabilidad geometrica y frecuencial . . . . . . . . . . . . . . . . . . . . . . 24

1.8. Ejercicios propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

2. Variable aleatoria 39

2.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

2.2. Modelo probabilıstico de una variable aleatoria . . . . . . . . . . . . . . . . . 42

2.2.1. Propiedades del modelo probabilıstico . . . . . . . . . . . . . . . . . . 44

2.3. El valor esperado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

2.3.1. Valor esperado de una funcion de una variable aleatoria . . . . . . . . 46

2.3.2. Otras propiedades del valor esperado . . . . . . . . . . . . . . . . . . 47

2.4. Varianza y desviacion estandar . . . . . . . . . . . . . . . . . . . . . . . . . 49

2.4.1. Propiedades de la varianza . . . . . . . . . . . . . . . . . . . . . . . . 50

3

4 Profesor Jose Flores Delgado Estadıstica

2.5. Funcion de distribucion acumulada . . . . . . . . . . . . . . . . . . . . . . . 51

2.6. Propiedades de la distribucion acumulada . . . . . . . . . . . . . . . . . . . . 52

2.7. Tecnica del cambio de variable . . . . . . . . . . . . . . . . . . . . . . . . . . 53


3. Modelos probabilısticos importantes 77

3.1. Modelos relacionados con un proceso de Bernoulli . . . . . . . . . . . . . . . 77

3.1.1. El Modelo o distribucion binomial . . . . . . . . . . . . . . . . . . . . 78

3.1.2. El modelo o distribucion geometrico . . . . . . . . . . . . . . . . . . . 80

3.1.3. El modelo o distribucion de Pascal o binomial negativa . . . . . . . . 82

3.2. Modelos relacionados con un proceso de Poisson . . . . . . . . . . . . . . . . 82

3.2.1. El modelo o distribucion de Poisson . . . . . . . . . . . . . . . . . . . 83

3.2.2. El modelo o distribucion exponencial . . . . . . . . . . . . . . . . . . 85

3.2.3. Modelo o distribucion gamma . . . . . . . . . . . . . . . . . . . . . . 86

3.3. Modelo gaussiano o distribucion normal . . . . . . . . . . . . . . . . . . . . . 87

3.3.1. Propiedades del modelo gaussiano o normal . . . . . . . . . . . . . . 88

3.4. Modelo o distribucion lognormal . . . . . . . . . . . . . . . . . . . . . . . . . 93

3.5. Modelo o distribucion hipergeometrica . . . . . . . . . . . . . . . . . . . . . 95

3.6. Modelo o distribucion uniforme . . . . . . . . . . . . . . . . . . . . . . . . . 95

3.7. Modelo o distribucion Beta . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99

3.8. La funcion generadora de momentos . . . . . . . . . . . . . . . . . . . . . . . 99


4. Indicadores de concentracion para medir la desigualdad de los ingresos 117

4.1. La Curva de Lorenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117

4.2. El Coeficiente de Gini . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119

4

Profesor Jose Flores Delgado INDICE

5. Estadıstica descriptiva 123

5.1. ¿Que es la Estadıstica? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123

5.2. Nociones basicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124

5.3. Escalas o niveles de medicion . . . . . . . . . . . . . . . . . . . . . . . . . . 126

5.3.1. Escala nominal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126

5.3.2. Escala ordinal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127

5.3.3. Escala de intervalo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127

5.3.4. Escala de razon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128

5.4. Organizacion y tratamiento de datos. Promedios y percentiles . . . . . . . . 129

5.4.1. Caso de variables cualitativas . . . . . . . . . . . . . . . . . . . . . . 129

5.4.2. Caso de variables cuantitativas discretas . . . . . . . . . . . . . . . . 130

5.4.3. Caso de variables cuantitativas continuas . . . . . . . . . . . . . . . . 131

5.5. Propiedades y uso de los promedios . . . . . . . . . . . . . . . . . . . . . . . 137

5.6. Medidas de dispersion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138

5.6.1. Propiedades de la desviacion estandar . . . . . . . . . . . . . . . . . . 141

5.7. Datos tipificados o estandarizados . . . . . . . . . . . . . . . . . . . . . . . . 142

5.8. Diagrama de hojas y tallos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143

5.9. Ejercicios Resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144


6. Correlacion y regresion lineal 157

6.1. Correlacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157

6.2. Indice de correlacion de Pearson . . . . . . . . . . . . . . . . . . . . . . . . . 158

6.3. Regresion lineal simple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 160

6.4. Analisis de varianza para la regresion . . . . . . . . . . . . . . . . . . . . . . 161

5


Bibliografıa 165

6

1. Probabilidad

1.1. Introduccion

El objetivo es cuantificar las posibilidades que tengan ciertos eventos inciertos. Sin duda,

el evento incierto de mayor importancia para la estadıstica ocurre cuando se infiere algo a

partir de solo una muestra, en este caso, es importante averiguar la veracidad o el grado de

credibilidad que se le pudiera dar a dicha generalizacion, por eso la probabilidad es de suma

importancia para la estadıstica.

Es importante senalar que muchas veces se debe tomar una decision en un contexto de

incertidumbre, en estos casos, la probabilidad resulta muy util para evaluar los riesgos.

Empezaremos tratando los conceptos basicos, propiedades y uso de la probabilidad; luego

veremos algunos modelos probabilısticos.

Definicion 1.1. Experimento aleatorio. Es cualquier experimento cuyo resultado no se

puede predecir con certeza antes de realizarlo.

Definicion 1.2. Espacio muestral asociado a un experimento aleatorio. Es el

conjunto de resultados posibles del experimento. Usualmente se lo denota por S u Ω.

Ejemplo 1.1. Un lote contiene unidades que pueden tener algun defecto. Se escogeran dos

unidades al azar y se determinara si estas tienen algun defecto. Podemos considerar como

espacio muestral a Ω = (0; 0), (0; 1), (1; 0), (1; 1) , con la convencion siguiente: el primer

componente de cada par ordenado representa el estado de la primera unidad y el segundo el

de la otra, ademas 0 significa que la unidad no tiene defectos y 1 que tiene alguno.

Definicion 1.3. Evento Es cualquier subconjunto del espacio muestral1. Es decir, salvo el

caso del evento φ, un evento es cualquier conjunto de resultados del experimento.

Ejemplo 1.2. A continuacion describamos algunos eventos del ejemplo anterior:

a) Ambas unidades estan en el mismo estado: A1 = (0; 0), (1; 1).

Este evento tiene dos resultados, cualquiera de estos lleva a ocurrir este evento.

b) La segunda unidad tiene defectos: A2 = (0; 1), (1; 1).

Nuevamente, este evento tiene dos resultados y cualquiera de estos lleva a ocurrir este

evento.1En un curso avanzado de probabilidades, solo los conjuntos que pertenecen a una familia llamada sigma-

algebra son considerados como eventos.

7


c) Ambas unidades se encuentran con defectos: A3 = (1; 1).

Este evento solo tiene un resultado, cuando ocurra dicho resultado ocurrira este evento.

Hemos definido los eventos como conjuntos, a continuacion formalizaremos la caracterıstica

mas importante que estos poseen, es decir, que pueden ocurrir.

Definicion 1.4. Diremos que un evento ocurre cuando al realizar el experimento el resultado

obtenido es uno del evento.

Gracias a la definicion anterior podemos interpretar algunas de las operaciones entre

conjuntos en el contexto de eventos, esto sera de suma importancia para hacer la conexion

entre la formalidad y la aplicacion:

1. El conjunto vacıo, φ, es denominado el evento imposible, pues nunca ocurre.

2. El espacio muestral, Ω, es denominado el evento seguro, pues siempre ocurre.

3. Si A y B son dos eventos de Ω, entonces:

a) A∪B es el evento que ocurre si, y solo si, al menos uno de los dos eventos ocurre.

b) A ∩B es el evento que ocurre si, y solo si, ambos eventos ocurren.

4. Si A es un evento de Ω, entonces:

Ac = Ω− A es el evento complementario de A y este ocurre si, y solo si, A no ocurre.

5. Si A y B son dos eventos de Ω que son disjuntos, es decir, A ∩ B = φ, se dira que

estos eventos son excluyentes, pues no pueden ocurrir juntos. Para resaltar este hecho

escribiremos A ]B, en lugar de A ∪B, cuando tengamos esta situacion.

Ejemplo 1.3. Un inspector debera revisar 3 trabajos, cualquiera de estos puede haber

satisfecho las especificaciones requeridas. Definamos los eventos Ai : el trabajo i satisfizo las

especificaciones, i = 1, 2, 3.

A partir de estos eventos expresemos los que siguen:

a) Los tres trabajos hayan satisfecho las especificaciones.

El evento de interes es A1 ∩ A2 ∩ A3, cuyo complemento es Ac1 ∪ Ac2 ∪ Ac3.

b) Por lo menos uno de los trabajos haya satisfecho las especificaciones.

En este caso el evento de interes es A1 ∪A2 ∪A3, cuyo complemento es Ac1 ∩Ac2 ∩Ac3.

c) Solo dos de los trabajos hayan satisfecho las especificaciones.

El evento de interes es (A1 ∩ A2 ∩ Ac3) ] (A1 ∩ Ac2 ∩ A3) ] (Ac1 ∩ A2 ∩ A3).

8

Profesor Jose Flores Delgado Probabilidad 9

d) Ninguno de los trabajos haya satisfecho las especificaciones.

El evento de interes es Ac1 ∩ Ac2 ∩ Ac3.

e) Por lo menos uno de los trabajos no haya satisfecho las especificaciones.

Este evento puede expresarse como: Ac1 ∪ Ac2 ∪ Ac3.

1.2. Definicion y propiedades de la probabilidad

Como ya se ha dicho la probabilidad debe procurar reflejar las posibilidades que tienen de

ocurrir los eventos, ası, como los eventos provienen de distintos experimentos, existen muchas

formas de asignar una probabilidad. A continuacion veamos cuando una asignacion de

probabilidades a los eventos de un espacio muestral se considera, en efecto, una probabilidad.

La definicion de Kolmogorov establece cuales son las condiciones mınimas que debe satisfacer

toda asignacion o regla de probabilidades a fin de lograr todo un conjunto de propiedades.

Definicion 1.5. Una probabilidad es una transformacion, P , que asigna a cada evento,

A, de un espacio muestral, Ω, un numero real: P (A) y que satisface las tres propiedades

siguientes, llamadas axiomas de probabilidad:

A1 Para cualquier evento A: P (A) ≥ 0.

A2 La probabilidad del espacio muestral es 1 : P ( Ω) = 1.

A3 Si A1 , A2 , . . . es una coleccion de eventos mutuamente excluyentes, entonces:

P (A1 ] A2 ] . . . ) = P (A1) + P (A2) + . . .

o, en notacion abreviada:

P( ∞⊎j=1

Aj

)=∞∑j=1

P (Aj)

Ejemplo 1.4. (Probabilidad Clasica) Si el experimento tiene un numero finito de resultados

y cada uno de ellos se cree que es igualmente posible, entonces la mejor manera de asignar

probabilidades a los eventos de su espacio muestral es la siguiente:

P (A) =#(A)

#(Ω), para cada evento A de Ω.

Observacion 1.1. Esta asignacion es adecuada, pues, al ser cada resultado igualmente

probable de ocurrir, deberıa tenerse que la probabilidad de un evento sea proporcional al

numero de resultados que este tenga (a mayores resultados, mayor probabilidad); la division

entre el numero de resultados posibles se hace para estandarizar, es decir, a fin de que toda

probabilidad este entre 0 y 1.

9


Ejemplo 1.5. En el ejemplo 1.1 tenemos que el espacio muestral es finito, pues #(Ω) = 4.

Supongamos que cada resultado sea igualmente posible. Por lo tanto, es adecuado asignar

probabilidades de la manera clasica, es decir:

P (A) =#(A)

4, ∀A ⊂ Ω.

En particular, considerando los eventos definidos en dicho ejemplo, tenemos que:

a) La probabilidad de que ambas unidades esten igual es P (A1) = #(A1)4

= 24

= 12.

b) La probabilidad de que la segunda unidad no tenga defectos es P (A2) = #(A2)4

= 24

= 12.

c) La probabilidad de que las dos unidades no tengan defectos es P (A3) = #(A3)4

= 14.

A continuacion veamos algunas de las demas propiedades que se derivan de las tres

basicas.

1.3. Propiedades de la probabilidad

P1 La probabilidad del evento imposible es nula: P ( φ ) = 0.

P2 La probabilidad de un evento y la de su complemento suman 1: P (A) + P (Ac) = 1.

P3 La probabilidad de cualquier evento, A, es menor o igual que 1: P (A) ≤ 1.

P4 Si un evento A esta incluido dentro de otro, B, entonces, su probabilidad es a lo sumo

igual a la de aquel: P (A) ≤ P (B).

P5 Para cualesquiera A y B, eventos de Ω : P (B) = P (B ∩ A) + P (B ∩ Ac).

P6 Para cualesquiera A y B, eventos de Ω : P (A ∪ B) = P (A) + P (B)− P (A ∩ B).

Observacion 1.2. Las dos ultimas propiedades se generalizan para tres o mas eventos, como

se enuncian en la propiedad que se da despues del ejemplo siguiente y en el primer ejercicio

propuesto, respectivamente.

Ejemplo 1.6. Dos personas suelen trabajar en equipo al realizar un proyecto. La

probabilidad de que, al realizar el proyecto, la primera termine a tiempo su trabajo es

de 0,7; y la de que termine a tiempo la segunda es de 0,8. Ademas, la probabilidad de que

ambas terminen a tiempo su trabajo es de 0,51.

A modo de ejemplo calculemos algunas probabilidades:

10


a) La probabilidad de que al menos una de estas personas termine a destiempo su trabajo.

Consideremos los eventos A, que la primera persona termine a tiempo su trabajo, y B,

que la segunda termine a tiempo. De los datos tenemos que: P (A) = 0, 7, P (B) = 0, 8

y P (A ∩B) = 0, 51.

Nos interesa calcular P (Ac∪Bc), esta, por la propiedad 2 de la probabilidad, se puede

determinar por medio de la de su evento complementario (que ambas terminen a

tiempo):

1− P (A ∩B) = 1− 0, 51 = 0, 49

A manera de ejercicio, obtenga la probabilidad anterior por medio de la propiedad 6

de la probabilidad:

P (Ac ∪Bc) = P (Ac) + P (Bc)− P (Ac ∩Bc).

b) La probabilidad de que la primera persona no termine a tiempo su trabajo, pero sı la

segunda.

En este caso el evento que nos interesa, que la primera persona no termine a tiempo

su trabajo, pero sı la segunda, corresponde al evento Ac ∩B, su probabilidad se puede

obtener usando la propiedad 5 de la probabilidad:

P (B) = P (B∩A)+P (B∩Ac)⇒ P (Ac∩B) = P (B)−P (B∩A) = 0, 8−0, 51 = 0, 29.

c) La probabilidad de que solo una de estas personas no termine a tiempo su trabajo.

Aquı, el evento que interesa es (Ac ∩ B) ] (A ∩ Bc) (no termine a tiempo la primera

pero sı la segunda, o bien no termine a tiempo la segunda pero sı la primera) y como

en esta reunion los eventos son excluyentes, basta sumar sus probabilidades (por el

axioma 3 de la probabilidad). Ası:

P(

(Ac ∩B) ] (A ∩Bc))

= P (Ac ∩B) + P (A ∩Bc) = 0, 29 + 0, 19 = 0, 48

Aquı se ha obtenido P (A ∩ Bc) de manera analoga a como se procedio en la parte

anterior para hallar P (Ac ∩B), es decir, usando: P (A) = P (A ∩B) + P (A ∩Bc).

d) La probabilidad de que al menos una de estas personas termine a tiempo su trabajo.

En este caso nos interesa el evento (A∪B) (al menos una de estas personas termine a

tiempo su trabajo). Para determinarla podemos usar la propiedad 6:

P (A ∪B) = P (A) + P (B)− P (A ∩B) = 0, 7 + 0, 8− 0, 51 = 0, 99.

Compruebe que P (A ∪B) = P (Ac ∩B) + P (A ∩Bc) + P (A ∩B).

11


Los datos y eventos dados pueden representarse en la tabla siguiente:

B Bc Totales

A P (A ∩B) = 0, 01 P (A ∩Bc) P (A) = 0, 3

Ac P (Ac ∩B) P (Ac ∩Bc) P (Ac) = 0, 7

Totales P (B) = 0, 2 P (Bc) = 0, 8 1

Observacion 1.3. Tenga siempre presente el uso de las propiedades de la probabilidad. No

use la tabla anterior (u otras graficas) como justificacion para el calculo de probabilidades,

solo use propiedades para este fin.

Propiedad (Regla de la probabilidad total) Sean A1, . . . , Ak, eventos mutuamente

excluyentes (esto es, Ai ∩Aj = φ, i 6= j) y exhaustivos (es decir,k⊎i=1

Ai = Ω). Entonces, para

todo evento, B, de Ω :

P (B) =k∑i=1

P (B ∩ Ai)

Esta propiedad es una de las mas importantes en las aplicaciones. Las propiedades que

satisfacen los eventos A1, . . . , Ak (mutuamente excluyentes y exhaustivos) se resumen

diciendo que estos constituyen una particion de Ω y se puede ilustrar como sigue:

Ejemplo 1.7. Para producir cierto bien se usa solo uno de tres procedimientos principales

existentes (1, 2 y 3) y, opcionalmente, uno secundario (4). La probabilidad de usar el

procedimiento 1 es de 0,6; la probabilidad de usar el procedimiento 1 con el secundario

es igual a 0,24. La probabilidad de usar el procedimiento 2 sin el procedimiento secundario

es de 0,06. La probabilidad de usar el procedimiento 3 es de 0,25; y la probabilidad de usar

el procedimiento secundario con este procedimiento es de 0,16.

Obtengamos la probabilidad de usar el procedimiento secundario:

Consideremos los eventos: Ai, usar el procedimiento i; para i = 1, . . . , 4.

Estos eventos nos permiten expresar los datos dados con las notaciones necesarias para usar

las propiedades de la probabilidad:

A1]A2]A3 = Ω, es decir, los eventos A1, A2 y A3 son mutuamente excluyentes y exhaustivos.

P (A1) = 0, 6, P (A1 ∩ A4) = 0, 24, P (A2 ∩ Ac4) = 0, 06, P (A3) = 0, 25 y P (A3 ∩ A4) = 0, 16.

Para obtener la probabilidad del evento que interesa, es decir de A4, la descomposicion

A1]A2]A3 = Ω nos permite expresar A4 = (A4∩A1)] (A4∩A2)] (A4∩A3); por lo tanto,

12


la probabilidad pedida es:

P (A4) = P(

(A4 ∩ A1) ] (A4 ∩ A2) ] (A4 ∩ A3))

= P (A4 ∩ A1) + P (A4 ∩ A2) + P (A4 ∩ A3)

= 0, 24 + P (A4 ∩ A2) + 0, 16

Luego, basta obtener la probabilidad P (A4 ∩ A2). Para esto, puesto que A1 ] A2 ] A3 = Ω,

podemos deducir inmediatamente que, P (A1) + P (A2) + P (A3) = 1 y ası P (A2) =

1 − 0, 6 − 0, 25 = 0, 15. Ademas, ya que P (A2) = P (A4 ∩ A2) + P (Ac4 ∩ A2), tenemos

que P (Ac4 ∩ A2) = P (A2)− 0, 06 = 0, 15− 0, 06. Ası, P (A4) = 0, 24 + 0, 09 + 0, 16 = 0, 49.

1.4. Probabilidad condicional

Como ya sabemos, una probabilidad P definida sobre los eventos de Ω cuantifica las

posibilidades que tienen de ocurrir dichos eventos. Sucede que en el transcurrir del tiempo

podemos ir recibiendo informacion que modifique el estado de incertidumbre que se tenıa

sobre el experimento antes de realizarlo. Por ejemplo, si en una empresa el 70 % de los

proyectos que llegan se desarrollan a tiempo; entonces, podemos decir que si un proyecto

llega hay una probabilidad de 0, 7 de desarrollarlo a tiempo; sin embargo, resulta que

algunos proyectos llegan solo con un mes de anticipacion, ¿se podra decir que estos tienen la

misma probabilidad de ser desarrollados a tiempo? El conocimiento de esta informacion a lo

mejor afectara las probabilidades anteriores, por lo tanto, hay la necesidad de actualizar las

probabilidades iniciales con base en el conocimiento de la nueva informacion adquirida, dicho

de otro modo, este conocimiento nos debe llevar a un aprendizaje que se concreta o expresa

en una nueva regla de asignacion de probabilidades, digamos P ′. Dicha informacion nueva

es expresada como la ocurrencia de un evento B; y la nueva asignacion de probabilidades P ′

es llamada “probabilidad condicional dado que ocurrio B” y se la define para cada evento

A, a partir de la probabilidad P, anterior a la informacion recibida, como:

P ′(A) =P (A ∩B)

P (B)

Ademas, se suele denotar a esta nueva asignacion de probabilidades, P ′, como P ( / B), es

decir, para cada evento A de Ω se tiene que:

P (A/ B) =P (A ∩B)

P (B)

Observese que para la asignacion clasica resulta:

P (A/ B) =P (A ∩B)

P (B)=

#(A∩B)#(Ω)

#(B)#(Ω)

=#(A ∩B)

#(B)

Por lo que se interpreta como la probabilidad de que ocurra A, cuando el espacio Ω se reduce

al evento B.

13


Observacion 1.4. La probabilidad condicional es, en efecto, una probabilidad, pues

satisface:

A1. P (A/ B) ≥ 0, para cada A evento de Ω.

A2. P (Ω/ B) = 1.

A3. Para cualesquiera C y D, eventos excluyentes de Ω:

P (C ]D/ B) = P (C/ B) + P (D/ B).

En particular satisface tambien cualquier otra propiedad de la probabilidad:

P1. La probabilidad del evento imposible es nula: P (φ/ B) = 0.

P2. La probabilidad de cualquier evento A es menor o igual que 1: P (A/ B) ≤ 1.

P3. La probabilidad de un evento mas la de su complemento da 1: P (A/ B)+P (Ac/ B) = 1.

P4. Si un evento, C, esta incluido dentro de otro, D, entonces, su probabilidad es a lo sumo

igual a la de aquel: P (C/ B) ≤ P (D/ B).

P5. Para cualesquiera C y D, eventos de Ω : P (C) = P (C ∩D/ B) + P (C ∩Dc/ B).

P6. Para cualesquiera C y D, eventos de Ω:

P (C ∪D/ B) = P (C/ B) + P (D/ B)− P (C ∩D/ B).

Propiedad (Regla del producto): para cualesquiera A y B eventos de Ω, se tiene que:

P (A ∩B) = P (B)P (A/B) = P (A)P (B/A).

Observacion 1.5. Esta regla es sumamente importante, pues permite obtener la

probabilidad que tienen de ocurrir conjuntamente dos eventos, a partir de la de uno de

ellos y la del otro condicional a la ocurrencia del primero.

En general:

P (A1 ∩ . . . ∩ Ak) = P (A1)P (A2/A1)P (A3/A1 ∩ A2) . . . P (Ak/A1 ∩ . . . ∩ Ak−1).

Ejemplo 1.8. Una empresa del paıs se encuentra en cierto estado financiero si posee dos

caracterısticas, c1 y c2 ; la probabilidad de que posea c1 es de 0,9. Ademas, una de cada cuatro

empresas, que posee la caracterıstica c1 , tambien posee la c2 .

Usaremos la regla anterior para calcular la probabilidad de que una de estas empresas,

escogida arbitrariamente, se encuentre en dicho estado financiero:

Ası, consideremos los eventos A : la empresa presente la caracterıstica c1 , y B : presente c2 .

Por los datos: P (A) = 0, 9 y P (B/A) = 1/4 = 0, 25.

14


Luego, por la regla del producto: P (A ∩B) = P (A)P (B/A) = 0, 225.

Propiedad (reglas de la probabilidad total y de Bayes) Sean A1, . . . , Ak, eventos

mutuamente excluyentes (esto es, Ai ∩ Aj = φ, para cualesquiera i 6= j) y exhaustivos (es

decir,k⊎i=1

Ai = Ω), y B otro evento. Esto se puede representar graficamente como sigue:

Entonces, tenemos las propiedades siguientes:

a) La regla de la probabilidad total: La probabilidad de B puede obtenerse mediante

una suma, como se muestra a continuacion:

P (B) =k∑i=1

P (B ∩ Ai) =k∑i=1

P (Ai)P (B/ Ai)

Es comun ilustrar esta regla mediante una tabla de probabilidades:

O, tambien, mediante un diagrama de arbol de probabilidades:

b) La regla de Bayes: Luego de saber de la ocurrencia del evento B, la probabilidad

que se le habıa asignado a Aj (para j = 1, . . . , k) se actualiza como:

P (Aj/ B) =P (Aj ∩B)

P (B)=

P (Aj)P (B/ Aj)k∑i=1

P (Ai)P (B/ Ai)

15


Ejemplo 1.9. En una companıa el 30 % de los proyectos es encargado al administrador 1,

el 20 % al administrador 2, y el resto al administrador 3. Cuando el proyecto esta a cargo

del administrador 1, solo en el 1 % de estos se comete un error grave; en el 3 % si es el

administrador 2 quien esta a cargo; y en el 4 % si es el administrador 3 el que esta a cargo.

¿Cual es la probabilidad de cometer un error grave al realizarse un proyecto?

En este caso los porcentajes se refieren a las probabilidades frecuenciales, y la pregunta puede

ser resuelta con porcentajes y un poco de razonamiento con aritmetica; pero se trata de usar

las propiedades de probabilidad que ya hemos visto, como lo haremos a continuacion:

Podemos considerar los eventos Ai : el proyecto es realizado por el administrador i, i = 1, 2, 3;

y B : cometer un error grave al realizar el proyecto.

Los datos son: P (A1) = 0, 3; P (A2) = 0, 2; P (A3) = 0, 5; P (B/A1) = 0, 01; P (B/A2) =

0, 03 y P (B/A3) = 0, 04.

Podemos ilustrar estos datos mediante la tabla siguiente:

A1 A2 A3 Total

B P (B ∩ A1) P (B ∩ A2) P (B ∩ A3) P (B)

Bc P (Bc ∩ A1) P (Bc ∩ A2) P (Bc ∩ A3) P (Bc)

Totales P (A1) = 0, 3 P (A2) = 0, 2 P (A3) = 0, 5 1

O mediante el diagrama de arbol siguiente:

16


Ası, la probabilidad de cometer un error grave al realizar el proyecto es:

P (B) = P (B ∩ A1) + P (B ∩ A2) + P (B ∩ A3)

= P (A1)P (B/A1) + P (A2)P (B/A2) + P (A3)P (B/A3)

= (0,3)(0,01) + (0,2)(0,03) + (0,5)(0,04)

= 0,029

Las probabilidades de la primera fila del cuadro, o la de cada rama del arbol, pueden ser

completadas usando la regla del producto, P (B ∩ Ai) = P (Ai)P (B/Ai), ası obtenemos:

A1 A2 A3 Total

B P (B ∩ A1) = 0, 003 P (B ∩ A2) = 0, 006 P (B ∩ A3) = 0, 02 P (B) = 0, 029

Bc P (Bc ∩ A1) P (Bc ∩ A2) P (Bc ∩ A3) P (Bc)

Totales P (A1) = 0, 3 P (A2) = 0, 2 P (A3) = 0, 5 1

Y:

Ejercicio: Al realizar un proyecto se cometio un error grave, ¿cual administrador tiene

mayor probabilidad de haberlo realizado?

17


Sugerencia: examine las probabilidades:

P (Ai/B) =P (Ai ∩B)

P (B)=P (Ai)P (B/Ai)

P (B), para i = 1, 2 y 3;

y luego determine a cual administrador corresponde la mayor probabilidad.

1.5. Independencia

Definicion 1.6. Dado un espacio muestral Ω, sobre cuyos eventos se tiene definida una regla

de asignacion de probabilidades P, se dice que dos eventos A y B son independientes, si:

P (A/ B) = P (A).

O, equivalentemente, si:

P (B/ A) = P (B).

Ası, esto significa que el conocimiento de la ocurrencia de uno de los eventos no altera la

probabilidad de que ocurra el otro.

Ejemplo 1.10. En el analisis costo-beneficio de la compra de cierta fabrica se considera,

para simplificar, que solo dos eventos pueden determinar el cierre de la fabrica al cabo del

primer ano: una demanda muy baja del producto que se fabricara, o que la fabrica se vuelva

anticuada debido a nuevas normas de control ambiental.

En este caso es razonable suponer que los eventos anteriores sean independientes, pues, la

ocurrencia de uno de ellos no altera la probabilidad de ocurrir el otro. Es decir, si denotamos

por A al primer evento, y por B al segundo, es claro que:

P (A/ B) = P (A) y P (B/ A) = P (B).

Supongamos que la probabilidad de que ocurra el primer evento antes mencionado sea 0,1,

y 0,05 la del segundo. Entonces, la probabilidad de que, durante el primer ano, ocurra una

demanda muy baja y que la fabrica se vuelva anticuada, puede obtenerse a partir de la regla

del producto y el concepto de independencia, ası, obtenemos que:

P (A ∩B) = P (A)P (B/A) = P (A)P (B) = 0, 1× 0, 05 = 0, 005.

Lo visto en el ejemplo anterior motiva la definicion equivalente siguiente.

Propiedad 1: A y B son eventos independientes si y solo si: P (A ∩B) = P (A)P (B).

Propiedad 2: Si A y B son eventos independientes, tambien lo son:

a) Ac y B; b) A y Bc; y c) Ac y Bc.

18


Observacion 1.6. Ası, podemos decir que dos eventos son independientes, si la probabilidad

de que ocurra uno de ellos no se altera aun sabiendo si ocurrio, o si no ocurrio el otro.

La definicion y propiedad anteriores se generalizan para una coleccion de eventos:

Definicion 1.7. Una coleccion de eventos, A1, A2, . . . , son independientes, si la

probabilidad de que ocurran simultaneamente cualquier numero finito de estos eventos, es

igual al producto de las probabilidades correspondientes.

Ası, por ejemplo, si se consideran n de tales eventos, digamos, Ai1 , Ai2 , . . . Ain , entonces:

P (Ai1 ∩ Ai2 ∩ . . . ∩ Ain) = P (Ai1)P (Ai2) . . . P (Ain)

Propiedad 3: Si en una coleccion de eventos independientes, A1, A2, . . . , se sustituye

cualquiera de los eventos Aij por su complemento Acij , entonces, los eventos que resultan

ası seguiran siendo independientes.

Observacion 1.7. Entonces, cuando se tiene independencia ocurre la simplificacion siguiente

de la regla del producto general:

P (Ai1 ∩ Ai2 . . . ∩ Ain) = P (Ai1)P (Ai2/Ai1)P (Ai3/Ai1 ∩ Ai2) . . . P (Ain/Ai1 ∩ . . . ∩ Ain−1)

Ejemplo 1.11. Los eventos A, B y C son independientes si se cumplen las igualdades

siguientes:

P (A∩B) = P (A)P (B), P (A∩C) = P (A)P (C), P (B∩C) = P (B)P (C) y P (A∩B∩C) =

P (A)P (B)P (C).

Ejemplo 1.12. Sea Ω = 1, 2, 3, 4 y los eventos A = 1, 4, B = 2, 4 y C = 3, 4.Si consideremos la probabilidad clasica, tenemos que:

P (A) = P (B) = P (C) = 2/4 = 1/2.

P (A ∩B) = P (A ∩ C) = P (B ∩ C) = 1/4 (pues A ∩B = A ∩ C = B ∩ C = 4).

Ası: P (A ∩B) = P (A)P (B), P (A ∩ C) = P (A)P (C) y P (B ∩ C) = P (B)P (C).

Sin embargo, P (A ∩ B ∩ C) 6= P (A)P (B)P (C). Es decir, estos tres eventos no son

conjuntamente independientes; pero dos cualesquiera de estos sı lo son.

Ejemplo 1.13. En el contexto del ejemplo 1.10, consideremos un perıodo de 3 anos.

Supongamos que, en cada uno de estos anos, la probabilidad de que la demanda sea muy

baja se mantenga constante, es decir igual a 0,1, e independientemente de los demas anos.

Interesa obtener la probabilidad de los eventos siguientes:

a) En cada uno de estos anos la demanda sea muy baja.

b) Por lo menos en uno de los anos de este perıodo la demanda sea muy baja.

19


c) Solo en un ano de este perıodo la demanda sea muy baja.

d) Solo en dos anos de este perıodo la demanda sea muy baja.

e) Por lo menos en dos anos de este perıodo la demanda sea muy baja.

Para obtenerlas definamos los tres eventos siguientes:

Ai : Durante el ano i la demanda sea muy baja, i = 1, 2, 3.

a) Aquı estamos interesado en el evento A1 ∩ A2 ∩ A3.

Por la independencia tenemos que:

P (A1 ∩ A2 ∩ A3) = P (A1)P (A2)P (A3)

= (0, 1)(0, 1)(0, 1)

= (0, 1)3

b) En este caso el evento de interes es A1 ∪A2 ∪A3, cuyo complemento es Ac1 ∩Ac2 ∩Ac3. Por

la independencia, resulta mas simple obtener la probabilidad del complemento, en efecto:

P (Ac1 ∩ Ac2 ∩ Ac3) = P (Ac1)P (Ac2)P (Ac3)

= (1− 0, 1)(1− 0, 1)(1− 0, 1)

= (1− 0, 1)3

= (0, 9)3

Ası, P (A1 ∪ A2 ∪ A3) = 1− P (Ac1 ∩ Ac2 ∩ Ac3) = 1− (1− 0, 1)3 = 1− (0, 9)3.

c) Aquı, el evento que interesa es: (A1 ∩ Ac2 ∩ Ac3) ] (Ac1 ∩ A2 ∩ Ac3) ] (Ac1 ∩ Ac2 ∩ A3).

Cuya probabilidad se puede obtener sumando las probabilidades de cada uno de los eventos

excluyentes anteriores, es decir:

P (A1 ∩ Ac2 ∩ Ac3) + P (Ac1 ∩ A2 ∩ Ac3) + P (Ac1 ∩ Ac2 ∩ A3)

Nuevamente por la independencia, tenemos que:

P (A1 ∩ Ac2 ∩ Ac3) = P (A1)P (Ac2)P (Ac3) = (0, 1)(1− 0, 1)(1− 0, 1) = (0, 1)(1− 0, 1)2

P (Ac1 ∩ A2 ∩ Ac3) = P (Ac1)P (A2)P (Ac3) = (1− 0, 1)(0, 1)(1− 0, 1) = (0, 1)(1− 0, 1)2

P (Ac1 ∩ Ac2 ∩ A3) = P (Ac1)P (Ac2)P (A3) = (1− 0, 1)(1− 0, 1)(0, 1) = (0, 1)(1− 0, 1)2

Por lo tanto, la probabilidad que interesa es: 3(0, 1)(1− 0, 1)2 = 3(0, 1)(0, 9)2.

d) Aquı, el evento que interesa es: (A1 ∩ A2 ∩ Ac3) ] (A1 ∩ Ac2 ∩ A3) ] (Ac1 ∩ A2 ∩ A3).

Cuya probabilidad se puede obtener sumando las probabilidades de cada uno de los eventos

excluyentes anteriores, es decir:

P (A1 ∩ A2 ∩ Ac3) + P (A1 ∩ Ac2 ∩ A3) + P (Ac1 ∩ A2 ∩ A3)

20


Nuevamente por la independencia, tenemos que:

P (A1 ∩ A2 ∩ Ac3) = P (A1)P (A2)P (Ac3) = (0, 1)(0, 1)(1− 0, 1) = (0, 1)2(1− 0, 1)

P (A1 ∩ Ac2 ∩ A3) = P (A1)P (Ac2)P (A3) = (0, 1)(1− 0, 1)(0, 1) = (0, 1)2(1− 0, 1)

P (Ac1 ∩ A2 ∩ A3) = P (Ac1)P (A2)P (A3) = (1− 0, 1)(0, 1)(0, 1) = (0, 1)2(1− 0, 1)

Por lo tanto, la probabilidad que interesa es: 3(0, 1)2(1− 0, 1) = 3(0, 1)2(0, 9).

e) Aquı el evento que interesa es la reunion del anterior, D, con el primero, A, es decir:

D ] A = (A1 ∩ A2 ∩ Ac3) ] (A1 ∩ Ac2 ∩ A3) ] (Ac1 ∩ A2 ∩ A3) ] (A1 ∩ A2 ∩ A3).

Y como estos eventos son excluyentes, la probabilidad que interesa es:

P (D ] A) = P (D) + P (A) = 3(0, 1)2(0, 9) + (0, 1)3.

Observacion 1.8. Se suele confundir el concepto de eventos independientes con el de eventos

excluyentes, esto sucede porque en el lenguaje comun y corriente independencia significa

autonomıa, ası, dos eventos excluyentes al no tener elementos en comun, son autonomos en

cuanto a sus elementos se refiere; pero la independencia de eventos se refiere a la autonomıa

de las probabilidades de ocurrir, de lo que carecen los eventos excluyentes, pues, si ocurre

uno de ellos el otro tendra una probabilidad nula de ocurrir.

Propiedad 4: Si en una coleccion de eventos independientes se escogen subcolecciones

disjuntas (de este modo ningun evento estara en mas de una subcoleccion) y en cada

subcoleccion se efectuan operaciones (de reunion, interseccion o complemento) con los

eventos que la integran, entonces, los eventos que resultan de estas operaciones tambien

son independientes.

1.6. Probabilidad clasica y combinatoria

Como fue visto en el ejemplo 1.4, para calcular la probabilidad clasica de un evento se

requiere contar su numero de resultados. Existen tecnicas que facilitan el conteo, estas son

parte del llamado analisis combinatorio, a continuacion describiremos brevemente algunas.

Definicion 1.8. (Numero combinatorio) Si m y n son dos numeros naturales, con m

mayor o igual que n, al numero:(m

n

)= C m

n =m!

n!(m− n)!

se le denomina combinatorio de m en n y nos da el numero de subconjuntos (o grupos), de

tamano n, que se pueden obtener a partir de m elementos.

Por m! entendemos el producto de los primeros m numeros naturales, es decir, m! =

1x 2x . . . xm, si m es mayor o igual que 1; y se define 0! como 1.

21


Ejemplo 1.14. Entre 20 empresas, de las cuales 5 son clasificadas del tipo ‘a’ y las otras

15 del tipo ‘b’, se toma una muestra al azar de 4 de estas. Podemos describir el espacio

muestral asociado a este experimento, Ω, como el conjunto de subconjuntos de tamano 4 que

se pueden determinar con 20 elementos.

De este modo se deduce que Ω tiene:(20

4

)=

20!

4! (20− 4)!=

20!

4! 16!=

17× 18× 19× 20

1× 2× 3× 4= 4 845 elementos o resultados.

Si quisieramos ser mas precisos podemos identificar a las empresas por los numeros naturales,

por ejemplo, del 1 al 20, donde los primeros 5 identifican a las del tipo a. Ası:

Ω = A / A ⊂ 1, . . . , 20, #(A) = 4 .

Note que todo elemento (resultado) A de Ω es un subconjunto (grupo), del conjunto

1, . . . , 20, integrado por 4 elementos.

Describamos dos eventos para ilustrar el uso del numero combinatorio en el conteo:

a) Seleccionar solo empresas del tipo a:

A1 = 1, 2, 3, 4, 1, 2, 3, 5, 1, 2, 4, 5, 1, 3, 4, 5, 2, 3, 4, 5

En este caso el subconjunto elegido, ademas de ser de cuatro elementos, estos deben ser solo

del conjunto 1, 2, 3, 4, 5, por lo tanto, A1 tiene:(5

4

)=

5!

4! 1!= 5 resultados o elementos,

cualquiera de estos resultados determina la ocurrencia del evento A1. Es decir, hay 5

posibilidades, entre 4 845, de que ocurra A1.

b) Seleccionar solo empresas del tipo b. Entonces, el grupo de 4 empresas debe estar integrado

solo por 4 de las seis del tipo b que hay en total, ası, este evento, digamos A2, tiene:(15

4

)=

15!

4! 11!=

12× 13× 14× 15

1× 2× 3× 4= 1 365 resultados o elementos.

En este caso hay 1 365 posibilidades, entre 4 845, de que ocurra A2. Ası, la probabilidad de

seleccionar solo empresas del tipo b es de 1 365 en 4 845.

A continuacion mostramos algunos de estos resultados:

A2 = 6, 7, 8, 9, 6, 7, 8, 10, . . . . , 6, 7, 8, 20, . . . . , 17, 18, 19, 20 .

Definicion 1.9. (Principio de la multiplicacion) Si una primera operacion se puede

llevar a cabo de m formas, y despues de esta una segunda operacion se puede realizar de n

formas, entonces, la operacion de llevar a cabo la primera operacion y luego la segunda, se

puede realizar de m× n formas posibles.

22


Ejemplo 1.15. En el mismo ejemplo anterior veamos dos eventos mas para ilustrar las dos

tecnicas vistas del analisis combinatorio:

a) A3 : Seleccionar solo tres empresas del tipo a. Ahora se completa el grupo de modo

que tenga tres empresas del tipo a y solo una del tipo b. Para determinar el numero

de resultados que tiene este evento podemos, por ejemplo, describir sus elementos

enumerandolos abreviadamente y como una matriz de m filas y n columnas, de este

modo el producto m× n nos dara el numero de resultados, veamos:

A3 =

1, 2, 3, 6, 1, 2, 3, 7, . . . 1, 2, 3, 20,1, 2, 4, 6, 1, 2, 4, 7, . . . 1, 2, 4, 20,

. . . . . . . . . . . .

3, 4, 5, 6, 3, 4, 5, 7, . . . 3, 4, 5, 20

Notemos que se han listado los resultados anteriores siguiendo un orden adecuado,

como para evitar dejar afuera alguno de ellos. Tambien observemos que en este arreglo

el numero de filas y el de columnas lo obtenemos usando el numero combinatorio. En

efecto, como una fila es determinada por las tres empresas del tipo a que se hayan

elegido, hay(

53

)= 5!

3!2!= 10 filas. Similarmente, cada columna es determinada por la

empresa del tipo b que se haya escogido, ası, hay(

151

)= 15!

1!14!= 15 columnas. Entonces,

el numero de casillas que hay en el arreglo anterior es 10× 15 = 150 (por el principio

de la multiplicacion), luego, el evento A3 tiene 150 resultados. Por lo tanto, hay 150

posibilidades, entre 4 845, de que ocurra A3.

b) A4 : Seleccionar dos empresas del tipo a y dos del tipo b.

Ahora tenemos que seleccionar dos empresas del tipo a, lo cual se puede hacer de(52

)= 5!

2!3!= 10 maneras, y seleccionar dos empresas del tipo b, lo cual se puede

hacer de(

152

)= 15!

2!13!= 105 maneras. Ası, por el principio de la multiplicacion, hay

10× 105 = 1 050 posibilidades para seleccionar dos empresas del tipo a y dos del tipo

b. Como lo hicimos con el evento anterior, podemos escoger un orden apropiado que

nos permita listar todas estas posibilidades como un arreglo de filas y columnas:

A4 =

1, 2, 6, 7, 1, 2, 6, 8, . . . 1, 2, 19, 20,1, 3, 6, 7, 1, 3, 6, 8, . . . 1, 3, 19, 20,

. . . . . . . . . . . .

4, 5, 6, 7, 4, 5, 6, 8, . . . 4, 5, 19, 20

En esta lista hay

(52

)= 5!

2!3!= 10 filas, cada una contiene

(152

)= 15!

2!13!= 105 columnas.

Ası, hay 10 × 15 = 150 casillas, cada una representa a uno de los resultados que

conducen a la ocurrencia de este evento. Por lo tanto, las posibilidades de que, al

tomar al azar un grupo de 4 empresas, resulten dos del tipo a y dos del tipo b son de

1050 en 4 845.

23


Observacion 1.9. El principio de la multiplicacion se generaliza para tres o mas operaciones.

Ejemplo 1.16. En el contexto del ejemplo 1.14, supongamos ahora que en cada una de las

proximas semanas se visitara una empresa distinta y escogida aleatoriamente. Y nos interesa

obtener la probabilidad de que en la primera y cuarta semana se visite a una empresa del

tipo a.

Ahora el espacio muestral no estara integrado por subconjuntos o grupos de tamano 4, sino

por cuartetos (grupo ordenado de tamano 4), es decir:

Ω = (a1, a2, a3, a4)/ ai ∈ 1, . . . , 20, ai 6= aj, i 6= j, i, j = 1, . . . , 20

Puesto que la primera empresa que visitar puede ser cualquiera de las 20, la segunda

cualquiera de las 19 restantes, la tercera cualquiera de las 18 restantes, y finalmente la cuarta

empresa por visitar puede ser cualquiera de las 17 restantes; entonces, por el principio de la

multiplicacion, el numero de resultados posibles lo podemos obtener mediante el producto

siguiente: #(Ω) = 20 x 19 x 18 x 17 = 116 280. Nuestro evento de interes lo podemos denotar

por E y describirlo como:

E = (a1, a2, a3, a4) ∈ Ω / a1, a4 ∈ 1, ..., 5

La primera empresa que visitar puede ser cualquiera de las 5 del tipo a, la cuarta cualquiera

de las 4 del tipo a restantes, la segunda empresa por visitar puede ser cualquiera de las 18

empresas restantes (entre las del tipo a y b), y la tercera cualquiera de las 17 restantes.

Entonces tenemos que #(E) = 5x4× 18× 17 = 6 120. Luego, P (E) = #(E)#(Ω)

= 6 120116 280

= 119.

Observacion 1.10. Si m y n son dos numeros naturales, con m mayor o igual que n, al

numero:

Pmn =

m!

(m− n)!= m(m− 1) . . . (m− (n− 1))

se le denomina numero de permutaciones de m en n y nos da el numero de n-tuplas (grupos

ordenados de tamano n) que se pueden obtener a partir de m elementos.

1.7. Probabilidad geometrica y frecuencial

Existe una infinidad de formas de asignar probabilidades a los eventos de un espacio

muestral, la mas conocida de todas es la llamada probabilidad clasica, pero el uso de una de

estas dependera de la situacion en particular. A continuacion veamos dos formas mas.

Definicion 1.10. (Probabilidad geometrica) Esta asignacion es analoga a la probabilidad

clasica; pero en este caso el experimento tiene un numero infinito e innumerable de resultados,

los cuales se encuentran distribuidos aleatoria e indistintamente (uniformemente) sobre toda

24


una region. Esta region puede ser un intervalo (por ejemplo de tiempo), un area o un volumen.

En este caso una manera natural de asignar probabilidades a los eventos del espacio muestral

(la region) es la siguiente:

P (A) =medida de A

medida de Ω

esto para cada evento, A, de Ω.

La medida a la que se refiere la definicion anterior depende de la dimension de la region.

Ası, en una dimension la medida usual es la longitud, en dos dimensiones el area, y en tres

el volumen. Ahora la probabilidad de un evento es proporcional a su medida.

Ejemplo 1.17. El precio del bien A varıa aleatoria y uniformemente entre 100 y 200 soles,

y el precio del bien B varıa entre 200 y 300 soles de manera aleatoria y uniformemente para

cualquiera que sea el precio del bien A.

Una persona que desea adquirir una unidad de cada bien dispone de un presupuesto de 450

soles. Se quiere cuantificar el riesgo que corre esta persona de no conseguir su objetivo.

En este caso el espacio muestral puede describirse como:

Ω = (x; y) ∈ R2 / 100 ≤ x ≤ 200, 200 ≤ y ≤ 300

Con la interpretacion siguiente: si (x; y) es un resultado de Ω, quiere decir que el precio del

bien A es x soles y el del bien B es y soles.

La persona desea que su presupuesto de 450 soles alcance, es decir, que ocurra el evento

siguiente: E = (x; y) ∈ Ω/ x + y ≤ 450 Y lo podemos representar graficamente junto al

espacio muestral como sigue:

Por la condicion del problema, cada resultado se distribuye indistintamente en toda la region

Ω, luego, la asignacion de probabilidades adecuada para cada evento, A, de Ω es

P (A) =medida de A

medida de Ω=area de A

area de Ω=area de A

1002.

25


En particular, la probabilidad de que el presupuesto de la persona sea insuficiente es

P (Ec) =50x50

2

1002= 0, 125

Esta probabilidad cuantifica el riesgo que corre la persona, cuando solo dispone de 450 soles

para adquirir una unidad de cada bien.

Definicion 1.11. Probabilidad frecuencial: Aquı, la probabilidad de un evento es

la frecuencia relativa con la que este ocurre en una gran cantidad de repeticiones del

experimento. Por tal motivo se acostumbra interpretarla como el porcentaje de veces que

suele ocurrir el evento en consideracion.

Ejemplo 1.18. En cierta region se ha observado la distribucion de los ingresos familiares

anuales (en ciertas unidades monetarias) siguiente:

x 0,5 0,75 1 1,5 2 2,5 4 8 9

F (x) 0,2 0,4 0,51 0,64 0,75 0,8 0,90 0.99 1

Entonces, si obtenemos las probabilidades de la manera frecuencial, podemos decir, entre

otras cosas, que

a) La probabilidad de que una familia tenga un ingreso anual de 1,5 um a lo sumo es 0, 64

(puesto que el 64 % de las familias ha tenido un ingreso de 1,5 um como maximo).

b) La probabilidad de que una familia tengo ingresos anuales entre 1 y 1,5 um es 0, 13.

c) La probabilidad de que una familia tengo ingresos anuales superiores a 2 um es 0,25,

pues el 75 % de las familias ha tenido un ingreso de hasta 2 um .

26


1.8. Ejercicios propuestos

Ejercicio 1.1.

Demuestre que la propiedad 6 de la probabilidad se generaliza como sigue:

P (A1 ∪ . . . ∪ An)

=n∑i=1

P (Ai)−∑∑

i<j

P (Ai∩Aj)+∑∑i<j<k

P (Ai∩Aj∩Ak)+ . . . +(−1)n+1P (A1∩ . . . ∩An).

En particular, si n = 3, se tiene que:

P (A1∪A2∪A3) = P (A1)+P (A2)+P (A3)−P (A1∩A2)−P (A1∩A3)−P (A2∩A3)+P (A1∩A2∩A3).

Ejercicio 1.2.

Cierto agente invierte en dos acciones con la meta de ganar mas de lo previsto, en por lo

menos una. La probabilidad de que gane mas de lo previsto en la primera es de 0,3; y la de

que solo gane mas de lo previsto en la segunda es de 0,2.

Cuantifique la confianza en lograr la meta.

Ejercicio 1.3.

En un supermercado los compradores tienen que elegir una de tres opciones de pago:

con dinero en efectivo, con credito proporcionado por el supermercado y con credito

proporcionado por otra entidad. La probabilidad de que un comprador pague con dinero

en efectivo es de 0,5. La probabilidad de que un comprador pague con credito proporcionado

por el supermercado es de 0,3. El supermercado propone a los compradores una donacion al

momento de pagar. La probabilidad de que un comprador pague con dinero en efectivo

y acepte donar es de 0,1. La probabilidad de que un comprador pague con credito

proporcionado por el supermercado y no acepte donar es de 0,05. La probabilidad de que un

comprador pague con credito credito proporcionado por otra entidad y acepte donar es de

0,15.

a) Exprese los datos dados con eventos previamente definidos e identifique una particion

conveniente del espacio muestral.

b) Determine la probabilidad de que un comprador pague con credito proporcionado por

otra entidad.

c) Determine la probabilidad de que un comprador pague con credito proporcionado por

el supermercado y acepte donar.

d) Determine la probabilidad de que un comprador acepte donar.

27


Ejercicio 1.4.

Sean P1 y P2 dos probabilidades definidas para los eventos de Ω.

Para cada evento A de Ω, se define Q(A) de la manera siguiente:

Q(A) =1

4P1(A) +

3

4P2(A) .

a) Demuestre que Q(A) ≥ 0, para todo evento A de Ω.

b) Halle Q(Ω).

c) Si A1 , A2 , . . . es una coleccion de eventos mutuamente excluyentes, demuestre que

Q(A1 ] A2 ] . . . ) = Q(A1) +Q(A2) + . . .

d) ¿Es Q una probabilidad?

Ejercicio 1.5.

Sea P una probabilidad definida para los eventos de Ω. Sea C un evento tal que P (C) > 0.

Se define, para cada evento A de Ω :

Q(A) =P (A ∩ C)

P (C).

a) Demuestre que Q(A) ≥ 0, para todo evento A de Ω.

b) Halle Q(Ω).

c) Si A1 , A2 , . . . es una coleccion de eventos mutuamente excluyentes, demuestre que

Q(A1 ] A2 ] . . . ) = Q(A1) +Q(A2) + . . .

d) ¿Es Q una probabilidad?

Ejercicio 1.6.

Dados los eventos A1, A2 y A3, se sabe que

P (A1 ∩ A2 ∩ Ac3) = P (A1 ∩ Ac2 ∩ A3) = P (Ac1 ∩ A2 ∩ A3) = P (A1 ∩ A2 ∩ A3) = 18.

a) ¿Cual es la probabilidad de que los tres eventos ocurran?

b) Halle la probabilidad de que solo dos de los tres eventos ocurran.

c) Halle la probabilidad de que por lo menos dos de los tres eventos ocurran.

d) Halle la probabilidad de que por lo menos uno de los tres eventos no ocurra.

28


Ejercicio 1.7.

Si P (A ∩Bc ∩ C) = 0, 8 y P (A ∩Bc ∩ C ∩Dc) = 0, 5.

a) Halle P (A ∩Bc ∩ C ∩D).

b) Halle P (Ac ∪B ∪ Cc ∪Dc).

Ejercicio 1.8.

Como “aguas duras” se consideran aquellas que requieren cantidades considerables de

jabon para producir espuma y ocasionan incrustaciones en las tuberıas de agua caliente,

calentadores y otras unidades en las cuales se incrementa la temperatura del agua.

Las aguas pueden clasificarse, segun su dureza, en cuatro tipos: blanda (cuando contiene

maximo 75 mg/L de CaCO3), moderadamente dura (cuando contiene entre 75 y 150 mg/L

de CaCO3), dura (cuando contiene mas de 150 y hasta 300 mg/L de CaCO3) y muy dura

(cuando contiene mas de 300 mg/L de CaCO3).

Un administrador, encargado de la comercializacion de cierto jabon que sera vendido en todo

el paıs, ha determinado que:

i) La probabilidad de que el jabon sea usado con aguas blandas es de 2/9.

ii) La probabilidad de que el jabon se use con aguas blandas pero no alcance los

resultados deseados es de 1/36.

iii) Dos de cada cinco veces, el jabon se usara con aguas moderadamente duras y

alcanzara los resultados deseados.

iv) El 15 % de las veces, el jabon se usara con aguas duras y alcanzara los resultados

deseados.

v) La probabilidad de que el jabon se use con aguas muy duras es de 0,3.

vi) La probabilidad de que el jabon se use con aguas muy duras y no alcance los

resultados esperados es de 0,2.


conveniente del espacio muestral.

b) ¿Cual es la probabilidad de que el jabon alcance los resultados esperados y sea usado

con aguas blandas?

c) ¿Cual es la probabilidad de que el jabon alcance los resultados esperados y sea usado

con aguas muy duras?

d) ¿Cual es la probabilidad de que el jabon alcance los resultados esperados?

29


Ejercicio 1.9.

Un trastorno se manifiesta si, y solo si, se presentan por lo menos dos de tres sıntomas: s1 ,

s2 y s3 . La probabilidad de que se presenten los sıntomas s1 y s2 es de 0,56. La probabilidad

de que se presenten estos tres sıntomas es de 0,504. La probabilidad de que se presenten los

sıntomas s1 y s3 pero no s2 es de 0,105. La probabilidad de que se presenten los sıntomas s2

y s3 pero no s1 es de 0,117.


del espacio muestral.

b) La probabilidad de que se presenten los sıntomas s1 y s2 pero no s3

c) La probabilidad de que se presenten los sıntomas s1 y s3 .

d) La probabilidad de que se presenten los sıntomas s1 y s2 pero no s3

e) Determine la probabilidad de que se manifieste el trastorno.

Ejercicio 1.10.

La probabilidad de ganar en las operaciones financieras 1 y 2 son iguales a 0,3 y 0,4,

respectivamente; y la probabilidad de ganar en ambas es de 0,2. ¿Cual es la probabilidad de

ganar en, por lo menos, una de estas operaciones?

Ejercicio 1.11.

En la produccion de cierto bien se puede usar, por lo menos, uno de tres procedimientos

secundarios (1, 2 y 3), cada uno de estos tiene una probabilidad de 0,55 de ser usado. La

probabilidad de que se usen el procedimiento 1 y 2 durante la produccion es de 0,2. Los

procedimientos 1 y 3 son utilizados durante la produccion, con probabilidad 0,25; lo mismo

ocurre cuando se usan los procedimientos 2 y 3. Ademas, la probabilidad de usar los tres

procedimientos en la produccion es de 0,01.

Considere los eventos Ai : usar el procedimiento secundario i, para i = 1, 2 y 3.

a) Use los eventos Ai, antes definidos, y operaciones de conjuntos para expresar cada uno

de los eventos siguientes:

i) E1 : usar al menos uno de los procedimientos secundarios en la produccion.

ii) E2 : usar uno o dos de los procedimientos secundarios en la produccion.

iii) E3 : usar a lo sumo dos de los procedimientos secundarios en la produccion.

iv) E4 : ninguno de los procedimientos secundarios es usado en la produccion.

b) Determine la probabilidad de los eventos descritos en la parte anterior. Solo use

propiedades de la probabilidad y los resultados de la parte anterior.

30


Ejercicio 1.12.

Una entidad crediticia califica a las empresas de cierto grupo para otorgarles un credito si, y

solo si, estas poseen al menos una de tres caracterısticas (s1, s2, s3). La probabilidad de que

una de estas empresas posea una sola de las caracterısticas es de 0,28 y la probabilidad de

que posea solo dos, de 0,67. Considere los eventos Ni : la cantidad de estas caracterısticas

que posee una empresa es igual a i, para i = 0, 1, 2, 3.

a) Use los eventos antes definidos para expresar los eventos siguientes:

i) Una empresa de este grupo califique para el credito.

ii) Una empresa de este grupo no califique para el credito o bien califique por tener

las tres caracterısticas.

b) Determine el valor de la suma P (N0) + P (N1) + P (N2) + P (N3).

c) Determine la probabilidad de que una empresa de este grupo no califique para el credito

o bien califique por tener las tres caracterısticas.

d) Suponga que la probabilidad de que una empresa de este grupo califique para el credito

sea de 0,96. ¿Cual serıa la probabilidad de que una de las empresas del grupo posea

las tres caracterısticas?

Ejercicio 1.13.

La produccion de cierto bien tiene tres procedimientos secundarios, (1, 2 y 3), y la

probabilidad de usar al menos uno se estos es de 0,9. En la produccion se pueden usar

al mismo tiempo dos procedimientos secundarios, 1 y 2, con probabilidad 0,2; 1 y 3, con

probabilidad 0,25, y 2 y 3 tambien con probabilidad 0,25. Por ultimo, la probabilidad de

usar los tres procedimientos secundarios en la produccion del bien es 0,01. Determine la

probabilidad de cada uno de los eventos siguientes:

a) Solo se usen los procedimientos secundarios 1 y 2.

Recuerde la propiedad P (A ∩B) = P (A ∩B ∩ C) + P (A ∩B ∩ Cc)

b) Solo se usen los procedimientos secundarios 1 y 3.

c) Solo se usen los procedimientos secundarios 2 y 3.

d) Solo se usen dos de los procedimientos secundarios.

e) Se use solo uno de los procedimientos secundarios.

f) Ninguno de los procedimientos secundarios se use.

g) Se usen, a lo mas, dos de los procedimientos secundarios.

31


Ejercicio 1.14.

Al poner a la venta un producto, el administrador responsable ha determinado que solo

puede presentarse una de las cuatro situaciones de la demanda siguientes: muy desfavorable,

desfavorable, favorable y optima. Tambien ha calculado las probabilidades siguientes:

i) 1/8 de que la demanda sea muy desfavorable.

ii) 1/9 de que la demanda sea muy desfavorable y no se logre los resultados deseados.

iii) 1/4 de que la demanda sea desfavorable.

iv) 0,15 de que la demanda sea desfavorable y se logre los resultados deseados.

v) 1/4 de que la demanda sea favorable.

vi) 0,18 de que la demanda sea favorable y se logre los resultados deseados.

vii) 0,1 de que la demanda sea optima y no se logre los resultados deseados.

a) Exprese los datos dados con eventos previamente definidos.

b) ¿Cual es la probabilidad de que la demanda sea muy desfavorable y se logre los

resultados deseados?

c) ¿Cual es la probabilidad de que la demanda sea optima?

d) Halle la probabilidad de que la demanda sea optima y se logre los resultados deseados.

e) Halle la probabilidad de que se logre los resultados deseados.

Ejercicio 1.15.

La probabilidad de fabricar un artıculo defectuoso es de 0,1; y la probabilidad de que un

artıculo fabricado defectuosamente sea inservible es de 0,8. ¿Cual es la probabilidad de

fabricar un artıculo defectuoso e inservible?

Ejercicio 1.16.

Con el fin de ganar 5 000 soles un inversionista realizara una de tres opciones. La probabilidad

de que se realice la opcion 1 es 0,3. Si se realiza la opcion 1, la probabilidad de ganar 5 000

soles es 0,4. Si se realiza la opcion 2, lo cual ocurre con probabilidad 0,2, la probabilidad de

ganar 5 000 soles es 0,1. Cuando se realiza la opcion 3, la probabilidad de ganar 5 000 soles

es 0,25. Cuantificar la confianza del inversionista en esta situacion.

Ejercicio 1.17.

En el contexto del ejemplo 1.8, suponga ahora que una empresa se encuentra en dicho estado

financiero si tambien posee la caracterıstica c3 . Si, ademas de la informacion ya dada, se sabe

que el 75 % de las empresas, que poseen las caracterısticas c1 y c2 , tambien presenta la c3 ;

¿cual es la probabilidad de que una empresa se encuentre en este estado financiero?

32


Ejercicio 1.18.

En la identificacion de una ceramica2, de cierto lugar arqueologico, esta puede ser preincaica,

con probabilidad 0,3, o bien incaica. Para ayudar a la identificacion de esta ceramica se

observa si posee cierta caracterıstica distintiva. Si la ceramica es preincaica, la probabilidad

que que posea la caracterıstica distintiva es de 0,6; pero si la ceramica es incaica, la

probabilidad solo es de 0,1.


b) Determine la probabilidad de que la ceramica posea la caracterıstica distintiva.

c) En la identificacion de una ceramica, se observo que poseıa la caracterıstica distintiva.

Si el arqueologo encargado quiere maximizar su confianza en la identificacion ¿la debe

clasificar como incaica o preincaica?

Ejercicio 1.19.

Estudios acerca de la calidad han determinado que un producto tiene un problema de calidad

cuando presentan los tres defectos siguientes: 1 (mala presentacion), 2 (contenido) y 3 (peso).

La probabilidad de que el producto posea el defecto 1 es 0,05. Una de cada cuatro unidades

del producto que presentan el defecto 1, tambien presentan el defecto 2. Ademas, se sabe

que el 75 % de las unidades del producto, que presentan los defectos 1 y 2, tambien presenta

el defecto 3. Determine la probabilidad de que uno de los artıculos del producto presente un

problema de calidad.

Ejercicio 1.20.

Al realizar tres proyectos, c1 , c2 y c3 , un economista estima las probabilidades siguientes:

i) 0,3, de que el desarrollo de c3 no sea exitoso.

ii) 0,8, para el desarrollo exitoso de c2 , si es que c3 resultara exitoso.

iii) 0,1, de que el desarrollo de c1 no sea exitoso, si es que resultaran exitosos c3 y c2 .

El economista obtendra un beneficio si, y solo si, los tres proyectos resultaran exitosos. Halle

la probabilidad de que este economista obtenga un beneficio.

Ejercicio 1.21.

Sean P, Q y R probabilidades tales que para cada evento A de Ω : Q(A) = P (A/B) y

R(A) = Q(A/C). Demuestre que para cada evento A : R(A) = P (A/B ∩ C).

2Este ejercicio es una simplificacion de un problema de Reconocimiento de Patrones. Una referencia es el

libro Neural Networks for Pattern Recognition de Christopher M. Bishop, Oxford University Press 2000.

33


Ejercicio 1.22.

Sean P, Q, R y S probabilidades tales que para cada evento A de Ω : Q(A) = P (A/B),

R(A) = Q(A/C) y S(A) = R(A/D). Demuestre que para cada evento A :

S(A) = P (A/B ∩ C ∩D).

Ejercicio 1.23.

Si P (A ∩ C/B) = 0, 1, P (A ∩ Cc/B) = 0, 2, halle P (A/B).

Ejercicio 1.24.

Halle la probabilidad P (A ∪B ∪ C ∪D), si se conocen las probabilidades siguientes:

P (A) = 0, 1, P (Bc/Ac) = 0, 8, P (C/Ac ∩Bc) = 0, 3 y P (D/Ac ∩Bc ∩ Cc) = 0, 4.

Ejercicio 1.25.

Al realizar tres proyectos, c1 , c2 y c3 , un economista estima las probabilidades siguientes:

i) 0,7, para el desarrollo exitoso de c1 ;

ii) 0,8, para el desarrollo exitoso de c2 , si es que c1 resultara exitoso;

iii) 0,6, para el desarrollo exitoso de c2 , si es que c1 no resultara exitoso;

iv) 0,9, para el desarrollo exitoso de c3 , si es que resultaran exitosos c1 y c2 ;

v) 0,75, para el desarrollo exitoso de c3 , si es que resultara exitoso c1 pero no c2 ;

vi) 0,65, para el desarrollo exitoso de c3 , si es que resultara exitoso c2 pero no c1 ;

vii) 0,5, para el desarrollo exitoso de c3 , si es que no resultaran exitosos c1 ni c2 .

El economista obtendra un beneficio si, y solo si, por lo menos dos de los tres proyectos

resultaran exitosos. Cuantifique el riesgo que correra al realizar los proyectos.

Ejercicio 1.26.

Se debe realizar una de dos inversiones. La probabilidad de que se realice la inversion I es

de 0,3. Si se realiza la inversion I, la probabilidad de ganar 5 000 soles es de 0,4. Si se realiza

la inversion II, la probabilidad de ganar 5 000 soles es de 0,1.

a) ¿Cual es la probabilidad de que se realice la inversion I y se gane 5 000 soles?

b) ¿Cual es la probabilidad de que se realice la inversion II y se gane 5 000 soles?

c) ¿Cual es la probabilidad de que se gane 5 000 soles?

d) Si se gano 5 000 soles, ¿cual inversion es la mas probable de haber sido realizada?

34


Ejercicio 1.27.

En el contexto del ejemplo 1.10, suponga un perıodo de 4 anos y que la probabilidad de

que la demanda sea muy baja se mantenga constante durante este perıodo; demas, que

la probabilidad de que la fabrica se vuelva anticuada (por las nuevas normas de control

ambiental) al cabo del ano i, dado que no se hizo antes, sea 1− (0, 95)i, para i = 2, 3 y 4.

a) Determine la probabilidad de que, al cabo de este perıodo, la fabrica no tenga que

cerrarse.

b) Generalice el resultado anterior para un perıodo de n anos. ¿Puede concluir lo que

ocurrira en el largo plazo?

Ejercicio 1.28.

De los reportes sobre una operacion financiera, se tiene la informacion siguiente:

– la probabilidad de ganar menos de 20 mil soles es de 0,35;

– el 40 % de las veces se gana entre 20 mil y 40 mil soles;

– cuando se gana menos de 20 mil soles, la probabilidad de no lograr la meta es de 0,2;

– si se gana entre 20 mil y 40 mil soles, la probabilidad de que se logre la meta es de 0,6;

– la probabilidad de ganar mas de 40 mil soles pero no lograr la meta es de 0,01.

a) Halle la probabilidad de que se logre la meta.

b) Si se logro la meta, ¿en cual de los tres rangos mencionados es mas probable que se

encuentre la ganancia en la operacion? Recuerde justificar.

Ejercicio 1.29.

Las inversiones financieras (de resultados inciertos) han sido clasificadas, segun el riesgo de

perder, en tres tipos: de riesgo bajo, de riesgo normal y de riesgo alto. Segun las estadısticas,

la probabilidad de realizar una inversion de riesgo bajo es de 0,5 y la de realizar una inversion

de riesgo normal es de 0,3. Si la inversion es de riesgo bajo, la probabilidad de perder es de

0,1. La probabilidad de perder en una inversion de riesgo normal es de 0,15. Solo en una de

cada cinco inversiones, de riesgo alto, no se pierde.


b) Determine la probabilidad de perder cuando la inversion es de riesgo alto.

c) Determine la probabilidad de perder en una inversion financiera.

d) Si se perdio en la inversion, halle la probabilidad de que haya sido de riesgo bajo.

35


Ejercicio 1.30.

En la produccion de cierto bien se usa solo uno de tres procedimientos principales (1, 2 y

3) y opcionalmente, por lo menos, uno de dos procedimientos secundarios (4 y 5). Si se usa

el procedimiento 1, lo cual ocurre con probabilidad 0,6, cada uno de los procedimientos

secundarios tiene una probabilidad igual a 0,4 de ser usado; en este mismo caso, la

probabilidad de que se usen ambos procedimientos es de 0,2. Si se usa el procedimiento

2, pueden usarse los procedimientos secundarios (4 y 5) de manera independiente cada uno

y con probabilidades 0,2 y 0,3, respectivamente. El procedimiento 3 puede usarse con una

probabilidad de 0,25, en este caso, la probabilidad de usar al menos uno de los procesos

secundarios es 0,85.

a) ¿Cual es la probabilidad de usar al menos uno de los procedimientos secundarios en la

produccion del bien, si se sabe que se ha usado el procedimiento 1?

b) ¿Cual es la probabilidad de usar al menos uno de los procedimientos secundarios en la

produccion del bien y el procedimiento 1?

c) ¿Cual es la probabilidad de usar al menos uno de los procedimientos secundarios?

Ejercicio 1.31.

En un supermercado cada cliente decide, independientemente de los demas, si compra un

artıculo en promocion. Se sabe que el 75 % de los clientes suele comprar un artıculo en

promocion. Suponga que 4 clientes (1, 2, 3 y 3) ingresan en el supermercado.

Use los eventos: Ai, el cliente i decida comprar un artıculo en promocion, para i = 1, 2, 3

y 4, para expresar los eventos que se dan a continuacion y calcular sus probabilidades

correspondientes:

a) Ninguno de los cuatro clientes decida comprar un artıculo en promocion.

b) Solo uno de los cuatro clientes decida comprar un artıculo en promocion.

c) Solo dos de los cuatro clientes decida comprar un artıculo en promocion.

d) Solo tres de los cuatro clientes decida comprar un artıculo en promocion.

e) Por lo menos uno, de los cuatro clientes, decida comprar un artıculo en promocion.

Ejercicio 1.32.

Halle la probabilidad P (A ∪B ∪ C), en cada uno de los casos siguientes:

a) Estos eventos son excluyentes y cada uno tiene una probabilidad de 0,1.

b) Estos eventos son independientes y cada uno tiene una probabilidad de 0,1.

c) P (Ac) = 0, 3, P (Bc/Ac) = 0, 4 y P (C/Ac ∩Bc) = 0, 8.

36


Ejercicio 1.33.

Al invertir en las operaciones financieras 1, 2, 3, 4 y 5 se puede ganar, independientemente

y con probabilidades iguales a 0,1; 0,2; 0,3; 0,4 y 0,5, respectivamente.


b) Halle la probabilidad de que ganar solamente en las operaciones 1 y 5.

c) Halle la probabilidad de ganar en, por lo menos, una de estas operaciones.

d) Para un agente financiero resulta rentable la inversion en las cinco operaciones si, y

solo si, gana en por lo menos una de las tres primeras y gana en las dos ultimas. Halle

la probabilidad de que resulte rentable la inversion en las cinco operaciones.

Ejercicio 1.34.

En una planta de produccion continua de un producto, en cualquier lapso de un minuto

puede producirse una imperfeccion con probabilidad 0,3. Si para perıodos de observacion,

que no se traslapan, las imperfecciones producidas son independientes, cuan probables seran

los eventos siguientes, referidos a cuatro minutos de observacion que no se traslapan:

a) En los cuatro minutos de observacion se produzca una imperfeccion.

b) En al menos uno de los cuatro minutos de observacion se produzca una imperfeccion.

c) Solo en los dos primeros minutos de observacion se produzca una imperfeccion.

d) Solo en dos de los minutos de observacion se produzca una imperfeccion.

Ejercicio 1.35.

En el analisis costo-beneficio de la compra de cierta fabrica, se ha determinado que solo si

alguno de los dos eventos siguientes ocurre se producirıa una perdida: el evento E1, cuya

probabilidad de ocurrir es de 0,1, y el evento E2, cuya probabilidad es de 0,05. Tambien se

sabe que la probabilidad de que ocurran ambos eventos es de 0,02.

a) ¿Puede deducirse que los eventos E1 y E2 sean independientes?

b) ¿Cual es la probabilidad de que ocurra una perdida a causa unicamente del evento E1?

c) ¿Cual es la probabilidad de que ocurra una perdida a causa unicamente del evento E2?

d) ¿Cual es la probabilidad de que la compra ocasione una perdida?

37


Ejercicio 1.36.

A1, . . . , A5 es una coleccion de eventos independientes, cada uno tiene una probabilidad

de 0,9. Determine la probabilidad de los eventos siguientes:

(A1 ∪ Ac2) ∩ A3 y A1 ∪(A2 ∩ (A3 ∪ A4)

)∪ A5 .

Ejercicio 1.37.

En una obra hay seis operarios, cada uno puede cometer algun error con una probabilidad de

0,05 e independientemente de los demas operarios. Calcular sus respectivas probabilidades:

a) Ninguno de los seis operarios comete un error.

b) Por lo menos uno de los seis operarios comete un error.

c) Solo uno de los seis operarios comete un error.

d) Solo dos de los seis operarios cometen un error.

e) Solo tres de los seis operarios cometen un error.

f) Los seis operarios cometen un error.

g) A lo sumo dos de los operarios cometen un error.

Ejercicio 1.38.

Con fines de auditorıa sobre 18 empresas aseguradoras que funcionan en nuestro medio (entre

las cuales tenemos a El Pacıfico Peruano Suiza, Genarali Peru y La Positiva) se tomara una

muestra aleatoria de 5 de ellas. Determine la probabilidad de los eventos siguientes:

a) Que la muestra solo tenga una de las tres empresas antes citadas.

b) Que la muestra solo tenga dos de las tres empresas antes citadas.

c) La muestra incluya a las tres empresas mencionadas.

d) Que la muestra incluya al menos una de las tres empresas antes citadas.

Ejercicio 1.39.

En el contexto del ejemplo 1.17:

a) ¿Cual es la probabilidad de que un presupuesto de 350 soles garantice la adquisicion

de una unidad de cada bien?

b) Halle el presupuesto mınimo necesario para garantizar, con una probabilidad mayor o

igual que 0,95, la adquisicion de una unidad de cada bien.

c) Cuantifique el grado de confianza de aseverar que con un presupuesto de 450 soles se

puedan adquirir dos unidades del bien A y una del bien B.

38

2. Variable aleatoria

2.1. Introduccion

Si tenemos una variable, X, para la cual desconocemos como asume sus valores, podemos

cuantificar esta incertidumbre asignando probabilidades sobre sus valores, de este modo se

tendra un mejor conocimiento del comportamiento de ella. Esta asignacion debe ser tal que

nos permita obtener la probabilidad de que la variable X asuma valores sobre cualquier

subconjunto, A, de valores posibles, es decir, P (X ∈ A). Tambien es posible obtener un

modelo o funcion que nos de tal asignacion de probabilidades que permita una descripcion

de la variable. A continuacion formalizamos un poco mas lo anterior.

Definicion 2.1. Sea Ω un espacio muestral asociado a un experimento aleatorio. Una

variable aleatoria es una funcion, X, que transforma cada resultado, ω, del espacio muestral,

en un numero real X(ω).

X : Ω→ Rω 7→ X(ω)

Observacion 2.1. ¿Que interpretacion podemos dar a esta definicion formal? Para

averiguarlo pongamonos en el papel de una persona que recibe u observa los valores de la

variable, para ella estos valores tendran una naturaleza aleatoria, puesto que estos se originan

al transformar los resultados de un experimento aleatorio en numeros. El experimento que

da la aleatoriedad resulta, para dicha persona, como una “caja negra”, pues dicha persona

solo recibe los valores y no observa el experimento mismo, por lo tanto, para tener una

descripcion de ella tendra que hacerlo de manera indirecta y no a traves del experimento

aleatorio mismo.

Ejemplo 2.1. En el contexto del ejemplo 1.14 del capıtulo anterior, en donde se tienen 20

empresas, de las cuales 5 son clasificadas del tipo ‘a’ y las otras 15 del tipo ‘b’, se toma una

muestra al azar de 4 de estas. Entonces, el espacio muestral asociado a este experimento es:

Ω = A / A ⊂ 1, . . . , 20, #(A) = 4

con la interpretacion que las empresas estan identificadas por los numeros naturales del 1 al

20 y los primeros 5 identifican a las del tipo a.

39


A manera de ejemplo, consideremos la variable X definida como el numero de empresas del

tipo a, que resultaran en la muestra por seleccionar. X es una variable, puede asumir como

valores 0 o 1 o 2 o 3 o 4, es decir, el rango de X es RX

= 0, 1, 2, 3, 4. Ademas, X asume

sus valores de manera aleatoria.

Veamos como se generan los valores de X a partir del experimento aleatorio que la origina,

es decir, entremos a la caja negra, pues en este caso es muy simple hacerlo.

Describamos, por ejemplo, como se genera el valor 4 de X, es decir, el evento X = 4 (las

cuatro empresas seleccionadas son del tipo a) o, dicho de otro modo, cuales son los resultados

de este experimento que generan este valor o, cual es el evento asociado a este valor:

X = 4 = 1, 2, 3, 4, 1, 2, 3, 5, 1, 2, 4, 5, 1, 3, 4, 5, 2, 3, 4, 5.

Note que todo resultado, ω, de este evento tiene la propiedad de ser transformado en el

numero 4, es decir, X(ω) = 4, ya que han sido seleccionadas cuatro de las empresas del tipo

a. Son(

54

)= 5 resultados que se convierten en el valor 4.

A continuacion hagamos lo mismo para el resto de los valores posibles de esta variable:

X = 3 =

1, 2, 3, 6, 1, 2, 3, 7, . . . 1, 2, 3, 20,1, 2, 4, 6, 1, 2, 4, 7, . . . 1, 2, 4, 20,

. . . . . . . . . . . .

3, 4, 5, 6, 3, 4, 5, 7, . . . 3, 4, 5, 20

En este caso todo resultado, ω, de este evento tiene la propiedad de ser transformado en el

numero 3, es decir, X(ω) = 3, ya que han sido seleccionadas tres de las empresas del tipo a.

Son(

53

)×(

151

)= 10x15 = 150 resultados que se convierten en el valor 3.

X = 2 =

1, 2, 6, 7, 1, 2, 6, 8, . . . 1, 2, 19, 20,1, 3, 6, 7, 1, 3, 6, 8, . . . 1, 3, 19, 20,

. . . . . . . . . . . .

4, 5, 6, 7, 4, 5, 6, 8, . . . 4, 5, 19, 20

Aquı, todo resultado, ω, de este evento tiene la propiedad de ser transformado en el numero

2, es decir, X(ω) = 2, pues solo han sido seleccionadas dos de las empresas del tipo a. Son(52

)×(

152

)= 10× 15 = 150 resultados que se convierten en el valor 2.

X = 1 =

1, 2, 3, 6, 1, 2, 3, 7, . . . 1, 2, 3, 20,1, 2, 4, 6, 1, 2, 4, 7, . . . 1, 2, 4, 20,

. . . . . . . . . . . .

3, 4, 5, 6, 3, 4, 5, 7, . . . 3, 4, 5, 20

Note que todo resultado, ω, de este evento tiene la propiedad de ser transformado en el

numero 1, es decir, X(ω) = 1, pues solo ha sido seleccionada una de las empresas del tipo

a. Son(

51

)×(

153

)= 5× 455 = 2 275 resultados que se convierten en el valor 1.

40

Profesor Jose Flores Delgado Variable aleatoria 41

Finalmente:

X = 0 = 6, 7, 8, 9, 6, 7, 8, 10, . . . . , 6, 7, 8, 20, . . . . , 17, 18, 19, 20 .

Todo resultado, ω, de este evento tiene la propiedad de ser transformado en el numero 0,

es decir, X(ω) = 0, ya que no han sido seleccionadas empresas del tipo a. Son(

154

)= 1 365

resultados que se convierten en el valor 0.

Definicion 2.2. El rango de una variable aleatoria X, es el conjunto de valores posibles que

puede asumir la variable. Se lo denota por RX .

Ejemplo 2.2. En el ejemplo anterior, el rango de la variable aleatoria X es RX =

0, 1, 2, 3, 4.

Definicion 2.3. Se dice que una variable aleatoria es discreta, si su rango es un conjunto

discreto; y continua, si su rango es un conjunto continuo.

Ejemplo 2.3. La variable aleatoria X, del ejemplo 1, es discreta.

Ejemplo 2.4. En el ejemplo 1.17 del tema anterior, en donde el precio del bien A varıa

aleatoria y uniformemente entre 100 y 200 soles, y el precio del bien B varıa entre 200 y 300

soles, el espacio muestral es: Ω = (x; y) ∈ R2 / 100 ≤ x ≤ 200, 200 ≤ y ≤ 300 Con la

interpretacion siguiente: si (x; y) es un resultado de Ω, quiere decir que el precio del bien A

es x soles y el del bien B es y soles.

Consideremos ahora la variable T definida como el precio total para adquirir una unidad de

cada uno de estos productos. Entonces, cada resultado posible, ω = (x, y), es transformado

por esta variable, T , en el numero T ((x, y)) = x + y. Ası, esta variable solo puede asumir

valores entre 300 y 500, es decir, RT = [300, 500]. Por lo tanto, T es una variable aleatoria

continua. Esto ultimo se ilustra en la figura siguiente:

Observacion 2.2. Los dos ejemplos anteriores ilustran de manera sencilla el concepto de

variable aleatoria. En la aplicacion practica encontramos variables que se generan de modo

complejo y en estas situaciones usamos un modelo probabilıstico para describirlas, esta forma

de hacerlo se describira a continuacion.

41


2.2. Modelo probabilıstico de una variable aleatoria

Definicion 2.4. Sea Ω un espacio muestral y P una asignacion de probabilidades definida

sobre sus eventos. Entonces, el ‘modelo’ o distribucion de probabilidades de una variable

aleatoria, X, definida en Ω, es una funcion f : RX → R, con la propiedad que, para cualquier

subconjunto A, de valores posibles para la variable, es decir, A ⊂ RX , se tiene que:

P (X ∈ A) =

∑x∈A

f(x), si X es discreta;∫A

f(x)dx, si X es continua.

Es decir, la probabilidad de que X tome valores en A se determina sumando o integrando,

segun sea X discreta o continua, la funcion f en A.

Observacion 2.3. En el contexto de la inferencia estadıstica clasica, la variable aleatoria

modela a la variable medida en toda una poblacion y su distribucion de probabilidades

describe la frecuencia relativa de todos sus valores en dicha poblacion; mientras que en la

estadıstica descriptiva, se dispone tan solo de una muestra de la variable de la poblacion, por

lo tanto, la distribucion de frecuencias solo describe la frecuencia relativa de los valores en la

muestra; ası, esta es solo una aproximacion o estimacion de la distribucion de la variable de

la poblacion. Mas formalmente, si para cada n ∈ N+, X1, . . . , Xn es una muestra aleatoria

de X, A ⊂ R y p = 1n

n∑j=1

1Xj∈A = (la proporcion de valores de la muestra que estan en A);

entonces, un resultado conocido como la Ley Fuerte de los Grandes Numeros, garantiza que

lımn→∞

p = P (X ∈ A) (con probabilidad 1).

Notese tambien que si en la muestra se consideran solamente los valores no repetidos, digamos

x1, . . . xk, y fr(x1), . . . , fr(xk) sus respectivas frecuencias relativas; entonces, p =∑x∈A

fr(x).

Ası, en la muestra se usan las frecuencias relativas obtenidas, fr(x), pero para la poblacion

estas frecuencias relativas son reemplazadas por los valores proporcionados por el modelo

probabilıstico, f(x).

A continuacion ilustramos graficamente el caso continuo:

42


Ejemplo 2.5. Veamos como es la distribucion de probabilidades en el rango de la variable

del ejemplo 2.1. Para esto, consideremos x cualquier valor posible para X y apliquemos la

definicion dada al conjunto A = x, entonces, resulta que:

P (X = x) = P (X ∈ x) =∑y∈x

f(y) = f(x),

es decir, f(x) = P (X = x).

En la tabla siguiente se muestran los valores de f(x) = P (X = x), para cada valor posible

de X :x 0 1 2 3 4

f(x)

(154

)(204

) (51

)(153

)(204

) (52

)(152

)(204

) (53

)(151

)(204

) (54

)(204

)En este caso tenemos la formula explıcita general:

f(X = x) = P (X = x) =

(5x

)(15

4−x

)(204

) , para cualquier x ∈ RX = 0, 1, 2, 3, 4 .

Y de aquı, si aplicamos la definicion para cualquier subconjunto, A, de valores posibles para

la variable, es decir, A ⊂ RX , se tiene que:

P (X ∈ A) =∑x∈A

P (X = x) =∑x∈A

(5x

)(15

4−x

)(204

)Veamos como obtener las probabilidades de algunos eventos relacionados con esta variable

X, a partir de su modelo probabilıstico f .

i) La probabilidad de que sean seleccionadas mas de 2 empresas del tipo a es

P (X > 2) =4∑

x=3

f(x) = f(3) + f(4) =

(53

)(15

4−3

)(204

) +

(54

)(15

4−4

)(204

) .

ii) La probabilidad de seleccionar a lo mas una empresa del tipo a es

P (X ≤ 1) = f(0) + f(1) =

(50

)(15

4−0

)(204

) +

(51

)(15

4−1

)(204

)iii) La probabilidad de seleccionar tres empresas del tipo a es: P (X = 3) = f(3) =

(53)(

154−3)

(204 )

Observacion 2.4. El modelo probabilıstico, f , de una variable aleatoriaX, puede extenderse

hacia todo numero real, definiendola como cero en los casos fuera del rango. Ademas, en el

caso discreto a esta funcion se le llama tambien funcion de probabilidad; y en el caso continuo

funcion de densidad.

43


Ejemplo 2.6. El ingreso en soles, en un sector, se considera una variable aleatoria continua,

X, cuyo modelo probabilıstico esta dado por:

f(x) =

0, 0008x/1500, si 0 ≤ x < 1500

0, 002− 0, 0008x/1000, si 1500 ≤ x ≤ 2500

0, en otro caso

A modo de ejemplo, obtengamos la probabilidad de que un trabajador gane a lo sumo 1000

soles, es decir, P (X ≤ 1000). Como X es continua sigue, de la definicion de f, que

P (X ≤ 1000) =

∫ 1000

0

f(x) dx =

∫ 1000

0

0, 0008

1500x dx =

0, 0008

1500

x2

2

/x=1000

x=0

= 0, 2667

Ası, el 26, 67 % de los trabajadores de este sector gana a lo mas 1000 soles.

Tambien calculemos la probabilidad de que un trabajador gane 2000 soles o menos, es decir,

la probabilidad P (X ≤ 2000). En este conviene usar el complemento:

P (X ≤ 2000) = 1− P (X > 2000) = 1−∫ 2500

2000

(0, 002− 0, 0008x/1000) dx = 1− 0, 1 = 0, 9.

Ası, el 90 % de los trabajadores de este sector gana, a lo mas, 2000 soles.

2.2.1. Propiedades del modelo probabilıstico

El modelo o distribucion de probabilidades, f, de una variable aleatoria X, satisface las

propiedades siguientes:

1. Si X es discreta, para cualquier x ∈ RX se cumple que: f(x) = P (X = x).

2. Si X es continua, para cualquier valor x se tiene que: P (X = x) = 0.

3. Para cualquier x ∈ RX se cumple que f(x) ≥ 0.

44


4. Si X es discreta, se tiene que:∑

x∈RX

f(x) = 1.

5. Si X es continua, se tiene que:∫RX

f(x)dx = 1.

6. Si X es continua, se cumple que f es el modelo probabilıstico de X, si y solo si:

para cualesquiera a < b : P (a ≤ X ≤ b) =

b∫a

f(x)dx.

7. Si X es continua, para cualesquiera a < b, se tiene que:

P (a ≤ X ≤ b) = P (a ≤ X < b) = P (a < X ≤ b) = P (a < X < b)

= P (X ≤ b)− P (X ≤ a).

Observacion 2.5. En las aplicaciones, para determinar el posible modelo probabilıstico de

una variable aleatoria, se debe buscar entre las funciones que satisfagan las propiedades 3 y

4, en el caso discreto, y 3 y 5, en el caso continuo.

2.3. El valor esperado

Definicion 2.5. La esperanza o media de una variable aleatoria, X, cuyo modelo

probabilıstico es fX, se denota por E(X) o µ

X, y se le define, segun sea la variable discreta

o continua, mediante:

µX

= E(X) =

∑

x∈RXxf

X

(x); si X es discreta.∫RX

xfX

(x)dx; si X es continua.

Observacion 2.6. Resulta, entonces, que en el caso discreto: E(X) =∑

x∈RXxP (X = x).

Ası, la esperanza o media es el promedio de los valores posibles de la variable ponderados

con sus respectivas probabilidades. Para extender esta definicion al caso continuo usamos la

integral, en este caso dicha integral tiene una interpretacion fısica: representa la abscisa del

centro de gravedad de un cuerpo cuya densidad es descrita por f . Por esta razon, cuando la

variable es continua a la funcion f se le llama funcion de densidad.

Ejemplo 2.7. Para nuestro ejemplo 2.1 (con los datos del ejemplo 2.5) como X es discreta:

E(X) =∑

x∈RXxf(x) =

4∑x=0

xf(x)

= 0f(0) + 1f(1) + 2f(2) + 3f(3) + 4f(4)

= 0 + 1(5

1)(153 )

(204 )

+ 2(5

2)(152 )

(204 )

+ 3(5

3)(151 )

(204 )

+ 4(5

4)(150 )

(204 )

= 1

Entonces, cuando se extraen muestras de 4 empresas, se encontrara en promedio una empresa

del tipo a en cada muestra.

45


Observacion 2.7. Cuando se registra u observa una gran cantidad de valores de una variable

aleatoria, la media de todos estos es aproximadamente igual a la esperanza de la variable.

Mas formalmente, si para cada n ∈ N+, X1, . . . , Xn es una muestra aleatoria de X y

X = 1n

n∑j=1

Xj (la media de la muestra); entonces, un resultado conocido por la Ley Fuerte de

los Grandes Numeros, establece que, con probabilidad 1, lımn→∞

X = E(X). De allı el nombre

e importancia del valor esperado o media, pues, con este valor podemos anticipar lo que

ocurrira en promedio.

Ejemplo 2.8. En el contexto del Ejemplo 2.6, la media o valor esperado de los ingresos es:∫RX

xf(x) dx =

∫ 1500

0

xf(x) dx+

∫ 2500

1500

xf(x) dx

=

∫ 1500

0

x(0, 0008x/1500)dx+

∫ 2500

1500

x(0, 002− 0,0008x/1000)dx

= 600 + 733, 33 = 1333, 33

Es decir, el ingreso esperado o medio, en este sector, es de 1 333,33 soles.

2.3.1. Valor esperado de una funcion de una variable aleatoria

Sea X una variable aleatoria, con modelo probabilıstico fX

(x), y g : RX→ R una funcion.

Entonces, la esperanza de la variable aleatoria g(X) puede obtenerse usando la distribucion

de probabilidades de X, segun sea esta discreta o continua, como se indica a continuacion:

E(g(X)) =

∑x∈RX

g(x)fX

(x); si X es discreta.

∫RX

g(x)fX

(x)dx; si X es continua.

Observacion 2.8. Esta propiedad es muy importante: desde el punto de vista practico, pues,

al establecer que con el modelo probabilıstico de una variable aleatoria se puede determinar

el valor esperado de cualquier funcion de esta, entonces no es necesario determinar el modelo

para la variable que es funcion de otra cuyo modelo es conocido; y desde el punto de vista

teorico, pues, permite deducir otras propiedades del valor esperado relacionadas con funciones

de una variable aleatoria, como las que se daran mas adelante.

Observe tambien que, en el caso discreto: E(g(X)) =∑

x∈RX

g(x)P (X = x).

Ejemplo 2.9. La demanda diaria de un artıculo se considera una variable aleatoria discreta,

X, con modelo probabilıstico:

f(x) =2x

6(x!), x = 1, 2, 3, 4.

46


El fabricante, de estos artıculos, decide producir 2 unidades diarias, durante un perıodo

de muchos dıas. Cada unidad vendida, del artıculo, genera una utilidad de 5 soles; pero

cualquier unidad que no se vende, al cabo del dıa, se desecha y genera una perdida de 3

soles. El fabricante desea saber cual sera la utilidad promedio, durante este perıodo.

Como la utilidad diaria es una funcion g(X), usamos la propiedad anterior para averiguarlo.

Los valores de g y f se muestran en la tabla siguiente:

x 1 2 3 4

g(x) 5(1)− 3(1) = 2 5(2)− 3(0) = 10 5(2)− 3(0) = 10 5(2)− 3(0) = 10

f(x) 21

6(1!)= 1

322

6(2!)= 1

323

6(3!)= 2

924

6(4!)= 1

9

Ası la utilidad esperada esta dada por:

E(g(X)

)=∑x∈RX

g(x)f(x) =4∑

x=1

g(x)f(x) = 2× 13

+ 10× 13

+ 10× 29

+ 10× 19

= 223.

Es decir, la utilidad diaria promedio, en este perıodo, sera de 7,33 soles.

Observacion 2.9. Un error frecuente es pensar que E(g(X)) = g(E(X)), es decir, que para

obtener el valor esperado de una funcion de X, baste evaluar g en E(X). Una excepcion

ocurre cuando la funcion g es lineal de la forma a+ bX, como se vera mas adelante.

Ejemplo 2.10. En el contexto del ejemplo anterior determinemos el valor esperado de X y

verifiquemos que E(g(X)) no es igual a g(E(X)).

Ası: E(X) =∑RX

xf(x) =4∑

x=1

xf(x) = 1 × 13

+ 2 × 13

+ 3 × 29

+ 4 × 19

= 199. Es decir, en

promedio, la demanda diaria es de 2,11 unidades. Ademas, en la tabla del ejemplo anterior

se puede apreciar que E(g(X)) 6= g(E(X)).

2.3.2. Otras propiedades del valor esperado

1. El valor esperado de una constante es dicha constante.

2. Para cualesquiera que sean las constantes a y b : E(a+ bX) = a+ bE(X).

3. Sean g1, . . . , gn, funciones, y a0 , a1 , . . . , an , constantes; entonces,

E(a0 + a1g1(X) + . . . + angn(X)

)= a0 + a1E(g1(X)) + . . . + anE(gn(X)).

Ejemplo 2.11. En el contexto del ejemplo 2.9, suponga que un comerciante compra cada

unidad demandada a 3 soles, y vende cada una a 6 soles; ademas la venta le produce un

costo fijo de 2 soles. Ası, la utilidad del comerciante es Y = 6X − 3X − 2 = 3X − 2. Por lo

tanto, por la propiedad anterior y el resultado del ejemplo anterior, la utilidad esperada del

comerciante es E(Y ) = E(3X − 2) = 3E(X)− 2 = 3(199

)− 2 = 133.

47


Ejemplo 2.12. Sea X una variable aleatoria tal que E(Xm) = m! , ∀m ∈ N+; entonces,

E(1 + 2X − 3X2 +X3) = 1 + 2E(X)− 3E(X2) + E(X3) = 1 + 2(1!)− 3(2!) + 3! = 3.

Ejemplo 2.13. (Teorıa de decisiones) Un comerciante debe decidir por cual de tres

proveedores comprar cierto producto. La demanda puede ser excelente, con probabilidad

0, 3, adecuada, con probabilidad 0, 5 o mala con probabilidad 0, 2. Y las utilidades semanales

(en soles) correspondientes dependen del proveedor y del estado de la demanda de los

consumidores, como se muestra a continuacion:

Estado de la demanda

Excelente Adecuada Mala

Proveedor

1 4000 1900 1800

2 2800 2850 1900

3 3100 2900 1200

La variable aleatoria que nos interesa esta asociada a los valores del estado de la demanda,

entonces, definamosla de la manera siguiente:

X =

1, si el estado de la demanda es excelente.

2, si el estado de la demanda es adecuado.

3, si el estado de la demanda es malo.

Estos valores son arbitrarios, solo sirven para diferenciar los posibles estados de la demanda.

a) Determinemos la mejor decision y la utilidad correspondiente, para cada valor posible

de la demanda:

Estado de la demanda X = x : 1 = Excelente 2 = Adecuada 3 = Mala

Decision: Proveedor 1 Proveedor 3 Proveedor 2

Utilidad= g(x) : 4000 2900 1900

Probabilidad P (X = x) = f(x) : 0, 3 0, 5 0, 2

b) Determinemos cual serıa la utilidad promedio del comerciante, si este pudiera enterarse

del estado de la demanda y obviamente tomara la mejor decision:

Como la utilidad es una funcion de X, el estado de la demanda, podemos usar la

propiedad anterior con g la funcion cuyos valores correspondientes estan en la tabla

anterior. Ası:

E(U) =∑

x∈RXg(x)f

X(x) = 4000× 0, 3 + 2900× 0, 5 + 1900× 0, 2 = S/. 3 030.

c) El comerciante enfrentara esta situacion durante muchas semanas, por eso, desde un

principio quiere optar por uno de los proveedores. ¿Cual es la mejor decision?

Por lo observado para el valor esperado, bastara comparar las utilidades esperadas,

E(Ui), que corresponderıan a cada decision posible (proveedor i elegido). Ası,

48


procediendo de manera analoga a lo efectuado en la parte anterior, nuevamente

podemos hacer una tabla que incluya los valores de estas utilidades:

Estado de la demanda X = x : 1 = Excelente 2 = Adecuada 3 = Mala

U1(x) : 4000 1900 1800

U2(x) : 2800 2850 1900

U3(x) : 3100 2900 1200

Probabilidad P (X = x) = f(x) : 0, 3 0, 5 0, 2

Resultara:

E(U1) =∑x∈RX

U1(x)fX

(x) = 4000× 0, 3 + 1900× 0, 5 + 1800× 0, 2 = S/. 2 550

E(U2) =∑x∈RX

U2(x)fX

(x) = 2800× 0, 3 + 2850× 0, 5 + 1900× 0, 2 = S/. 2 645

E(U3) =∑x∈RX

U3(x)fX

(x) = 3100× 0, 3 + 2900× 0, 5 + 1200× 0, 2 = S/. 2 620

Por lo tanto, la mejor decision sera optar por el segundo proveedor, ya que con este el

comerciante tendra una mayor utilidad promedio, en este caso de S/. 2 645.

d) Supongamos que el comerciante podrıa averiguar el estado de la demanda pagando un

precio. En promedio, ¿cual sera el valor maximo que podrıa pagar?

En la teorıa de decisiones, este valor se llama el “valor esperado de la informacion

perfecta”. Lo obtenemos comparando las utilidades esperadas antes obtenidas, bajo

el conocimiento perfecto del estado de la demanda y bajo incertidumbre. Ası, el

comerciante debera pagar, en promedio, S/. 3 030 − S/. 2 645 = S/. 385 como maximo.

2.4. Varianza y desviacion estandar

Definicion 2.6. La varianza de una variable aleatoria X cuya media o esperanza es µX, se

define como: E(X − µX

)2 y se la denota por V (X) o σ2X. Ası,

σ2X

= V (X) = E(X − µX

)2 = E(X − E(X))2

A la raız cuadrada de la varianza, σX, se le llama desviacion estandar.

Observacion 2.10. La desviacion estandar mide la variabilidad promedio respecto a la

media. Por medio de la propiedad basica del valor esperado, puede verificarse que:

σ2X

= E(X2)− µ2X

Ejemplo 2.14. Calculemos la desviacion estandar de la variable X del ejemplo 2.1 (con los

datos de los ejemplos 2.5 y 2.7).

49


Primero calculamos E(X2). Para esto basta usar la propiedad que permite obtener el valor

esperado de una funcion de una variable aleatoria discreta, ası:

E(X2) =∑x∈RX

x2f(x) =4∑

x=0

x2f(x)

= 02f(0) + 12f(1) + 22f(2) + 32f(3) + 42f(4)

= 0 + 1

(51

)(153

)(204

) + 4

(52

)(152

)(204

) + 9

(53

)(151

)(204

) + 16

(54

)(150

)(204

)= 3, 1053.

Luego σ2X

= E(X2)− µ2X

= 3, 1053− 12 = 2, 1053; y σX

= 1,4509. Entonces, en general, los

valores de X no varıan demasiado entorno de su media.

Ejemplo 2.15. Calculemos ahora la desviacion estandar de la variable X del ejemplo 6.

Nuevamente calculamos primero E(X2), pero ahora usamos la propiedad que permite obtener

el valor esperado de una funcion de una variable aleatoria continua:

E(X2) =

∫RX

x2f(x) dx =

∫ 1500

0

x2fX

(x) dx+

∫ 2500

1500

x2fX

(x) dx

=

∫ 1500

0

x2(0, 0008x

1500)dx+

∫ 2500

1500

x2(0, 002− 0,0008x

1000)dx

= 675 000 + 1 366 666, 7 = 2 041 666, 7.

Ası, σ2X

= E(X2)− µ2X

= 3 408 333, 4− (1333, 3333)2 = 26 3889, 0201 y σX

= 513, 70.

En resumen, el ingreso medio del sector es de 1 333,33 soles y la desviacion promedio de los

ingresos entorno de esta media es de 513,7 soles.

2.4.1. Propiedades de la varianza

La varianza tiene, entre otras, las propiedades siguientes:

1. Si a y b son constantes, entonces V (a+ bX) = b2V (X).

2. Desigualdad de Chebyshev: Si X es una variable aleatoria, entonces, para cualquier

k > 0 se cumple que:

P (| X − µX | ≤ kσX) ≥ 1− 1

k2

o, equivalentemente:

P (| X − µX | > kσX) <1

k2

50


Observacion 2.11. De la desigualdad anterior se deduce que la proporcion de veces con

la cual la variable asume valores que disten de la media, en mas de tres veces la desviacion

estandar, es menor que un noveno. Por tal razon, a los valores que distan de la media, en mas

de tres veces la desviacion estandar, se les puede llamar valores poco frecuentes o inusuales.

2.5. Funcion de distribucion acumulada

Definicion 2.7. Si X es una variable aleatoria, discreta o continua, se define su funcion de

distribucion acumulada, FX, mediante:

FX

(x) = P (X ≤ x), para cada x ∈ R.

Luego, recordando como se obtienen las probabilidades a traves de la ley o distribucion de

probabilidades de X, fX

(x), se tiene que:

FX

(x) =

∑y≤x

fX

(y); si X es discreta.

x∫fX

(y) dy; si X es continua.

Ejemplo 2.16. En el contexto del ejemplo 2.6, en donde el ingreso en soles, en un sector,

se considera una variable aleatoria continua, X, con densidad:

f(x) =

0,0008x/1500, si 0 ≤ x < 1500.

0,002− 0,0008x/1000, si 1500 ≤ x ≤ 2500.

0, si x /∈ [ 0; 2500 ].

Obtengamos la distribucion acumulada F (x) = P (X ≤ x) =x∫f(y) dy :

Si 0 < x ≤ 1500 : F (x) = P (X ≤ x) =

x∫0

fX

(y) dy =

∫ x

0

(0, 0008y/1500)dy =8

3x10−7x2.

Si 1500 ≤ x ≤ 2500 :

F (x) = P (X ≤ x) = 1−P (X > x) = 1−2500∫x

fX

(y) dy= 1−∫ 2500

x

(0, 002− 0, 0008y/1000) dy

= 0,002x− 4x10−7x2 − 1,5.

51


⇒ F (x) =

0, si x < 0.83

x10−7x2, si 0 ≤ x < 1500.

0,002x− 4x10−7x2 − 1,5, si 1500 ≤ x ≤ 2500.

1, si x > 2500.

Ahora veamos dos casos que ilustran como la distribucion acumulada facilita el calculo de

las probabilidades:

a) La probabilidad de que un trabajador gane entre 1000 y 2000 es:

P (1000 ≤ X ≤ 2000) = F (2000)− F (1000)

= 0,002(2000)− 4x10−7(2000)2 − 1,5− 83x10−7(1000)2

= 0,6333

Ası, el 63, 33 % de los trabajadores de este sector gana entre entre 1000 y 2000 soles.

b) La probabilidad de que un trabajador gane mas que el ingreso promedio (1333,33) es:

P (X > 1333, 33) = 1− F (1333, 33) = 1− 83

x10−7x2 = 0, 4741.

Con la densidad: P (X > 1333, 33) =

∫ 2500

1333,33

f(x)dx =

∫ 1500

1333,33

0,0008x1500

dx +

∫ 2500

1500

0,002−0,0008x100

dx;

con el complemento y la densidad: P (X > 1333, 33) = 1 − P (X ≤ 1333, 33) =

1−∫ 1333,33

0

0,0008x1500

dx = 1− 0, 5259 = 0, 4741.

2.6. Propiedades de la distribucion acumulada

La funcion de distribucion acumulada tiene las propiedades siguientes:

1. La distribucion acumulada es siempre creciente. Y si la variable es continua y su rango

es un intervalo, entonces es estrictamente creciente sobre este intervalo.

2. F es siempre continua por la derecha, es decir, lımy → x+

F (y) = F (x).

Ademas, el conjunto de puntos en los que presenta discontinuidad es enumerable y

estos solo son aquellos que tienen probabilidad positiva, pues, se cumple que para cada

52


x:

lımy→x−

F (y) = F (x)− P (X = x)

3. P (a ≤ X ≤ b) = F (b)− F (a) + P (X = a).

En particular, si X es continua: P (a ≤ x ≤ b) = F (b)− F (a).

4. Si X es continua con densidad continua: F ′(x) = f(x).

5. Si X es discreta y rango, digamos, RX = a1, a2, . . . , con a1 < a2 < . . . , entonces,

para i > 1 : f(ai) = P (X = ai) = F (ai)− F (ai−1).

Observacion 2.12. Las dos ultimas propiedades establecen que la distribucion acumulada

identifica al modelo o distribucion de probabilidades.

2.7. Tecnica del cambio de variable

Sean X e Y dos variables aleatorias, con Y una funcion de X. En algunos casos se puede

deducir el modelo probabilıstico de Y a partir del modelo de X, una tecnica para hacerlo se

detalla a continuacion:

a) Si Y es discreta fY

(y) = P (Y = y). Para hallar esta probabilidad se expresa el evento

Y = y en terminos de X; hecho esto se obtiene la probabilidad con el modelo de X.

b) Cuando Y es continua fY

(y) = P (Y = y) = 0; ası, lo explicado en la parte anterior

no es util. En este caso primero se determina la funcion de distribucion acumulada de

Y, a partir de FY

(y) = P (Y ≤ y). Es decir, se expresa el evento Y ≤ y en terminos

de X, hecho esto se expresa la probabilidad P (Y ≤ y) en terminos de la distribucion

acumulada de X. Obtenida FY, se deriva para obtener f

Y

(y) (esto ultimo por una

propiedad dada para los modelos de las variables continuas).

Ejemplo 2.17. Si la funcion de distribucion (o modelo probabilıstico) de la variable aleatoria

positiva X esta dada por fX

(x) = 2 e−2x, x > 0, determinemos la funcion de densidad de

la variable Y = 4X. Para esto no basta reemplazar x = y/4 en fX

(x), como podrıamos

pensar, pues, el modelo probabilıstico no es solo una funcion matematica, ademas de esto

determina probabilidades y otras cantidades relacionadas con la variable aleatoria (recuerde

la definicion).

Como Y es continua, primero debemos determinar FY

a partir de FX

:

FY

(y) = P (Y ≤ y) = P (4X ≤ y) = P (X ≤ y/4) = FX

(y/4).

Es decir, FY

(y) = FX

(y/4), luego se obtiene la derivada respecto de y :

53


fY

(y) = DyFY (y) = [F ′X

(y/4) ]Dy(y/4) = [ fX

(y/4) ] 14

= 2 e−2y/4 14

= 12e−y/2, y > 0.

Ejemplo 2.18. Sea X una variable aleatoria positiva, cuya funcion de probabilidad (o

modelo probabilıstico) esta dada por fX

(x) = x/210, para x = 1, . . . , 20. Sigamos la tecnica

antes descrita, para determinar la funcion de la variable Y = 2X.

Como Y es discreta: fY

(y) = P (Y = y).

Ademas, P (Y = y) = P (2X = y) = P (X = y/2) = fX

(y/2). Ası, fY

(y) = fX

(y/2) = y/420,

para y = 2, 4, . . . , 40.

54



Ejercicio 2.1.

El precio de una unidad del bien A varıa en el conjunto 1; 2; 3; 4 , lo mismo ocurre con

el precio del bien B, pero ademas el de B nunca es mayor que el de A.

a) Interesa observar simultaneamente los precios unitarios de cada bien. Determine (por

extension) un conjunto que describa el espacio muestral asociado.

b) Considere el espacio muestral anterior y la variable aleatoria X definida como el gasto

total al comprar una unidad de cada bien.

b1) Determine el evento (del espacio muestral) asociado con X = 4.

b2) Determine el evento asociado con X = 3.

b3) Determine el evento asociado con X = 8.

b4) Halle el rango de X.

b5) Si se considera la Probabilidad Clasica, halle P (X = 4).

b6) Si se considera como modelo probabilıstico de X a la funcion definida por

f(x) = x2/203, halle P (X ≥ 3).

Ejercicio 2.2.

Cierto productor fabrica un bien cuya demanda semanal, en toneladas, es una variable

aleatoria X, con rango entre 0 y 10 toneladas, y funcion de densidad f(x) = x/50, x ∈ RX.

Cada tonelada tiene un costo de produccion de diez mil soles y un precio de venta de 25 mil

soles. Suponga que en cierta semana el productor decide fabricar cinco toneladas.

a) ¿Cual es la probabilidad de satisfacer la demanda?

b) ¿Cual es la probabilidad de que se satisfaga la demanda y al mismo tiempo el productor

gane mas de 30 mil soles?

c) ¿Cual es la probabilidad de que la demanda no sea satisfecha?

d) ¿Cual es la probabilidad de que la demanda no sea satisfecha y al mismo tiempo el

productor gane mas de 30 mil soles?

e) ¿Cual es la probabilidad de que el productor gane mas de 30 mil soles?

f) Determine la produccion semanal que maximiza la utilidad esperada.

Ejercicio 2.3.

Sea X una variable aleatoria con rango 1, . . . , 20 . Determine el modelo probabilıstico si

este es constante en el rango de la variable.

55


Ejercicio 2.4.

El numero de automoviles que contaminan el ambiente, cada minuto, es una variable

aleatoria, X, cuyo modelo probabilıstico esta dado por: f(x) = e−2 2x

x!, x = 0, 1, . . .

a) Determine la probabilidad de que en un minuto no circulen automoviles que contaminen

el ambiente.

b) ¿Cual es la probabilidad de que en un minuto circulen mas de un automovil

contaminando el ambiente?

Ejercicio 2.5.

Considere los 55 datos siguientes:

1,

2, 2,

3, 3,

4, 4, 4, 4, 4

5, 5, 5, 5, 5,

6, 6, 6, 6, 6,

7, 7, 7, 7, 7, 7, 7, 7

8, 8, 8, 8, 8, 8, 8, 8,

9, 9, 9, 9, 9, 9, 9, 9, 9, 9

10, 10, 10, 10, 10, 10, 10, 10, 10,

a) Encuentre la proporcion de veces que ocurre cada uno de los valores anteriores y la

media de estos datos e indıquelas en la tabla siguiente:

x 1 2 3 4 5 6 7 8 9 10

p

b) Asuma que los valores dados correspondan a una muestra aleatoria de la variable

aleatoria X cuyo modelo probabilıstico esta dado por f(x) = x/55. Use este modelo

para completar la tabla siguiente:

x 1 2 3 4 5 6 7 8 9 10

P (X = x)

c) Diga si los resultados obtenidos en las partes anteriores estan en armonıa. Emplee la

Ley Fuerte de los Grandes Numeros.

d) Obtenga X (la media de la muestra de estos 55 datos) y E(X) (el valor esperado de

X); luego, diga si los resultados obtenidos estan en armonıa con la Ley Fuerte de los

Grandes Numeros.

56


Ejercicio 2.6.

Sea X una variable aleatoria continua que puede tomar cualquier valor y modelo

probabilıstico dado por f(x) = c1+x2 .

a) Determine el valor de la constante c.

b) Halle P (X > 0).

c) Demuestre que esta variable aleatoria no tiene valor esperado.

Ejercicio 2.7.

El ahorro de los habitantes de una ciudad (medido en miles de soles) es considerado una

variable aleatoria continua, X, cuyo modelo probabilıstico esta determinado por la regla

f(x) = x2/9, 0 ≤ x ≤ 3.

a) Segun este modelo probabilıstico, ¿que porcentaje de los habitantes de esta ciudad

ahorran mas de mil soles?

b) Segun este modelo probabilıstico, ¿cual es el ahorro promedio de los habitantes de esta

ciudad?

c) Segun las autoridades, el consumo de los habitantes de la ciudad, en funcion del ahorro,

esta dado por 1 + 4X. Si esto es ası, halle el consumo promedio.

d) Suponga que las autoridades han estimado un impacto en la economıa igual a 1000X2.

Si es ası, halle el valor esperado de este impacto.

Ejercicio 2.8.

Cierto productor fabrica un bien cuya demanda semanal, en kilogramos, es una variable

aleatoria X con densidad f(x) = 0, 002e−0,002x, x > 0. Cada kilogramo producido le cuesta

100 soles y lo vende a 250 soles. Toda cantidad que no logra vender el productor se pierde sin

generar un costo adicional al de su fabricacion. Suponga que en cierta semana el productor

decide fabricar 500 kilogramos.

a) ¿Cual es la probabilidad de satisfacer la demanda?

b) ¿Cual es la probabilidad de que se satisfaga la demanda y al mismo tiempo el productor

gane mas de cincuenta mil soles?

c) ¿Cual es la probabilidad de que la demanda no sea satisfecha?

d) ¿Cual es la probabilidad de que la demanda no sea satisfecha y al mismo tiempo el

productor gane mas de cincuenta mil soles?

e) ¿Cual es la probabilidad de que el productor gane mas de cincuenta mil soles?

57


Ejercicio 2.9.

Sea X una variable aleatoria discreta cuyos valores y probabilidades correspondientes se

muestran en la tabla siguiente:

x -2 0 2

P (X = x) 1/4 1/2 1/4

a) Halle P (X 6= 0).

b) Determine el valor esperado de X.

c) Determine el valor esperado de X2. ¿No deberıa cumplirse que E(X2) = [E(X) ]2 ?

d) Determine el valor esperado de 5 + 6X.

Ejercicio 2.10.

Se realizaran cinco inversiones; se sabe que por lo menos una resultara exitosa. Sea X la

variable aleatoria definida como la cantidad de inversiones que resulten exitosas. El modelo

probabilıstico de esta variable esta determinado por f(x) = c 2−x, x ∈ RX, con c una

constante.

a) Determine el rango de la variable aleatoria X.

b) ¿Cual es el valor de la constante c?

c) Halle la probabilidad de que mas de tres inversiones resulten exitosas.

d) Halle la probabilidad de que mas de dos inversiones resulten exitosas.

e) Halle el valor esperado del numero de inversiones que resulten exitosas.

f) Cada inversion tiene un costo de 100 soles; si la inversion resulta exitosa se gana 200

soles, pero si no resulta exitosa se pierde 150 soles. Obtenga el valor esperado de de la

utilidad que generara realizar estas cinco inversiones.

g) Halle el valor esperado de la razon existente entre el numero de inversiones que no

resulten exitosas y el numero de inversiones que resulten exitosas.

Ejercicio 2.11.

Sea X una variable aleatoria que puede asumir cualquier valor positivo y funcion de densidad

dada por f(x) = β e−β x, x > 0, con β > 0.

a) Verifique que, en efecto, f determina un modelo probabilıstico.

b) Demuestre que P (X > t+ h / X > t) = P (X > h), ∀ h, t > 0.

58


Ejercicio 2.12.

La distribucion de los ingresos, X, de los trabajadores en cierto sector laboral, esta deter-

minada por la funcion de densidad, definida entre 0 y 10000 soles, y cuya grafica se muestra

en la figura siguiente:

Suponga que un impuesto de solidaridad es implantado en este sector: los que ganan menos

de 2000 soles quedan exonerados; los que ganen entre 2000 y 3000 soles pagaran 10 soles, los

que ganen mas de 3000 pero menos de 8000 pagaran 15 soles; y los que ganen mas de 8000

soles pagaran 20 soles.

a) Halle el porcentaje de los trabajadores cuyos ingresos estan entre 2000 y 4000 soles.

b) ¿Que porcentaje de trabajadores tendra sus ingresos gravados con el impuesto?

c) ¿Que porcentaje de trabajadores debera pagar mas de 15 soles?

d) Determine el monto promedio que se pagara por este impuesto. Hagalo con el modelo

de X. Luego, use el modelo probabilıstico de la variable aleatoria Y, definida como el

monto pagado por trabajador debido al impuesto.

Ejercicio 2.13.

El tiempo (en anos) hasta la ocurrencia de cierto evento catastrofico se considera una variable

aleatoria continua, X, con modelo probabilıstico dado por: f(x) = 2 x/25 , 0 ≤ x ≤ 5.

a) Halle P (1 < X < 2).

b) ¿Cual es la probabilidad de que dicho evento ocurra despues de 2 anos?

c) Si ya hace un ano que no ocurre tal evento, determine la probabilidad de que pasen

mas de 2 anos todavıa.

d) Una persona adquiere una poliza, contra este tipo de evento, que le cuesta mil soles.

El contrato de la poliza estipula que esta vale solo por un ano y cubre solamente la

primera vez que ocurra el evento, de modo que si el evento ocurre en este perıodo la

companıa aseguradora le pagara una suma indemnizatoria de tres mil soles, pero no lo

volvera hacer si ocurriera nuevamente el evento.

d1) Determine la probabilidad de que la aseguradora gane dos mil soles.

d2) Determine la utilidad esperada de la aseguradora.

59


Ejercicio 2.14.

En cierta region se tomo una muestra aleatoria de 100 habitantes y se registro, para cada

uno de estos, el ingreso mensual (en miles de soles). Los resultados obtenidos se resumen en

la tabla siguiente:

Ingso. men. (miles de soles) [ 0, 1 [ [ 1, 2 [ [ 2, 3 [ [ 3, 4 [ [ 4, 5 ]

Numero de habitantes 6 19 33 31 11

Para realizar inferencias sobre los ingresos en la region entera se decidio considerar al ingreso

mensual (en miles de soles) de sus habitantes como una variable aleatoria continua, X, con

valores en el intervalo [0, 5] y modelo probabilıstico dado por

f(x) =

215x, si 0 ≤ x ≤ 3.

1− 15x, si 3 < x ≤ 5.

0, en otro caso.

a) Use el modelo considerado para calcular la proporcion de habitantes, en la region

completa, que ganan hasta tres mil soles.

b) Diga si los valores observados (mostrados en la tabla anterior) parecen estar en armonıa

con el modelo probabilıstico considerado. Haga los calculos que considere necesarios,

de modo que pueda sustentar su respuesta con estos y la Ley Fuerte de los Grandes

Numeros (aplicada a proporciones de muestras).

c) Halle E(X).

d) Interprete el valor obtenido en la parte anterior, segun este contexto.

e) Para tomar en cuenta solo los ingresos de quienes ganan hasta tres mil soles, se

considera la funcion siguiente:

g(x) =

x, si 0 ≤ x ≤ 3.

0, si 3 < x.

Use esta funcion y el modelo probabilıstico de X para hallar el ingreso promedio

de quienes ganan hasta tres mil soles. Luego calcule que proporcion representa este

promedio obtenido, respecto del ingreso promedio en la region entera (tambien obtenido

con el modelo)

f) Un especialista afirma que el ingreso total de esta region se distribuye desigualmente

entre sus habitantes. Trate de explicar si las proporciones obtenidas en las partes a y

e reflejan esta afirmacion.

g) El gasto en alimentos de los habitantes de esta region esta dado por 1+ 12X. Determine

el gasto promedio en alimentos en esta region.

60


Ejercicio 2.15.

En el contexto del ejercicio 1.27 del capıtulo de probabilidad, halle el rango, la funcion de

probabilidad, el valor esperado y la desviacion estandar de la variable, X, definida como el

numero de anos (del perıodo considerado) en los que la demanda es muy baja.

Generalizar el ejercicio para un perıodo de n anos.

Ejercicio 2.16.

Suponga que la proporcion diaria de veces que ciertos comerciantes evaden la entrega de

una boleta de pago es una variable aleatoria con funcion de densidad f(x) = 6x(1 − x),

0 ≤ x ≤ 1. Una muestra aleatoria de 100 comerciantes fue supervisada durante un dıa y se

registro, para cada uno de estos, la proporcion diaria de evasiones:

Proporcion de evasiones [ 0, 0,2 [ [ 0,2, 0,4 [ [ 0,4, 0,6 [ [ 0,6, 0,8 [ [ 0,8, 1 ]

Numero de comerciantes 9 26 30 25 10

a) Determine la probabilidad que corresponde a cada uno de los intervalos de la tabla

anterior, segun el modelo dado; luego, diga si estas probabilidades y los datos de la

tabla estan en armonıa con la Ley Fuerte de los Grandes Numeros (comente).

b) Determine e interprete el valor esperado de la proporcion diaria de evasion por

comerciante.

Ejercicio 2.17.

El tiempo (en anos) hasta la ocurrencia de cierto evento catastrofico puede considerarse

como una variable aleatoria continua con funcion de densidad f(x) = 0, 1e−0,1x, x > 0.

a) ¿Cual es la probabilidad de que pasen mas de 2 anos hasta la ocurrencia de dicho

evento?

b) Si ya hace un ano que no ocurre tal evento, determine la probabilidad de que pasen

mas de 2 anos todavıa.

c) ¿Encuentra extranos los resultados obtenidos en las partes anteriores? Generalice estos

considerando t anos, en lugar de 2, y h anos transcurridos en lugar de uno.

d) Una persona adquiere una poliza contra este tipo de evento. El contrato estipula que si

el evento ocurre antes del primer ano la companıa aseguradora debe pagarle una suma

indemnizatoria de 3000 soles por una unica vez. La poliza cuesta 5000 soles. Determine

la utilidad esperada de la aseguradora.

61


Ejercicio 2.18.

Supongamos que X, la demanda diaria de un artıculo, ha sido considerada como una variable

aleatoria discreta con modelo probabilıstico: f(x) = 16

( 2x

x!), x = 1, 2, 3, 4.

a) Antes de optar por el modelo anterior se tenıa informacion de la demanda diaria

correspondiente a sesenta dıas, que se resume por la distribucion de frecuencias

siguiente:

¿Le parece a usted que la eleccion de la distribucion de probabilidades es coherente

con esta informacion que se tenıa?

b) ¿Cual serıa la demanda diaria esperada?

c) Cada artıculo se vende por 5 soles. Cualquier artıculo que no se vende al cabo del

dıa se desecha, lo cual genera una perdida de 3 soles. El fabricante, de estos artıculos,

fijara su produccion diaria, N, que regira a lo largo de muchos dıas, y debe decidirlo

entre uno de los valores posibles de la demanda: 1 o 2 o 3 o 4 artıculos. ¿Cual es su

mejor decision?

Ejercicio 2.19.

La cantidad mensual (en toneladas) que suele vender un comerciante se considera una

variable aleatoria continua, X, con rango RX

= [ 0, 5 ] y modelo probabilıstico dado por:

f(x) = 2 x/25 , 0 ≤ x ≤ 5.

a) Determine la cantidad promedio que el comerciante vende mensualmente.

b) Determine la desviacion estandar de la cantidad mensual que vende el comerciante.

c) Adquirir cada tonelada le cuesta al comerciante una unidad monetaria. El precio de

venta por tonelada es de tres unidades monetarias. Ademas hay un costo fijo mensual

de cuatro unidades monetarias. Halle el valor esperado y la varianza de la utilidad del

comerciante.

62


Ejercicio 2.20.

El ingreso mensual (en miles de soles) de las familias de cierta region es una variable aleatoria

continua, X, con rango el intervalo [0; 2], y funcion de densidad f(x) = 1 − 12x, 0 ≤ x ≤ 2.

Para tomar en cuenta solo los ingresos de las familias que ganan hasta y miles de soles, con

0 ≤ y ≤ 2, se considera la funcion g cuya regla de correspondencia es la siguiente:

g(x) =

x, si 0 ≤ x ≤ y;

0, si x > y.

a) Halle h(y) = E(g(X)) : el ingreso promedio de quienes ganan hasta y miles de soles.

b) Halle Φ(y) =h(y)

E(X): la proporcion del ingreso promedio de quienes ganan hasta y

miles de soles, respecto al ingreso promedio en la region, 0 ≤ y ≤ 2.

c) Halle el Coeficiente de Gini: 1− 2E(

Φ(X)).

d) Bosqueje la Curva de Lorenz, es decir, la formada por los pares (F (x), Φ(x)). Concluya,

comparandola con la situacion de distribucion sin desigualdad.

Ejercicio 2.21.

Para el estudio de la distribucion de los ingresos de cierta region, se decidio considerar al

ingreso mensual (en miles de soles) de las familias (de esta region) como una variable aleatoria

continua, X, con valores en el intervalo [0, 8] y modelo probabilıstico determinado por la

funcion de distribucion acumulada siguiente: F (x) = 14x− 1

64x2 , si 0 ≤ x ≤ 8.

a) Use solo F para obtener la probabilidad P (2 < X ≤ 4).

b) Halle f : el modelo probabilıstico de X.

c) Halle E(X) e interpretelo en este contexto.

d) Para tomar en cuenta solo los ingresos de las familias que ganan hasta y miles de soles

(0 ≤ y ≤ 8), se considera la funcion g, con la regla de correspondencia siguiente:

g(x) =

x, si 0 ≤ x ≤ y,

0, si x > y.

d1) Halle h(y) = E(g(X)).

d2) Se define Φ(y) =h(y)

E(X), para 0 ≤ y ≤ 8. ¿Que representa Φ(y)?

d3) Obtenga Φ(y) (para 0 ≤ y ≤ 8).

d4) Haga un bosquejo de la Curva de Lorenz, es decir, de la curva formada por los

pares (F (y), Φ(y)). Concluya.

d5) Halle el Coeficiente de Gini: 1− 2E(

Φ(X)).

63


Ejercicio 2.22.

Sea X una variable aleatoria continua tal que P (X > 1) = 0, 2. Sea la variable aleatoria Y

tal que Y = 1, si X > 1, e Y = 0, si X 1. Determine el valor esperado de la variable Y.

Ejercicio 2.23.

El numero de semanas, X, en las que una inversion es de alto riesgo, durante cierto perıodo

de 8 semanas, tiene como modelo probabilıstico a la funcion dada por: f(x) =c(5)x

x!, x ∈ R

X.

Tambien se sabe que por lo menos en una semana (de este perıodo) la inversion es de alto

riesgo, pero no en todas las semanas sera ası.

a) Determine el rango de la variable aleatoria X.

b) ¿Cual es el valor de la constante c?

c) Determine la probabilidad de que en mas de la mitad de las semanas (de este perıodo)

la inversion sea de alto riesgo.

d) Determine la probabilidad de que en mas de dos de las semanas (de este perıodo) la

inversion sea de alto riesgo.

e) Halle el numero promedio de semanas en las que la inversion sera de alto riesgo.

f) Cuando la inversion es de alto riesgo la perdida en la semana es de 400 um; mientras

que cuando no lo es se obtiene una ganancia semanal de 500 um. Obtenga el valor

esperado de la utilidad semanal.

g) Determine el valor esperado de la proporcion existente entre el numero de semanas en

las que la inversion es de alto riesgo y el numero de semanas en las que no lo es.

Ejercicio 2.24.

Sea X una variable aleatoria con media µ = 14 y desviacion estandar σ = 2

a) Halle la media y la varianza de Y = 12X − 6.

b) Halle las constantes a y b para que la transformacion de X : Y = a + bX, tenga una

media de 50 y una desviacion estandar de 10.

c) Use la desigualdad de Chebychev para tener una idea de como es el valor de la

probabilidad: P (6 ≤ X ≤ 22).

d) Use la desigualdad de Chebychev para tener una idea de como es el valor de la


e) Use la desigualdad de Chebychev para tener una idea de como es el valor de la


64


Ejercicio 2.25.

Un psicoterapeuta, que se especializa en problemas de autoestima, ha registrado el tiempo

necesario que necesitan sus pacientes para revertir este problema. Ası, ha determinado que

esta variable puede considerarse continua, con un rango de valores entre 0, 5 y 4, 5 meses, y

funcion de densidad f(x) = x/10, 0, 5 ≤ x ≤ 4, 5.

a) Un alumno con problemas de autoestima inicia su terapia un mes antes de sus examenes

finales. ¿Cuan probable es que este tiempo sea suficiente para revertir su problema antes

de dichos examenes?

b) Determine e interprete el valor esperado del tiempo que necesitan los pacientes para

revertir este problema.

c) El costo de la terapia (en soles) puede considerarse como una variable, Y, que depende

del tiempo necesario para revertir este problema, X, como sigue:

Y =

400, si 0, 5 ≤ X ≤ 1.

600, si 1 < X ≤ 2.

1000, si 2 < X ≤ 3.

2000, si 3 < X ≤ 4, 5.

Determine e interprete el valor esperado del costo de la terapia. Use el modelo

probabilıstico de X; y luego el de Y.

Ejercicio 2.26.

La demanda, de cierto producto es una variable aleatoria discreta, X, con valores posibles

entre 0 y 100 unidades y funcion de distribucion acumulada:

FX

(x) =x(x+ 1)

10 100, x ∈ 0, 1, . . . , 100 .

La utilidad del fabricante del producto, en funcion de la demanda y en miles de soles,

esta dada por:

g(X) =

20X − 850, para X = 0, 1, . . . , 80.

750, para X = 81, 82, . . . , 100.

a) Determine la probabilidad de que el productor obtenga por lo menos 160 mil soles,

pero menos de 750 mil.

b) Determine la media de la utilidad del productor.

c) Halle la funcion de probabilidad de la variable aleatoria Y = g(X).

d) Emplee la definicion de valor esperado y el resultado anterior para determinar la media

pedida en la parte b.

65


Ejercicio 2.27.

Tres pacientes inician un tratamiento que durara un mes. Sea X el numero de estos pacientes

que estaran curados al cabo del mes. Suponga que el modelo probabilıstico para esta variable

esta dado por: f(x) = 2740

13x, x = 0, 1, 2, 3.

a) Determine el valor esperado del numero de pacientes que estaran curados al cabo del

mes.

b) Determine la desviacion estandar del numero de pacientes que estaran curados al cabo

del mes.

c) El costo por paciente que se recupere al cabo del mes es de tres unidades monetarias.

Cada paciente que no se recupera al cabo del mes origina un costo adicional de una

unidad monetaria. Ademas, hay un costo fijo de dos unidades monetarias. Halle el valor

esperado y la desviacion estandar del costo total.

Ejercicio 2.28.

Al invertir una cantidad en una operacion financiera se obtiene una tasa de rentabilidad, X,

modelada por la funcion de densidad siguiente:

f(x) =

x+ c, si − 1 ≤ x < 0.

d− x, si 0 ≤ x ≤ 1.

con c y d constantes. Ademas, en tres de cada ocho inversiones se gana, pero menos del 50 %

de lo invertido.

a) Determine las constantes c y d.

b) Determine la probabilidad de que la rentabilidad este entre - 0,3 y 0,7.

c) Halle el valore esperado de la rentabilidad.

d) Suponga que al invertir en esta operacion, se quiere que en el peor de los casos se pierda

una fraccion r de lo invertido. Determine el valor r para que lo anterior suceda con una

probabilidad de 0,95. Este valor r se conoce como el valor en riesgo (VaR) que tiene

una confianza del 95 %. Note que si c0 es la cantidad invertida y cf

es la cantidad al

final de la inversion; entonces, X =cf− c0

c0

. Si X > 0 : se gana; y si X < 0 : se pierde.

Ejercicio 2.29.

Sea X una variable aleatoria continua, con rango RX

= [ 0, 5 ] y modelo probabilıstico

dado por: f(x) = 2x/25 , 0 ≤ x ≤ 5. Halle E(g(X)

), si g(x) = 10x, 0 ≤ x ≤ 2 y

g(x) = −5x, 2 < x ≤ 5.

66


Ejercicio 2.30.

Una municipalidad verificara si las tiendas de su distrito cumplen una ordenanza dictada

recientemente. Con este fin, se escogera una muestra aleatoria de 20 tiendas.La cantidad de

tiendas, en la muestra que sera seleccionada, que incumplan la ordenanza es una variable

aleatoria, X, cuya funcion de probabilidad esta dada por: f(x) = x/210, x = 0, 1, . . . , 20 .

a) Determine la probabilidad de que por lo menos cinco de las tiendas, en la muestra por

seleccionar, incumplan la ordenanza.

b) Determine e interprete el valor esperado del numero de tiendas, en la muestra por

seleccionar, que incumplan la ordenanza.

c) Suponga que inspeccionar cada tienda de la muestra seleccionada costara 500 soles.

Ademas, cada deteccion originara un descuento de 500 soles en el costo, pues esta

cantidad sera pagada por el propietario de la tienda que incumpla la ordenanza; pero

cada tienda seleccionada que cumpla la ordenanza originara un costo adicional de 250

soles, pues el propietario de la tienda recibira un descuento en sus tributos por este

valor. El presupuesto para llevar a cabo este muestreo es de 12 750 soles.

c1) Cuantifique la confianza de este presupuesto para poder llevar a cabo el muestreo.

c2) Determine e interprete el valor esperado del costo para llevar a cabo el muestreo.

Ejercicio 2.31.

El numero de unidades defectuosas, que se pueden encontrar en un lote de artıculos,

corresponde a una variable aleatoria X cuya distribucion acumulada es:

F (x) =

0, si x < 0

0,75, si 0 ≤ x < 1

0,85, si 1 ≤ x < 2

0,925, si 2 ≤ x < 3

0,975, si 3 ≤ x < 4

1, si x ≥ 4

a) Use F solamente, sin obtener la funcion de probabilidad asociada f, para obtener las

probabilidades de los eventos siguientes:

i) No encontrar unidades defectuosas en el lote.

ii) Encontrar, como maximo, tres unidades defectuosas en el lote.

iii) Encontrar, por lo menos, una unidad defectuosa, pero maximo tres.

b) Determine el numero promedio de unidades defectuosas.

67


Ejercicio 2.32.

El fabricante de cierto producto debe decidir la cantidad ‘t’de toneladas que debe fabricar

mensualmente. Por estudios de mercado realizados por el fabricante sobre la demanda para el

mes siguiente, se llego a establecer que la demanda proyectada debe considerarse una variable

aleatoria continua, pudiendo asumir valores entre 0 y 10 toneladas y funcion de densidad

f(x) = x/50, 0 ≤ x ≤ 10. El costo de fabricacion y el precio de venta proyectados, por

cada tonelada del producto, son 10 mil y 20 mil soles, respectivamente. Ademas el estudio

de mercado le costo al fabricante 50 mil soles y naturalmente debera incluirlo en sus costos.

a) Suponga que el fabricante decidiera producir una cantidad t igual a 8 toneladas, ¿cual

serıa la probabilidad de que gane menos de 10 mil soles?

b) Determine el valor, t, que debe producir el fabricante para maximizar su utilidad

esperada.

Ejercicio 2.33.

El estudio de la demanda de un bien para el perıodo de los proximos tres anos (1, 2 y 3)

determino que esta podrıa ser muy baja en cualquiera de estos anos, de manera independiente

y con una probabilidad de un decimo. Las decisiones que se deben tomar dependen de la

variable aleatoria X, definida como la cantidad de anos (de este perıodo) en los que la

demanda sera muy baja.

a) Determine la probabilidad de que en los tres anos de este perıodo la demanda del bien

sea muy baja.

b) Determine la probabilidad de que solo en dos de los anos de este perıodo la demanda

del bien sea muy baja.

c) Halle RX, el rango de la variable aleatoria X.

d) Determine fX, el modelo probabilıstico de la variable X. Sugerencia: considere los

eventos Ai : la demanda sera muy baja en el ano i; i = 1, 2 y 3.

e) Halle el valor esperado de la cantidad de anos (de este perıodo) en los que la demanda

sera muy baja.

f) La utilidad de cierta inversion (en miles de soles) es una funcion g(X), con

g(x) =

1000, si x = 0.

1000− 200x, si x = 1 o 2.

1000− 400x, si x = 3 o 4.

Determine el valor esperado de esta utilidad.

68


Ejercicio 2.34.

En cierta inversion la utilidad generada es una variable aleatoria, X, con valores entre 6,5 y

7,5 miles de soles y funcion de densidad dada por:

f(x) =57

40− 51(x− 7)2

10; 6, 5 ≤ x ≤ 7, 5.

a) Halle la probabilidad de que esta inversion genere mas de siete mil soles de utilidad.

b) Una persona desea invertir de modo que su utilidad esperada sea de 7 mil soles. ¿Esta

inversion cumple este requerimiento?

c) Determine la probabilidad de que esta inversion genere utilidades superiores a la media.

d) Determine los valores de a y b, de modo que la probabilidad de que la utilidad generada,

X, este en el intervalo [ a , b ] sea igual a 0,95. Si es posible, hagalo de tal forma que la

longitud de este intervalo sea lo mas pequena posible.

e) Halle e interprete la utilidad esperada.

Ejercicio 2.35.

Se debe decidir cual debe ser el tamano de un lote, de cierto artıculo, que debe ser adquirido.

El tamano posible del lote puede ser 100, 200 o 400 unidades. Ademas, en cada lote, cada

unidad sin defectos genera una ganancia de 500 soles y cada unidad defectuosa origina una

perdida de 300 soles. Por otra parte, se sabe que la proporcion de unidades defectuosas, por

lote adquirido durante una semana, es una variable aleatoria discreta, X, cuya distribucion

acumulada, F, tiene la grafica siguiente:

Suponga el tamano del lote que se adquirira sera el mismo para un perıodo de muchas

semanas.

a) Si adquieren lotes de 100 unidades, ¿cual sera la utilidad esperada por lote?

b) Si adquieren lotes de 200 unidades, ¿cual sera la utilidad esperada por lote?

c) Si adquieren lotes de 400 unidades, ¿cual sera la utilidad esperada por lote?

d) ¿Cual es el tamano optimo del lote que se debe adquirir?

69


Ejercicio 2.36.

La proporcion de comerciantes evasores de cierto impuesto es una variable aleatoria continua,

X, cuyo modelo probabilıstico esta determinado por la funcion: fX(x) = 2,5 x, 0, 1 < x < 0,9.

La perdida para el fisco (en millones de soles) esta determinada por la variable Y = 10X+5.

a) Halle la probabilidad de que la proporcion de evasion sea superior a 0,3.

b) Halle la probabilidad de que la perdida del fisco este entre 7 y 9 millones de soles.

c) Determine e interprete el valor esperado de la proporcion de evasion.

d) Determine e interprete la desviacion estandar de la proporcion de evasion.

e) ¿Cual es el valor esperado de la perdida del fisco?

f) Determine, fY, la densidad de Y.

g) Emplee la definicion del valor esperado y el resultado anterior para determinar el valor

esperado pedido en la parte e.

Ejercicio 2.37.

La demanda de cierto bien es descrita por una variable aleatoria continua X, cuya funcion

de distribucion acumulada esta dada por: FX

(x) = 1 − e−x − x e−x, x > 0. La utilidad de

cierto comerciante (en miles de soles) es una funcion de la demanda: g(X), con g dada por:

g(x) =

1, si 0 < x ≤ 1.

x, si x ≥ 1.

a) Halle la probabilidad de que la demanda sea mayor que 4.

b) Halle la probabilidad de que la demanda este entre 2 y 5.

c) Halle la probabilidad de que el comerciante gane entre 2 mil y 3 mil soles.

d) Halle la probabilidad de que el comerciante gane entre 500 soles y 3 mil soles.

e) Determine la funcion de densidad de X.

f) Determine e interprete el valor esperado de la demanda.

g) Determine la desviacion estandar de la demanda.

h) Determine el valor esperado de la utilidad.

i) Determine la desviacion estandar de la utilidad.

70


Ejercicio 2.38.

La duracion, X (en horas), de un dispositivo electronico tiene una funcion de distribucion

acumulada dada por: FX

(x) = 1− e−x/3; x > 0.

a) Determine la probabilidad de que el dispositivo dure mas de dos horas.

b) Determine la probabilidad de que el dispositivo dure, maximo, una hora.

c) Determine la probabilidad de que el dispositivo dure entre 2 y 4 horas.

d) Determine la media de la duracion y su desviacion estandar.

e) Halle la probabilidad P ( |X − µX| ≤ 2σ

X).

Ejercicio 2.39.

Sea X es una variable aleatoria discreta con funcion de probabilidad dada por fX(x) =

0, 9 (0, 1)x−1, x ∈ N+. Se define Y = X − 1.

a) Determine E(X).

b) Determine, fY, la funcion de probabilidad de Y.

c) Determine E(Y ) con la funcion de probabilidad de X; y luego con la de Y.

Ejercicio 2.40.

Sea X una variable aleatoria continua, positiva, con funcion de distribucion acumulada dada

por FX

(x) = 1− e−4x2, x > 0. Sea Y = X2

a) Halle P (X > 2).

b) Halle P (2 ≤ X ≤ 4).

c) Determine, fX, la funcion de densidad de X.

d) Determine, FY, la funcion de distribucion acumulada de Y.

e) Determine, fY, la funcion de densidad de Y.

f) Determine E(Y ) con la funcion de densidad de Y ; y luego con la de X.

Ejercicio 2.41.

Sea X una variable aleatoria continua tal que E(X t) = et2, ∀t ∈ R.

a) Halle E(X), E(X2), E(X3) y V (X).

b) Halle E( 2 + 3e−1X + 4e−4X2 + e−9X3 ).

71


Ejercicio 2.42.

Sea X una variable aleatoria continua tal que E(Xm) =√π

2m+1 , ∀m > 0.

a) Halle E(1 + 12X).

b) Halle la varianza de X.

c) Halle E(4 + 5√πX + 2√

πX2 − 3√

πX3).

Ejercicio 2.43.

Sea X una variable aleatoria con rango RX

= R, media 3,5 y desviacion estandar 0,25.

La utilidad que genera una inversion, en funcion de X, esta dada por:

G(X) =

100; 2 ≤ X ≤ 4.

−160; X < 2 o X > 4.

a) Si usa la desigualdad de Chebychev ¿que podrıa concluir acerca de la probabilidad

P (3 ≤ X ≤ 4) ?

b) Segun su conclusion dada anteriormente, ¿que puede concluir acerca de la probabilidad

P (2 ≤ X ≤ 4) ?

c) ¿Puede asegurarse que la media de estas utilidades sea por lo menos 35?

Ejercicio 2.44.

Sea X una variable aleatoria continua y positiva, con funcion de densidad f (continua) y

funcion de distribucion acumulada F.

a) Si F (x) = 1− e−β x, x > 0 (con β > 0), demuestre que:

P (X > t+ h / X > t) = P (X > h), ∀ h > 0, ∀t > 0.

b) Si P (X > t+ h / X > t) = P (X > h), ∀ h, ∀t > 0, demuestre que:

F (x) = 1− e−β x, x > 0, con β = F ′(0) = f(0).

Sugerencia: exprese las probabilidades anteriores en terminos de F y compruebe que:

F ′(t) = limh→ 0+

F (t+ h)− F (t)

h= [1− F (t)] lim

h→ 0+

F (h)

h= [1− F (t)]F ′(0) , ∀t > 0.

Ejercicio 2.45.

Si X ∼ Pareto(1; θ); es decir, fX(x) = θ x−(θ+1), x > 1, con θ > 0. Determine E(X) y

V (X).

72


Ejercicio 2.46.

El numero de clientes que llegan a un cajero automatico, hasta el primero que realiza

una transferencia hacia otra cuenta, es una variable aleatoria discreta X cuya funcion de

distribucion acumulada esta dada por F (x) = 1− (0, 6)x, x = 1, 2, . . .

a) Halle la probabilidad de que el numero de clientes que lleguen al cajero, hasta el primero

que realice una transferencia hacia otra cuenta, sea mayor o igual que 2 pero menor o

igual que 20. Use solo F.

b) Halle P (X ≥ 4). Use solo F.

c) Halle f(x) = P (X = x), x = 1, 2, . . .

Ejercicio 2.47.

El tiempo (medido en minutos) hasta el primer automovil que pasa contaminando el ambiente

es una variable aleatoria continua, X, cuya funcion de distribucion acumulada esta dada por

F (x) = 1− e−2x, x > 0.

a) Halle la probabilidad de que el tiempo hasta el primer automovil que pasa

contaminando el ambiente este entre dos y cinco minutos. Use solo F.

b) Halle P (X ≥ 4). Use solo F.

c) Halle f(x), x > 0.

Ejercicio 2.48.

En el contexto del ejemplo 1.17 del capıtulo anterior:

a) Determine la funcion de distribucion acumulada de la variable aleatoria, T, definida

como el precio de venta total de una unidad de cada bien.

Sugerencia: use la probabilidad geometrica para determinar P (T ≤ t).

b) Determine la funcion de densidad de la variable T, definida en la parte anterior.

c) Obtenga e interprete el valor esperado y la desviacion estandar de T.

Ejercicio 2.49.

Sea X una variable aleatoria continua con funcion de densidad fX

(x) = 4x3, 0 ≤ x ≤ 1.

Considere la variable Y = 5X, halle fY

. Use la tecnica del cambio de variable descrita en la

seccion 2.7

73


Ejercicio 2.50.

Se dice que una variable aleatoria continua y positiva, X, tiene modelo exponencial con

parametro β (con β > 0) 1, si su modelo probabilıstico esta dado por

fX

(x) = β e−β x, x > 0.

Denotamos esto por X ∼ exp(β).

a) Si X ∼ exp(β), use la tecnica del cambio de variable (descrita en la seccion 2.7) para

hallar e identificar el modelo probabilıstico de Y = 17X. Incluya los parametros.

b) Si X ∼ exp(β), halle FX

(x), ∀x > 0.

c) Si X ∼ exp(β), halle el modelo de Y = eX .

d) Sea X como en el ejercicio 2.45, determine e identifique el modelo de Y = Ln(X).

Ejercicio 2.51.

Se dice que una variable aleatoria continua y positiva, X, tiene modelo gamma con

parametros α > 0 y β > 0, si su modelo probabilıstico esta dado por

fX

(x) =βα

Γ(α)xα−1 e−β x, x > 0;

con Γ la funcion gamma, definida por Γ(z) =

∫ ∞0

tz−1e−tdt, z > 0. Esto se denota por

X ∼ G(α, β).

Si X ∼ G(α, β), use la tecnica del cambio de variable (descrita en la seccion 2.7) para hallar

e identificar el modelo probabilıstico de Y = 2X. Incluya los parametros.

Ejercicio 2.52.

Se dice que una variable aleatoria continua y positiva, X, tiene modelo Weibull con

parametros α > 0 y β > 0, si su modelo probabilıstico esta dado por

fX

(x) = βα xα−1 e−β xα

, x > 0.

Esto se denota por X ∼ W (α; β).

a) Si X ∼ W (α; β), halle e identifique el modelo probabilıstico de Y = 2X.

b) Si X ∼ exp(β), halle e identifique el modelo probabilıstico de Y = Xα.

1Vease el ejercicio propuesto 2.11.

74


Ejercicio 2.53.

Otro de los modelos probabilısticos importantes para variables aleatorias positivas es el

Weibull generalizado. Este modelo se caracteriza por la distribucion acumulada siguiente:

F (x) =(1− e−βxα

)γ, x > 0;

con α > 0, β > 0 y γ > 0. Si X es una variable positiva que tiene este modelo, denotamos

esto por X ∼ Wg(α; β; γ).

a) Determine las probabilidades siguientes:

P (X > 5) y P (2 ≤ X < 5).

b) Use la tecnica del cambio de variable para hallar e identificar el modelo probabilıstico

de Y = δX, con δ > 0.

Ejercicio 2.54.

El modelo exponencial generalizado2 es una extension del modelo exponencial, definido en el

ejercicio 2.50, y es otro de los modelos importantes para variables aleatorias positivas. Este

modelo se caracteriza por la distribucion acumulada siguiente:

F (x) =(1− e−βx

)α, x > 0;

con α > 0 y β > 0. Sea X una variable positiva que tiene este modelo, denotamos esto por

X ∼ expg(α; β).

Use la tecnica del cambio de variable para hallar e identificar el modelo probabilıstico de

Y = γX, con γ > 0.

Ejercicio 2.55.

Se dice que una variable aleatoria continua, X, tiene modelo normal con parametros son µ

y σ2 (con µ ∈ R y σ > 0), si su modelo probabilıstico esta dado por

fX

(x) =1√2π σ

e−1

2σ2 (x−µ)2

, −∞ < x <∞.

Denotamos esto por X ∼ N(µ, σ2).

Si X ∼ N(µ, σ2), use la tecnica del cambio de variable (descrita en la seccion 2.7) para

hallar e identificar el modelo probabilıstico de Y = a + bX (con a ∈ R y b > 0). No olvide

dar los parametros.

2Gupta & Kundu(1999). Theory & methods: Generalized exponential distributions. Australian and New

Zealand Journal of Statistics, 41(2), 173–188.

75


Ejercicio 2.56.

Sea X ∼ N(µ, σ2), es decir, el modelo dado en el ejercicio 2.55. Use la tecnica del cambio

de variable para hallar el modelo de Y = (X − µ)/σ. Tenga el cuenta el ejercicio 2.51 para

reconocer el modelo obtenido anteriormente.

Si X ∼ N(µ, σ2), use la tecnica del cambio de variable (descrita en la seccion 2.7) para

hallar e identificar el modelo probabilıstico de Y = a + bX (con a ∈ R y b > 0). No olvide

dar los parametros.

Ejercicio 2.57.

En la tabla siguiente se muestran algunos valores de la funcion de distribucion acumulada,

F, de una variable aleatoria X :

x 1,0 1,5 2,0 2,5 3,0 3,5 4,0 4,5 5,0 5,5

F (x) 0,0190 0,0656 0,1429 0,2424 0,3528 0,4634 0,5665 0,6577 0,7350 0,7983

x 6,0 6,5 7,0 7,5 8,0 8,5 9,0 9,5 10,0 10,5

F (x) 0,8488 0,8882 0,9182 0,9409 0,9576 0,9699 0,9788 0,9851 0,9897 0,9929

Determine P (2 ≤ X ≤ 10) en cada una de las situaciones siguientes:

a) el conjunto de valores posibles de X es RX

=] 0; ∞ [ ;

b) el conjunto de valores posibles de X es RX

= 0; 0,5; 1; 1,5; . . . ; 11,5; 12 .

76

3. Modelos probabilısticos importantes

En las aplicaciones practicas algunas variables aleatorias se presentan con mucha

frecuencia, por tal motivo a sus distribuciones de probabilidad se les denomina distribuciones

importantes y son usadas como modelos probabilısticos para describir el comportamiento

de variables que asumen sus valores de modo incierto. Estas distribuciones o variables ya

han sido ampliamente estudiadas por importantes estudiosos del area de las ciencias, fueron

personas que tuvieron la capacidad de entrar en la “caja negra” en donde se originaban estas

variables y proporcionarnos la informacion mas relevante en un lenguaje a nuestro alcance, es

decir, nos proporcionaron los supuestos basicos que las gobiernan, para ası poder identificar

mas rapidamente otras variables similares, ası como tambien la funcion matematica o ley

de probabilidades que las describe. A continuacion veremos algunas de estas y empezaremos

con las que se originan a partir de dos de los procesos mas conocidos en probabilidad y

estadıstica: el proceso de Bernoulli y el proceso de Poisson, luego veremos otros modelos

como el normal.

3.1. Modelos relacionados con un proceso de Bernoulli

Nuestro punto de partida para tratar con un proceso de Bernoulli (y tambien con uno

de Poisson) es un evento de interes. Sucede que en determinado momento, por alguna

razon, nuestro interes se concentra en un evento incierto, por tal motivo, cuando este ocurra

podemos decir que se ha tenido exito, ası, podemos denominar a este evento de interes como

E: exito; mientras que a su complemento como Ec o F , que significara fracaso. En el proceso

de Bernoulli se puede decir que la observacion es discreta, puesto que lo hacemos dentro de

una secuencia de ensayos u oportunidades, en cada uno de ellos puede ocurrir el evento que

nos interesa o su complemento (todo lo demas que puede ocurrir).

Supongamos que en cualquier secuencia de ensayos, el evento E ocurra independiente-

mente y con la misma probabilidad en cada ensayo. Si el proceso de observacion del evento

E se da bajo estas condiciones, diremos que estamos frente a un proceso de Bernoulli.

Ası, si definimos la secuencia de eventos E1, E2, . . . , con Ei ocurrio E en el i-esimo

ensayo, tendremos que estos eventos son independientes y con la misma probabilidad, la

cual la denotamos por p, la probabilidad de exito; los complementos de estos eventos tendran

como probabilidad a 1− p, la probabilidad de fracaso, que sera denotada por q.

Ejemplo 3.1. Cuando un producto se ofrece en venta con una promocion, el promotor

de ventas esta interesado en averiguar si los clientes que visitara compraran el producto.

77


El promotor visitara a muchos clientes, cada uno de estos puede comprar el producto en

promocion. Cada visita origina un ensayo u oportunidad para observar si ocurre el evento

de interes: que el cliente compre el producto. Entonces, si cada cliente puede comprar el

producto independientemente de los demas y con la misma probabilidad, se tendra un proceso

de Bernoulli.

Ahora veamos los tres modelos que se generan a partir de un proceso de Bernoulli.

3.1.1. El Modelo o distribucion binomial

En un proceso de Bernoulli, definimos X como el numero de exitos obtenidos, en n

ensayos, entonces el modelo probabilıstico de X es dado por

f(x) = P (X = x) =

(n

x

)pxqn−x, x = 0, 1, . . . , n.

Cuando el modelo probabilıstico de una variable aleatoria X es de esta forma, se dice que

X tiene distribucion binomial con parametros n y p. Se denotara esto por: X ∼ b(n, p).

Los parametros sirven para identificar una distribucion especıfica, dentro de una familia de

distribuciones, en este caso de la forma antes indicada.

Los valores esperados son: µX

= np y σ2X

= npq

La distribucion acumulada no tiene una formula explıcita particular.

Ejemplo 3.2. En el contexto del ejemplo 1, supongamos que los registros acerca de este tipo

de promociones indican que el 75 % de los clientes suele comprar el producto cuando se da

esta promocion. Ası, tenemos que la probabilidad de nuestro evento de interes (que el cliente

visitado compre el producto) es P (E) = 0, 75. Supongamos ahora que el promotor visite a

50 clientes, entonces, si X es el numero de clientes que compraran el producto, tenemos que:

X ∼ b(50; 0, 75).

Esto se justifica porque X puede ser vista como el numero de exitos en una secuencia de

50 eventos de un proceso de Bernoulli. Siendo ası, tenemos que la probabilidad de que x de

estos clientes compren el producto es:

f(x) = P (X = x) =

(50

x

)(0, 75)x(0, 25)50−x, x = 0, 1, . . . , 50.

En particular la probabilidad de que 30 clientes compren el producto es:

P (X = 30) = f(30) =

(50

30

)(0, 75)30(0, 25)50−30 = 0, 0077.

La media (promedio) o valor esperado del numero de clientes que compraran el producto es:

µX

= E(X) = np = (50)(0, 75) = 37, 5.

78

Profesor Jose Flores Delgado Modelos probabilısticos importantes 79

¿Entre que valores se encontrara el grupo promedio de esta distribucion? Ya sabemos que

este es el grupo de datos que esta entre µX± σ

X.

Como ya se vio µX

= 37, 5.

Ademas σ2X

= npq = (50)(0, 75)(0, 25) = 9, 375, ası, σX

= 3, 0618.

Por lo tanto, los datos dentro del promedio estaran entre 34, 4382 y 40, 5618 o,

equivalentemente, entre 35 y 40. Ası, cuando se de esta promocion y se ofrezca a 50 clientes

en muchas ocasiones, observaremos con mayor frecuencia que el numero de clientes que

compraran este producto estara entre 35 y 40.

Obtengamos otra probabilidad, por ejemplo, la de que, a lo mas, 45 de estos clientes compren

el producto en promocion es P (X ≤ 45) y conviene hallarla por el complemento:

P (X > 45)

= f(46) + f(47) + f(48) + f(49) + f(50)

=(

5046

)(0, 75)46(0, 25)50−46 +

(5047

)(0, 75)47(0, 25)50−47 +

(5048

)(0, 75)48(0, 25)50−48

+(

5049

)(0, 75)49(0, 25)50−49 +

(5050

)(0, 75)50(0, 25)50−50

= 0,0021.

Ası, P (X ≤ 45) = 1− P (X > 45) = 1− 0, 0021 = 0, 9979.

Podemos tambien obtener probabilidades a partir de la distribucion acumulada, pero como

esta no tiene una formula explıcita debemos usar la computadora o, como era costumbre

hace algun tiempo atras, con tablas.

Si usamos el Excel podemos obtener muy rapidamente probabilidades en este contexto.

Por ejemplo, la probabilidad de que mas de 25, pero a lo sumo 40 clientes compren el

producto:

P (25 < X ≤ 40) = f(26) + · · ·+ f(40) = F (40)− F (25) = 0, 8363− 0, 0001 = 0, 8362.

Se ha restado la probabilidad acumulada hasta 25 porque deseamos excluir este valor.

O la probabilidad de que compren como mınimo 30, pero a lo sumo 45 clientes es:

P (30 ≤ X ≤ 45) = f(30) + · · ·+ f(45) = F (45)− F (29) = 0, 9979− 0, 0063 = 0, 9916.

Se ha restado la probabilidad acumulada hasta 29 porque debemos incluir el valor 30.

Para terminar, la probabilidad de que por lo menos 35 clientes compren el producto es:

P (X ≥ 35) = 1− P (X ≤ 34) = 1− F (34) = 1− 0, 1631 = 0, 8369.

79


Ejemplo 3.3. (modelo financiero binomial)

Cada dıa puede llevarse a cabo una operacion financiera, la cual puede resultar exitosa

o fracasada. Cuando la operacion es exitosa, lo cual ocurre con probabilidad 0,7, se gana

una proporcion de lo invertido igual a 0,02; mientras que cuando la operacion fracasa se

pierde una fraccion de lo invertido igual a 0,04. El capital inicial es de 50 000 soles; y en las

sucesivas operaciones se invierte el monto que resulta de las inversiones anteriores. Ademas

los resultados de las operaciones financieras se asumen independientes. Por las condiciones

dadas, la secuencia de operaciones realizadas originan un proceso de Bernoulli con evento

de interes, E, que la operacion sea exitosa (tambien pudo escogerse su complemento) con

probabilidad p = 0, 7. En particular, X, el numero de operaciones que resulten exitosas,

entre n llevadas a cabo, tiene distribucion binomial con parametros n y p = 0, 7, es decir,

X ∼ b(n, 0, 7).

Esta variable X nos permite determinar cual sera el valor del capital acumulado, Y, hasta

la enesima operacion. En efecto, no es difıcil verificar que:

Y = 50 000(1 + 0, 02)X(1− 0, 04)n−X (3.1)

Tenemos una situacion de incertidumbre, pero la formalizacion anterior nos permite

cuantificar, mediante probabilidades, confianzas y riesgos. Por ejemplo, si la inversion de los

50 000 soles se hace con la meta de que al cabo de 10 operaciones se obtenga una ganancia

de, por lo menos, 5 000 soles; entonces, el riesgo que se corre puede cuantificarse por la

probabilidad de que el capital acumulado, al cabo de las 10 operaciones, resulte menor

que 55 000 soles, es decir, la probabilidad P (Y < 55 000) que por la ecuacion 3.1 dada

anteriormente, equivale a:

P (50 000(1 + 0, 02)X(1− 0, 04)10−X < 55 000)

o, despejando X :

P (X < 8, 3057) = 1−[fX

(9) + fX

(10)]

= 1−[ (

109

)(0, 7)9(0, 3)10−9 +

(1010

)(0, 7)10(0, 3)10−10

]= 1− 0, 1493 = 0, 8507

Es decir, el riesgo que corre el inversionista es bastante alto.

Otro asunto de interes al respecto se encuentra en el ejercicio propuesto 3.8.

3.1.2. El modelo o distribucion geometrico

Definimos ahora, X, como el numero de ensayos que son necesarios para

conseguir el primer exito, entonces el modelo probabilıstico de X viene dado por

f(x) = P (X = x) = qx−1p, x = 1, 2, . . .

80



X tiene distribucion geometrica con parametro p. Se denotara esto por X ∼ g(p).


= 1/p y σ2X

= q/p2.

La distribucion acumulada esta dada por:

F (x) = P (X ≤ x) =x∑j=1

qj−1p = 1− qx, x = 1, 2, . . .

Ejemplo 3.4. Continuando con el evento de interes anterior, supongamos que ahora nos

interese la variable X definida como el numero de clientes que debe visitar el promotor hasta

el primero que compre el producto. Entonces, como el proceso es de Bernoulli y X puede

verse como el numero de ensayos (en la secuencia de visitas) hasta lograr el primer exito, se

tiene que X ∼ g(0, 75).

Ası, la probabilidad de que el primer cliente, que compre el producto, sea el x-esimo que

visite es

P (X = x) = f(x) = (0, 25)x−1(0, 75), x = 1, 2, . . .

El valor esperado de esta variable es µX = 1/p = 1/0, 75 = 4/3 = 1, 333, por lo tanto, si

fueran muchas las visitas que haga el promotor y asumimos condiciones similares para cada

una de estas, en promedio en la primera visita el cliente comprara el producto.

En este caso, como la distribucion acumulada tiene una formula explıcita, podemos calcular

muchas probabilidades usando dicha formula:

F (x) = P (X ≤ x) = 1− qx = 1− (0, 25)x; x = 1, 2, . . .

Por ejemplo, la probabilidad de que el primer cliente que compre el producto sea por lo

menos el cuarto que visite, pero a lo mas el decimo, es:

P (4 ≤ X ≤ 10) = F (10)− F (3) = (1− (0, 25)10)− (1− (0, 25)3) = 0, 0156.

Propiedad: esta es la unica distribucion discreta que satisface la relacion:

P (X > m+ n / X > m) = P (X > n), ∀ m,n ∈ N+.

Esta propiedad afirma que si ya se han realizado m ensayos sin haber obtenido un exito,

entonces, la probabilidad de que sean necesarios n ensayos adicionales, para lograrlo, es

exactamente igual a la probabilidad que se tenıa antes de realizar estos m ensayos. Por lo

que se dice que la distribucion no tiene memoria.

81


3.1.3. El modelo o distribucion de Pascal o binomial negativa

Si ahora X es el numero de ensayos que son necesarios hasta conseguir el r-

esimo exito, entonces el modelo probabilıstico de X viene dado por

f(x) = P (X = x) =

(x− 1

r − 1

)qx−rpr, x = r, r + 1, . . .

Cuando el modelo probabilıstico de una variable aleatoria X es de esta forma, se dice que X

tiene distribucion de Pascal con parametros r y p. Se denotara esto por: X ∼ Ps(r, p).


= r/p y σ2X

= rq/p2.


Ejemplo 3.5. Nuevamente en el contexto del proceso de Bernoulli de los ejemplos anteriores,

sea ahora la variable X definida como el numero de clientes que debe visitar el promotor

hasta el tercero que compre el producto. Entonces, como el proceso es de Bernoulli y X puede

verse como el numero de ensayos hasta lograr el tercer exito, se tiene que X ∼ g(0, 75).

Ası, la probabilidad de que el tercer cliente, que compre el producto, sea el x-esimo visitado

es: P (X = x) = f(x) =(x−13−1

)(0, 25)x−3(0, 75)3, x = 3, 4, . . .

Propiedades:

a) La variable X tiene distribucion geometrica con parametro p si, y solo si, X tiene

distribucion de Pascal con parametros 1 y p.

b) La suma de variables independientes y cuya distribucion sea geometrica tiene una

distribucion de Pascal. Es decir, si X1, . . . , Xn son variables aleatorias independientes,

con distribucion geometrica de parametro p, entonces,n∑j=1

Xj tiene distribucion de

pascal con parametros r = n y p.

3.2. Modelos relacionados con un proceso de Poisson

En el proceso de Poisson se observa el evento de interes, E, en una region continua, como

por ejemplo un intervalo de tiempo o un area, y con los supuestos siguientes:

S1. La probabilidad de que ocurra E en una region de medida pequena, ∆t, es

aproximadamente igual a ω ∆t, para cierta constante positiva ω independiente de

la medida de la region ∆t.

S2. La probabilidad de que ocurra E mas de una vez en una region pequena es casi nula.

S3. Las ocurrencias de E en regiones excluyentes son independientes.

82


Si E ocurre satisfaciendo los supuestos anteriores, entonces estamos frente a un

proceso de Poisson con tasa, o promedio de ocurrencias, ω por unidad de medida.

Ejemplo 3.6. Hoy que comenzamos a tomar mas conciencia del problema de la

contaminacion ambiental, podemos interesarnos en observar, durante cierto perıodo del dıa,

los vehıculos que pasan contaminando el ambiente por determinada avenida. Supongamos

que se cumplen:

S1. La probabilidad de que pase un vehıculo contaminando el ambiente en una region

de medida pequena, ∆t, es aproximadamente proporcional a dicha medida, esto es,

aproximadamente igual a ω∆t, para cierta constante positiva ω independiente de la

medida de la region ∆t, digamos ω = 2 vehıculos por minuto.

S2. La probabilidad de que pase mas de una vehıculo contaminando el ambiente en un

intervalo de tiempo muy pequeno es casi nula.

S3. Las ocurrencias de las llegadas de los automoviles que pasan contaminando el ambiente,

en regiones excluyentes, son independientes.

En este caso, los automoviles pasan contaminando el ambiente segun un proceso de Poisson,

con una tasa de 2 automoviles por minuto.

Veamos ahora las variables aleatorias y distribuciones de probabilidad que se generan a

partir de un proceso de Poisson, cada una tiene su analoga en el proceso de Bernoulli.

3.2.1. El modelo o distribucion de Poisson

Si definimos X como el numero de ocurrencias de E en una region de medida

t, entonces, el modelo probabilıstico de X viene dado por:

f(x) = P (X = x) =e−λλx

x!, x = 0, 1, . . . con λ = ωt.


X tiene distribucion de Poisson con parametro λ. Se denotara esto por: X ∼ P (λ).


= λ y σ2X

= λ.


Ejemplo 3.7. En el ejemplo 3.6, si X es el numero de vehıculos que pasen, durante un

perıodo de media hora, contaminando el ambiente, entonces X tiene distribucion de Poisson

con parametro λ = ω t = 2 vehıculosminuto × 30 minutos = 60 vehıculos.

Ası, la probabilidad de que, durante un perıodo de media hora, pasen x vehıculos que

contaminen el ambiente es:

P (X = x) = f(x) =e−60(60)x

x!, x = 0, 1, . . .

83


En particular, la probabilidad de que, durante un perıodo de media hora, no pasen vehıculos

que contaminen el ambiente es:

P (X = 0) = f(0) =e−60(60)0

0!= e−60 = 8, 8× 10−27.

O la probabilidad de que, durante un perıodo de media hora, pasen entre 59 y 61 vehıculos

que contaminen el ambiente es:

P (59 ≤ X ≤ 61) = f(59) + f(60) + f(61) =e−60(60)59

59!+e−60(60)60

60!+e−60(60)61

61!= 0, 1535.

Tambien podemos obtener probabilidades a partir de la distribucion acumulada, F, la cual

se obtiene con la ayuda de una computadora, por ejemplo, la probabilidad de que, durante

un perıodo de media hora, pasen entre 50 y 70 vehıculos que contaminen el ambiente es:

P (50 ≤ X ≤ 70) = f(50) + . . . + f(70) = F (70)− F (49) = 0, 9098− 0, 0844 = 0, 8254.

Propiedades:

a) Este proceso es estacionario en la region de observacion, en el sentido que, la

distribucion del numero de exitos solo depende de la medida de la region de observacion

y no de la parte de la region escogida para la observacion.

Ası, el numero de vehıculos que pasan contaminando el ambiente en un perıodo de una

hora deberıa comportarse probabilısticamente igual si el perıodo es de ocho a nueve de

la manana o si es de ocho de la noche a nueve de la noche. Lo que ocurre en la realidad

es que a veces la tasa del proceso no es la misma a lo largo del tiempo, es decir, existen

procesos con tasas heterogeneas.

b) La distribucion de Poisson puede verse como un caso lımite de la distribucion binomial.

En efecto, si el numero de observaciones, n, crece indefinidamente y p tiende a cero, de

modo que np tienda a λ, la distribucion binomial tiende a una distribucion de Poisson

con parametro λ.

Una forma de entender la anterior propiedad es la siguiente: dividamos la region de

observacion en una gran cantidad, n, de partes muy pequenas y excluyentes. Tenemos,

entonces, una secuencia de n partes y el numero de exitos en la region puede obtenerse

observando la cantidad de exitos en cada una de estas partes muy pequenas; pero

por los supuesto S2 y S3, puede decirse que en cada una de estas partes solo puede

ocurrir una o ninguna vez el evento de interes y que ademas estas ocurrencias son

independientes, por lo tanto, el numero de exitos en estas n partes muy pequenas

(que tambien da el numero de exitos en toda la region) sigue, aproximadamente, una

distribucion binomial, esto es, se estarıa aproximando la distribucion binomial a la de

Poisson.

84


3.2.2. El modelo o distribucion exponencial

En el proceso de Poisson, si definimos X como la medida de la region que habra que

observar hasta que se presente el primer exito, entonces, se puede verificar que la

distribucion de probabilidades de X es dada por

f(x) = βe−βx, x > 0; siendo β = ω.

Cuando la densidad de una variable aleatoria X es de esta forma, se dice que X tiene

distribucion exponencial con parametro β. Se denotara esto por: X ∼ exp(β).

A continuacion se muestran las graficas de la densidad y de la distribucion acumulada:


= 1/β y σ2X

= 1/β2.

La distribucion acumulada: F (x) = P (X ≤ x) =x∫0

βe−βtdt = 1− e−βx, x > 0.

Ejemplo 3.8. Nuevamente en el contexto del ejemplo 3.6, tenemos que la variable X,

definida como el tiempo (en minutos) que hay que esperar hasta que pase el primer vehıculo

contaminando el ambiente, sigue una distribucion exponencial con parametro β = 2, esto

si medimos el tiempo en minutos (recuerdese que la tasa del proceso de llegadas de los

vehıculos que contaminan el ambiente es ω = 2 vehıculosminuto ). Ası, su modelo probabilıstico

esta determinado por la funcion f(x) = 2e−2x, x > 0; y su funcion de distribucion acumulada

es dada por: F (x) = 1 − e−2x, x > 0. En particular, la probabilidad de que sea necesario

esperar menos de cinco minutos hasta que pase el primer vehıculo que contamine el ambiente

es:

P (X < 5) = P (X ≤ 5) = F (5) = 1− e−2(5) = 0, 99995.

Propiedad: esta es la unica distribucion continua que satisface:

P (X > t+ h / X > t) = P (X > h), ∀ h, t > 0.

Segun lo indicado en el caso de la distribucion geometrica, se dice que la distribucion

no tiene memoria. Por ejemplo, si suponemos que la duracion de una computadora tiene

una distribucion exponencial y si tenemos que al cabo de dos anos, esta aun no se ha

malogrado, entonces el riesgo de malograrse dentro del ano siguiente, serıa el mismo que el

correspondiente a cuando esta era nueva. Una interpretacion que se le puede dar a esto, al

parecer increıble, es que cuando la computadora falla se debe a causas incidentales.

85


3.2.3. Modelo o distribucion gamma

En el proceso de Poisson, si definimos ahora X como la medida de la region que

se debe observar hasta que se presente el r - esimo exito; entonces, el modelo

probabilıstico, o funcion de densidad, de X es dado por

f(x) =βαxα−1e−βx

Γ(α), x > 0,

con α = r, β = ω > 0 y Γ la funcion gamma.

Cuando la densidad de una variable aleatoria X es de esta forma, se dice que X tiene

distribucion gamma con parametros α y β. Se denotara esto por: X ∼ G(α, β).

Observacion 3.1. La funcion gamma, Γ, se define para todo y > 0, como: Γ(y) =∫ ∞0

ty−1e−tdt. Tiene las propiedades siguientes: Γ(y + 1) = yΓ(y); Γ(0, 5) =√π y si y

es natural positivo Γ(y) = (y − 1)!

La distribucion gamma se extiende para todo α positivo y tambien se le conoce como la

distribucion de Pearson Tipo-III ; y cuando α es un numero natural tambien se denomina

distribucion de Erlang.

La grafica de la densidad es como se muestra a continuacion:


= α/β y σ2X

= α/β2.

Si el parametro α es un numero natural, la distribucion acumulada tiene la forma siguiente:

F (x) = 1−α−1∑j=0

e−βx(βx)j

j!, x > 0.

Ejemplo 3.9. Siguiendo con los ejemplos anteriores, si definimos la variable X como el

tiempo (en minutos) que habra que esperar hasta que pase el quinto vehıculo contaminando el

ambiente, tenemos que X tiene distribucion gamma con parametros α = 5 y β = 2. Podemos,

por ejemplo, obtener la probabilidad de que el quinto vehıculo que pase contaminando el

ambiente lo haga luego de cuatro minutos:

P (X > 4) = 1− P (X ≤ 4) = 1− F (4) = 1− (1−5−1∑j=0

e−2(4)(2(4))j

j!) = 0, 0996.

86


Propiedades. Este modelo tiene, entre otras, las propiedades siguientes:

a) Se cumple que X tiene distribucion exponencial de parametro β, si y solo si, X tiene

distribucion Gamma de parametros α = 1 y β.

b) Si X1, . . . , Xn son variables aleatorias independientes y con distribucion exponencial

de parametro β, entonces la suma tiene distribucion gamma:n∑j=1

Xj ∼ G(n, β).

3.3. Modelo gaussiano o distribucion normal

Si la densidad de una variable aleatoria X esta dada por

f(x) =1√2πσ

e−(x−µ)2

2σ2 , −∞ < x <∞; con σ > 0 y µ ∈ R.

Se dice que X tiene distribucion normal o gaussiana, con parametros µ y σ2. Esto lo

denotamos por X ∼ N(µ, σ2).

La grafica de esta funcion es de la forma siguiente:

Es decir, la grafica tiene forma de campana y es simetrica alrededor de µ, con inflexiones

en µ− σ y µ + σ. Ademas, las areas a los extremos de la media tienden a cero conforme se

distancian de esta; tanto ası que, con fines practicos, si consideramos solo cuatro decimales

el rango de la variable se reduce al intervalo [µ−4σ; µ+ 4σ], es decir, fuera de este intervalo

f(x) es aproximadamente cero.


= µ y σ2X

= σ2.

Observacion 3.2.

a) Si µ = 0 y σ = 1 : la distribucion se llama normal estandar.

Es decir, si Z ∼ N(0; 1) :

fZ

(z) =1√2π

e−z2

2 , −∞ < z <∞ .

b) No hay una formula explıcita para la distribucion acumulada; pero existen tablas para

la distribucion normal estandar, ası, para poder usarlas previamente se debe pasar

a la forma estandar, como se indica en la segunda de las propiedades que se dan a

continuacion. Sin embargo, debe mencionarse que hoy en dıa estas tablas estan cayendo

en desuso, la razon es obvia: las computadoras.

87


c) Originalmente esta distribucion fue propuesta por Karl Gauss (1777-1855) para

modelar errores (en el ejemplo siguiente se ilustra esta situacion)

3.3.1. Propiedades del modelo gaussiano o normal

A continuacion veremos las propiedades de este modelo.

1. Propiedad de cerradura respecto a transformaciones lineales.

Si X tiene distribucion normal, entonces, la transformacion lineal Y = a + bX, para b 6= 0,

tambien tiene distribucion normal. Es decir,

X ∼ N(µX

; σ2X

) e Y = a+ bX ⇒ Y ∼ N(µY

; σ2Y

), con µY

= a+ bµX

y σ2Y

= b2σ2X.

Ejemplo 3.10. Al medir con cierto instrumento la longitud, µ, de un objeto, se produce un

error aleatorio, ε. Es muy razonable modelar este error con el modelo normal, con media 0

mm y desviacion estandar σ mm.

A continuacion determinamos el modelo probabilıstico que describe a X, la medicion

resultante. Para este fin, notemos que X = µ+ ε, es decir, X es una transformacion lineal

de ε y este tiene distribucion normal, es decir, ε∼ N(0; σ2).

Por lo tanto, por la propiedad anterior: X ∼ N(µ; σ2).

2. Propiedad de estandarizacion

Cualquier distribucion normal puede convertirse en una normal estandar. En efecto, si X

tiene distribucion normal y consideramos

Z =X − µ

X

σX

;

entonces, Z ∼ N(0, 1). Es decir: X ∼ N(µX

; σ2X

) y Z =X − µ

X

σX

⇒ Z ∼ N(0, 1).

Por lo tanto:

FX

(x) = FZ

(x−µ

X

σX

)

Esta transformacion se deduce de la primera propiedad, y se la conoce como formula de

estandarizacion.

Ejemplo 3.11. Los ingresos en cierto sector pueden ser modelados por una variable X con

distribucion normal de media 20 unidades monetarias (u.m.) y desviacion estandar de 5 u.m.

A manera de ejemplo, calculemos la probabilidad de que el ingreso de un trabajador de este

sector sea superior a 22 u.m., es decir, la probabilidad P (X > 22). Para esto obtenemos

88


primero FX

(22), y tenemos dos formas de obtener esta probabilidad acumulada: con la

computadora, o con una tabla de la distribucion normal estandar.

Si usamos el Excel, solo debemos pedir FX

(22) y se obtendra inmediatamente FX

(22) =

0, 6554. Por lo tanto, P (X > 22) = 1− FX

(22) = 1− 0, 6554 = 0, 3446.

Si usamos una tabla de la distribucion normal estandar, como nuestra variable X no es

estandar, previamente debemos estandarizarla segun la segunda propiedad de la distribucion

normal:

En este caso Z = X−205∼ N(0; 1), ası:

FX

(22) = FZ

( 22− 20

5

)= F

Z(0, 4) = 0, 6554.

Para hacer un calculo mas, supongamos que en este sector solo los ingresos superiores a 25

u.m. estan sujetos a un impuesto extraordinario; y queremos averiguar, para el sector de

trabajadores que ganan mas de 22 u.m. , cual es el porcentaje que paga este impuesto.

En este caso basta obtener la probabilidad:

P (X > 25/ X > 22) =P (X > 25 ∩X > 22)

P (X > 22)=P (X > 25)

P (X > 22)=

1− FX(25)

1− FX(22)

=0, 1587

0, 3446= 0, 4604.

Las probabilidades anteriores se han obtenido usando el programa Excel; pero tambien

pueden obtenerse usando una tabla de la distribucion normal estandar.

FX(25) = F

Z

(25−20

5

)= F

Z(1) = 0, 8413;

Y como ya se obtuvo antes:

FX(22) = F

Z

(22−20

5

)= F

Z(0, 4) = 0, 6554.

Ası, el porcentaje buscado es 46,04 %.

3. Propiedad de cerradura de la distribucion normal, respecto de la suma.

La suma de variables normales e independientes sigue teniendo distribucion normal:

Si X1, . . . , Xn son variables aleatorias independientes y con distribucion normal, entonces,

la suma de ellas, T =n∑j=1

Xj , tambien tiene distribucion normal:

T ∼ N(µT; σ2

T), con µ

T=

n∑j=1

µXj

y σ2T

=n∑j=1

σ2Xj.

En este caso:

Z =T − µ

T

σT

∼ N(0, 1).

89


Observacion 3.3. La propiedad anterior requiere las aclaraciones siguientes:

Se dice que las variables aleatorias X1, . . . , Xn son independientes, cuando para cada Ai,

conjunto de valores posibles para Xi, se tiene que:

P (X1 ∈ A1 ∩ . . . ∩Xn ∈ An) = P (X1 ∈ A1) . . . P (Xn ∈ An)

La esperanza de una suma de variables aleatorias es igual a la suma de sus esperanzas, es

decir: E( n∑j=1

Xj

)=

n∑j=1

E(Xj).

Y cuando las variables son independientes, la varianza de su suma es igual a la suma de sus

varianzas, es decir: V (n∑j=1

Xj) =n∑j=1

V (Xj).

Ademas, si a esta propiedad le anadimos la de linealidad, tenemos que:

T = a0 +n∑j=1

ajXj ∼ N(µ

T; σ2

T), con µ

T= a0 +

n∑j=1

ajµXj

y σ2T

=n∑j=1

a2jσ2Xj, con

a0 , a1 , . . . , an constantes, con por lo menos una de estas distinta de cero.

Ejemplo 3.12. En el contexto del ejemplo anterior, supongamos que para 10 trabajadores,

cuyos ingresos son independientes, interesa determinar la probabilidad de que la suma de los

ingresos correspondientes este entre 190 u.m. y 240 u.m.

Para este fin, consideremos las variables Xj, el ingreso del j-esimo trabajador, j = 1, . . . , 10.

Ası, la suma los ingresos es T =10∑j=1

Xj; e interesa obtener la probabilidad P (190 ≤ T ≤ 240).

Tenemos que estas variables Xj tienen distribucion normal (Xj ∼ N(20, 52)) y son

independientes, entonces podemos aplicar esta propiedad de cerradura respecto de la suma

para establecer que T =10∑j=1

Xj, tambien sigue una distribucion normal; pero con una media,

µT, igual a la suma de las medias, es decir, µ

T= 200, y una varianza, σ2

T, igual a la suma

de las varianzas, es decir, σ2T

= 250.

Ası, T ∼ N(200, 250) y P (190 ≤ T ≤ 240) = FT(240) − F

T(190) = 0, 9943 − 0, 2635 =

0, 7307.

Para calcular las probabilidades anteriores con la distribucion normal estandar debe

considerarse la variable:

Z =T − µ

T

σT

=T − 200√

250.

Ası, FT(240) = F

Z

(240−200√

250

)= F

Z(2, 53) = 0, 9943 y F

T(190) = F

Z

(190−200√

250

)= F

Z(−0, 63).

Ejemplo 3.13. En el contexto del ejemplo 3.10, suponga que para determinar la verdadera

longitud del objeto, µ, se realizaran n mediciones independientes con las caracterısticas

mencionadas. Luego, se estimara µ con la media aritmetica de las mediciones efectuadas, X.

90


a) Deducir la distribucion de T = X1 + . . . +Xn, la suma de las mediciones efectuadas,

y a partir de esta deduzca la de X.

b) Deducir la distribucion de X.

c) Si n = 4 y σ = 5, halle la probabilidad de que el error de estimacion, |X − µ|, sea a lo

sumo 2 mm.

Solucion:

a) Por lo visto en el ejemplo 3.10, cada una de las mediciones X1, . . . , Xn tiene

distribucion normal, con media µ y desviacion estandar σ, ademas estas son

independientes, entonces, por la propiedad anterior de la distribucion normal, la suma

de estas variables, T, tiene distribucion normal con media µT

= µX1

+ . . . +µXn

= nµ

y varianza σ2T

= σ2X1

+ . . . + σ2Xn

= nσ2, es decir, T ∼ N(nµ; nσ2).

b) Como T ∼ N(nµ; nσ2) y X =T

nes una transformacion lineal de T , entonces la

primera propiedad de la distribucion normal establece que X tambien tiene distribucion

normal, pero con media: µX

= 1nµT

= µ, y varianza: σ2X

= 1n2 σ

2T

= σ2

n, es decir,

X ∼ N(µ; σ2

n).

c) Queremos determinar la probabilidad P (|X − µ| ≤ 2) = FX

(µ+ 2)− FX

(µ− 2).

La deduccion anterior aplicada a este caso da: X ∼ N(µ; 52

4). Es claro que no se

puede usar directamente FX, la distribucion acumulada de X, porque el valor de µ es

desconocido; sin embargo con la estandarizacion sı lo sera.

En efecto, en este caso Z =X − µ

52

=X − µ

2, 5∼ N(0; 1),

luego: FX

(µ+ 2)− FX

(µ− 2) = FZ

(µ+2−µ

2,5

)− F

Z

(µ−2−µ

2,5

)= F

Z(0, 8)− F

Z(−0, 8) = 0, 7881− 0, 2119 = 0, 5763.

Observacion 3.4. (Muestra aleatoria y distribucion de la media de una muestra)

Si X es una variable aleatoria, una muestra aleatoria de X, de tamano n, es un conjunto de

n variables aleatorias, X1, . . . , Xn, independientes y con la misma distribucion que la de X.

Como consecuencia del ejemplo anterior se tiene el resultado siguiente:

Si X1, . . . , Xn es una muestra aleatoria de una variable, X, con distribucion normal de

media µX

y varianza σ2X, entonces, su media aritmetica, X, tiene distribucion normal con

media µX

y varianzaσ2X

n, es decir: X ∼ N(µ;

σ2

n).

4. Teorema del lımite central (T.L.C.)

La suma de muchas variables independientes tiene una distribucion aproximadamente

normal. En efecto, si las variables X1, . . . , Xn son independientes y n es suficientemente

grande, entonces:

91


T =n∑j=1

Xj, tiene aproximadamente distribucion normal de media µT

y varianza σ2T , con

µT

=n∑j=1

µXj

y σ2T

=n∑j=1

σ2Xj

, es decir, Taprox.∼ N(µ

T, σ2

T).

En particular, si las Xj tienen la misma distribucion: µT

= nµ y σ2T

= nσ2, con µ y σ2 la

media y varianza comun a todas las variables Xj.

Ejemplo 3.14. Un inversionista recibe 100 utilidades, las cuales pueden ser consideradas

como variables aleatorias independientes de igual distribucion, con una media de 5 u.m. y

una desviacion estandar de 0,5 u.m. Interesa saber la probabilidad de que la utilidad total

recibida por el inversionista sea menor que 510 u.m. (el mınimo previsto). Para averiguar

lo deseado consideremos, como en el ejemplo anterior, las variables: Xj, la j-esima utilidad

recibida, j = 1, . . . , 100. Como estas variables son muchas e independientes, entonces, por

la cuarta propiedad de la distribucion normal (el teorema del lımite central), la suma de

estas, T =100∑j=1

Xj, sigue aproximadamente una distribucion normal con media µT , igual a la

suma de las medias, y varianza σ2T, igual a la suma de las varianzas, es decir, µ

T= 500 y

σ2 = 25. Entonces tenemos que T ∼ N(500, 25), luego podemos obtener la probabilidad de

interes directamente con el Excel. Es decir: P (T < 510) = FT(510) = 0, 9772.

Observese que, en este caso, para usar la distribucion normal estandar debe considerarse la

variable:

Z =T − µ

T

σT

=T − 500

5∼ N(0; 1).

Ası, el calculo de la probabilidad que interesa resulta ahora:

FT(510) = P (T ≤ 510) = F

Z

(510−500

5

)= F

Z(2) = 0, 9772.

Ejemplo 3.15. En el contexto del ejemplo anterior, ¿cual serıa la probabilidad de que la

media de las utilidades recibidas sea menor o igual a 5,1 u.m.? Ahora se desea averiguar el

valor de la probabilidad P (X ≤ 5, 1), con X =100∑j=1

Xj/100 = T/100.

Ası: P (X ≤ 5, 1) = P ( T100≤ 5, 1) = P (T ≤ 510) = F

T(510) = F

Z(2) = 0, 9772.

Tambien puede deducirse la distribucion de X a partir de la de T =100∑j=1

Xj. En efecto, como

X = T100

y T ∼ N(500; 25), entonces, por la propiedad de linealidad de la distribucion

normal, tenemos que: X ∼ N(µX, σ2

X), con µ

X=

µT

100= 500

100= 5, y σ2

X=

σ2T

1002 = 251002 =

0, 0025, es decir, X ∼ N(5; 0, 0025).

Para usar la distribucion normal estandar tenemos que: Z = X−50,05

∼ N(0, 1). Ası,

P (X ≤ 5, 1) = FX

(5, 1) = FZ

(5,1−50,05

)= F

Z(2) = 0, 9772.

92


3.4. Modelo o distribucion lognormal

Se dice que una variable aleatoria, X, tiene distribucion lognormal si, y solo si, la

transformacion logaritmo natural de X, Ln(X), tiene una distribucion normal. Puede

verificar que la densidad es la siguiente:

f(x) = 1√2πσ

x−1e−

(lnx− µ)2

2σ2 , x > 0.

Esto lo denotamos por: X ∼ logN(µ; σ2).

Las constantes µ ∈ R y σ2 > 0, son los parametros del modelo y estos son tambien los

parametros de la distribucion de Ln(X), es decir, se tiene que Ln(X) ∼ N(µ, σ2).

La grafica de la funcion de densidad es de la forma siguiente:


= e(2µ+σ2)/2

y σ2X

= e2µ+σ2

(eσ2

− 1) = µ2X

(eσ2

− 1).

Observacion 3.5. En general este modelo es util para describir datos con valores positivos

y distribucion asimetrica, como suele ocurrir con los ingresos o algunos precios.

En la economıa y las finanzas esta distribucion aparece, por ejemplo, cuando el valor de cierta

inversion es el resultado de muchas variaciones ocasionadas por incrementos o reducciones

aleatorias, cada variacion reduce o aumenta el valor actual en una proporcion aleatoria. Esto

se conoce como la Ley de fragmentacion de Kolmogorov. Una explicacion de la validez de

esta ley se muestra en el ejemplo siguiente.

Ejemplo 3.16. En la enesima operacion, de una serie de operaciones financieras, se invierte

el capital acumulado, cuyo valor es Xn unidades monetarias (u.m.). La tasa de rentabilidad

de esta operacion se define como

Rn =Xn −Xn−1

Xn−1

,

con Xn−1 el valor del capital acumulado disponible antes de realizar la operacion.

Sigue inmediatamente que el valor del capital acumulado, Xn, en funcion del capital invertido

(Xn−1) y la tasa de rentabilidad de esta inversion (Rn), esta dada por:

Xn = (1 +Rn)Xn−1

93


Y si usamos Wn = 1 +Rn, que se conoce como el factor de capitalizacion, tenemos que:

Xn = WnXn−1

De aquı no es difıcil verificar que Xn = W1, . . . , WnX0, con X0 el valor del capital inicial

(un valor conocido).

Y si en esta ultima ecuacion tomamos logaritmos resulta que:

Ln(Xn) = Ln(W1) + Ln(W2) + . . . + Ln(Wn) + Ln(X0).

Supongamos un contexto financiero de incertidumbre segun el cual las tasas de rentabilidad,

Ri, son variables aleatorias independientes, entonces, ası tambien los seran los factores de

capitalizacion, Wi. Si ademas de este supuesto tenemos muchas operaciones, entonces, por el

teorema del lımite central tendremos que Ln(Xn) tendra aproximadamente una distribucion

normal y, por lo tanto, Xn una distribucion lognormal.

Entonces, podemos decir que el valor del capital al cabo de muchas operaciones (en el largo

plazo) sigue una distribucion lognormal.

Ejemplo 3.17. Actualmente en finanzas se ha hecho bastante conocido el modelo de precios

de Black-Scholes1. Por ejemplo, segun este modelo, la ecuacion que describe la evolucion

del precio de un stock en el tiempo es de la forma:

St = S0 exp [ (µ− 1

2σ2) t+ σXt ], t > 0, (1)

donde: S0 > 0 es el precio inicial del stock; µ es el valor esperado de la tasa instantanea de

rentabilidad; σ > 0 es la volatilidad del stock (estos ultimos no se consideran aleatorios sino

constantes) y Xt es una variable aleatoria con distribucion normal, de media cero y varianza

t, es decir, Xt ∼ N(0, t).

El modelo anterior puede escribirse como:

LnSt = LnS0 + (µ− 1

2σ2) t+ σXt (2)

Y como Xt tiene distribucion normal, entonces, por la primera propiedad de la distribucion

normal, Ln(St) tambien tendra distribucion normal, es decir:

LnSt ∼ N( LnS0 + (µ− 1

2σ2)t; σ2t ) (3)

Por lo tanto, la distribucion de St es lognormal.

Para ilustrar el uso de este modelo supongamos que el valor inicial del stock sea 20 u.m. ,

que el valor esperado de la tasa instantanea de rentabilidad sea 0,2 y que la volatilidad del

stock sea 0,4. Entonces, reemplazando estos valores en la ecuacion (3), tenemos que:

LnS5 ∼ N(2, 795; 0, 8 )

1Vease Lars Tyge Nielsen (1999), ejemplo 1.7, pag. 13.

94


En particular, la probabilidad de que el precio del stock, despues de 5 unidades de tiempo,

sea inferior a 55 u.m. esta dada por:

P (S5 < 55) = P (Ln(S5) < Ln(55)) = P (Ln(S5) < 4) = FLn(S5)

(4) = 0, 911.

Y para usar la normal estandar tenemos que Z = Ln(S5)− 2,795√0,8

∼ N(0, 1).

Ası: FLn(S5)

(4) = FZ

(4−2,795√

0,8

)= F

Z

(1, 35) = 0, 911.

3.5. Modelo o distribucion hipergeometrica

Si de una poblacion con N elementos, de los cuales M son de interes, se toma una muestra

aleatoria de n elementos; y definimos X como el numero de elementos de interes en la

muestra, entonces el modelo probabilıstico de X viene dado por:

f(x) = P (X = x) =CMx C

N−Mn−x

CNn

, x = 0, 1, . . . , n.

Cuando la ley de probabilidad de una variable aleatoria X es ası, se dice que tiene una

distribucion hipergeometrica con parametros N , M y n.

Se denotara esto por: X ∼ H(N,M, n).

Observacion 3.6. en realidad X asume valores que van, desde el mayor de los valores entre

0 y n− (N −M), hasta el menor de los valores de n y M , es decir, no necesariamente entre

0 y n.

Los valores esperados son: µX = np y σ2X = npq(N−n

N−1), siendo p = M

Ny q = 1− p.


Observacion 3.7. Si la muestra es con reposicion, X ∼ b(n, p); y si N es muy grande, en

relacion con n, la distribucion hipergeometrica se aproxima a la binomial.

Ejemplo 3.18. En el ejemplo 2.1 del capıtulo anterior, la variable X, el numero de empresas

del tipo a en la muestra de tamano 4, tomada de la poblacion de 20 empresas entre las cuales

5 son del tipo a, sigue una distribucion hipergeometrica con parametros: N = 20, M = 5 y

n = 4. Ası, su modelo probabilıstico esta dado por la funcion:

f(X = x) = P (X = x) =

(5x

)(15

4−x

)(204

) , para cualquier x ∈ RX = 0, 1, 2, 3, 4 .

3.6. Modelo o distribucion uniforme

Si una variable aleatoria X tiene como rango a un intervalo de extremos finitos, a y b, y

su densidad es constante, es decir, dada por:

95


f(x) =1

b− a, a ≤ x ≤ b.

Se dice que X tiene distribucion uniforme. Denotamos esto por X ∼ U(a, b).

La grafica de la densidad es la de una funcion constante:


=a+ b

2y σ2

X=

(b− a)2

12.

La distribucion acumulada: F (x) = P (X ≤ x) =x− ab− a

, a ≤ x ≤ b.

Observacion 3.8. Esta distribucion es adecuada para describir a una variable que asuma

sus valores uniforme o indistintamente en un intervalo de extremos finitos.

Propiedad: Sea U una variable aleatoria con distribucion uniforme en el intervalo [0, 1], es

decir, U ∼ U [0, 1], y X una variable aleatoria con distribucion acumulada F.

Caso 1: Si X es continua podemos asumir que F es continua sobre RX y suponiendo

que esta sea estrictamente creciente, entonces tendra una inversa F−1. Definimos para cada

0 ≤ u ≤ 1 : G(u) = F−1(u).

Caso 2: Si X es discreta, definimos para cada 0 ≤ u ≤ 1 : G(u) = minx ∈ RX / F (x) ≥ u

Entonces, en ambos casos, la variable transformada de U, G(U), tiene la misma distribucion

que la de X: G(U)d= X.

Observacion 3.9. La propiedad anterior nos dice como transformar una variable aleatoria

con distribucion uniforme en [0, 1], U ∼ U [0, 1], en otra que tenga una distribucion deseada.

Esto permite generar valores de una distribucion arbitraria, a partir de valores generados de

una distribucion uniforme y es la tecnica mas conocida en simulacion. Es decir, si u1, . . . , un

son n valores generados de una distribucion uniforme entre 0 y 1, entonces, los valores

asociados a una variable X, con distribucion con acumulada F, se pueden generar como

sigue.

En el caso que X sea continua, consideraremos:

xj = F−1(uj)⇔ uj = F (xj), j = 1, . . . , n.

Y en el caso que X sea discreta:

xj = G(uj) = minx ∈ RX / F (x) ≥ uj, j = 1, . . . , n.

96


Ejemplo 3.19. Simulemos 50 valores de una variable aleatoria, X, con modelo exponencial

con parametro β = 1/4.

Para generar, mediante simulacion, 50 valores de X : x1, . . . , x50. Primero simulamos 50

valores de una variable aleatoria con distribucion uniforme en [0, 1], U ∼ U(0; 1). Por

ejemplo, con una computadora y el Excel obtenemos los numeros aleatorios siguientes:

0,674 0,558 0,682 0,914 0,104 0,273 0,854 0,430 0,508 0,089

0,696 0,926 0,271 0,073 0,817 0,639 0,005 0,947 0,906 0,449

0,734 0,126 0,732 0,493 0,194 0,470 0,019 0,191 0,870 0,785

0,070 0,973 0,948 0,592 0,580 0,479 0,832 0,208 0,522 0,524

0,377 0,661 0,519 0,603 0,504 0,480 0,614 0,213 0,345 0,878

Como X es continua, podemos considerar xj = G(uj) = F−1(uj), j = 1, . . . , 50.

Ası, ya que X ∼ exp(1/4), se tiene que F (x) = 1− e−x/4, x > 0.

Luego:

xj = F−1(uj)⇔ uj = F (xj) = 1− e−xj/4 ⇔ xj = −4Ln(1− uj), j = 1, . . . , 30.

De este modo se obtienen los valores deseados:

4,480 3,263 4,582 9,815 0,439 1,277 7,683 2,246 2,833 0,374

4,761 10,406 1,266 0,305 6,800 4,072 0,019 11,770 9,442 2,382

5,299 0,537 5,274 2,715 0,864 2,540 0,077 0,850 8,168 6,152

0,290 14,506 11,861 3,589 3,471 2,611 7,137 0,932 2,951 2,973

1,891 4,330 2,930 3,691 2,801 2,618 3,806 0,956 1,695 8,429

Si consideramos estos datos generados como una muestra aleatoria de X existe una tecnica

llamada “bondad de ajuste” para verificar que efectivamente el modelo de esta variable es uno

especificado, en este caso exponencial con parametro β = 1/4. A continuacion aplicaremos

esta tecnica que requiere una muestra grande, como lo es en este caso, pero solo en la etapa

descriptiva y no en la de inferencia.

Empezamos por ver como es la distribucion de frecuencias de la muestra generada:

X 0− 3 3− 6 6− 9 9−∞frecuencia observada 26 12 7 5

frecuencia relativa observada 0, 52 0, 24 0, 14 0, 1

97


Se observa una tendencia decreciente, como ocurre en un una distribucion exponencial; pero

esto -incluso en esta etapa descriptivo- aun resulta impreciso, pues esta grafica depende del

numero de intervalos y ademas solo esta forma del polıgono no garantiza que la distribucion

exponencial con el parametro especificado (β = 1/4). Entonces, debemos comparar las

frecuencias observadas (las de los valores obtenidos para X) con las frecuencias esperadas,

segun la distribucion supuesta para X (en este caso exp (1/4)). A continuacion expresamos

los valores de estos tipos de frecuencias en la tabla siguiente:

X 0− 3 3− 6 6− 9 9−∞frecuencia observada (o

j) 26 12 7 5

frecuencia relativa observada (fj) 0, 52 0, 24∗ 0, 14 0, 1

frecuencia relativa esperada (pj) 0, 5276 0, 2492∗∗ 0, 1177 0, 1054

frecuencia esperada (ei

= npj) 26,3817 12, 4618∗∗∗ 5,8865 5,2700

Se observa que las frecuencias observadas estan proximas a las esperadas. Por lo tanto, el

modelo especificado parece ajustar a los datos; es decir, la simulacion parece haber sido

adecuada. ∗0, 24 = 12/50; ∗∗0, 2492 = FX

(6)− FX

(3); ∗∗∗12, 4618 = 50× 0, 2492.

Tambien se acostumbra ilustrar la conclusion con la llamada grafica de probabilidades, es

decir, la grafica de las frecuencias relativas esperadas (probabilidades esperadas segun el

modelo) con las correspondientes a las observadas:

Se observa que las frecuencias observadas estan proximas de las esperadas. Por lo tanto, la

simulacion parece haber sido adecuada; es decir, generado datos segun el modelo especificado.

Esto se cumple, pues el metodo para simular lo establece y la cantidad de datos es grande.

98


3.7. Modelo o distribucion Beta

Se dice que la variable aleatoria X tiene modelo o distribucion beta, si su funcion de

densidad esta dada por:

f(x) =Γ(α + β)

Γ(α)Γ(β)xα−1 (1− x)β−1, 0 ≤ x ≤ 1.

con α > 0 y β > 0, los parametros del modelo. Esto lo denotamos por X ∼ B(α; β).

A continuacion se muestran las graficas tıpicas de este modelo, para α 6= 1 y β 6= 1 :


=α

α + βy σ2

X=

αβ

(α + β)2(α + β + 1).

Observacion 3.10. Esta distribucion puede ser generalizada para un intervalo de extremos

arbitrarios, a < b, mediante el cambio de variable Y = a+(b−a)X. En este caso la densidad

de Y esta dada por:

fY

(y) =Γ(α + β)

Γ(α)Γ(β)(y − a)α−1 (b− y)β−1/(b− a)α+β−1, a ≤ y ≤ b.

Ademas, la distribucion uniforme en el intervalo de extremos 0 y 1 es un caso particular

de esta distribucion. En efecto: X ∼ U(0; 1) ⇔ X ∼ B(1; 1). Ası, el modelo beta es de

gran utilidad para modelar una variable aleatoria que asume sus valores en un intervalo de

extremos finitos y aun cuando no sea de manera uniforme, generalizando de este modo a la

distribucion uniforme.

3.8. La funcion generadora de momentos

Definicion 3.1. Si X es una variable aleatoria, se define su funcion generadora de momentos

MX

: R → R, mediante: MX(t) = E(etX).

t 7→ MX(t)

A continuacion veamos la propiedad principal de la funcion generadora de momentos,

esta explica el nombre que se le da. Aunque la deduciremos para una variable discreta,

similarmente se puede deducir para el caso continuo.

99


Por la propiedad que permite obtener el valor esperado de una funcion de una variable

aleatoria, se tiene que:

MX(t) = E(etX)

=∑x∈R

X

etxfX

(x)

Entonces, al derivar respecto de t y evaluar en cero, obtenemos:

M ′X

(t) =∑x∈R

X

xetxfX

(x)

M ′X

(0) =∑x∈R

X

xfX

(x)

Entonces, M ′X

(0) = E(X). Pero se debe observar que no siempre es posible hacer esta

derivacion.

Y al derivar una vez mas respecto de t y evaluar en cero, obtenemos:

M ′′X

(t) =∑x∈R

X

x2etxfX

(x)

M ′′X

(0) =∑x∈R

X

x2fX

(x)

Entonces, M ′′X

(0) = E(X2). Generalizando, tenemos que M (j)X

(0) = E(Xj).

Ejemplo 3.20. Si Z ∼ N(0; 1), entonces: MZ(t) = et

2/2 ∀t ∈ R. En efecto:

MZ(t) = E(etZ)

=

∫ ∞−∞

etz1√2π

e−z2

2 dz

=

∫ ∞−∞

1√2π

e tz−z2

2 dz

=

∫ ∞−∞

1√2π

e−12

(z2−2tz) dz

=

∫ ∞−∞

1√2π

e−12

(z2−2tz+t2−t2) dz

=

∫ ∞−∞

1√2π

e−12

(z−t)2+ 12t2 dz

= e t2/2

∫ ∞−∞

1√2π

e−12

(z−t)2

dz︸︷︷︸1

= e t2/2, ∀t ∈ R.

Propiedad 1.

Si X es una variable aleatoria, con funcion generadora de momentos MX, e Y = a + bX;

entonces:

MY

(t) = e a tMX

(bt).

100


Ejemplo 3.21. Como se vio en el ejemplo anterior, si Z ∼ N(0; 1); entonces, MZ(t) =

e t2/2, ∀t ∈ R.

A partir de este resultado, usaremos la propiedad anterior para determinar la funcion

generadora de una normal con parametros arbitrarios, X ∼ N(µ; σ2).

Ası, si X ∼ N(µ; σ2) :X = a︸︷︷︸+ b︸︷︷︸ Z

Z =X − µσ

∼ N(0; 1)⇒ X = µ + σ Z;

luego, por la propiedad anterior(M

Y(t) = e a tM

X(bt)

):

MX

(t) = eµ tMZ(σ t) = e tµeσ

2t2/2 = e tµ+σ2t2/2; ası, MX

(t) = e tµ+σ2t2/2, ∀t ∈ R.

Propiedad 2.

La funcion generadora de momentos determina unıvocamente el modelo probabilıstico.

Ejemplo 3.22. Demostremos la propiedad de cerradura del modelo normal respecto de

la transformacion lineal. Es decir, si X ∼ N(µX

; σ2X

) e Y = a + bX, entonces: Y ∼N(a+ b µ

X; b2 σ2

X).

Para esto, hallaremos la funcion generadora de Y y veremos que esta corresponde a la de

una normal con parametros a + b µX

; b2 σ2X, ası el resultado quedara garantizado por esta

ultima propiedad de la funcion generadora.

Como ya hemos visto, si X ∼ N(µX

; σ2X

), su funcion generadora esta dada por:

MX

(t) = e tµ+σ2t2/2, ∀t ∈ R.

Luego, como Y = a+bX, entonces, por la propiedad 1 se puede derivar la funcion generadora

de momentos de Y a partir de la de X :

MY

(t) = e a tMX

(bt)

= e a te btµX+σ2X

(bt)2/2, ∀bt ∈ R= e at+bµX t+b

2σ2Xt2/2

= e (a+b µX

)t+(bσX

)2 t2/2, ∀t ∈ R.

Ası, la funcion generadora de momentos de Y corresponde a la de una normal con parametros

a+b µX

; y b2 σ2X

; y como la funcion generadora determine unıvocamente el modelo, entonces

se puede afirmar que Y ∼ N(a+ b µX

; b2 σ2X

).

Propiedad 3.

Si X1, . . . , Xn son variables aleatorias independientes, entonces, la funcion generadora de

momentos de la suma es el producto de las correspondientes a estas variables:

MX1 + · · · +Xn

(t) = MX1

(t) . . .MXn

(t) .

101


Ejemplo 3.23. Demostremos la propiedad de cerradura del modelo normal respecto de la

suma de variables independientes.

Es decir, si Xj∼ N(µ

Xj; σ2

Xj), para j = 1, . . . , n; entonces,

X1 + · · · +Xn ∼ N(µX1

+ · · ·+ µXn

; σ2X1

+ · · ·+ σ2Xn

).

Para esto, hallaremos la funcion generadora de X1 + · · ·+Xn y veremos que esta corresponde

a la de una normal con parametros µX1

+ · · · + µXn

y σ2X1

+ · · · + σ2Xn, ası el resultado

quedara garantizado por esta ultima propiedad de la funcion generadora.

MX1 + · · · +Xn

(t) = MX1

(t) . . . MXn

(t)

= etµX1

+σ2X1

t2/2. . . e

tµXn

+σ2Xn

t2/2

= etµX1

+σ2X1

t2/2 +...+tµXn

+σ2Xn

t2/2

MX1+···+Xn

(t) = et(µ

X1+···+µ

Xn)+(σ2

X1+...+σ2

Xn)t2/2

Que era lo que se querıa demostrar, es decir, la funcion generadora de momentos de la suma

corresponde a la de una normal con parametros µX1

+ · · · + µXn

y σ2X1

+ · · · + σ2Xn, por lo

tanto, este sera el modelo de la suma: N(µX1

+ · · ·+ µXn

; σ2X1

+ · · ·+ σ2Xn

).

102



Ejercicio 3.1.

En cierto sector del comercio, los establecimientos comerciales pueden pagar sus tributos a

tiempo, independientemente entre estos y en un porcentaje del 95 %.

a) Identifique la distribucion de la variableX definida como el numero de establecimientos,

entre 8 por inspeccionar, que paguen a tiempo sus tributos. A partir de esta distribucion

determine la probabilidad del evento siguiente:

Por lo menos 6 de los 8 establecimientos paguen a tiempo sus tributos.

b) Identifique la distribucion de la variable X definida como el numero de establecimientos

que deben ser inspeccionados hasta que se encuentre el primero que haya pagado a

tiempo sus tributos. A partir de esta distribucion determine la probabilidad del evento

siguiente:

El numero de establecimientos inspeccionados, hasta el primero que pague sus

impuestos a tiempo, esta entre 5 como mınimo y 15 como maximo.

c) Identifique la distribucion de la variable X definida como el numero de establecimientos

que deben inspeccionarse hasta que se encuentre el cuarto que haya pagado a tiempo sus

tributos. A partir de esta distribucion determine la probabilidad del evento siguiente:

El numero de establecimientos inspeccionados, hasta el cuarto que pague sus tributos

a tiempo, esta entre 5 como mınimo y 7 como maximo.

Ejercicio 3.2.

En una empresa de transporte cada vehıculo puede llegar a tiempo, independientemente de

otros vehıculos y con una probabilidad de 0,6.

a) En un dıa, la terminal espera el arribo de 20 vehıculos; determine la probabilidad de

que por lo menos dos, de estos vehıculos lleguen a tiempo. Debe definir una variable e

identificar (justificando) su modelo.

b) Halle la probabilidad de que el primer vehıculo que llegue a tiempo sea por lo menos

el vigesimo. Debe definir una variable e identificar (justificando) su modelo.

c) Halle e interprete el valor esperado del numero de vehıculos hasta el primero que llegue

a tiempo.

d) Halle la probabilidad de que el tercer vehıculo que llegue a tiempo sea por lo menos el

quinto. Debe definir una variable e identificar (justificando) su modelo.

103


Ejercicio 3.3.

Suponga que los usuarios de un sistema de informacion llegan de acuerdo con un proceso de

Poisson con una tasa de 2 usuarios por minuto.

a) Identifique la distribucion de la variable X definida como el numero de usuarios

que llegan al sistema en un perıodo de cinco minutos. A partir de esta distribucion

determine la probabilidad de que el numero de usuarios que llegan al sistema en un

perıodo de cinco minutos es por lo menos 6 y maximo 7.

b) Identifique la distribucion de la variable X definida como el tiempo (en minutos) hasta

que llegue el primer usuario del sistema. A partir de esta distribucion determine la

probabilidad de que se deba esperar entre 4 y 12 minutos hasta que llegue el primer

usuario.

c) Identifique la distribucion de la variable X definida como el tiempo (en minutos) hasta

que llegue el tercer usuario del sistema. A partir de esta distribucion determine la

probabilidad de que se espere por lo menos 3 minutos hasta que llegue el tercer usuario.

Ejercicio 3.4.

Una agencia bancaria (que nunca cierra para los clientes) divide su trabajo interno en

perıodos. Durante cada perıodo se debe realizar cierta operacion de verificacion, esta se

puede realizar mal con una probabilidad de 0,9 e independientemente en cada perıodo.

a) ¿Cuan probable es que esta operacion se realice mal despues del quinto perıodo?

b) Cada vez que dicha operacion se realice mal se debe registrar algunos datos en una

ficha especial. Al empezar la jornada de trabajo de diez perıodos el administrador se

da cuenta que solo dispone de cinco de estas fichas, pero no solicita mas. Determine el

numero esperado de fichas que seran usadas durante esta jornada de trabajo.

c) Determine la funcion de probabilidad de la variable aleatoria Y, definida como la

cantidad de perıodos de trabajo antes de que se realice mal dicha operacion.

Ejercicio 3.5.

Determine la probabilidad de que por lo menos dos vehıculos lleguen a tiempo en cada una

de las situaciones siguientes:

a) hay 20 vehıculos en total, ademas, se sabe que cada vehıculo puede llegar a tiempo,

independientemente entre ellos y con una probabilidad de 0,6;

b) en un perıodo de 2 minutos, ademas, se sabe que los vehıculos llegan a tiempo segun

un proceso de Poisson con una tasa de 5 vehıculos por minuto.

104


Ejercicio 3.6.

Un educador ha elaborado una prueba de opcion multiple con 10 preguntas de 5 opciones

cada una. El educador es conciente que algunos alumnos rendiran la prueba simplemente

escogiendo al azar una de las cinco opciones como respuesta y haran esto para cada una de

las preguntas de modo independiente, por tal motivo es necesario penalizar las respuestas

incorrectas. En las cuestiones siguientes solo considere este tipo de alumnos.

a) Identifique un proceso de observacion de Bernoulli en el contexto dado.

b) Determine el modelo probabilıstico mas adecuado para describir a la variable X, el

numero de respuestas acertadas.

c) Determine e interprete el numero de respuestas correctamente contestadas.

d) Cada pregunta bien contestada vale 2 puntos. Determine cuanto debe descontarse por

cada pregunta mal contestada, de modo que la nota esperada de los alumnos de este

grupo sea cero.

Sugerencia: si k es el valor buscado, vea que la nota es 2X − k(10−X).

e) Uno de estos alumnos necesita por lo menos 14 en esta prueba para aprobar el curso.

Cuantifique el riesgo que correra. Use el valor de k obtenido en la parte anterior.

Ejercicio 3.7.

Los clientes de un banco que deben recibir un tratamiento especial llegan de acuerdo con un

proceso de Poisson con un tasa de un cliente cada 20 minutos.

a) ¿Cual es la probabilidad de que en un perıodo de media hora lleguen mas de 2 clientes

que deben recibir un tratamiento especial en el banco?

b) A todo cliente que debe recibir un tratamiento especial se le entrega un premio; pero

al empezar la jornada de trabajo el administrador se da cuenta que solo dispone de

cinco de estos premios. Determine el numero esperado de premios que seran entregados

durante la primera hora de atencion.

c) Determine el tiempo que dispone el administrador para que, con una probabilidad de

0,9, pueda completar una pequena labor antes de la llegada del primer cliente que deba

recibir un tratamiento especial.

d) ¿Cual es la probabilidad de que pase mas de una hora hasta la llegada del tercer cliente

que deba recibir un tratamiento especial en el banco?

105


Ejercicio 3.8.

En el contexto del modelo binomial de finanzas, descrito en el ejemplo 3.3, determine el valor

esperado del capital acumulado al cabo de 10 operaciones.

Puede ser util la formula del binomio de Newton: (a+ b)n =n∑i=0

(ni

)aibn−i.

Ejercicio 3.9.

La ocurrencia de cierto evento catastrofico para la economıa ocurre de acuerdo con un proceso

de Poisson con una tasa de uno cada cinco anos.

a) Halle la probabilidad de que en una decada no ocurra mas de dos veces este evento.

b) Halle la probabilidad de que en, un perıodo de cinco anos, ocurra mas de dos veces

este evento catastrofico.

c) Un proyecto debe ejecutarse durante un perıodo de diez anos. Si este evento no se

presenta durante el perıodo de ejecucion del proyecto, el costo es de 200 unidades

monetarias (u.m.); en otro caso este costo se incrementa en 100 u.m. por cada unidad de

tiempo faltante hasta completar la ejecucion del proyecto. Determine el valor esperado

del costo de ejecucion del proyecto.

d) ¿Cuan probable es que pasen mas de 20 anos hasta que ocurra tres veces dicho evento?

e) Considerando las proximas 5 decadas, determine la probabilidad de que en por lo menos

dos de estas el evento catastrofico ocurra mas de dos veces. Asuma independencia y

condiciones similares en cada una de las 5 decadas.

Ejercicio 3.10.

Cierto evento imprevisto puede ocurrir durante cada mes, con una probabilidad de 0,1 e

independientemente de otros meses.

a) Al comenzar el mes se inicia la ejecucion de un proyecto que debe tardar 10 meses.

Ademas, el proyecto se concluira en el plazo previsto siempre y cuando el evento

imprevisto no ocurra en mas de 2 meses de este plazo. Cuantifique el riesgo que se

corre al afirmar que la ejecucion se concluira en el plazo previsto.

b) Una persona adquiere una poliza contra este tipo de evento, que regira durante los

cinco meses siguientes. El contrato estipula que si el evento ocurre antes del quinto

mes, entonces, la companıa aseguradora debe pagarle una suma indemnizatoria de

seis mil soles, pero no volvera hacerlo si ocurriera nuevamente; ademas, la persona solo

hara un unico pago de diez mil soles. Determine la utilidad esperada de la aseguradora.

c) Halle la probabilidad de que el evento ocurra por tercera vez despues del quinto mes.

106


Ejercicio 3.11.

Los pedidos llegan a cierto supermercado (que atiende las 24 horas del dıa) segun un proceso

de Poisson, con una media de cuatro pedidos por hora.

a) Desde que empezo un dıa, ha pasado media hora y no ha llegado el primer pedido, halle

la probabilidad de que este pedido tampoco llegue durante la siguiente media hora.

b) Por dıa el supermercado tiene un costo de 250 soles, siempre y cuando el primer

pedido llegue durante las dos primeras horas del dıa; pero por cada hora adicional (a

las primeras dos horas del dıa) que tarde este primer pedido, dicho costo se incrementa

en 50 soles. Determine el costo esperado por dıa.

Ejercicio 3.12.

Se sabe que la demanda anual de un bien puede ser muy baja en cualquier ano, de manera

independiente de otros anos y con una probabilidad de un decimo.

a) Un comerciante estudia la posibilidad de adquirir grandes cantidades de este bien, en

cada uno de los proximos seis anos.

a1) El comerciante ha calculado que su inversion sera exitosa si a lo mas en cuatro de

estos seis anos la demanda del bien es muy baja. Cuantifique el riesgo que corre.

a2) El comerciante ha calculado que, en cada ano en el que la demanda del bien sea

muy baja perdera 10 u.m. ; pero en cada ano en el que la demanda no sea muy

baja ganara 30 u.m. Determine e interprete la utilidad esperada del comerciante.

b) Calcule la probabilidad de que el primer ano en el que la demanda sea muy baja sea

por lo menos el quinto, pero maximo el vigesimo.

Ejercicio 3.13.

Suponga que durante un ano, en cierto paıs, los eventos catastroficos ocurren segun un

proceso de Poisson con una tasa de 2 eventos por mes. Ademas, cada evento catastrofico

produce una dano cuya magnitud es independiente de las correspondientes a otros eventos

catastroficos y con distribucion exponencial. El diseno de “prevencion contra desastres”del

gobierno considero un valor crıtico para el dano ocasionado por una catastrofe cuando esta

es 3,5 veces la media de dicha magnitud. Obtenga la “confiabilidad del diseno prevencion

contra desastres”durante el perıodo de un ano, es decir, la probabilidad de que durante dicho

perıodo ninguna de las magnitudes de los danos que se produzcan supere el valor crıtico2.

Sugerencia: sean X el numero de tales eventos en un ano e Y, el numero de los que su

magnitud supera el valor crıtico. Se desea hallar P (Y = 0) =∞∑x=0

P (X = 0 ∩ Y = 0). Note

que si X = x : Y ∼ b(x, p), con p = P (Z > 3, 5/β), donde Z ∼ exp(β).

2Este ejercicio esta basado en la teorıa estudio de peligro sısmico, presentada en Alejandro Munoz P.

(2002).

107


Ejercicio 3.14.

Una municipalidad verificara si las tiendas de su distrito cumplen una ordenanza dictada

recientemente. Con este fin, se escogera una muestra aleatoria de 20 tiendas del distrito.

Ademas, por experiencia se sabe que el 25 % de estos establecimientos suele incumplir las

ordenanzas nuevas.

a) Identifique un proceso de observacion de Bernoulli en el contexto dado. Debera asumir

la validez de los supuestos necesarios y dar su significado en este contexto.

b) Halle el modelo probabilıstico que describe a la variable X, definida como el numero

de tiendas, en la muestra por seleccionar, que incumplen la ordenanza.

c) Determine la probabilidad de que por lo menos cinco de las tiendas, en la muestra por

seleccionar, incumplan la ordenanza.

d) Determine e interprete el valor esperado del numero de tiendas, en la muestra por

seleccionar, que incumplan la ordenanza.

e) Suponga que inspeccionar cada tienda de la muestra seleccionada costara 500 soles.

Ademas, cada deteccion originara un descuento de 500 soles en el costo, pues esta

cantidad sera pagada por el propietario de la tienda que incumpla la ordenanza; pero

cada tienda seleccionada que cumpla la ordenanza originara un costo adicional de 250

soles, pues el propietario de la tienda recibira un descuento en sus tributos por este

valor. Si el presupuesto para llevar a cabo este muestreo es de 12 750 soles:

e1) Cuantifique la confianza de este presupuesto para poder llevar a cabo el muestreo.

e2) Determine e interprete el valor esperado del costo para llevar a cabo el muestreo.

Ejercicio 3.15.

Una companıa alquila un equipo que se puede descomponer durante un mes independien-

temente de otros meses y con probabilidad 0,2. El equipo se usara 20 meses. Cada mes le

generara un ingreso de 1000 soles (ası se descomponga el equipo); ademas cada mes en donde

se descomponga el equipo le significara un egreso de 500 soles por reparacion.

a) Identifique el modelo probabilıstico que describe a la variable, X, definida como el

numero de meses (entre los 20) en los que el equipo se descompondra.

b) Halle el valor esperado y la desviacion estandar del numero de meses en los que se

descompondra el equipo.

c) Determine la utilidad esperada de la companıa.

d) La companıa desea ganar, por lo menos, 18 500 soles. Cuantifique el riesgo que correra.

108


Ejercicio 3.16.

Los pedidos llegan a una central segun un proceso de Poisson con una tasa de tres por

minuto.

a) Determine la probabilidad de que, en un intervalo de diez minutos, lleguen mas de dos

pedidos. Debe definir una variable e identificar (justificando) su modelo.

b) Halle la probabilidad de que el primer pedido demore en llegar mas de cinco minutos

pero menos de diez. Debe definir una variable e identificar (justificando) su modelo.

c) Halle la probabilidad de que el segundo pedido demore en llegar mas de cinco minutos

pero menos de diez. Debe definir una variable e identificar (justificando) su modelo.

Ejercicio 3.17.

En una empresa de transporte cada vehıculo puede llegar a tiempo, independientemente de

otros vehıculos y con una probabilidad de 0,6.

a) En un dıa, la terminal espera el arribo de 20 vehıculos; determine la probabilidad de

que por lo menos dos, de estos vehıculos lleguen a tiempo. Debe definir una variable e

identificar (justificando) su modelo.

b) Halle la probabilidad de que el primer vehıculo que llegue a tiempo sea por lo menos

el vigesimo. Debe definir una variable e identificar (justificando) su modelo.

Ejercicio 3.18.

Si X ∼ b(10; 0, 1), encuentre fY

: la funcion de probabilidad de Y = 10−X. Use la tecnica

descrita al final del capıtulo anterior.

Ejercicio 3.19.

Si X ∼ exp(2), encuentre la funcion de densidad de Y = 3X. Use la tecnica descrita al final

del capıtulo anterior.

Ejercicio 3.20.

Una operacion financiera resulta rentable con una probabilidad de 0,25. Un inversionista

realizara esta operacion en 20 oportunidades. Para evaluar los riesgos se supondra que las

operaciones originan resultados independientes y que la probabilidad de que sea rentable se

mantiene constante. Determine la probabilidad de que por lo menos tres de las operaciones

resulten rentables. Debe definir una variable X e identificar, justificando, su modelo.

109


Ejercicio 3.21.

Parte del trabajo de un promotor que trabaja en una Administradora de Fondos de Pensiones

(AFP) consistente en visitar a personas que estan afiliadas a una AFP distinta para tratar de

convencerlos de que se cambien a esta AFP. Este promotor, segun su experiencia, estima que

la probabilidad de convencer a una persona es de apenas 0,05. El promotor decide evaluar

ciertos riesgos, para esto considerara que este trabajo obedece un proceso de Bernoulli

a) Diga cuales son las dos condiciones que se deben cumplir para que, efectivamente, el

convencer a los afiliados que visite el promotor ocurra segun un proceso de Bernoulli.

b) Durante el ano que termina, la gerencia de la AFP considera que el promotor ha

realizado un buen trabajo; ası, le ofrece otorgarle una bonificacion extraordinaria

(por fin de ano) siempre y cuando convenza a, por lo menos, tres clientes mas. La

dificultad que enfrenta el promotor es que solo dispone de veinte visitas mas; entonces,

antes de tomar una medida distinta a las usadas hasta ahora, decide suponer que las

condiciones mencionadas en la parte anterior se verifican y emplear la teorıa basica de

modelos probabilısticos para cuantificar su confianza actual en lograr esta bonificacion

extraordinaria. Efectue el procedimiento que realizara el promotor y determine el valor

que obtendra.

Ejercicio 3.22.

Ciertas bacterias se presentan en un deposito de agua, conforme un proceso de Poisson con

una tasa de cuatro bacterias por cm3.

a) Determine la probabilidad de que, en un volumen de cinco cm3, se encuentren por lo

menos dos bacterias. Debe definir una variable e identificar, justificando, su modelo.

b) Halle la probabilidad de que el volumen de agua que se debe revisar hasta ubicar la

primera bacteria este entre cinco y diez cm3.

Ejercicio 3.23.

Sea X una variable aleatoria con modelo probabilıstico normal, con media µX

y desviacion

estandar σX.

a) Obtenga el valor de la probabilidad P ( |X − µX| ≤ 2σ

X).

b) Use la tecnica de cambio de variable para demostrar la propiedad de estandarizacion.

c) Use la tecnica de cambio de variable para demostrar la propiedad de cerradura del

modelo normal respecto con respecto a transformaciones lineales.

d) Use la tecnica de cambio de variable, para demostrar que el cuadrado de la variable

estandarizada de X tiene distribucion gamma con parametros α = β = 12.

110


Ejercicio 3.24.

El precio de una unidad del bien A es una variable aleatoria X con modelo normal de media

30 soles y desviacion estandar 4 soles. El precio de una unidad del bien B es una variable

aleatoria Y con modelo normal de media 20 soles y desviacion estandar 3 soles. Estas dos

variables son independientes.

a) Halle la probabilidad de que el precio de una unidad del bien A sea mayor que 25 soles.

b) Se debe comprar una unidad del bien A y otra del bien B; halle la probabilidad de que

55 soles sean suficientes.

c) Halle la probabilidad de que el precio de una unidad del bien A sea mayor que el de

una del bien B.

d) Halle la probabilidad de que el precio de una unidad del bien A sea mayor que dos del

bien B.

e) Se debe comprar una unidad del bien A y dos del bien B; halle la probabilidad de que

60 soles sean suficientes.

Ejercicio 3.25.

La distribucion de los tiempos necesarios para que las personas se recuperen de la dolencia

A se considera normal con media 14, 5 horas y desviacion estandar 3 horas; mientras que el

tiempo necesario correspondiente a la recuperacion de la dolencia B se considera normal con

media 13, 5 horas y cuarto inferior a partir de 15 horas. Suponiendo que existe independencia

entre ambos tiempos:

a) Determine el porcentaje de personas que se recuperan de la dolencia A despues de 11

horas.

b) Determine la cantidad de horas, t, que deberıa disminuir el tiempo de recuperacion

de cada persona para reducir en 25 el porcentaje de personas que se recuperan de la

dolencia A despues de 11 horas.

c) Halle la desviacion estandar de los tiempos de recuperacion de la dolencia B.

d) ¿Cual es la probabilidad de que ambos tiempos de recuperacion sean mayores que 11

horas?

e) ¿Cual es la probabilidad de que la media de los tiempos de recuperacion de ambas

dolencias, para una persona, sea mayor que 11 horas?

f) ¿Cual es el porcentaje de personas que se recuperan de la dolencia A en mayor tiempo

que el correspondiente a la dolencia B?

111


Ejercicio 3.26.

En una operacion financiera la tasa de rentabilidad, R, se considera una variable aleatoria

con distribucion normal de media 0,05 y desviacion estandar 0,25.

a) Determine la probabilidad de que la tasa de rentabilidad R, asociada a esta operacion

financiera, sea superior a 0,3.

b) Halle el valor en riesgo (VaR) de un grado de confianza del 95 %. Vea el ejercicio 2.28

c) Determine la probabilidad de que el factor de capitalizacion W = 1 + R, asociado a

esta operacion, sea superior a 1,25.

d) Un inversionista coloca un capital de 10 unidades monetarias (u.m.), en esta operacion

financiera, a fin de ganar por lo menos 5,5 um. Cuantifique el riesgo que afrontara.

e) En el contexto de la parte anterior, determine cual debe ser el monto del capital que

debera colocar el inversionista para que, con una probabilidad de 0,95 o mas, la perdida

no pase de 5,5 u.m.

f) Suponga que se realizan dos operaciones independientes con estas caracterısticas, pero

una de 10 u.m. y la otra de 20 u.m.

f1) Determine la probabilidad de que, R1, la rentabilidad de la primera inversion, sea

menor o igual que 0,95.

f2) Determine la probabilidad de que, R2, la rentabilidad de la segunda inversion, sea

mayor que 1,02.

f3) Halle la probabilidad que la suma de los capitales finales sea por lo menos 30 u.m.

f) El capital acumulado al cabo de una gran cantidad de estas operaciones tiene

distribucion lognormal con media 60,34 u.m. y desviacion estandar 28,39 u.m.

Determine la probabilidad de que un capital inicial de 20 u.m. genere mas de 50 u.m.

de utilidad.

Ejercicio 3.27.

El modelos probabilıstico de Pareto se usa para describir los ingresos, su densidad es de la

forma f(x) = αx−β, x > 0, con α > 0 y β > 0 los parametros del modelo.

a) Bosqueje, lo mas precisamente posible, la grafica de dicha densidad.

b) Encuentre una formula explıcita para la distribucion acumulada.

c) Encuentre formulas explıcitas para la media y la desviacion estandar.

d) Determine la probabilidad de que el ingreso de una persona sea superior a la media.

112


Ejercicio 3.28.

La distribucion de los salarios en el sector A se considera normal con una media de 1 450

soles y una desviacion estandar de 300 soles. En el sector B la distribucion de los ingresos

es normal con media 1 350 soles; ademas el 25 % de los asalariados gana mas de 1 500 soles.

a) Determine el porcentaje de asalariados, en el sector A, que ganan mas de 1 100 soles.

b) Determine el percentil 75 de la distribucion de los salarios en el sector A.

c) ¿En cual sector los salarios son menos variables?

d) Un promotor de creditos visita a una pareja de asalariados, uno del sector A y el otro

del B, para ofrecerles un credito que requiere un salario conjunto de por lo menos

2 500 soles. ¿Cual es la probabilidad de que esta pareja cumpla el requisito anterior

para poder acceder al credito? Asuma que los salarios son independientes.

e) Se escoge al azar un asalariado de la ciudad A y otro de la B. Determine la probabilidad

de que el de la ciudad A gane mas. Asuma que los salarios son independientes.

f) En el contexto de la parte anterior, determine la probabilidad de que ambos salarios

se diferencien en 200 soles, como maximo.

Ejercicio 3.29.

Se realizaran 100 operaciones financieras, en cada una se invertira 10 u.m. , las tasas

de rentabilidad correspondientes son variables aleatorias con modelos probabilısticos

desconocidos; pero estas son independientes, cada una de las primeras 25 tiene una media

de 0,01, y cada una de las restantes 75 una media de 0,02. Cada tasa tiene una desviacion

estandar de 0,3. Halle la probabilidad de que el capital final este entre 950 y 1100 u.m.

Ejercicio 3.30.

Para el ingreso familiar en una region se considera un modelo lognormal con media 1,65

miles de soles y desviacion estandar 2,16 miles de soles. En la tabla siguiente se muestra

informacion incompleta respecto a estos ingresos:

x 0 0,5 0,75 1 1,5 2 2,5 4 8 9

F (x) 0 0,2441 0,3868 - - - - - - - - - - - - - - - 0,9812 0,9860

x es un valor del ingreso familiar y F (x) la proporcion de familias con ingresos hasta x.

a) ¿El modelo parece estar en armonıa con los datos?

b) Complete la tabla dada, a partir del modelo dado.

c) ¿Cual es la proporcion de familias con ingresos superiores a 5 mil soles?

113


Ejercicio 3.31.

El capital acumulado al cabo de una gran cantidad de operaciones financieras tiene una

distribucion lognormal, su media es de 60 u.m. y su desviacion estandar de 28 u.m.

a) Encuentre los parametros de este modelo lognormal.

b) Halle la probabilidad de que un capital inicial de 20 u.m. genere mas de 25 u.m. de

utilidad.

Ejercicio 3.32.

Los ingresos (en miles de soles), de los trabajadores de cierto sector, son explicados por un

modelo lognormal con parametros µ = 3 y σ2 = 1.

a) Determine la probabilidad de que un trabajador gane 55 mil soles o menos.

b) Halle la media y la desviacion estandar de los ingresos en este sector.

Ejercicio 3.33.

Sea X ∼ b(n; p).

a) Verifique, calculando, que MX

(t) = E(etX) = (pet + q)n, ∀t ∈ R.

Recuerde que (a+ b)n =n∑i=0

(ni

)aibn−i.

b) Halle E(X) y E(X2), a partir de la funcion generadora de momentos.

c) Si Y = n−X, halle MY.

Recuerde la propiedad: si Y = a+ bX, entonces, MY

(t) = e a tMX

(bt).

d) Si Y = n−X, demuestre que X ∼ b(n; q).

Use el resultado de la parte anterior y la propiedad por la que la funcion generadora

de momentos determina unıvocamente el modelo o distribucion de la variable.

Ejercicio 3.34.

Sea X una variable aleatoria con distribucion binomial con parametros n = 1 y p.

a) Deducir la funcion generadora de momentos de X.

b) Use la funcion generadora de X para obtener E(X) y E(X2).

c) Si X1, . . . , Xn es una muestra aleatoria de X, deducir el modelo de X1 + · · · +Xn, a

partir de su funcion generadora de momentos.

114


Ejercicio 3.35.

Sea X una variable aleatoria con distribucion gamma de parametros α y β.

a) Demuestre que la funcion generadora de momentos de este modelo esta dada por:

MX

(t) =βα

(β − t)α, t < β.

b) Sea Y = bX, con b > 0. Use la tecnica de cambio de variable para obtener fY

: la

funcion de densidad de Y. Luego identifique el modelo obtenido.

c) Sea Y = bX, con b > 0. Use la tecnica de la funcion generadora de momentos para

obtener el modelo probabilıstico de Y.

d) Sean X1, . . . , Xn variables aleatorias independientes y cada una con modelo

probabilıstico gamma con primeros parametros α1, . . . , αn, respectivamente, y

segundos parametros iguales a β. Use la tecnica de la funcion generadora de momentos

para determinar el modelo probabilıstico (con sus parametros) de X1 + · · · + Xn.

e) Use la funcion generadora de X para obtener E(X) y E(X2).

Ejercicio 3.36.

Sea X una variable aleatoria con distribucion exponencial de parametro β.

a) Sea Y = bX, con b > 0. Use la tecnica de cambio de variable para obtener fY

: la

funcion de densidad de Y. Luego identifique el modelo obtenido.

b) Halle la funcion generadora de X. Use la definicion y propiedades del valor esperado.

c) Sea Y = bX, con b > 0. Use la tecnica de la funcion generadora de momentos para

obtener el modelo probabilıstico de Y.

d) Sean X1, . . . , Xn variables anteriores independientes y cada una con modelo

probabilıstico exponencial de parametro β. Use la tecnica de la funcion generadora

de momentos para determinar el modelo probabilıstico (con sus parametros) de

X1 + · · · + Xn. Para esto ultimo vea el resultado del ejercicio siguiente.

Ejercicio 3.37.

Sea X una variable aleatoria con distribucion de Poisson de parametro λ.


b) Use la funcion generadora de X para obtener E(X) y E(X2).

c) Si X1, . . . , Xn es una muestra aleatoria de X, deducir el modelo de X1 + · · · +Xn, a


115


Ejercicio 3.38.

Sea X una variable aleatoria con distribucion de Pascal con parametros r y p.


b) Si X1, . . . , Xn es una muestra aleatoria de X, deducir el modelo de X1 + · · · +Xn, a


c) Use la funcion generadora de X para obtener E(X) y E(X2).

Ejercicio 3.39.

Sea X ∼ g(p).

a) Verifique, calculando, que MX

(t) = E(etX) = pet

1−qet , t < −ln q.

Recuerde que si 0 < r < 1 :∞∑i=1

ri = r1−r .

b) Si X1, . . . , Xn son independientes, determine el modelo probabilıstico X1 + · · · +Xn,

a partir de su funcion generadora.

Ejercicio 3.40.

La llegada de cada uno de los empleados a su centro de labores se produce independiente y

uniformemente entre las 8.00 a.m. y las 8.25 a.m.

a) Determine la probabilidad de que uno de estos empleados llegue entre las 8.00 a.m y

las 8.20 a.m.

b) Si son diez los empleados,

i) en promedio, ¿cuantos de estos llegan entre las 8.00 a.m. y las 8.20 a.m. ?

ii) ¿cual es la probabilidad de que cuatro empleados lleguen entre las 8.00 a.m y las

8.20 a.m. ?

Sugerencia: considere la variable X, definida como el numero de empleados que llegan

entre las 8.00 a.m. y las 8.20 a.m.

116

4. Indicadores de concentracion para medir la

desigualdad de los ingresos

4.1. La Curva de Lorenz

Definicion 4.1. Sea X una variable con densidad f, distribucion acumulada F y media

µ > 0. Definimos la funcion Φ mediante

Φ(x) =

∫ x

−∞yf(y)dy

µ

Observacion 4.1. Si X es el ingreso familiar, sigue de la definicion anterior que Φ(x) puede

interpretarse como la fraccion que representa el ingreso promedio (o total) de las familias con

ingresos inferiores o iguales a x, respecto al ingreso medio (o total) familiar 1. Para entender

esto recuerdese que µ = E(X) =∞∫−∞

yf(y)dy; ademas, si para cada x consideramos g(y) = x,

si y ≤ x, y g(y) = 0, si y > x, entonces, E(g(X)) =x∫−∞

g(y)f(y)dy corresponde al ingreso

promedio de las familias con ingresos menores o iguales que x2

Ejemplo 4.1. Si X ∼ N(µ; σ2), tenemos que Φ(x) = F (x) − σ

µ√

2πe−

12σ2 (x−µ)2

, como se

verifica a continuacion:

Φ(x) =1

µ

∫ x

−∞yf(y) dy =

1

µ

∫ x

−∞y

1√2π σ

e−1

2σ2 (y−µ)2

dy =1

µ

∫ x−µσ

−∞(µ+ σ z)

1√2π

e−12z2

dz

=

∫ x−µσ

−∞

1√2π

e−12z2

dz +σ

µ

∫ x−µσ

−∞z

1√2π

e−12z2

dz

= FZ

(x−µσ

) +σ

µ

∫ x−µσ

−∞z

1√2π

e−12z2

dz = F (x)− σ

µ√

2πe−

12σ2 (x−µ)2

, con Z ∼ N(0; 1).

En particular, Φ(x) < F (x), es decir, la fraccion que representa el ingreso total de las familias

con ingresos inferiores o iguales a x (respecto al ingreso total de las familias) siempre es

menor que la proporcion de familias con ingresos inferiores o iguales a x (esto ultimo es

la interpretacion de F (x)). Por lo tanto, para completar una proporcion del ingreso total

(empezando con las familias de menores ingresos) siempre se requiere una proporcion menor

de familias. Esta es una de las propiedades que se enuncian a continuacion y que justificaran

la forma de la curva de Lorenz.1Vease Frankn A. Cowell 1995, pag. 138.2Vease la parte e del ejercicio propuesto 2.12.

117


Propiedades. Φ satisface, entre otras, las propiedades siguientes:

1. Φ es una funcion creciente, si xf(x) > 0. 2. lımx→−∞

Φ(x) = 0 y lımx→∞

Φ(x) = 1.

3. Si L(x) = Φ(x)− F (x), entonces, lımx→−∞

L(x) = lımx→∞

L(x) = 0.

4. L(x) = Φ(x)− F (x) es una funcion decreciente, si x < µ, creciente si x > µ

5. Φ(x) < F (x), si 0 < F (x) < 1, y Φ(x) = F (x), si F (x) = 0 o F (x) = 1.

Para justificar estas propiedades basicamente se debe notar que Φ′(x) = xf(x)/µ, F ′(x) =

f(x), lımx→−∞

F (x) = 0 y lımx→∞

F (x) = 1.

Definicion 4.2. Sea X una variable con densidad f, distribucion acumulada F y media µ.

Se define la Curva de Lorenz como la grafica de los pares (F (x), Φ(x)), para cada x ∈ R.

Observacion 4.2. La Curva de Lorenz es uno de los metodos mas usados para ilustrar

la desigualdad de la distribucion de los ingresos totales (riqueza) de una poblacion, fue

introducida en 19053. Como se han interpretado Φ(x) y F (x), esta curva muestra cual es la

proporcion del ingreso acumulado que es obtenida por cada proporcion de la poblacion.

La siguiente grafica muestra una desigualdad en la distribucion de los ingresos, esta es

la curva tıpica de Lorenz para una distribucion de ingresos con tendencia central, pero con

presencia de valores grandes concentrados en una proporcion baja de familias, como ocurre,

por ejemplo, en un modelo lognormal4:

podemos apreciar que para llegar a completar solo el 28 % de los ingresos (empezando por

los de menor valor) se tiene ya el 66 % de la poblacion; que evidencia la distribucion desigual

del ingreso en la poblacion, la mayor parte de este se concentra en una parte muy pequena

de la poblacion. Observese que inicialmente la diferencia entre Φ(x) y F (x) es nula (si la

proporcion del ingreso acumulado es cero tambien lo es la proporcion de la poblacion), luego

a medida que aumenta Φ(x) esta diferencia aumenta (la desigualdad se hace mayor), pero a

partir de cierto valor disminuye (la desigualdad se hace menor) hasta ser nuevamente nula

(el ingreso total corresponde a la poblacion completa): conforme las dos ultimas propiedades.

3Vease Frankn A. Cowell 1995, pag. 19.4La grafica se ha elaborado considerando un modelo lognormal con parametros µ = 0 y σ = 1.

118

Profesor Jose Flores Delgado Indicadores de concentracion de los ingresos 119

La lınea de igualdad que se muestra corresponde a una distribucion igual del ingreso entre la

poblacion, es decir, cuando para completar determinada proporcion del ingreso se requiere

la misma proporcion de la poblacion, es decir, si X es constante.

A continuacion comparemos la desigualdad de las distribuciones de los ingresos de dos

poblaciones, R1 y R2, a partir de sus respectivas graficas de Lorenz.

De las graficas anteriores podemos deducir, entre otras cosas, que para llegar a completar

solo el 28 % de los ingresos (empezando por los de menor valor), en la poblacion R2 se tiene

ya el 66 % de la poblacion; pero en la poblacion R1 se tiene solo el 46 %. En resumen la

distribucion del ingreso en la region R2 es mas desigual.

4.2. El Coeficiente de Gini

Definicion 4.3. El Coeficiente de Gini, denotado G, asociado a una variable X con densidad

f se define como sigue:

G = 1− 2E(

Φ(X));

o, equivalentemente,

G = 1− 2

∫ ∞−∞

Φ(x)f(x)dx

Observacion 4.3. El coeficiente de Gini cuantifica el grado de desigualdad del ingreso en

la curva de Lorenz. Cuando no hay desigualdad, este coeficiente es igual a cero, y a medida

que aumenta dicho valor se tendra mayor desigualdad; pero este coeficiente por sı mismo

no determina si esta desigualdad se concentra en los valores superiores o inferiores de los

ingresos, es decir, no da una idea de la forma de la curva de la distribucion. Puesto que

graficamente la integral∫

Φ(x)f(x)dx =∫

Φ(x)dF (x) representa el area debajo de la curva

de Lorenz y por encima del eje horizontal; y el area debajo de la recta de igualdad es

igual a 1/2, entonces, graficamente el valor del coeficiente de Gini es igual al doble del area

comprendida entre la curva de Lorenz y la recta de igualdad. Esto se ilustra a continuacion:

119


Ejemplo 4.2. Si X ∼ N(µ; σ2) el Coeficiente de Gini es igual aσ

µ√π, como se verifica a

continuacion:

G = 1− 2E(

Φ(X))

= 1− 2E(F (X) − σ

µ√

2πe−

12σ2 (X−µ)2

)(vease el ejemplo 4.1)

= 1− 2E(F (X)

)+ 2

σ

µ√

2πE(e−

12σ2 (X−µ)2

)= 1− 2 (1

2) +

2σ

µ√

2πE(e−

12σ2 (X−µ)2

)(F (X) tiene distribucion uniforme en (0, 1) )

=2σ

µ√

2πE(e−

12σ2 (X−µ)2

)=

2σ

µ√

2π

∫ ∞−∞

e−1

2σ2 (x−µ)2 1√2π σ

e−1

2σ2 (x−µ)2

dx

=2σ

µ√

2π

∫ ∞−∞

1√2π σ

e−1σ2 (x−µ)2

dx

=2σ

µ√

2π

1√2

∫ ∞−∞

1√2π σ√

2

e− 1

2 (σ/√

2)2(x−µ)2

dx︸︷︷︸1

=2σ

µ√

2π

1√2

=σ

µ√π.

Ejemplo 4.3. Ası, las distribuciones de los ingresos de dos poblaciones, R1 y R2, son

normales con parametros µ1 = µ2 = 5, σ1 = 1 y σ2 = 3, entonces, los coeficientes de

Gini respectivos son: G1 =1

5√π

= 0, 1128 y G2 =3

5√π

= 0, 3385. La conclusion es que

la distribucion del ingreso en la poblacion R1 es menos desigual. Lo anterior se ilustra en el

grafico que sigue:

120

Profesor Jose Flores Delgado Indicadores de concentracion de los ingresos 121

Observacion 4.4. Un defecto que tiene este coeficiente es que dos distribuciones pueden

tener el mismo coeficiente y, sin embargo, distinto grado de desigualdad.

Definicion 4.4. Si trabajamos con datos disponibles, en lugar de un modelo, la definicion

formal es la siguiente:

G =1

2n2X

n∑i=1

n∑j=1

|xi − xj |

121

5. Estadıstica descriptiva

5.1. ¿Que es la Estadıstica?

Como es natural, lo primero que debemos precisar es que es la estadıstica; en ese sentido,

proponemos las observaciones siguientes. ¿De donde proviene el termino ‘estadıstica’?

Desde tiempos muy remotos en la historia de la humanidad, 2300 anos antes de Cristo,

encontramos evidencias historicas que demuestran que culturas antiguas, como la china,

la hebrea, la griega (particularmente la ateniense) y la romana, formaron censos (listas,

registros, resumenes), por razones de estado, por ejemplo, tributarios, alimentarios y

militares. Como puede imaginarse, en aquellos tiempos remotos, el habitante comun no

estaba interesado en llevar a cabo semejante tarea, es decir, esta generacion de datos

resumidos era una labor o competencia exclusiva del estado; no es ahora difıcil imaginar

que de allı derive el termino estadıstica, en cuanto a su acepcion de censo, lista o incluso

resumen. Para ilustrar mas este significado de estadıstica, recordemos las siguientes frases

comunes:“las estadısticas no mienten”

“las estadısticas demuestran que...”

“existen las mentiras, las grandes mentiras y las estadısticas”

Despues de tratar del origen de la estadıstica, veamos ahora el significado actual de esta.

Solo a fines del siglo XVII, en Alemania, es la estadıstica considerada como ciencia, gracias

a los trabajos culminantes de Karl Friedrich Gauss. En efecto, hoy en dıa, la estadıstica

es considerada como una ciencia y su caracterıstica principal, ya no es solo obtener

resumenes; sino mas bien, realizar inferencias a partir de los resultados obtenidos

de una muestra relativamente pequena de datos. A continuacion damos dos ejemplos

de esto ultimo.

Ejemplo 5.1. Cuando estamos en epocas de elecciones, queremos saber las preferencias de

todo el electorado, pero encuestar a todos resulta imposible, por razones de tiempo y dinero.

Entonces, se recurre a tomar adecuadamente una muestra y a partir de los resultados que

se obtienen de ella, inferir lo que ocurrira en general.

Ejemplo 5.2. En el proceso de produccion de un artıculo, interesa comprobar si realmente

se ha logrado el nivel de calidad deseado. Evidentemente, usar todas las unidades fabricadas

resulta muy costoso y poco factible. Entonces, nuevamente, se opta por efectuar el control

de la calidad solo para una muestra de unidades (apropiadamente elegida) para evidenciarse

si esta o no satisfecho el nivel deseado.

123


Parece claro que las inferencias que resulten de lo observado, en solo una muestra de la

poblacion de estudio, no tienen que ser necesariamente verdaderas; sino que mas bien estan

acompanadas de cierto margen de error y nivel de confianza, es decir, son solo ‘estimaciones’

o aproximaciones de lo que realmente ocurre. Es precisamente la busqueda de estas medidas

de error y de confianza para las inferencias, que convierten a la estadıstica en una ciencia,

pues para ello usa las matematicas y crea su propia teorıa. El primer resultado cientıfico en

ese sentido, data de 1818, en este se estudio la eficiencia de los estimadores estadısticos, lo

que se obtuvo gracias a resultados matematicos, originales de Gauss, sobre teorıa de los

errores.

A continuacion, empezamos dando algunas definiciones, mas bien conceptos o ideas

basicas.

5.2. Nociones basicas

Definicion 5.1. La estadıstica es una ciencia que se ocupa de la recoleccion, presentacion

y analisis de datos. La caracterıstica que la distingue es la de hacer generalizaciones o

inferencias, a partir de solo una muestra.

Ejemplo 5.3. Un ejemplo de inferencia estadıstica muy conocido es la inferencia sobre las

preferencias electorales. Por ejemplo: “basandose en los resultados de una muestra de 1822

electores del paıs, se estima que el porcentaje de electores (en todo el paıs) a favor del

candidato AT es de 41 %, con un margen de error de 2 % y un nivel de confianza en esta

inferencia del 95 %”. En este caso, el margen de error significa que en realidad el verdadero

porcentaje a favor del candidato AT esta entre 41 % − 2 % y 41 % + 2 %, es decir, entre

39 % y 43 %. Y el nivel de confianza significa que la metodologıa seguida, para estimar dicho

porcentaje, acierta en el 95 % de las veces que es usada con muestras de este tamano; por

lo tanto, siendo este porcentaje de aciertos tan alto, uno confıa en que esta aplicacion de la

metodologıa, con la muestra dada, sea uno de los casos en que se acierta en la inferencia.

Clasificacion de la estadıstica Existen dos grandes ramas en la estadıstica: la Estadıstica

Descriptiva y la Estadıstica Inferencial.

La estadıstica descriptiva, como su nombre lo da a entender, no va mas alla de los datos

disponibles, por ejemplo la muestra; y lo que interesa es describir que muestran los datos.

Es la parte mas conocida por la mayorıa de las personas. Sus labores la encontramos, por

ejemplo, en las tablas y graficas que se acostumbran presentar con el fin de ilustrar ciertos

patrones de tendencia que presenten los datos o, simplemente, para que los resultados sean

mejor entendidos. Se puede decir que se ocupa de la primera etapa en el analisis de los datos:

la descripcion o analisis exploratorio. La estadıstica inferencial, en cambio, hace el trabajo

mas importante, es decir, lo que respecta a las inferencias: segunda etapa en el analisis de

los datos.

124

Profesor Jose Flores Delgado Estadıstica descriptiva 125

Observacion 5.1. En realidad, en la estadıstica inferencial actual, existen dos corrientes

cuyas metodologıas se contraponen: La llamada estadıstica clasica, esta es la que se

acostumbra a ensenar y la mas conocida; y por otra parte, esta la llamada estadıstica

bayesiana —en honor a su impulsor Thomas Bayes (1702-1761)—, esta ultima estuvo

demasiado tiempo olvidada, pues requiere de mucho calculo computacional. Con respecto

a fundamentos, la estadıstica bayesiana parece ser mas formal, por ejemplo, la inferencia

obtenida con la estadıstica clasica, como ya hemos explicado, se basa en la aplicacion de

una tecnica sobre determinada muestra aleatoria disponible, entonces, sucede que en un

alto porcentaje de las veces la tecnica produce un resultado o inferencia acertada, por tal

razon, parece natural que quien la aplica en una muestra en particular, confıe en que esa

vez corresponda a uno de los aciertos y no a uno de los desaciertos, salvo, claro esta, que

la persona en cuestion se considere muy desafortunada, es decir, la inferencia estadıstica

clasica se sustenta en el llamado “principio de la confianza”. En contraposicion, para la

estadıstica inferencial bayesiana, el grado de credibilidad o de confianza, en una inferencia,

se debe basar solo en la oportunidad en la cual se este aplicando, es decir, en la muestra

disponible sin considerar todas las veces en las cuales se aplica. Entender esta exigencia de

rigor requiere de un espıritu filosofico innato en el hombre desde su origen; pero mas alla de

esta discusion, lo importante es que el objetivo basico es hacer inferencias.

Definicion 5.2. Una variable es cualquier caracterıstica de interes.

Definicion 5.3. Poblacion es el conjunto de unidades, personas u objetos, sobre los cuales

interesa observar una o mas caracterısticas.

Definicion 5.4. Una muestra es cualquier conjunto de una poblacion. La muestra se llama

aleatoria, si sus integrantes han sido escogidos al azar.

Definicion 5.5. Un dato u observacion es cualquier medida, resultado de haber observado

una variable en una unidad de alguna poblacion.

Ejemplo 5.4. A continuacion veamos algunos ejemplos de variables, todas referidas a la

poblacion de electores del Peru:

Preferencia electoral (opcion del elector por determinado candidato o ninguno).

Edad del elector (generalmente en anos cumplidos).

Estado socioeconomico del elector.

Numero de integrantes en la familia del elector.

Sexo del elector.

Grado de instruccion del elector.

Ingresos mensuales del elector.

125


Definicion 5.6. Las variables se suelen clasificar como cualitativas si tienen caracter no

numerico, y cuantitativas, si representan cantidades. A su vez, las variables cuantitativas,

se subclasifican en discretas, si el conjunto de valores posibles de la variable (denominado

rango) puede ser enumerado, y en continuas, si este conjunto de valores constituye un

intervalo o reunion de intervalos.

Ejemplo 5.5. Veamos como se clasifican las variables dadas en el ejemplo 5.4:

La preferencia electoral es una variable cualitativa, expresa la intencion de votar a favor o

en contra de determinado candidato.

La edad del elector es una variable cuantitativa y por la forma de medirla usualmente, se la

puede considerar discreta; formalmente deberıa ser continua, pero en la practica se mide en

anos cumplidos.

El estado socioeconomico del elector es tambien una variable cualitativa, expresa el grupo o

estrato socioeconomico al que pertenece el elector.

El numero de integrantes en la familia del elector es una variable cuantitativa discreta, ya

que representa una cantidad y ademas los valores posibles que podrıa asumir, se pueden

enumerar.

El sexo del elector es una variable cualitativa.

El grado de instruccion del elector, tambien es una variable cualitativa, pues si bien representa

un grado, esto solo significa mas o menos instruccion, pero no cantidad.

El ingreso mensual es una variable cuantitativa continua, pues representa una cantidad y

sus valores posibles, en teorıa, constituyen un intervalo.

5.3. Escalas o niveles de medicion

Por medicion se puede entender al proceso de observacion de una caracterıstica de interes

sobre las unidades de la poblacion. Esta medicion se debe expresar como un numero

que informe, lo mas precisamente posible, sobre la caracterıstica en la unidad

observada. Claro esta que no siempre los numeros informaran lo mismo, pues

depende de la naturaleza de lo observado, segun esto, se tienen distintos niveles de

medicion o escalas, solemos considerar cuatro niveles que trataremos a continuacion.

5.3.1. Escala nominal

Aquı, los numeros solo sirven para distinguir valores o categorıas diferentes de la variable.

126


Ejemplo 5.6. El sexo de los electores se mide a este nivel de medicion o escala. Una escala

apropiada puede ser, por ejemplo, la siguiente:

0 = femenino; 1 = masculino.

En general, cualquier escala de este tipo es de la forma:

a = femenino; b = masculino.

Para ciertos a y b numeros reales, fijados previamente y con la unica condicion de que sean

diferentes.

5.3.2. Escala ordinal

Aquı, los numeros, ademas de servir para distinguir, reflejan un orden existente entre

los valores de la variable, segun el menor o mayor grado en el que se encuentre presente la

caracterıstica.

Ejemplo 5.7. El grado de instruccion del elector, se suele medir con este nivel.

Para simplificar, supongamos que solo distingamos cuatro valores: analfabeto, primaria,

secundaria y superior. Entonces, una escala apropiada puede ser:

0 = analfabeto; 1 = primaria; 2 = secundaria; 3 = superior

En general, cualquier escala de este tipo es de la forma:

a = analfabeto; b = primaria; c = secundaria; d = superior

Para ciertos a, b, c y d numeros reales, fijados previamente y con la unica condicion de que

a < b < c < d.

5.3.3. Escala de intervalo

Ademas de las caracterısticas anteriores, se tiene que las diferencias entre los numeros

asignados representan propiamente cantidades de la caracterıstica medida. Esto se logra

definiendo una unidad de medida y un cero u origen, este ultimo es arbitrario por no existir

naturalmente, es decir, no existe un valor que indique ausencia de la caracterıstica que se

mide.

127


Ejemplo 5.8. El tiempo en el calendario actual es medido de esta forma. Para ilustrar este

tipo de escala fijemonos en el acontecimiento de tres eventos A, B y C, en el calendario

actual, como se muestra a continuacion:

A B C

A.C. 0 100 200 300 400 500

Es inexacto afirmar que el tiempo transcurrido hasta B sea el doble del transcurrido hasta A,

en efecto, esto puede parecer cierto en esta escala del calendario gregoriano, donde el origen,

al no existir naturalmente, ha sido fijado arbitrariamente, es decir, no significa ausencia de

tiempo transcurrido. Sin embargo, sı es cierto que la diferencia entre el tiempo transcurrido

hasta el acontecimiento A y el transcurrido hasta B, es la tercera parte de la correspondiente

diferencia existente entre B y C.

Observacion 5.2. Si dos escalas de intervalo son equivalentes, es decir, son utiles para medir

la misma caracterıstica, la relacion existente entre una medicion, X, cualquiera, obtenida

para un elemento de la poblacion; e Y , la correspondiente medicion en el mismo elemento,

pero con la otra escala es:

Y = a+ bX

Siendo a y b constantes independientes del objeto que se mide con ambas escalas. Esto es ası,

pues b representa el posible cambio de unidad, por ejemplo de anos a siglos, y a representa

el posible cambio de origen.

5.3.4. Escala de razon

Aquı, los propios numeros asignados en la medicion ya representan cantidades de la

caracterıstica que se mide. Estas escalas se caracterizan, no solo por tener una unidad de

medida; sino tambien por poseer un cero u origen natural, el cual significa ausencia de la

caracterıstica que se mide. Por esta razon, las proporciones entre los propios numeros ya

representan cantidades y de allı el nombre de escala de razon.

Ejemplo 5.9. Los ingresos del elector se miden con este nivel o escala, pues existe una

unidad de medida (soles, dolares, etc.) y existe un cero absoluto u origen natural, es decir,

un valor que, sin importar la escala de razon empleada, indica ausencia de ingresos. Por la

misma razon, el numero de integrantes de la familia del elector, tambien se mide con este

nivel, en efecto, hay una unidad de medida (unidades, decenas, etc) y el cero es unico, indica

que no hay integrantes.

Observacion 5.3. Si dos escalas de razon poseen equivalencia, es decir, son utiles para medir

la misma caracterıstica, existira una relacion entre una medicion, X, cualquiera, obtenida

128


para un elemento de la poblacion, e Y , la correspondiente medicion en el mismo elemento,

pero con la otra escala. La relacion existente entre ambas es:

Y = bX

Siendo b una constante independiente del objeto sobre el que se mide con ambas escalas.

Esto es ası, pues b representa el posible cambio de unidad, por ejemplo de anos a siglos o,

de soles a dolares, o de unidades a decenas.

5.4. Organizacion y tratamiento de datos. Promedios y

percentiles

A fin de poder detectar patrones de tendencia que puedan mostrar los datos disponibles, es

usual organizarlos en una distribucion de frecuencias, agrupandolos en clases y determinando

las frecuencias, es decir, el numero o proporcion de datos correspondiente a cada una. Como

veremos a continuacion, el tratamiento depende del tipo de variable, pero vale la pena senalar

que no existe una unica manera de hacerlo. En todos los casos, suponemos queX es la variable

de la cual se han obtenido los n datos disponibles.

5.4.1. Caso de variables cualitativas

Ejemplo 5.10. El tipo de credito directo otorgado por la banca multiple es una variable

cualitativa de interes en la supervision de la banca. Supongamos que se desea averiguar como

se han distribuido los creditos otorgados segun el tipo, esta informacion la podemos obtener

de la pagina web de la superintendencia de banca y seguros. Ası, la tabla siguiente muestra

la distribucion de esta variable al 31 de mayo de 2003:

Distribucion del Tipo de Credito

Concedido por la Banca Multiple

Tipo de Credito Numero de deudores Porcentaje de deudores

Hipotecario Para Vivienda 38 761 2,5

Comercial y a Microempresa 237 882 15

De Consumo 1 303 561 82,5

La distribucion de frecuencias se representa mediante barras o mediante sectores circulares,

en ambos casos los tamanos son proporcionales a la frecuencia del valor que representa.

Ejemplo 5.11. La distribucion del ejemplo anterior puede representarse mediante barras o

sectores circulares como se muestra a continuacion:

129


Distribucion de los deudores segun el tipo de credito adquirido. Panel izquierdo: grafico de barras.

Panel derecho: grafico de sectores circulares

Apreciamos claramente que la mayor parte de los creditos concedidos son de consumo, con un

82,5 % del total de creditos asignados, sigue el tipo de credito comercial y a microempresas

(con el 15 %), y el tipo de credito menos otorgado es el hipotecario con solo un 2,5 %.

Al valor de la variable que se presenta con mayor frecuencia se de denomina moda, entonces,

podemos decir que la moda del tipo de credito otorgado es el tipo de consumo.

5.4.2. Caso de variables cuantitativas discretas

Ejemplo 5.12. A fin de estudiar el numero de sucursales que tienen las empresas de cierto

ramo de la produccion nacional, se tomo una muestra de 80 estas empresas y se conto el

numero de sucursales que tenıa cada una, obteniendose los resultados siguientes:

2 4 5 4 4 4 5 3 4 5 5 2 4 1 3 5 5 3 4 4 7 5 2 4 4 5 4

5 5 7 6 5 5 6 5 4 6 4 3 4 6 4 6 4 4 5 3 4 4 4 4 5 4 6

4 4 4 6 4 4 4 4 4 5 4 4 4 6 4 5 4 5 4 4 5 4 4 5 2 4

Estos datos se organizan en una distribucion de frecuencia como sigue:

Distribucion del

numero de sucursales

Sucursales

X

Empresas

f

Acumulado

F

1 1 1

2 4 5

3 5 10

4 40 50

5 20 70

6 8 78

7 2 80

130


Una representacion grafica de esta distribucion es la siguiente:

Puede apreciarse que el numero de sucursales tiende a concentrarse alrededor de 4, es decir,

la tendencia es hacia la centralizacion, pues, existe un valor valor central que sobresale en

frecuencia y alrededor de este se distribuyen los demas valores los cuales van disminuyendo

en frecuencia conforme se distancian del valor central. En este caso es facil encontrar un valor

promedio, es decir, uno que represente a la mayor parte de los datos (el termino medio).

Una medida de este valor central es, por ejemplo, la moda, 4 sucursales, o la media aritmetica:

X =

n∑j=1

xj

n=

1(1) + 2(4) + ...+ 7(2)

80=

346

80= 4, 325.

Las estadısticas mas usadas para determinar un valor promedio son la media aritmetica, la

moda y la mediana. La mediana, me, es el valor que ocupa la posicion central cuando los

datos se ordenan, por lo tanto este valor tiene la propiedad que la mitad de los datos son

menores o iguales que el. En el ultimo ejemplo, la mediana es 4, es decir, la mitad de las

empresas tienen 4 sucursales o menos.

El promedio es entonces un valor medio, en el sentido que se parece a muchos de los

datos, ası, puede ser usado para representarlos. Sin duda el promedio es la estadıstica mas

importante, pues da una idea general de los valores de los datos.

5.4.3. Caso de variables cuantitativas continuas

En este caso, los datos se agrupan en k intervalos de igual longitud o amplitud, C, luego se

determinan las frecuencias de los intervalos. Tambien se acostumbra definir el representante

o marca de clase de cada intervalo, como el punto medio del intervalo, este servira para

aproximar a todos los datos que se encuentren en dicho intervalo.

Ejemplo 5.13. En un cajero automatico se midio el tiempo de las transacciones de cada

uno de 25 clientes, de una muestra aleatoria. Se obtuvo en minutos:

0,19 1,39 2,16 1,23 0,75 2,59 1,40 0,02 0,71 2,41 3,53 1,17 1,16

1,61 3,76 0,96 1,94 1,65 4,75 1,59 0,47 2,01 0,82 0,92 3,07

131


Obtengamos primero las estadısticas usadas para determinar un promedio, las cuales se

complementaran con los patrones de tendencia que se puedan detectar al organizar los datos

en una distribucion de frecuencias, y mas adelante veremos otras estadısticas que serviran

para cuantificar la variabilidad existente entre los datos y, de este modo, verificar la idoneidad

de tales promedios. Ası, la media aritmetica resulta: X = (x1 + x2 + . . . + x25)/25 =

42, 26/25 = 1, 6904, entonces, segun este resultado, el tiempo promedio para efectuar las

transacciones es de 1,6904 min ; sin embargo, esto no es suficiente para garantizar que

realmente este valor sea un buen promedio. Estos datos no tienen una moda, pues no existe

uno que se repita mas. La mediana de estos datos es el que ocupa la posicion central (en

este caso la decimotercera), es decir, 1,4, ası, tenemos que el 50 % de los clientes demoro 1,4

min o menos. Este ultimo valor tambien puede tomarse como promedio, pero, como ya se

menciono, debe verificarse que realmente cumpla este rol.

Ahora pasemos a la deteccion de los posibles patrones de tendencia, para este fin

construyamos una distribucion de frecuencias con k = 6 intervalos de igual longitud. Los

datos extremos son: x(1) = 0, 02 y x(25) = 4, 75. Luego, el rango es R = 4, 75− 0, 02 = 4, 73.

Ası, la longitud de cada uno de los k = 6 intervalos sera C = 4, 73/6 = C = 0, 78833..., pero

como no sale un valor exacto, es necesario redondear. En este caso, podemos redondear a

2 decimales (pues los datos solo tienen dos decimales, ası, no vale la pena considerar mas),

claramente el redondeo debe ser por exceso (hacia arriba), pues de otro modo el mayor

dato quedarıa fuera. Tomamos C = 0, 79. El primer intervalo comenzarıa en x(1) = 0, 02 y

terminarıa en x(1) + C = 0, 02 + 0, 79 = 0, 81, el segundo empezarıa en 0, 81 y terminarıa

en 0, 81 + C = 1, 60; y ası sucesivamente, hasta haber completado los k = 6 intervalos. Con

estos intervalos se obtiene la tabla, todavıa incompleta, de la forma siguiente:

Tiempo Marca Frecuencia

[0, 02; 0, 81]

]0, 81; 1, 60]

]1, 60; 2, 39]

]2, 39; 3, 18]

]3, 18; 3,97]

]3, 97; 4, 76]

Ahora, se distribuyen los datos uno por uno. Al final, se habra completado la tabla de

frecuencias siguiente:

Tiempo Marca Frecuencia

[0, 02; 0, 81] 5

]0, 81; 1, 60] 9

]1, 60; 2, 39] 5

]2, 39; 3, 18] 3

]3, 18; 3,97] 2

]3, 97; 4, 76] 1

132


Las otras partes de la tabla son las siguientes: xj = marca de clase del intervalo j (punto

medio del intervalo j); Fj = frecuencia acumulada hasta el intervalo j; h = f/n y H = F/n.

Con estas completamos la tabla de la distribucion de frecuencias

Distribucion de los tiempos necesarios

Tiempo Marca Frecuencia Frecuencia Frecuencia Frecuencia

(minutos) X f acumulada relativa acumulada relativa

[0, 02; 0, 81] 0, 415 5 5 0, 20 0, 20

]0, 81; 1, 60] 1, 205 9 14 0, 36 0, 56

]1, 60; 2, 39] 1, 995 5 19 0, 20 0, 76

]2, 39; 3, 18] 2, 785 3 22 0, 12 0, 88

]3, 18; 3,97] 3, 575 2 24 0, 08 0,96

]3, 97; 4, 76] 4, 365 1 25 0, 04 1, 00

Podemos representar la distribucion de frecuencias con el histograma o el polıgono de

frecuencias. El histograma es una representacion con barras de altura proporcionales a la

frecuencia del intervalo que representa. El polıgono se obtiene uniendo, con lıneas continuas,

cada punto con una abscisa igual a la marca de clase de un intervalo y ordenada igual a la

frecuencia de dicho intervalo. Existen otras graficas, como la grafica de caja. A continuacion

se presentan estos dos graficos para nuestro ejemplo anterior:

Distribucion de los tiempos para realizar las transacciones. Panel izquierdo: histograma. Panel

derecho: polıgono

En cualquiera de estas graficas apreciamos los patrones de tendencia que muestran los datos.

Podemos empezar por mencionar lo evidente, la variacion natural de los datos, es decir, no

todos los clientes necesitan el mismo tiempo, los valores correspondientes estan entre 0,02

y 4,75 min. Tambien se puede apreciar claramente que los tiempos necesarios, para que

los clientes efectuen sus transacciones, tienden a distribuirse alrededor del intervalo entre

0,81 y 1,6, el cual sobresale en frecuencia y conforme consideramos tiempos con valores que

se alejan de este intervalo, son menos los clientes que necesitan de este tiempo, es decir,

se distingue un patron de centralizacion, como es razonable. Por lo observado, la media y

mediana sı cumplen el papel de promedio, y algo mejor la mediana por estar en el intervalo

central. Ademas, existen unos pocos clientes cuyos tiempos necesarios son muy grandes en

comparacion con los otros, es decir, existe una asimetrıa o sesgo hacia valores altos.

133


Ahora, representaremos las frecuencias acumuladas mediante la ojiva de frecuencias, usando

tambien los datos de nuestro ejemplo anterior:

Figura 5.1: Ojiva de la distribucion de los tiempos para realizar las transacciones

Esta grafica es de utilidad cuando, por ejemplo, queremos determinar ubicaciones relativas

en la distribucion, como lo ilustra el ejemplo siguiente.

Ejemplo 5.14. Al banco le interesa saber, entre otros detalles, si necesita dar mas

recomendaciones en cuanto al uso del cajero para bienestar de todos los clientes. Ası, no

solo le interesa que los tiempos necesarios tiendan a centralizarse alrededor de un valor

razonable; sino tambien que no exista un sesgo indicativo de posible malestar en los clientes

que podrıan estar esperando su turno, por mucho tiempo. En ese sentido, el banco considera

un grupo de clientes ‘crıtico’, este lo integran aquellos que necesitan de mayores tiempos y

que constituyen la cuarta parte de los clientes. ¿A partir de que tiempo un cliente, de la

muestra, ya es considerado dentro del grupo referido?

Ya hemos hablado sobre el patron de tendencia a la centralizacion. Ahora, para obtener el

valor del tiempo a partir del cual un cliente estara dentro del grupo ‘crıtico’, basta observar

en la ojiva anterior, el porcentaje acumulado de 75 %, pues, si este grupo de mayores tiempos

constituyen una cuarta parte o 25 %, entonces, las otras tres cuartas partes o 75 % (y cuyos

tiempos correspondientes son inferiores) estan fuera del grupo. Ası, es claro que el valor

buscado, x, debe ser tal que le corresponda un porcentaje acumulado igual a 75 %, es decir,

H(x) = 0, 75. De aquı la solucion es simple, basta ordenar los datos para descubrir dicho

valor, es decir, 2,16 minutos.

Supongamos ahora que se deseara resolver el problema, pero la poblacion completa de

clientes. Claramente la solucion es compleja, casi inviable, por eso podemos recurrir a una

solucion estadıstica, hacer una inferencia a partir de los datos de la muestra disponible,

entonces, el valor obtenido en la muestra es solo una estimacion, es decir, podemos decir, que

2,16 es el tiempo estimado, sin embargo para que esto sea realmente una inferencia estadıstica

habrıa que cuantificar el error de estimacion y el correspondiente nivel de confianza en esta,

esto sera visto posteriormente.

134


El problema anterior tambien puede resolverse desde un punto de vista probabilıstico, para

esto basta obtener un modelo que describa las frecuencias relativas de los tiempos necesarios

—mas adelante nos ocuparemos del estudio de modelos de esta naturaleza—, podemos

considerar uno muy simple a partir de los datos de la muestra, es decir, una funcion H

cuya grafica corresponde a la ojiva dada anteriormente, ası, de allı observamos (o incluso

simplemente de la tabla de la distribucion) que el valor buscado, x, esta en el tercer intervalo,

es decir, x ∈]1, 60; 2, 39], luego, concentrando nuestra atencion en este intervalo, obtenemos:

x = 2,3505. Lo anterior se ilustra a continuacion:

Determinacion de un percentil a partir de la ojiva

Con esta funcion podemos averiguar, bajo un enfoque probabilıstico, todo lo relacionado

con esta variable (el tiempo necesario para realizar las transacciones en el cajero), como por

ejemplo el tiempo promedio necesario, de esto nos ocuparemos en el capıtulo de probabilidad.

El ejemplo anterior tambien motiva la definicion siguiente.

Definicion 5.7. Si K es un numero entre 0 y 100, el percentil K es el valor de los datos

que tiene la propiedad de que el K % de las observaciones es menor o igual que el. Podemos

denotarlo por PK . Ası, H(PK) = k / 100 o, equivalentemente, F (PK) = nk / 100, siendo n

el numero total de observaciones.

Observacion 5.4. Notese que el percentil es una medida de posicion o ubicacion

relativa dentro del grupo de observaciones. Un ejemplo muy familiar para todos nosotros

lo encontramos en la universidad cuando se habla del “tercio superior” o, a veces, hasta del

“quinto superior”; el primer grupo corresponde a los alumnos con un promedio ponderado

de notas de por lo menos igual al P66,66; y el segundo grupo esta integrado por los alumnos

cuyo promedio ponderado de notas sea por lo menos igual al P80. Estas medidas son de suma

utilidad cuando queremos comparar datos medidos en diferentes unidades.

135


Ejemplo 5.15. Cuando usted, como es de esperarse, termine satisfactoriamente sus estudios

o, haya completado buena parte de ellos, querra empezar a trabajar o, tal vez, querra salir

al extranjero para realizar un pos grado; entonces, tendra que preparar su curriculum vitae,

ademas, probablemente tenga que rendir un examen de suficiencia en el idioma ingles y

tambien le tendran que elaborar algunas cartas de recomendacion. Para lo del ingles, lo

que importara sera su ubicacion relativa o, percentil, dentro de las notas de dicho examen;

mientras que para la carta de recomendacion, sera de suma importancia su percentil dentro

del grupo de notas de los alumnos de la universidad.

Definicion 5.8. Grafica de caja: es una grafica que se obtiene con los percentiles 25, 50

y 75, junto con el menor y mayor valor de los datos. Se obtiene ası un buen resumen de los

datos.

A continuacion hagamos la grafica de caja que corresponde a los datos del ejemplo 5.13,

correspondientes a los tiempos necesarios para realizar una transaccion en un cajero

automatico. Las estadısticas necesarias las presentamos en la tabla siguiente:

Tiempo necesario (min)

Mınimo 0,02

Maximo 4,75

Percentil 25 0,92

Percentil 75 2,16

Percentil 50 1,4

Figura 5.2: Grafica de caja de la distribucion de los tiempos para realizar las transacciones

En esta grafica se puede apreciar que los tiempos necesarios para realizar las transacciones

varıan entre 0,02 min y 4,75 min, mientras que el 50 % de las tiempos centrales esta entre

0,92 min y 2,16 min, esto da un rango medio de 2,48 min . Un promedio para estos tiempos

puede ser 1,4 min .

Observacion 5.5. Una vez mas destacamos que la distribucion de los datos tiene por

finalidad primordial detectar patrones de tendencia que muestren estos datos y en particular

proponer, a partir de estos patrones, modelos para describir no solo la muestra de datos

disponibles, sino a la poblacion entera de la que provienen estos. Las estadısticas (resumenes)

de una muestra de datos disponible (media, moda, mediana, etc.) se obtienen directamente

con los propios datos, sin necesidad de la distribucion de frecuencias.

136


5.5. Propiedades y uso de los promedios

La importancia del promedio se debe a que muchas veces necesitamos saber como son

los datos en general y esto resulta mas importante que las particularidades de cada uno. A

continuacion damos algunas observaciones y propiedades de los promedios ya definidos, no

sin antes incidir una vez mas que la media aritmetica no es la unica forma de obtener un

promedio, es la mas conocida, pues, generalmente es la mejor, pero no siempre lo es.

1. La moda se puede calcular y tendra significado en terminos de la variable medida,

incluso con escalas nominales. Para la mediana esto sucede a partir de escalas ordinales.

Para la media con escalas de razon y hasta con las de intervalo.

2. La moda y la mediana presentan dificultades en su calculo. Puede ocurrir que ninguno

de los datos sobresalga en frecuencia, en este caso no existe la moda o, a veces, se admite

la existencia de una o dos modas. Si el numero de datos es par, existirıan dos de ellos

que ocuparıan las posiciones centrales al ser ordenados, si estos dos son iguales, no hay

ningun problema; pero si no lo son, dos reglas son muy usadas: la primera consiste en

tomar el de menor valor, la cual es muy util incluso con escalas ordinales simplemente;

y la segunda, valida para escalas de intervalo o de razon, consiste en tomar la media

aritmetica de los dos valores centrales.

3. De estos tres promedios, solo la media es proporcional a la suma total de las

observaciones. Y se tiene que:n∑j=1

xj = nX. Ası, solo la media debera usarse para

este fin.

4. En el caso de variables cuantitativas, la media aritmetica es el promedio mas usado,

esto se debe a que tiene mejores propiedades y es mas adecuado para la inferencia

estadıstica, pues produce generalmente mejores estimaciones. Sin embargo, como

medida del promedio, la principal desventaja de la media es que se ve afectada por

la presencia de asimetrıa o valores extremos no compensados, desplazandose en esa

direccion. A continuacion se ilustra esto graficamente para el caso de una distribucion

correspondiente a una variable cuantitativa continua con tendencia a la centralizacion:

El ejemplo 5.13 ilustra la situacion de asimetrıa hacia la derecha, razon por cual la

media resulta un poco mayor que la mediana.

137


5. La media aritmetica es el unico punto de equilibrio, compensa los valores de a su

izquierda con los de su derecha. Se cumple que:

n∑j=1

(xj − X) = 0 y sin∑j=1

(xj − x) = 0, entonces, x = X.

6. Considerando la distancia euclidiana, la media aritmetica es el punto que mas cerca

esta de todos los datos en general, es decir, para cualquier numero real x se cumple

que:n∑j=1

(xj − X)2 ≤n∑j=1

(xj − x)2.

La propiedad anterior tambien se enuncia diciendo que la media aritmetica es el valor

que tiene la propiedad de minimizar la suma de los cuadrados de las desviaciones de

los datos respecto a el.

7. Considerando la distancia valor absoluto, la mediana es el punto que mas cerca esta de

todos los datos en general, es decir, para cualquier numero real x se cumple que:

n∑j=1

| xj −Me | ≤n∑j=1

| xj − x |.

La propiedad anterior tambien se enuncia diciendo que la mediana es el valor que tiene

la propiedad de minimizar la suma de los valores absolutos de las desviaciones de los

datos respecto a el.

8. Para cualesquiera a y b, que se fijen, si hacemos que cada dato xj, se transforme en:

yj = a+ bxj,

entonces, la media aritmetica resultante de estos datos, ası transformados, tambien

satisface dicha relacion, es decir,

Y = a+ bX.

Esta propiedad nos dice como varıa la media aritmetica ante cambios en la unidad de

medida o del origen de la escala.

Ahora veamos las principales medidas de dispersion, la tendencia natural de los datos a

diferenciarse entre ellos.

5.6. Medidas de dispersion

La tendencia a la dispersion es la tendencia mas natural en los datos, sin ella no existirıan

problemas que resolver y significa la tendencia que tienen los datos a diferenciarse entre ellos,

a ser menos homogeneos y mas heterogeneos, a estar mas dispersos.

138


El Rango es la diferencia entre los dos valores mas extremos, es decir, entre el mayor y el

menor de los datos. Lo podemos denotar por R. Ası, si como ya fue indicado antes, x(1) es

el menor valor y x(n) es el mayor, se tiene que:

R = x(n) − x(1)

Claramente es una medida muy imprecisa, como se ilustra en el ejemplo siguiente.

Ejemplo 5.16. Dadas las series de datos siguientes:

Datos R X = Me = Mo

Serie 1 : 15 20 20 20 25 10 20

Serie 2 : 195 200 200 200 200 200 200 200 205 10 200

¿En cual de las series dirıa usted que los datos estan menos dispersos?

La respuesta es en la segunda, pues puede apreciarse en ella que hay mayor cantidad de

datos parecidos a su promedio. El rango es una medida muy imprecisa. Solo cuando el rango

sea pequeno, tendremos razones para pensar que no haya mucha dispersion.

El rango intercuartil Es la diferencia existente entre los percentiles 75 y 25. Lo podemos

denotar por RI. Ası:

RI = P75 − P25.

Esta medida refina al rango, pues ya no considera los dos valores mas extremos; sino a los

cuartos superior e inferior, es decir, descarta los datos que queden fuera del intervalo formado

por estos percentiles y se queda solo con el 50 % restante, o sea, el 50 % central.

La desviacion estandar Se la define como una ‘distancia’ promedio de los datos respecto

a su media. Esto es, si la denotamos por S, tenemos que:

S =

√√√√√ n∑j=1

(xj − X)2

n.

En esta formula, la raız cuadrada permite que esta medida se exprese en las mismas unidades

de los datos.

Si no se dividiera por n, se tendrıa exactamente la distancia euclidiana entre los puntos de

Rn : (x1, . . . , xn) y (X, . . . , X), entonces esta medida es una distancia promedio de los

datos a su media. Cuanto mas grande sea este valor, mas heterogeneos seran los datos; y

cuanto mas pequeno sea este valor, mas homogeneos lo seran.

Esta estadıstica es la medida de dispersion mas usada, por razones similares a las que hacen

de la media la medida de resumen o promedio mas usada, y naturalmente tambien presenta

dificultades cuando existe asimetrıa.

139


La varianza es el cuadrado de la desviacion estandar, por eso se la denota por S2.

El coeficiente de variacion Se le define como la proporcion que representa el valor de la

desviacion estandar respecto al de la media. Se lo denota por CV. Ası:

CV =S

X.

Al carecer de unidades, se le suele usar para comparar la dispersion existente entre dos

grupos de datos cuyas unidades no sean comparables, o cuyos promedios esten

muy distanciados por corresponder a distintas poblaciones.

Ejemplo 5.17. Veamos lo que ocurre con los datos del ejemplo 5.12. Aprovechemos para

obtener las principales estadısticas de estos datos con ayuda del Excel, el cual tiene los

procedimientos estadısticos en la opcion del menu de Herramientas llamada Analisis de

datos (si esta opcion no estuviera activada se puede hacerlo en los Complementos del

menu de Herramientas). En la opcion Analisis de datos se pide el procedimiento Estadıstica

descriptiva, ası, la secuencia anterior es:

Herramientas → Analisis de datos → Estadıstica descriptiva.

Al procedimiento Estadıstica Descriptiva se le solicita el resumen de estadısticas y para

que este incluya los percentiles 75 y 25 se indica el k-esimo mayor y el k-esimo menor

correspondientes, en este caso como son 80 datos, estos corresponden al vigesimo mayor y

vigesimo menor, respectivamente (la cuarta parte de 80 es 20). Ası obtenemos, entre otras,

las estadısticas siguientes:

Numero de sucursales

Media 4,325

Error tıpico 0,1204

Mediana 4

Moda 4

Desviacion estandar 1,077

Varianza de la muestra 1,1589

Curtosis 1,1995

Coeficiente de asimetrıa -0,1874

Rango 6

Mınimo 1

Maximo 7

Suma 346

Cuenta 80

Mayor (20) 5

Menor(20) 4

Nivel de confianza(95 %) 0,2396

140


Como ya hemos visto los datos estan alrededor de 4. Vemos que el rango es 6, mientras

que el rango intercuartil es P75 − P25 = 5 − 4 = 1 este ultimo indica que no es muy

grande la dispersion en el numero de sucursales, al igual que la desviacion estandar que

es 1,077, si queremos precisar mejor cuan grande son estas medidas de dispersion hay que

compararlas con la magnitud promedio de los datos, ası apreciamos que es relativamente

baja la dispersion. Entonces, por lo visto hasta ahora sobre estos datos, concluimos que el

numero promedio de sucursales es 4 y es relativamente pequena la variabilidad.

Ejemplo 5.18. En el ejemplo 5.13 la media, mediana, desviacion estandar y rango

intercuartil son respectivamente 1,6904; 1,4; 1,1289 y 1,24. Ası, con los patrones de tendencia

observados y las estadısticas anteriores, concluimos que en promedio los clientes tardan 1,4

minutos y la variabilidad promedio es de 1,2 minutos.

5.6.1. Propiedades de la desviacion estandar

1. Se verifica la formula siguiente, llamada formula de calculo para la varianza:

S2 =

n∑j=1

x2j − nX2

n=

n∑j=1

x2j

n− X2.

2. Para cualesquiera a y b, que se fijen, si hacemos que cada dato xj, se transforma en:

yj = a+ bxj,

entonces, la varianza resultante de estos datos ası transformados satisface:

S2Y = b2S2

X

Y si b es positivo: SY = bSX .

3. Desigualdad de Chebychev Para cualquier numero K > 0, la proporcion de datos

que caen dentro del intervalo de extremos X −KS y X + KS, es por lo menos igual

a 1− 1 / K2.

Esta propiedad permite establecer que entre X − 3S y X + 3S, se encuentran por lo

menos 8/9 de los datos, es decir, el 88,89 % (aproximadamente). De aquı que mientras

mas disten los datos respecto a su media, menos frecuentes seran.

Lo discutido al final tambien motiva, en parte, la definicion siguiente, relacionada con

la ubicacion relativa de un dato respecto a la media de su grupo.

141


5.7. Datos tipificados o estandarizados

Si en un grupo de datos, la media es X y la desviacion estandar es SX , entonces el valor

tipificado de xj, se lo denota por zj y se le define como:

zj =xj − XSX

.

Ası, el dato tipificado, no es mas que su distancia respecto a la media del grupo; pero

expresada en terminos de la desviacion estandar. Especıficamente, el signo del dato,

ası tipificado, indica si el dato esta por debajo o por encima de la media del grupo; y la

magnitud, en valor absoluto, indica cuan alejado esta en terminos del alejamiento promedio

de los datos (la desviacion estandar). Tambien es claro que al pasar los datos a esta escala,

es decir aplicando tal formula de transformacion, los datos ası obtenidos preservan el orden

original.

Ademas de lo mencionado antes, lo mas importante es que al transformar ası los datos,

sin que importe cual sea la media y desviacion estandar de los datos originales, los valores

resultantes tienen una media igual a cero y una desviacion estandar igual a 1, de allı el

nombre de estandarizados. Esto ultimo y el hecho que el orden se preserve al transformar

ası los datos, hace que esta transformacion sea de utilidad, por ejemplo, cuando se quiere

comparar dos datos provenientes de grupos con medias muy diferentes, o si corresponden a

mediciones efectuadas en distintas escalas.

Observacion 5.6. La forma anterior no es la unica utilizada para estandarizar, existen otras

como la puntuacion T , para la cual la media es 50 y la desviacion estandar 10, no es difıcil

verificar que la formula para este caso es la siguiente:

T = 50 +

(xj − XSX

)10.

Esta es la formula que se utiliza para estandarizar las notas en nuestra universidad, antes

de obtener el coeficiente de rendimiento estandarizado (CRAEST).

La deduccion de esta formula es la siguiente:

Si X es la variable original, deseamos efectuar una transformacion simple de ella: Y = a+bX,

con b > 0 (para conservar el orden original de los valores de X), de modo que la media y

desviacion estandar resultantes sean 50 y 10, respectivamente. Entonces, por la propiedad 8

de la media y la propiedad 2 de la desviacion estandar, a y b deben satisfacer las ecuaciones

siguientes:

a+ b X = 50

b SX = 10.

entonces, b =10

SXy a = 50− 10

SXX. Ası, Y = 50− 10

SXX +

10

SXX = 50 +

(xj − XSX

)10.

142


Resulta claro que al efectuar esta transformacion el orden de merito de los alumnos en un

determinado curso, establecido por la nota final (x), se mantiene al hacerlo con las notas

estandarizadas (T ), pero con la diferencia que ahora la media es 50 y la desviacion estandar

10, lo que facilita la comparacion del rendimiento de dos alumnos de diferentes facultades.

Tambien se puede notar que si el promedio ponderado de un alumno esta por debajo de la

media de su facultad (esto es x < X), entonces su CRAEST sera menor que 50; pero si su

promedio esta por arriba de la media de su facultad (esto es x > X), entonces su craest

sera mayor que 50.

Observacion 5.7. En general, si se quiere una media Y = y y una desviacion estandar

SY = sY , la formula de transformacion es:

Y = y +

(xj − XSX

)sy

5.8. Diagrama de hojas y tallos

Este diagrama es una alternativa a la distribucion de frecuencias, para la tarea de analizar

los datos. En esta grafica cada dato se divide en dos partes: su tallo y sus hojas.

Ejemplo, a continuacion tenemos 21 datos:

72 71 65 54 78 85 63 61 51 77 85 83 63 55 57 73 73 68 73 75 77

Primero ordenamos los datos de menor a mayor:

51 54 55 57 61 63 63 65 68 71 72 73 73 73 75 77 77 78 83 85 85

Observamos que el menor dato es 51 y el mayor 85. Para cada dato, podemos tomar la cifra

de las decenas como tallo, entonces, la otra sera la hoja. Ası, por ejemplo, para el dato 51: su

tallo es 5, su hoja 1. Tenemos, entonces, colocamos los tallos en una columna, como sigue:

5

6

7

8

Luego escribimos cada hoja junto a su tallo:

5 1 4 5 7

6 1 3 3 5 8

7 1 2 3 3 5 7 7 8

8 3 5 5

143


5.9. Ejercicios Resueltos

Ejercicio 5.1.

Muestre dos grupos de datos para verificar que el rango es una medida de dispersion muy

imprecisa.

Solucion: Dadas las series de datos siguientes:

Serie 1: 195 200 200 200 205

Serie 2: 15 20 20 20 20 20 20 20 20 20 25

En ambas series el rango es 10; pero en la segunda hay mayor cantidad de datos parecidos

entre sı.

Ejercicio 5.2.

Muestre una serie de datos para los que no exista un promedio o termino medio.

Solucion: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 18, 19, 20, 21, 22, 23.

No existe una estadıstica que sirva de termino medio, es decir, los datos no se parecen a un

valor en particular.

Ejercicio 5.3.

En una companıa la media aritmetica de los sueldos es de S/. 2 500. Se proponen dos

alternativas de aumento, en la primera se propone incrementar a todos los empleados S/.

600; mientras que, en la segunda un aumento del 5 % mas una bonificacion de S/. 200. ¿Cual

de las dos alternativas le representara mas gasto a la companıa?

Solucion: Para responder la pregunta, basta comparar las medias bajo cada alternativa,

pues la media es proporcional a la suma total. Veamos entonces como cambia la media con

cada alternativa:

Segun la primera alternativa, cada sueldo xj se transforma en yj = 600 + xj. Ası, por la

propiedad 8 de la media, resulta una media Y = 600 + X = 600 + 2500 = S/. 3 100.

Para la segunda alternativa, cada sueldo xj se transforma en tj = xj + 0, 05xj + 200 =

200 + 1, 05xj. Nuevamente, por la propiedad anterior, resulta que la media bajo esta

alternativa es T = 200 + 1, 05X = 200 + (1, 05)2500 = S/. 2 825.

Ası, la primera alternativa le representara mas gasto a la companıa.

144


Ejercicio 5.4.

A fin de tomar diferentes decisiones sobre el tiempo que permanece inactivo un sistema de

informacion durante un dıa, se le solicita a usted el valor promedio y el tiempo total de

inactividad en un perıodo de 60 dıas. Suponga que solo se tiene la informacion siguiente

sobre los tiempos registrados para cada uno de los dıas de este perıodo:

Mediana = 6 000 s; Media = 8 500 s .

Proporcione lo solicitado. Si fuera el caso, mencione la informacion que se requiera para una

mejor respuesta.

Solucion: Sean x1 . . . x60 los tiempos de inactividad correspondientes a los 60 dıas de este

perıodo. Entonces, el tiempo total de inactividad es60∑j=1

xj

= 60 X = 60× 8 500 = 510 000.

Pero para dar una respuesta apropiada para el tiempo promedio de inactividad, se requiere

mayor informacion. Podrıamos optar por la mediana, pensando que si este valor difiere de la

media, probablemente se deba a que en algunos dıas el tiempo de inactividad es muy grande;

pero incluso podrıa ser que no se pueda encontrar un buen promedio o termino medio para

los tiempos registrados.

Ejercicio 5.5.

A fin de mejorar el rendimiento de los alumnos, en un curso de estadıstica, los alumnos fueron

separados en dos grupos, al primero le fue dado un curso con herramientas computacionales

modernas, al segundo un curso tradicional sin las herramientas computacionales. Al cabo

del curso ambos grupos fueron evaluados con una misma prueba, las notas correspondientes

fueron procesados con el Excel, obteniendose las distribuciones de frecuencias siguientes:

Con herramientas computacionales Sin herramientas computacionales

Notas Alumnos Notas Alumnos

9 1 9 4

10 4 10 7

11 2 11 12

12 3 12 9

13 10 13 10

14 10 14 3

15 7 15 3

16 8 16 2

17 4

18 1

145


a) Obtenga e interprete las estadısticas descriptivas que resumen los datos.

b) Represente cada distribucion con su respectiva grafica de caja de modo que se muestre

la conclusion al problema formulado. Comente al respecto.

Solucion:

a) Estadısticas importantes:

Estadıstica Con Sin

Cuenta 50 50

Media 13,92 11,9

Mediana 14 12

Moda 13 y 14 11

Desviacion estandar 2,1174 1,7871

Mınimo 9 9

Maximo 18 16

Rango 9 7

Percentil 75 16 13

Percentil 25 13 11

Rango medio 3 2

Fueron evaluados 50 alumnos con cada prueba.

La nota promedio (media) fue 13,92, cuando se usaron herramientas computacionales,

y 11,9 cuando no se usaron dichas herramientas.

El 50 % de los alumnos tuvo una nota menor o igual que 14, cuando se usaron

herramientas computacionales, y menor o igual que 12, cuando no se usaron.

La mayorıa de los alumnos tuvo una igual a 14, cuando se usaron herramientas

computacionales, y 11, cuando no se usaron dichas herramientas.

La diferencia promedio de las notas fue 2,1173, cuando se usaron herramientas

computacionales, y 1,7871, cuando no se usaron dichas herramientas.

La mınima nota fue 9 independientemente del uso de herramientas computacionales;

pero cuando se usaron dichas herramientas la maxima nota fue 18, dos puntos mas que

cuando no fueron usadas. Lo que determina un rango de variacion de las notas de 9 en

el primer caso y de 7 en el segundo.





146


El rango de variacion medio de las notas fue 3 puntos, cuando se usaron herramientas

computacionales y 2 cuando no se usaron dichas herramientas.

b) Graficas de cajas:

Figura 5.3: Comparacion de las notas cuando se usan herramientas computacionales

Se concluye que cuando se usaron las herramientas computacionales el promedio de las

notas aumento (aproximadamente dos puntos); sin embargo las notas resultaron algo

mas heterogeneas, pues la variabilidad aumento (aproximadamente un punto).

147



Ejercicio 5.1.

Redacte la conclusion dada en cada una de las partes siguientes, pero segun el contexto

respectivo:

a) En un estudio sobre cambios en la conducta de drogadictos, de cierto grupo de personas,

fue registrada la edad (en anos) en la cual dichas personas iniciaron el consumo de

drogas. Se concluyo que el 75 % de los datos registrados era mayor que 15.

b) En un estudio sobre cierto sector laboral, se registro el ingreso mensual (en soles) de

cada trabajador. Se concluyo que solo el 10 % de los datos registrados era superior a

3 500.

c) En un estudio acerca de las caracterısticas de ciertas ceramicas precolombinas fue

registrado (en centımetros) el diametro central de estas. Se concluyo que el 30 % de los

datos registrados estaba entre 20 cm y 25 cm .

Ejercicio 5.2.

Usando una misma escala, cierta caracterıstica ha sido medida sobre tres objetos, A, B y C,

obteniendose los valores 0, 40 y 20, respectivamente.

a) Con esta informacion no se puede asegurar que la escala usada sea ordinal. Justifique

con un ejemplo.

b) Con esta informacion no se puede descartar que la escala usada sea ordinal. Justifique

con un ejemplo.

c) Con una segunda escala, tambien del mismo tipo de la primera, se midio la misma

caracterıstica sobre estos objetos y se obtuvieron las mediciones siguientes: 10, 90 y

50, respectivamente. ¿Cual puede ser el nivel de medicion empleado?

d) Suponga que esta caracterıstica sea cuantitativa y que la escala usada sea de razon.

De usted una variable que pueda servir como ejemplo y brinde la informacion principal

que proporcionarıan dichos valores acerca de ella.

Ejercicio 5.3.

Fue registrada la tolerancia de tres personas, A, B y C, empleando una escala nominal, y se

obtuvo los resultados siguientes:

A B C

3 5 5

¿Se puede deducir si una de estas personas es mas tolerante que las otras dos?

148


Ejercicio 5.4.

A continuacion se presentan tres series de datos y tres afirmaciones:

Serie 1: 1, 2, 4, 6, 6, 6, 6, 8, 10, 11.

Serie 2: 39, 40, 40, 40, 40, 40, 40, 40, 40, 40, 40, 40, 40, 41, 70.

Serie 3: 3, 3, 4, 4, 5, 5, 6, 6, 7, 7, 8, 8, 9, 9.

Afirmacion 1: El producto de la mediana y el numero de datos

no proporciona una buena idea de la suma total de los datos.

Afirmacion 2: No siempre es facil determinar un valor promedio.

Afirmacion 3: El rango es una medida de dispersion muy imprecisa.

Identifique cada afirmacion con la serie de datos que mejor refleje lo sostenido en ella. Para

la eleccion de cada serie debera indicar la razon por la que descarta las otras.

Ejercicio 5.5.

En una clınica, cada una de dos terapias nuevas (A y B) para la rehabilitacion de pacientes

con depresion se aplico en uno de dos grupos de igual numero de pacientes (con caracterısticas

similares) que adolecıan de este problema, obteniendose las estadısticas siguientes sobre las

horas de terapia aplicadas hasta la recuperacion de los pacientes:

Horas de aplicacion

Estadıstica Terapia A Terapia B

Media 66,5 77,0

Mediana 66,5 63,0

Moda 66,5 63,0


Percentil 75 86,0 83,0


a) Si los histogramas de cada muestra de datos mostraron una tendencia a la

centralizacion, determine la terapia que, en general, necesito de un menor tiempo de

aplicacion por paciente.

b) Si el gasto para la clınica, por hora de aplicacion, fue el mismo para cada terapia, ¿la

aplicacion de cual de las terapias significo un menor gasto total para la clınica?

c) Si como criterio para decidir cual de las terapias se debıa adoptar se impuso la condicion

de que, a lo mas, el 25 % de los pacientes requieran mas de 85 horas, ¿cual de estas dos

terapias, si existe una, decidirıa adoptar usted?

149


Ejercicio 5.6.

A continuacion se dan cuatro afirmaciones. Estudie la veracidad de cada una de ellas.

Ademas, si una afirmacion es verdadera proporcione una serie de datos que refleje lo que esta

sostiene; y si considera que la afirmacion es falsa muestre una serie que exhiba lo contrario.

i) Con el ‘promedio’ de una serie de 10 datos se puede tener cierta idea de la suma total

de los datos, pero no necesariamente la suma exacta.

ii) Para obtener un percentil de una serie de datos, obtenidos de una variable cuantitativa

continua, es necesario construir previamente la distribucion de frecuencias y usar la

ojiva de frecuencias acumuladas.

iii) El rango es una medida de dispersion muy imprecisa.

iv) Si una serie de datos tiene una media distinta a la mediana, entonces, necesariamente

existe un patron de tendencia a la centralizacion con sesgo.

Ejercicio 5.7.

A fin de estudiar la eficiencia de cierto programa, usado para la ubicacion de archivos, se

registro el tiempo que demoro el programa para localizar la posicion de memoria de cincuenta

archivos de caracterısticas similares. Se obtuvo los resultados siguientes:

Tiempo (s) Frecuencia relativa

[ 0,000; 0,125 ] 0,04

] 0,125; 0,250 ] 0,12

] 0,250; 0,375 ] 0,16

] 0,375; 0,500 ] 0,18

] 0,500; 0,625 ] 0,18

] 0,625; 0,750 ] 0,14

] 0,750; 0,875 ] 0,12

] 0,875; 1,000 ] 0,06

a) Una hipotesis sostiene que el tiempo necesario para localizar la posicion de memoria

esta, para la mayorıa de los archivos, alrededor de medio segundo y conforme el tiempo

se aleje de este valor, se encontraran menos archivos que requeriran de tal tiempo.

¿Considera que los datos evidencian la validez de esta hipotesis? Comente y justifique

con el apoyo de una grafica conveniente.

b) La funcion G(x) = 6(x2

2− x

3

3), 0 ≤ x ≤ 1, es una de las funciones usadas para modelar

(aproximar) la frecuencia relativa acumulada hasta x, cuando 0 ≤ x ≤ 1. Segun esta

funcion, ¿cual serıa el valor de la frecuencia que corresponde al cuarto intervalo de la

distribucion de estos datos?

150


Ejercicio 5.8.

Se hizo un muestreo aleatorio de 66 comunidades del paıs para averiguar el porcentaje de

carencias basicas de las comunidades. Los datos se muestran a continuacion:

87,4 75,5 70,6 71 70,9 75,4 76 66,5 72,7 75,2 71,6

75,2 76,6 86,4 65,4 74,8 84,5 76,8 76,4 70,4 71,7 75,9

82,1 78 83,6 70,9 74,5 77 78,5 70,5 80,8 83,8 75,3

82,3 71,9 77,1 77,2 71,8 75,2 75,1 70,8 79,5 71,3 79

74,8 74,4 74,7 78,3 83,7 76,9 81,7 78,6 81,8 80,9 75,9

77,2 75,4 67,5 80,8 73 71,7 67,7 66,6 68,2 79,6 72,4

A fin de realizar una descripcion estadıstica de estos datos, primero se obtuvieron las

principales estadısticas con el Excel:

Porcentaje de Carencias

Media 75,68

Mediana 75,40

Moda 75,20


Rango 22,00

Mınimo 65,40

Maximo 87,40

Suma 4994,90

Cuenta 66,00

Mayor (17) 78,60

Menor(17) 71,70

Nivel de confianza (95 %) 1,22

A continuacion, con fines de detectar los posibles patrones de tendencia, se construyo una

distribucion de frecuencias. Para esto primero se uso la regla empırica “2 a la k,” la cual

establece que el numero de intervalos es el menor entero, k, con la propiedad de que 2 elevado

a la k sea mayor o igual que el numero de datos, por lo que se consideraron 7 intervalos de

igual longitud.

Luego, para obtener la tabla de la distribucion de frecuencias correspondiente se uso el

Excel, para esto se proporciono los datos y como “rango de clases” los lımites derechos de

los intervalos segun la secuencia:

Herramientas → Analisis de datos → Histograma.

Ası, se obtuvo la tabla siguiente:

151


PorcentajeFrecuencia

relativa

Frecuencia

acumulada

68,55 0,09 0,09

71,70 0,17 0,26

74,85 0,15 0,41

78,00 0,30 0,71

81,15 0,14 0,85

84,30 0,11 0,95

87,45 0,05 1,00

En la primera columna de esta tabla se encuentran los lımites derechos de los intervalos y

estos son cerrados.

a) Obtenga las conclusiones.

Debe incluir:

i) Interpretacion de las estadısticas que arroja el Excel y otras que considere

necesarias.

ii) Estudio de los posibles patrones de tendencia que muestran estos datos, con

ilustracion grafica, identificacion e interpretacion de estos en el contexto dado.

iii) Conclusiones que integren los puntos anteriores.

b) En el estudio se considero que una comunidad estaba en extrema pobreza si el

porcentaje de carencias era superior al 70 %.

i) ¿Que porcentaje de comunidades en extrema pobreza hay en esta muestra?

ii) Como es sabido la ojiva muestra la tendencia mostrada por las frecuencias

acumuladas de esta muestra de datos. Considere la ojiva como la grafica de una

funcion modelo para describir, bajo un enfoque probabilıstico, el porcentaje de

carencias en las comunidades del paıs. Segun este modelo, ¿cual serıa el porcentaje

de comunidades en el paıs que se encuentra en extrema pobreza?

c) Determine en cuanto deberıa disminuir el porcentaje de carencias de cada comunidad

para que la media de dicho porcentaje sea solo del 55 %. Si se lograra esto, ¿que ocurrirıa

con la desviacion estandar de dicho porcentaje?

Ejercicio 5.9.

Si x1, . . . , xn es una serie de datos con media X y desviacion estandar SX, determine la

media y desviacion estandar de la serie y1, . . . , yn, en cada uno de los casos siguientes:

a) yj = 4 + 5(xj − X), j = 1, . . . , n. b) yj = n(xj − X), j = 1, . . . , n.

c) yj = (xj − X) + xn, j = 1, . . . , n. d) yj = 10xj − X, j = 1, . . . , n.

152


Ejercicio 5.10.

Para comparar la dureza del agua en dos ciudades, A y B, se tomaron muestras de agua y

se medio el contenido de calcio. Los resultados, en miligramos por litro de agua, fueron los

siguientes:

A 250 250 258 270 270 270 271 271 272 284 291 291 292 292

B 222 244 250 251 255 261 264 264 265 266 277 277

a) Haga las graficas de caja, de manera que facilite la comparacion del contenido de calcio

entre las muestras de agua de las ciudades. Obtenga las conclusiones.

b) El tercer valor de la muestra de agua en la ciudad A fue 258, el correspondiente a la

B fue 250. ¿Cual de estos valores representa mayor contenido de calcio en su grupo?

Ejercicio 5.11.

En un banco se quiere estudiar la implementacion de una capacitacion a fin de mejorar

la atencion que brindan los empleados. Con esta finalidad se tomaron dos muestras de 50

empleados y se capacito a los de una de estas. Luego se espero a que todos los empleados

hayan atendido 10 clientes y se registro, para cada empleado, el numero de clientes que

mostraron su insatisfaccion por la atencion recibida. Los datos fueron procesados con el

Excel obteniendose, entre otros, los resultados siguientes:

Sin la Capacitacion Con la Capacitacion

Insatisfechos Empleados Insatisfechos Empleados

1 1 1 4

2 4 2 7

3 2 3 12

4 3 4 9

5 10 5 10

6 10 6 3

7 7 7 3

8 8 8 2

9 4

10 1

Media 5.92 Media 3.9

Desviacion estandar 2.12 Desviacion estandar 1.79

Obtenga conclusiones a partir de la descripcion de estos datos. Incluya tambien otras

estadısticas importantes que no han sido presentadas en el resumen de los datos y represente

cada distribucion mediante una grafica de caja y comente segun esta.

153


Ejercicio 5.12.

A fin de fiscalizar el pago de impuestos de los empleados de cierto sector laboral, se tomo una

muestra aleatoria de 25 empleados, entre los 10 000 que integran este sector.

Los ingresos mensuales de esta muestra (en miles de soles) se procesaron con las herramientas

estadısticas que proporciona el Excel y se obtuvo los resultados siguientes:

Media 9,69

Mediana 9,40


Cuenta 25

a) Complete la informacion faltante en el grafico.

b) Obtenga las conclusiones importantes que se derivan de esta informacion.

c) Los ingresos mensuales de este sector, superiores a 10 mil soles, seran gravados con un

impuesto extraordinario de 100 soles. Se presenta el problema de estimar la recaudacion

total mensual que se obtendra al aplicar el impuesto sobre este sector.

i) Resuelva el problema bajo un enfoque estadıstico descriptivo, es decir, considere

los resultados de la muestra para obtener una estimacion.

ii) Resuelva el problema bajo un enfoque probabilıstico, empleando como modelo a la

funcion, H, cuya grafica corresponde a la ojiva de frecuencias relativas acumuladas

de esta muestra.

154


Ejercicio 5.13.

En un centro de trabajo, al que llega una gran cantidad de clientes por dıa, los

operarios fueron capacitados, siguiendo un entrenamiento patron, para realizar funciones

del mismo tipo y con gran rapidez. Los tiempos correspondientes hasta que se requiere

un descanso, durante el dıa de trabajo, se distribuyen siguiendo una patron de tendencia

a la centralizacion, cuya media y percentiles 25, 50 y 75 son 4,6; 2,75; 5,1 y 5,1 horas,

respectivamente. Con el fin de mejorar los tiempos, anteriormente descritos, fue elaborado

un nuevo tipo de entrenamiento para realizar las mismas funciones diarias; y al adiestrar

a los operarios los tiempos correspondientes dieron una media y percentiles 25, 50 y 75 de

4,5; 4,1; 5,4 y 5,5 horas, respectivamente. Ademas la distribucion de frecuencias con este

entrenamiento nuevo es como la representada a continuacion:

a) ¿Existe tambien un patron de tendencia a la centralizacion en la distribucion de los

tiempos correspondientes al nuevo entrenamiento? Explique por que razones podrıa

esperarse la existencia de este patron de tendencia en este contexto.

b) Respecto al entrenamiento patron, se sostenıa que un grupo de operarios requerıa una

capacitacion complementaria. ¿Esta usted de acuerdo? ¿Que puede decir al respecto si

se trata de la capacitacion nueva?

c) El entrenamiento nuevo sera implantado definitivamente, en lugar del antiguo, si tanto

el tiempo promedio, como la variabilidad, resultaran mejores. Usted es encargado para

decidirlo, ¿cual, segun los datos, serıa su decision?

d) ¿Cual es el tiempo mınimo para ser considerado en el “cuarto mejor calificado”, segun

cada entrenamiento?

e) ¿Cual es el tiempo maximo para ser considerado en el “cuarto menos calificado”, segun

cada entrenamiento?

155


Ejercicio 5.14.

Un alumno obtuvo una nota de 14 en el curso A y esta corresponde al percentil 40 de las

notas en el curso. La nota de este alumno en el curso B fue de 13 y esta corresponde al

percentil 60 de las notas en este curso. Determine en cual de los dos cursos el alumno obtuvo

un mejor desempeno con respecto a los demas alumnos. Suponga que el desempeno esta dado

por la nota y justifique su respuesta.

Ejercicio 5.15.

En una clınica, cada una de dos terapias nuevas (A y B) para la rehabilitacion de pacientes

con depresion se aplico en uno de dos grupos de igual numero de pacientes (con caracterısticas

similares) que adolecıan de este problema, obteniendose las estadısticas siguientes sobre las

horas de terapia aplicadas hasta la recuperacion de los pacientes:

Horas de aplicacion

Estadıstica Terapia A Terapia B

Media 66,5 77,0

Mediana 66,5 63,0

Moda 66,5 63,0




Ademas, los histogramas de cada muestra de datos mostraron una tendencia a la

centralizacion.

a) Si el gasto para la clınica, por hora de aplicacion, fue el mismo para cada terapia, ¿la

aplicacion de cual de las terapias significo un menor gasto total para la clınica?

b) Si como criterio para decidir cual de las terapias se debıa adoptar se impuso la condicion

de que, a lo mas, el 25 % de los pacientes requieran mas de 85 horas, ¿cual de estas dos

terapias, si existe una, decidirıa adoptar usted?

c) Analice en cual de las terapias los tiempos de recuperacion fueron mas homogeneos.

Ejercicio 5.16.

Durante el ultimo perıodo de doce meses, la rentabilidad mensual de cierta operacion

financiera tuvo una media de 20 % y una desviacion estandar de 5 %. Si un agente invirtio en

cada mes un capital de 500 unidades monetarias, determınese la media y la desviacion

estandar de los capitales finales mensuales en este perıodo.

Nota: si x1, . . . , x12 son las rentabilidades (en porcentaje) de cada uno de estos meses,

observe que el capital final al cabo del j-esimo mes es de 500 + 500xj100

= 500 + 5xj .

156

6. Correlacion y regresion lineal

6.1. Correlacion

Basicamente, el analisis de correlacion lineal consiste en averiguar si dos variables X e

Y estan asociadas o correlacionadas de manera lineal. Y el objetivo principal del analisis

de regresion lineal es poder predecir el valor de una de las variables (la que se denomina

dependiente y usualmente se la denota por Y ) a partir de un determinado valor de la

otra (variable independiente), para lo cual se determina la ecuacion del modelo lineal que

relaciona a las dos variables. Para estos fines se dispone de una muestra de n observaciones

conjuntas de ambas variables, digamos (x1, y1), . . . , (xn, yn); en donde cada par corresponde

a la medicion de X e Y, respectivamente, sobre una misma unidad (sujeto u objeto) de

observacion.

La correlacion se puede detectar facilmente mediante la grafica de los pares dados en un

sistema de coordenadas cartesianas, la que se conoce como “Diagrama de dispersion” o de

‘esparcimiento’. A continuacion se muestran cuatro ejemplos:

Estos diagramas sugieren que el promedio de los valores (xi− X)(yi− Y ) es un indicador de

correlacion lineal, a este se le llama covarianza y se denota por SX,Y . Ası:

SX,Y =

n∑i=1

(xi − X)(yi − Y )

n

157


Como se aprecia en los graficos anteriores, si los datos tienden a seguir un patron de tendencia

lineal y directa (si una aumenta la otra tambien aumenta), entonces, la covarianza es positiva;

si en cambio la tendencia lineal es inversa (si una aumenta la otra disminuye), la covarianza

es negativa. Pero, este indicador no es tan preciso como lo es el siguiente.

6.2. Indice de correlacion de Pearson

A partir de la covarianza se puede definir el indicador de correlacion lineal siguiente:

r =SX,YSXSY

Una formula util para el calculo de r es la siguiente:

r =

n∑j=1

xjyj − nXY√(n∑j=1

x2j − nX2)(

n∑j=1

y2j − nY 2)

Las propiedades que tiene este indicador son las siguientes:

1. Esta limitado entre −1 y 1; es decir: −1 ≤ r ≤ 1.

2. Solo en el caso de que entre los datos exista una relacion lineal exacta es r, en valor

absoluto, igual a 1. Si dicha relacion es directa, r es igual a 1, y si es inversa r es igual

a −1. Es decir, se cumple que:

r = 1⇔ existen a y b, positivo, tales que: yj = a+ bxj, j = 1, . . . , n.

r = −1⇔ existen a y b, negativo, tales que: yj = a+ bxj, j = 1, . . . , n.

3. Este indicador es invariante ante transformaciones de los datos que sean lineales y del

mismo tipo (ambas directas, o bien ambas inversas). Se tiene que si uj = c + dxj y

vj = e + fyj, j = 1, . . . , n, con d y f con el mismo signo, entonces, el coeficiente de

correlacion de los datos, ası transformados, no varıa; es decir, rU,V = rX,Y .

Ejemplo 6.1. En un centro de procesamiento de datos, se esta interesado en estudiar Y, el

tiempo que se necesita en el computador central para procesar una cantidad, X, de ciertos

trabajos especiales. Para este fin, determinados numeros de trabajos de este tipo fueron

procesados en diferentes oportunidades. Los resultados se presentan a continuacion:

X 2 5 7 9 11 15 9 2 7 10 15 7 11

Y 5, 5 8 9 11 13 20 11 5, 5 9, 2 12 20 8, 4 13

X 5 9 11 2 5 7 10 9 15 10 2 7

Y 8, 4 11 12 5, 9 8, 2 9, 4 12 11 20 12 5, 5 8, 6

158

Profesor Jose Flores Delgado Correlacion y regresion lineal 159

Con estos datos haremos un breve analisis de correlacion lineal, grafica y cuantitativamente.

Graficamente, construimos el diagrama de dispersion:

Se observa una fuerte tendencia lineal entre ambas variables, de modo que a mayor numero

de trabajos le corresponde un mayor tiempo.

Cuantitativamente, usamos el coeficiente de correlacion entre ambas variables:

r =

n∑j=1

xjyj − nXY√(n∑j=1

x2j − nX2)(

n∑j=1

y2j − nY 2)

= 0, 96453

Se ratifica lo apreciado en el grafico, es decir, existe una fuerte relacion lineal (r ≈ 1) y

directa (r > 0) entre el numero de trabajos para procesar y el tiempo correspondiente.

Ejemplo 6.2. En determinada empresa, se piensa que Y, el precio de venta (en soles) de un

producto, decrece conforme aumenta X, el tiempo (en anos) que tiene de uso este, y segun

el modelo Y = αβX , para ciertos parametros positivos α y β, con este ultimo menor que 1 y

expresados en unidades convenientes. Para corroborarlo, se dispuso de la muestra conjunta

de ambas variables siguiente:

X 1 3 6 8 9 10 12

Y 4500 1200 155 42 22 11 5

En este caso, el diagrama de dispersion es:

Claramente se aprecia que las variables tienden a relacionarse, pero no de forma lineal, sino

mas bien parece una forma exponencial decreciente como la del tipo senalado.

159


Para analizar la validez de este modelo no podemos usar el coeficiente de correlacion, pues no

es lineal. Sin embargo, veamos como, en este caso, es posible transformar el modelo formulado

en uno equivalente y que sı sea lineal, de este modo podremos resolver el problema aplicando

la teorıa al modelo lineal. Para esto basta usar logaritmos, en efecto:

Y = αβX ⇔ LnY = Lnα + (Lnβ)X

Es decir, LnY y X estan relacionados linealmente. Para estudiar el modelo transformado en

lineal, con variables LnY y X, usamos el coeficiente de correlacion, al hacerlo obtenemos:

rLnY ; X

= −0, 9977. Ası, como este coeficiente grande, en valor absoluto, se concluye que existe

una fuerte relacion lineal e inversa entre LnY y X. Por lo tanto, tambien es fuertemente

apreciable la formulada: Y = αβX . A continuacion se muestra la grafica de LnY y X.

6.3. Regresion lineal simple

Si ya sabemos que los datos presentan una correlacion lineal, entonces, interesa ahora

determinar cual es la ecuacion de la relacion que los aproxima, es decir, cuales son los valores

de a y b tales que, para la mayorıa de los datos xj e yj, se tenga que yj sea aproximadamente

igual a a+ bxj. El metodo mas conocido es el de los “cuadrados mınimos”. Bajo este metodo

los valores de a y b son aquellos que minimizan la suma de los cuadrados:

Q(a, b) =n∑j=1

(yj − a− bxj)2

Se demuestra que estos valores son:

a = Y − bX y b = rSYSX

Geometricamente, la recta buscada es la que ‘mejor’ ajusta a los datos (como muestra la

figura anterior).

160


Ejemplo 6.3. En el problema formulado en el ejemplo 6.1, ya sabemos que entre el tiempo

de procesamiento, Y, y el correspondiente numero de trabajos X, existe una fuerte relacion

lineal, es decir, esperamos que el modelo entre las dos variables sea:

Y = a+ bX

Entonces, el paso siguiente serıa averiguar los valores a y b que definen dicha relacion.

Estos parametros a y b los podemos estimar usando los datos dados y el metodo de

los cuadrados mınimos. Ası: b = r SYSX

= 0, 96453 × 4,17063,90427

= 1, 03033; a = Y − bX =

10, 832−1, 03033(8, 08) = 2, 50693. Luego, el modelo estimado es: Y = 2, 50693+1, 03033X.

En particular, podemos hacer el pronostico de la variable dependiente asociada a un valor

cualquiera dentro del rango de valores registrados de la variable independiente. Por ejemplo,

la estimacion del pronostico, para una cantidad de 8 trabajos, es Y = 2, 50693+1, 03033(8) =

10, 75 minutos.

Ejemplo 6.4. En el contexto del ejemplo6.2, ya sabemos que entre el precio del producto,

Y, y la correspondiente edad, predomina una fuerte relacion del tipo:

Y = αβX ⇔ LnY = Lnα + (Lnβ)X

Para efectuar un pronostico, estimamos los parametros del modelo transformado a lineal.

Para esto, usamos las formulas dadas para el modelo lineal Y = a + bX, con ‘Y ’ = LnY ; y

‘X’ = X; a = Lnα y b = Lnβ. Ası, usando los datos dados del ejemplo obtenemos:

b = Lnβ = rLnY ; X

SLnY / SX = −0, 638197, por lo tanto, β = 0, 52824.

a = Ln α = Y − bX = LnY − (Lnβ)X = 4, 483054 − (−0, 638197)(7) = 8, 95043, por lo

tanto, α = 7711, 20697.

Entonces, la ecuacion del modelo esperado, la estimamos como: Y = 7711, 20697(0, 52824)X .

Ası, por ejemplo, el pronostico del precio del producto que tiene cinco anos de uso es

Y = 7711, 20697(0, 52824)5 = 317, 16 soles.

Observacion 6.1. Todo esto ha sido basado exclusivamente en una muestra, por lo tanto,

serıa valido solo para los datos dados, es decir, hemos trabajado simplemente a nivel

descriptivo y no de inferencia. Ademas, incluso para los propios datos, estarıa faltando una

medida de la bondad de las estimaciones y del pronostico. Lo ultimo sera completado a

continuacion; pero la inferencia correspondiente no es materia del curso.

6.4. Analisis de varianza para la regresion

Veamos como se puede medir el poder explicativo de la variable dependiente (X) sobre

la independiente (Y ), a traves de la regresion planteada. Analizaremos la varianza de Y,

llamada de la regresion, identificando dos fuentes que dan origen a ella.

161


El valor ajustado por la regresion de X sobre Y , para cada valor yj de Y es:

yj = a+ bxj = Y + b(xj − X)

Y el correspondiente error es:

ej = yj − yj = yj − Y − b(xj − X)

Tenemos lo siguiente:

La media de los valores ajustados es igual a la de los propios valores: Y =n∑j=1

yj/n = Y .

La media de los errores de ajuste es cero: e = 0.

La llamada suma de cuadrados total es:

SCT = nS2Y =

n∑j=1

(yj − Y )2

Como sabemos, esta mide la variabilidad de Y .

La llamada suma de cuadrados de la regresion es:

SCR = nS2Y

=n∑j=1

(yj − Y )2

=n∑j=1

(yj − Y )2

= b2n∑j=1

(xj − X)2

= n b2S2X

Esta debe medir la variabilidad de la variable Y , es decir, la de los valores que se obtendrıan

para Y si se usara la regresion lineal obtenida con X. Es claro que si el ajuste es perfecto

(lo cual sucede solo si efectivamente la relacion lineal entre X e Y es exacta), se tendra que

Y = Y y ası S2Y

= S2Y .

La llamada suma de cuadrados de los errores es:

SCE = nS2e =

n∑j=1

(ej − e)2

=n∑j=1

ej2 =

n∑j=1

(yj − Y − b(xj − X))2

Y debe medir la variabilidad de los errores que se cometen al usar la regresion lineal para

ajustar los valores de Y, ası, tambien mide el ajuste de los datos a la recta de regresion.

De las ecuaciones anteriores, se verifica la identidad siguiente llamada descomposicion de

la varianza:

SCT = SCR + SCE

162


Ası, las sumas anteriores tiene una nueva interpretacion:

SCR estarıa midiendo la variabilidad de Y explicada por su relacion lineal con X; mientras

que SCE estarıa midiendo la otra parte de la variabilidad.

De la descomposicion anterior se tiene la siguiente identidad:

1 =SCR

SCT+SCE

SCT

A la proporcion

R2 =SCR

SCT= r2

X, Y

Se le llama el coeficiente de determinacion. Por lo visto en la descomposicion de la varianza,

este coeficiente mide la proporcion de variabilidad de la variable dependiente, que es debida

a su relacion lineal con la variable independiente.

Ejemplo 6.5. Ası, en el contexto del ejemplo 6.1, no solo estamos, ahora, en la capacidad

de afirmar que la relacion existente entre el tiempo de procesamiento y la cantidad de

trabajos asociada es fuertemente lineal y directa; sino ademas podemos sostener que el 93 %

(r2X, Y

= 0, 93) de la variabilidad en el tiempo se debe a la asociacion lineal existente con el

numero de trabajos para procesar.

163


164

Referencias bibliograficas

1. Introduccion a la Teorıa de Probabilidades e Inferencia Estadıstica. LARSON, Harold.

2. Ingenierıa Sismorresistente.

Alejandro Munoz P.

PUCP 2002.

3. Pricing and Hedging of Derivate Securities.

Lars Tyge Nielsen.

Oxford University Press, 1999.

4. Measuring Inequality.

Frank A. Cowell.

Prentice Hall/ Harvester Wheatsheaf 1995.

165

Date post:	14-Apr-2016
Category:	Documents
Upload:	daniel-moya
View:	128 times
Download:	22 times

Flores, J. (2013) . Estadística. EGGLL PUCP

Documents