CENTRO UNIVERSITARIO UAEM ZUMPANGO
FECHA: AGOSTO DE 2017
INGENIERO EN COMPUTACIÓN
“MUESTRAS ALEATORIAS Y DISTRIBUCIONES DE MUESTREO”
ELABORÓ: M. EN C. LUIS ENRIQUE KU MOO
UNIDAD DE APRENDIZAJE
“PROBABILIDAD Y ESTADÍSTICA”
UNIDAD DE COMPETENCIA VII:
“Muestras aleatorias y distribuciones de
muestreo”
1. Medidas estadísticas y distribuciones de muestreo.
2. Estadísticos y sus distribuciones de probabilidad.
3. Teorema del límite central.
4. Distribuciones t, F, ji cuadrada.
OBJETIVOS
Comprender las medidas estadísticas y distribucionesde muestreo.
Aplicar los estadísticos y sus distribuciones deprobabilidad.
Aplicar el teorema del límite central.
Aplicar las distribuciones t, F, ji cuadrdada.
MUESTRA: Es una porción, parte o un subconjunto de
miembros seleccionados de una población. El número de
individuos que integran la muestra, llamado tamaño de la
muestra se representa con la letra n.
CONCEPTO DE MUESTRA
CONCEPTO DE MUESTRAS
MUESTRA ALEATORIA: Se considera aleatoria siempre y
cuando cada observación, medición o individuo de la
población tenga la misma probabilidad de ser
seleccionado.
CONCEPTO DE MUESTRAS
MUESTRA NO PROBABILÍSTICA: Consiste en seleccionar
una muestra de la población por el hecho de que sea
accesible. Es decir, los individuos empleados en la
investigación se seleccionan porque están fácilmente
disponibles.
MUESTREO: Es la técnica para la selección de unamuestra a partir de una población estadística. Es unaherramienta de la investigación científica, cuya funciónbásica es determinar que parte de una población debeexaminarse.
CONCEPTO DE MUESTREO
Todos sus elementos tienen una misma probabilidad de
ser elegidos; los elementos muestrales tendrán valores
muy parecidos a los de la población, los tipos son:
•Muestreo aleatorio simple
•Muestreo aleatorio sistemático
• Muestreo aleatorio por conglomerados
• Muestreo aleatorio estratificado
TIPOS DE MUESTREO ALEATORIO
MUESTREO ALEATORIO SIMPLE: Se asigna un númeroa cada individuo de la población y mediante de algúnmedio mecánico (números aleatorios en una bolsa,en la tabla, en una calculadora o computadora) seeligen los sujetos necesarios.
MUESTREO ALEATORIO SIMPLE
No aplica en poblaciones grandes
MUESTREO ALEATORIO SISTEMÁTICO: Se numeran todos
los elementos de la población, pero en lugar de extraer n
números aleatorios sólo se extrae uno (i). Se toman los
individuos de k en k, siendo k el resultado de dividir el
tamaño de la población entre el tamaño de la muestra:
k=N/n. Se seleccionan los elementos que ocupan los
lugares i, i+k, i+2k, i+3k, …, i+(n-1)k.
MUESTREO ALEATORIO SISTEMÁTICO
Ejemplo:N=60 n=12
MUESTREO ALEATORIO ESTRATIFICADO. Consiste enconsiderar categorías típicas diferentes entre sí (estratos)que poseen gran homogeneidad respecto a algunacaracterística. la muestra se escoge aleatoriamente ennúmero proporcional al de los componentes de cada claseo estrato.
MUESTREO ALEATORIO ESTRATIFICADO
MUESTREO ALEATORIO POR CONGLOMERADOS: Se
forman grupos de elementos de la población que forman
una unidad que son heterogéneos en su interior, a la que
llamamos conglomerado. Consiste en seleccionar
aleatoriamente un cierto número de conglomerados y
posteriormente investigar todos sus elementos. También
suele llamarse muestreo por áreas
MUESTREO POR CONGLOMERADOS
MUESTREO NO PROBABILÍSTICO: También conocido
como determinístico, el cálculo del tamaño y selección de
la muestra se basan en juicios y criterios subjetivos, por lo
tanto se desconoce la probabilidad de selección de las
unidades de la población bajo estudio
MUESTREO NO PROBABILISTICO
VARIABILIDAD DEL MUESTREO: Cuando de una misma
población con parámetros poblacionales (µ, σ) se toman𝑁𝑛
muestras diferentes, es de esperar que los estadísticos
muestrales para cada muestra sean diferentes entre si y
diferentes de los parámetros poblacionales.
DISTRIBUCIÓN DE MUESTREO. Es una distribución de
probabilidad que nos expresa la variación de un estadístico
muestral debido a la variación de las posibles muestras que
pueden obtenerse de una población.
DISTRIBUCIÓN DE MUESTREO
DISTRIBUCION MUESTRAL: Es el conjunto deestadísticos que pueden obtenerse de las diferentesmuestras de igual tamaño que conforman una poblacióndeterminada. La distribución de frecuencia de unestadístico muestral se denomina distribución muestral.
DISTRIBUCION MUESTRAL DE MEDIAS: Es unadistribución de probabilidades de todas las mediasposibles de las muestras de igual tamaño que se puedenextraer de poblaciones dadas.
DISTRIBUCIÓN MUESTRAL
Sea 𝑥 la media de una muestra aleatoria de nobservaciones extraídas de una población con media µx
y varianza 𝜎𝑥2. Entonces,
1. La distribución muestral de 𝑥 tiene media µx es decir,E( 𝑥) = µx
2. La distribución muestral de 𝑥 tiene desviación
estándar 𝜎 𝑥 =𝜎𝑥
𝑛que es el error estándar de la media
3. Si el tamaño muestral n no es una fracción pequeñade tamaño poblacional N, entonces el error estándar de 𝑥 es
𝜎 𝑥 =𝜎𝑥
𝑛
𝑁−𝑛
𝑁−1
DISTRIBUCIÓN MUESTRAL: ESTADÍSTICOS
1. Determinar el número de muestras.
2. Hacer la lista de todas las muestras.
3. Calcular la media para cada muestra.
4. Agrupación de medias y cálculo de la media de medias.
5. Cálculo de la media poblacional.
6. Confirmar que la media de medias es igual a la
poblacional.
7. Calcular del error estándar.
8. Confirmar que el error estándar de las medias es igual
al error estándar poblacional.
DISTRIBUCIÓN MUESTRAL: Pasos
EJEMPLO1. Se tiene la siguiente población: N= {2, 4, 6, 8}Determine la distribución muestral considerando muestras de 2elementos (n = 2)
1. Número de muestras. Se tienen que seleccionar dos
elementos de cuatro. 𝐶𝑁𝑛 =
𝑁𝑛
=𝑁!
𝑛! 𝑁−𝑛 !=
4!
2! 4−2 != 6
2. Hacer la lista de todas las muestras.
{(2, 4), (2, 6), (2, 8), (4, 6), (4, 8), (6, 8)}
3. Calcular la media para cada muestra.
{3, 4, 5, 5, 6, 7}
4. cálculo de la media de medias. 𝑥 𝑥 =3+4+5+5+6+7
6=
30
6= 5
5. Cálculo de la media poblacional. 𝜇 = 𝑥𝑖
𝑁=
2+4+6+8
4=
20
4= 5
6. La media de medias es igual a la poblacional.
NÚMERO DE MUESTRAS (SIN REEMPLAZO)
NÚMERO DE MUESTRAS (SIN REEMPLAZO)
7. Calculo del error estándar de la medias muestrales
𝜎 𝑥 = 𝑓 𝑥−𝜇 𝑥
2
𝑓=
10
6= 1.29
𝑥 f fx ( 𝑥 -µ)2 f( 𝑥 -µ)2 Prob.
3 1 3 4 4 1/6
4 1 4 1 1 1/6
5 2 10 0 0 2/6
6 1 6 1 1 1/6
7 1 7 4 4 1/6
∑ 6 30 10 6/6
xi (xi - µ)2 f( 𝑥 - µ)2
2 9 9
4 1 1
6 1 1
8 9 9
∑ 20
8. Confirmar que el error estándar de las medias es igual al
error estándar poblacional.
𝜎 = 𝑥 − 𝜇 2
𝑁
20
4= 5
𝜎 𝑥 =𝜎𝑥
𝑛
𝑁−𝑛
𝑁−1=
5
2
4−2
4−1= 1.29
NÚMERO DE MUESTRAS (SIN REEMPLAZO)
EJEMPLO2. Se tiene la siguiente población: N= {2, 4, 6, 6, 7, 8} (N = 6)
Determine la distribución muestral considerando muestras de 4 elementos (n =4)
1. Número de muestras. Se tienen que seleccionar dos elementos de cuatro.
𝐶𝑁𝑛 =
𝑁𝑛
=𝑁!
𝑛! 𝑁−𝑛 !=
6!
4! 6−4 != 15
LISTA DE MUESTRAS (SIN REEMPLAZO)2. Hacer la lista de todas las muestras y 3. Calcular la media para cada muestra. Muestra Media Muestra media
2, 4, 6, 6 4.50 2, 6, 7, 8 5.75
2, 4, 6, 7 4.75 2, 6, 7, 8 5.75
2, 4, 6, 8 5.00 4, 6, 6, 7 5.75
2, 4, 6, 7 4.75 4, 6, 6, 8 6.00
2, 4, 6, 8 5.00 4, 6, 7, 8 6.25
2, 4, 7, 8 5.25 4, 6, 7, 8 6.25
2, 6, 6, 7 5.25 6, 6, 7, 8 6.75
2, 6, 6, 8 5.50 Media = 5.5
4. cálculo de la media de medias.
𝑥 𝑥 =4.5 + 4.75 + 5 + 4.75 + 5 + 5.25 + 5.25 + 5.5 + 5.75 + 5.75 + 5.75 + 6 + 6.25 + 6.25 + 6.75
15= 5.5
5. Cálculo de la media poblacional.
𝜇 = 𝑥𝑖
𝑁=
2+4+6+6+7+8
6=
33
6= 5.5
LISTA DE MUESTRAS (SIN REEMPLAZO)
6. La media de medias es igual a la poblacional.
7. Calculo del error estándar 𝑥 f f 𝑥 ( 𝑥 -µ)2 f( 𝑥 -µ)2 Prob.
4.50 1 4.5 1 1 1/15
4.75 2 9.5 .5625 1.125 2/15
5.00 2 10.0 .25 .50 2/15
5.25 2 10.5 .0625 .125 2/15
5.50 1 5.5 0 0 1/15
5.75 3 17.25 .0625 .1875 3/15
6.00 1 6.00 .25 .25 1/15
6.25 2 12.5 .5625 1.125 2/15
6.75 1 6.75 1.5625 1.5625 1/15
∑ 15 82.5 4.875 15/15
𝜎 𝑥 = 𝑓 𝑥 − 𝜇 𝑥
2
𝑓=
4.875
15= .5
LISTA DE MUESTRAS (SIN REEMPLAZO)
8. Confirmar que el error estándar de las medias es igual al error estándar poblacional.
𝜎 𝑥 = 𝑥−𝜇 2
𝑁=
23.5
6= 3.9167 =1.979
𝜎 𝑥 =𝜎
𝑛
𝑁 − 𝑛
𝑁 − 1=
3.9167
4
6 − 4
6 − 1
= 0.5
xi (xi - µ)2 f( 𝑥 - µ)2
2 12.25 12.25
4 2.25 2.25
6 .25 .25
6 .25 .25
7 2.25 2.25
8 6.25 6.25
∑ 23.5
TEOREMA DEL LÍMITE CENTRAL
El teorema del límite central afirma que, para grandesmuestras aleatorias, la distribución muestral de las mediasde las muestras está más próxima a una distribución deprobabilidad normal.
Si la población tiene una distribución de probabilidadnormal, entonces, para cualquier tamaño de muestra ladistribución del muestreo de la media también tendrá unadistribución normal.
Si la distribución de la población es simétrica (pero nonormal), se verá que surge forma normal como loestablece el teorema del límite central aún con muestrastan pequeñas como de tamaño 10.
TEOREMA DEL LÍMITE CENTRAL
Por otra parte, si se toma una distribución que estésesgada o que tenga extremos muy gruesos, quizárequiera muestras de al menos 30 para observar lacaracterística de normalidad.La mayoría de los estadísticos consideran que unamuestra de 30 es lo bastante grande para poder emplearel teorema del límite central.
TEOREMA DEL LÍMITE CENTRAL: CONCLUSIONES
1. Conforme el tamaño de la muestra aumenta, la
distribución de las medias muestrales 𝑥 se aproximará la
una distribución normal.
2. La media de todas las medias muestrales es la media
poblacional µ .
3. La desviación estándar de todas las medias muestrales
es 𝜎/ 𝑛
Desarrollada con base en distribuciones defrecuencia empíricas por William Gosset, (a)“Student”.
Distribución muestral del promedio se ajusta muybien a la distribución Normal cuando se conoce . Sin es grande, esto no presenta ningún problema, esrazonable sustituirla por s cuando es desconocida.
Sin embargo, en el caso de usar valores de n < 30, osea en el caso de pequeñas muestras, esto nofunciona tan bien.Por lo que se utiliza la distribución t de Student
Distribución “t” de Student
Es continua, tiene forma de campana y es simétrica respecto al cerocomo la distribución z.La distribución t está más dispersa y es más plana en el centro que ladistribución z, pero se acerca a ella cuando el tamaño de la muestracrece.
Distribución “t” de Student
Distribución “t” de Student
Localizamos lacolumna del valor de y fila del valor de .La intersección de lafila y la columna nosdará el valor de t.
Calcular el valor de t después del cual se encuentre el 5% del área dela curva con 9 gl
1. En la distribución t con 16 grados de libertad,encuentre el área, o la probabilidad, de cada una de lasregiones siguientes:
a. A la derecha de 2.120
b. A la izquierda de 1.337
c. A la izquierda de -1.746
d. A la derecha de 2.583
e. Entre -2.120 y 2.120
f. Entre -1.746 y 1.746
Distribución “t” de Student
2. Encuentre los valores de t para las situacionessiguientes.
a. Un área de 0.025 en la cola superior, con 12 gradosde libertad
b. Un área de 0.05 en la cola inferior, con 50 grados delibertad
c. Un área de 0.01 en la cola superior, con 30 grados delibertad
d. Entre los que queda 90% del área, con 25 grados delibertad
e. Entre los que queda 95% del área, con 45 grados delibertad
Distribución “t” de Student
•Asimétrica y asintótica al eje x por la derecha; Su
dominio va de 0 a + y el area bajo la curva desde 0 a
+ =1
•Tiene parámetro = n-1 (g.l.)
•Al aumentar n se aproxima a la normal
•Representa distribución muestral de varianza.
Entre las aplicaciones:•Determinación intervalos confianza para varianzas
•Pruebas de hipótesis para una varianza
•Tablas de contingencia
•El ajuste de datos a una distribución dada conocida
•Las pruebas de independencia.
Distribución “Chi-cuadrada”
Valores 2 para varios , Área a su derecha = .1ª columna = 1ª fila: áreas en la cola a la derecha de 2
Cuerpo tabla son los valores de 2
Calcular el valor de 2 después del cual se encuentre el5% del área en una distribución Ji-cuadrado con 4 g.l.
Distribución “Chi-cuadrada”
•Cada miembro de la familia está determinado por dosparámetros: los grados de libertad (gl) en el numerador ylos grados de libertad en el denominador.•El valor de F no puede ser negativo y es una distribucióncontinua.•La distribución F tiene sesgo positivo.•Sus valores varían de 0 a . ConformeF la curva se aproxima al eje X.
Características de la distribución F
Tablas independientes de valores de F para =0.01 y
=0.05 para varias combinaciones de 1 y 2.
Se escoge la tabla para la probabilidad deseada y se
escoge 1 en la fila superior y 2 en la 1ª columna. La
intersección nos da el valor de F deseado.
Determine la probabilidad de tener un valor de F mayor
que 9.28 en una distribución F con 1=3 y 2=3 g.l.
Halle la el valor crítico de F(0.05) para 1=3 y 2=15 g.l.
Distribución F
BIBLIOGRAFIA
• Canavos, C. G:, Probabilidad y estadística, aplicaciones y métodos, Mc Graw Hill, México, 1986.
• DeVore, J. L., Probabilidad y Estadística para ingeniería y ciencias, Sexta ed. Thomson, México, 2005.
• Navidi, W. Estadística para ingenieros y científicos, McGraw-Hill, México, 2006.
• Walpole, R. R. H. Myers y S. Myers, Probabilidad y estadística para ingeniería y ciencia, Octava ed. Prentice Hall Pearson, México, 2007-.
• Weimer, R. C., Estadística, CECSA, México, 1996.