Estadistica II IIBimestre

ESCUELA:

NOMBRES

ESTADÍSTICA II

FECHA:

Dr. Gonzalo Morales

Octubre – Febrero 2010

1

BIMESTRE: II Bimestre

Psicología

Prueba t de student para una

muestra

Distribución t de Student

W.S. Gosset (principios del siglo XX).

N 30 y no se conoce.

Además, al utilizar la distribución t, suponemos

que la población es normal o aproximadamente

normal.

Propiedades de la distribución t

df

Nivel de Significación para la prueba de una cola

df

Nivel de Significación para la prueba de una cola

0,10 0,05 0,025 0,01 0,005 0,0005 0,10 0,05 0,025 0,01 0,005 0,0005

Nivel de Significación para la prueba de dos colas Nivel de Significación para la prueba de dos colas

0,20 0,10 0,05 0,02 0,01 0,001 0,20 0,10 0,05 0,02 0,01 0,001

1 3,078 6,314 12,706 31,821 63,657 636,619 18 1,330 1,734 2,101 2,552 2,878 3,922

2 1,886 2,920 4,303 6,965 9,925 31,599 19 1,328 1,729 2,093 2,539 2,861 3,883

3 1,638 2,353 3,182 4,541 5,841 12,924 20 1,325 1,725 2,086 2,528 2,845 3,850

4 1,533 2,132 2,776 3,747 4,604 8,610 21 1,323 1,721 2,080 2,518 2,831 3,819

5 1,476 2,015 2,571 3,365 4,032 6,869 22 1,321 1,717 2,074 2,508 2,819 3,792

6 1,440 1,943 2,447 3,143 3,707 5,959 23 1,319 1,714 2,069 2,500 2,807 3,768

7 1,415 1,895 2,365 2,998 3,499 5,408 24 1,318 1,711 2,064 2,492 2,797 3,745

8 1,397 1,860 2,306 2,896 3,355 5,041 25 1,316 1,708 2,060 2,485 2,787 3,725

9 1,383 1,833 2,262 2,821 3,250 4,781 26 1,315 1,706 2,056 2,479 2,779 3,707

10 1,372 1,812 2,228 2,764 3,169 4,587 27 1,314 1,703 2,052 2,473 2,771 3,690

11 1,363 1,796 2,201 2,718 3,106 4,437 28 1,313 1,701 2,048 2,467 2,763 3,674

12 1,356 1,782 2,179 2,681 3,055 4,318 29 1,311 1,699 2,045 2,462 2,756 3,659

13 1,350 1,771 2,160 2,650 3,012 4,221 30 1,310 1,697 2,042 2,457 2,750 3,646

14 1,345 1,761 2,145 2,624 2,977 4,140 40 1,303 1,684 2,021 2,423 2,704 3,551

15 1,341 1,753 2,131 2,602 2,947 4,073 60 1,296 1,671 2,000 2,390 2,660 3,460

16 1,337 1,746 2,120 2,583 2,921 4,015 120 1,289 1,658 1,980 2,358 2,617 3,373

17 1,333 1,740 2,110 2,567 2,898 3,965 ∞ 1,282 1,645 1,960 2,326 2,576 3,291

Si de una población Normal con media y

desviación estándar se extrae una muestra de

tamaño n, entonces el estadístico:

n

s

xt

se distribuye como una t de Student con n-1

grados de libertad.

Ejemplo

Los tiempos de sobrevivencia (en años) de 12 personas que se han sometido a un transplante de corazón son los siguientes:

3.1 .9 2.8 4.3 .6 1.4 5.8 9.9 6.3 10.4 0 11.5

Hallar un intervalo de confianza del 99 por ciento para el promedio de vida

de todas las personas que se han sometido a un transplante de corazón.

Solución4.5

12

1.65

12

5.1104.103.69.98.54.16.03.48.29.01.3X

112

)1.6()4.5()5()9.0()5.4()4.0()4()8.4()1.1()6.2()5.4()3.2(222222222222

s

112

)4.55.11()4.50()4.54.10()4.53.6()4.59.9()4.58.5()4.54.1()4.56.0()4.53.4()4.58.2()4.59.0()4.51.3(222222222222

s

1.483.1611

14.185

112

21.3716.202581.025.2016.01604.2321.176.625.2029.5s

t0.99,11=3,106;

El intervalo de confianza será: (5.4-3.106x4.1/3.46; 5.4+3.106x4.1/3.46)

(5.4-3.7;5.4+3.7)=(1.7;9.1)

46.312

Prueba de hipotesis (varianza desconocida)

Caso I Caso II Caso III

Ho : = 0 Ho : = 0 Ho : = o

Ha : < 0 Ha : ≠ 0 Ha : > 0

Prueba Estadística

n

s

xt

o

Si tcal < -t entonces Si |tcal |>t /2 entonces Si tcal >t entonces

se rechaza Ho se rechaza Ho se rechaza Ho

Usando los datos del Ejemplo anterior, un cardiocirujano afirma

que el tiempo de vida promedio de las personas sometidas a

transplante de corazón es mayor que 4 años. ¿A qué conclusión

se llegará después de hacer la prueba de hipótesis?

Solución:

La hipótesis nula es H0: = 4 (el tiempo de vida promedio de

todas las personas que se han sometido a transplante de corazón

es de 4 años) y la hipótesis alterna es Ha: > 4 (el tiempo de vida

promedio es mayor que 4 años).

Es menor que 3.106 por lo tanto no se rechaza la hipótesis nula y

se concluye de que no hay evidencia de que el tiempo promedio

de vida después del transplante haya aumentado de 4 años.

Notar que el extremo inferior del intervalo de confianza de un solo

lado al 99% es 1.575 mucho menor que 4.

19.118.1

4.1

12/1.4

44.5

/ ns

Xt

Prueba t de Student para grupos

correlacionados e independientes

Comparando medias de dos poblaciones

usando muestras pareadasEn este caso se trata de comparar dos métodos o tratamientos, pero se quiere que las unidades experimentales donde se aplican los tratamientos sean las mismas, ó lo más parecidas posibles, para evitar influencia de otros factores en la comparación

Sea Xi el valor del tratamiento I y Yi el valor del tratamiento

II en el i-ésimo sujeto. Consideremos di = Xi - Yi la diferencia

de los tratamientos en el i-ésimo sujeto.

Las inferencias que se hacen son acerca del promedio

poblacional d de las di. Si d = 0, entonces significa que no hay

diferencia entre los dos tratamientos.

Un intervalo de confianza del 100(1- )% para la

diferencia poblacional d

dada una muestra de tamaño n es de la forma

( - t(n-1, /2) sd/ , + t(n-1, /2) sd/ )

Intervalo de Confianza

nn dd

donde , es la media de las diferencias muestrales di

y es la desviación estándar.

1

2

n

dd

s i

i

d

)(

d

Pruebas de Hipótesis

Caso I Caso II Caso III

Ho : d = 0 Ho : d = 0 Ho : d =0

Ha : d < 0 Ha : d 0 Ha : d >0

Prueba Estadística:

t = se distribuye con una t de Student con n-1 gl.

Decisión:

Si t<-t entonces Si | t |>t /2 entonces Si Tcal >t entonces

se rechaza Ho se rechaza Ho se rechaza Ho

n

s

d

d

EjemploUn médico desea investigar si una droga tiene el efecto de

bajar la presión sanguínea en los usuarios. El médico eligió al

azar 15 pacientes mujeres y les tomó la presión, luego les

recetó la medicina por un período de 6 meses, y al final del

mismo nuevamente les tomó la presión. Los resultados son

como siguen:

Sujetos

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

Antes 70 80 72 76 76 76 72 78 82 64 74 92 74 68 84

Desp. 68 72 62 70 58 66 68 52 64 72 74 60 74 72 74

Solución

Solución:

Sea d que representa la media poblacional de

las diferencias. Luego:

Ho: d = 0 (La droga no tiene ningún efecto)

Ha: d > 0 (La droga tiene efecto, la presión

antes de usar la droga era mayor

que después de usarla).

Las diferencias son: -2, -8, -10, -6, -18, -10, -4, -26, -18, 8, 0, -32, 0, 4, -10.

El promedio de las diferencias es -8.8

La desviación estándar de las diferencias es 10,98

La desviación estándar de las medias muestrales es 2.83

Ejemplo (Cont.)

El valor crítico de t con 14 grados de libertad (n-1) y α=0.05 es

2.145, el valor calculado es superior, por lo tanto se rechaza la

hipótesis nula y se acepta la alterna, el medicamento es efectivo para

reducir la presión arterial

109.383.2

08.8t

Análisis de Varianza

EJERCICIO

En capítulos anteriores usted aprendió a hacerinferencias acerca de una o dos medias, ahoraaprenderemos a hacer lo mismo respecto de tres omás medias, supongamos para ello a tres grupostomados al azar de 6 bachilleres graduados endiferentes colegios que se presentan a una prueba deadmisión en la Universidad X, los bachilleres delcolegio A han obtenido las notas: 20, 20, 18, 13, 19 y18; los bachilleres del colegio B tienen: 18, 15, 12,09, 14 y 16, por último, los bachilleres del colegio Ctienen como resultado: 13, 15, 20, 18, 20 y 16.Queremos, en base a esos datos saber cuál es elcolegio cuyos bachilleres obtienen mejores resultadosen los exámenes de ingreso a la universidad.

= (18+15+12+09+14+16)/6=14

y los del colegio C un promedio de 17

= (20+20+18+13+19+18)/6=18

los del colegio B tienen una media de 14

Ax

Bx

Cx

Una primera aproximación para saberlo es obtener la

media de cada colegio, fácilmente podemos ver que

los estudiantes del colegio A tienen una media de 18,

= (13+15+20+18+20+16)/6=17.

La varianza entre las medias es:

=[(18-16,33)2+(17-16,33)2+(14-16,33)2]/(3-1) [1]

=4.33

La varianza dentro de los grupos es:

=[(20-18)2+(20-18)2+(18-18)2+(13-18)2+(19-18)2+(18-18)2+(18-14)2+(15-14)2+(12-14)2+(9-14)2+(14-14)2+(16-14)2+(13-17)2+(15-17)2+(20-17)2+(18-17)2+(20-17)2+(16-17)2]/[(6-1)+(6-1)+(6-1)] [2]

=(4+4+0+25+1+0+16+1+4+25+0+4+16+4+9+1+9+1)/15

=124/15=8.27

La suma de las varianzas dentro de los grupos es 8,27 y la varianza de las medias es 4.33, para comparar estos valores dividimos el producto de 6 por la varianza entre las medias para la varianza dentro de los grupos y obtenemos F=3,15

A esta cantidad la llamaremos coeficiente F en honor de Sir Ronald Fisher quien elaboró una tabla, que nos da la probabilidad de que la hipótesis nula sea verdadera, para utilizarla debemos observar los grados de libertad del numerador, que serían el número de colegios menos uno (2), y los grados de libertad del denominador (3 colegios por 6-1 bachilleres de cada colegio, o sea 15).

En la tabla buscamos en el extremo superior grados de libertad en el numerador, bajo la columna 2 y tratamos de encontrar la intersección con la fila donde dice grados de libertad del denominador, en este caso la fila con el numero 15.

El valor que hemos encontrado en la tabla, 3.68, es superior al valor que hemos calculado, 3,15 lo que nos indica que la probabilidad de que Ho sea verdadera es superior a 0.05 (5%).

Pruebas no paramétricas 2

Distribución ji-cuadrado

-Nunca adopta valores menores de 0

-Es asimétrica positiva

-Es en realidad una familia de curvas, en función de los

llamados “grados de libertad”. Es decir, hay una

distribución chi-cuadrado con 1 gl, una distribución chi-

cuadrado con 2 gl, etc. (Nota: Los grados de libertad

son siempre números positivos.)

-A medida que aumentan los grados de libertad, la distribución se

hace más y más simétrica.

2

Usos de la Ji-Cuadrado

a) Para hacer inferencias acerca de la varianza

poblacional. Es decir, para calcular Intervalos de

Confianza y Prueba de hipótesis para la varianza

poblacional.

b) Para hacer pruebas de Bondad de Ajuste. O sea,

para probar si un conjunto de datos sigue una

distribución pre-determinada.

c) Para hacer análisis de tablas de contingencia.

Por ejemplo, se divide un grupo de estudiantes en buenos y malos alumnos y se constató si tenían interés en problemas políticos, con nivel de significación del 1% ¿Se puede decir de los resultados que se muestran en la tabla a continuación si el interés por la política es independiente del hecho de ser o no buen estudiante?

Sin interés político Con interés Político

Buen estudiante 100 20

Mal estudiante 20 60

Sin interés

político

Con interés

Político

Buen

estudiante100 20 120

Mal

estudiante20 60 80

120 80 200

Sin interés

político

Con interés

Político

Buen

estudiante

100 (72) 20 (48) 120

Mal

estudiante

20 (48) 60 (32) 80

120 80 200

De acuerdo al cuadro anterior

(100-72)2/72+(20-48)2/48+(20-48)2/48+(60-32)2/32=7,84+39,2+39,2+13,07=99,31

Al consultar el valor crítico correspondiente de 2 encontramos

20,95,(2-1)(2-1)=

20,95,1=3,84

Como el valor encontrado supera al valor crítico rechazamos la hipótesis nula (independencia entre las variables) y aceptamos la alterna, el interés político y el rendimiento académico no son independientes.

CONSULTAS, COMENT

ARIOS Y

SUGERENCIAS A

[email protected]

33

Date post:	07-Jul-2015
Category:	Education
Upload:	videoconferencias-utpl
View:	1,872 times
Download:	1 times

Estadistica II IIBimestre

Education