Estadística II (II Bimestre) - [Download PPT Powerpoint]

ESCUELA:

PONENTE:

BIMESTRE:

ESTADÍSTICA II

CICLO:

PSICOLOGÍA

II BIMESTRE

Ec. Miriam Guajala

ABRIL – AGOSTO 2007

PRUEBA DE T DE STUDENT PARA UNA MUESTRA

Pruebas de homogeneidad

Estudian si dos o más muestras que se diferencian en el valor de una característica proceden de poblaciones donde los parámetros que las definen son iguales.

Valoran si hay diferencias entre medias,varianzas,proporciones, etc.

• Pruebas de homogeneidad de dos medias• Pruebas de homogeneidad de dos

proporciones

2 Muestras 1: N1, x1

S21

2: N2, x2 S2

2

2 Poblaciones 1: 11 2: 2 2

• Se desea contrastar las hipótesis:

– Ho= 1 = 2 (1 - 2 = 0)

– H1= (1 2 )

Prueba de homogeneidad de dos medias

¿Pertenecen a 2 poblaciones de igual media?

La t de student, es una prueba práctica, bastante poderosa ampliamente utilizada en las ciencias del comportamiento.

Esta prueba es muy similar a la prueba Z y la diferencia radica en que Z utiliza la una desviación poblacional y la prueba t en cambio utiliza una desviación estándar muestra

QUE ES LA PRUEBA T DE STUDENT?

FORMULAS

N

xZobt

−

=N

xtobt

δ−

=

USO:

1. Probar hipótesis en experimentos con una sola muestra.

2. Estimar la media de la población al construir intervalos de confianza.

3. Probar la significancia de la r de Pearson.

• PROBAR HIPOTESIS EN EXPERIMENTOS CON UNA PROBAR HIPOTESIS EN EXPERIMENTOS CON UNA SOLA MUESTRA.SOLA MUESTRA.

La prueba t es adecuada cuando:

• Se conoce la media poblacional de la Ho y se desconoce la

N

xtobt

δ−

=

La distribución t, es una familia de curvas que varían con los grados de libertad asociados al cálculo de t. Existe N-1 grados de libertad asociados con la prueba t para una muestra.

Las curvas de la distribución muestral son simétricas, con forma de campana y media = 0.

La prueba t es adecuada cuando la distribución muestral de es normal. Para que la distribución muestral de sea normal, la población de datos debe poseer una distribución normal, o bien N<30

xx

Intervalos de confianza: Rango de valores que probablemente, contengan al valor poblacional.

Límites de confianza: Valores que delimitan al intervalo de confianza.

Significacia de la r de Pearson: Nos permite examinar el valor de la muestra para ver si existe una correlación de la población.

GRÁFICAS

Tipos de pruebas t

Prueba t para una muestra: prueba si la media de la muestra de una variable difiere significativamente de la media conocida de la población

Prueba t no pareada o independiente: prueba si las medias estimadas de la población por 2 muestras independientes difieren significativamente (grupo de hombres y grupo de mujeres)

Prueba t pareada: prueba si la media estimada de la población por muestras dependientes difieren significativamente (media de pre y post-tratamiento para el mismo grupo de pacientes.

La fórmula para grupos independientes x1 - x2

t = S2

1/N1 + S22/N2

Con un nº de grados de libertad de N1+N2-2

* Si t t,N se acepta la hipótesis nula * Si t > t,N se rechaza la hipótesis nula.

Nº de datos que pueden variar independientemente

para una determinada operación

Pruebas de independencia Ver si en un estudio de 2 ó más variables, éstas

relacionadas

Coeficiente de correlación de Pearson (r)

Designa la magnitud de la relación entre 2 variables

Sus valores absolutos oscilan entre 0 y 1.La correlación es perfecta positiva si su valor es +1La correlación es perfecta negativa si su valor es -1La relación entre 2 variables x e y es positiva cuando al aumentar una, aumenta la otra y negativa cuando al disminuir una disminuye la otra

VARIANZA - PRUEBA F VARIANZA - PRUEBA F (ANOVA)(ANOVA)

Es usada para descubrir el efecto principal y los efectos de interacción de variables categóricas independientes (llamados factores) sobre un intervalo de la variable dependiente

Tipos de anova

Anova de una forma prueba diferencias en un intervalo de la variable dependiente entre dos, tres o más grupos formados por las categorías de una variable categórica independiente.

Uno de las pruebas mas importantes que utiliza la varianza en la F, que básicamente es la razón de dos estimaciones independientes de la varianza de la misma poblacion.

Varian con los grados de libertad.

La distribución F: Está sesgada positivamente No tiene valores negativos Posee una mediana aproximadamente igual a 1 según la

n de las estimaciones.

La técnica del análisis de varianza se utiliza con los experimentos con más de dos grupos independientes.

Esta técnica permite comparar las medias de los distintos grupos en una sola evaluación y asi evita el aumento de probabilidad de cometer un error de tipo I.

– Si F < Ft: no existen diferencias en las varianzas

– Se compara con la Ft de la tabla, para (N-1) gº de libertad del numerador y denominador:

Cuando hay igualdad de varianzas: única estimación de la varianza poblacional en la diferencia de medias.

PRUEBA JI CUADRADOPRUEBA JI CUADRADO

Una de las técnicas de inferencia de uso más frecuente, para el análisis de datos nominales es la prueba no paramétrica llamada Ji – cuadrado. Es adecuada para el análisis de datos consistentes en frecuencias que provienen de una o dos variables.

Pruebas de homogeneidad de 2 proporciones (Prueba de χ2)

χ2 : Estadístico que indica, en general, la discrepancia entre ciertas frecuencias observadas (empíricas) de una variable cualitativa dividida en k categorías y la frecuencia teórica.

La Ji cuadrada mide, es esencia, la discrepancia entre la frecuencia observada y la frecuencia esperada, para cada una de las celdas en una tabla de doble entrada.

REQUERIMIENTOS

Datos deberán estar en forma de frecuencias El total número de observaciones deberá exceder 20 Frecuencia esperada en una categoría o en cualquier celda

deberá ser >5 (cuando un de las celdas tiene <5 observados se usa corrección de Yates o si tiene <5 de esperados se usa exacta de Fisher)

El grupo de comparación deberá ser aproximadamente igual.

Usada para probar la fuerza de asociación entre dos variables cualitativas

Usada para datos categóricos

• Se compara el valor de χ2 obtenido con el teórico que proporciona la tabla de su función de probabilidad:

– Si χ20> χ2

t , se rechaza Ho

– Si χ20 χ2t , se acepta Ho.

• Se obtiene el estadístico χ2

El valor de χ2 teórica depende de: Nivel de significación α Grados de libertad (k-1)(y-1)

k = nº de muestras y = nº de categorías

Al trabajar con una tabla de contingencia tetracórica de 2 X 2 el nº de gº de libertad es 1

1 2

A a1 a2NA

B b1 b2NB

N1 N2 N

1 2

A N1NA

N

N2NA

N

NA

B N1NB

N

N2NB

N

NB

N1 N2 N

Frecuencias esperadas o teóricas

Frecuencias observadas

Sumando cada diferencia:

χ2 = N (a1b2 – a2b1)

N1N2NANB

χ2

Como seleccionar la prueba estadística adecuada

Tipo de variables Cuantitativa (tensión arterial) Cualitativa (género)

Tipos de preguntas de investigación Asociación Comparación Factor de riesgo

•Estructura de datos•Independientes•Dependientes•Pareados

Pregunta de investigación Asociación de 2 variables (dep, indep)

Correlación Spearman Regresión lineal

CuantitativaCuantitativa

2 Prueba T +3 ANOVA

categóricaCuantitativa

Regresión logísticacuantitativacategórica

chi-cuadradacategóricacategórica

Prueba Tipos de variableDependiente independiente

Buscando el factor de riesgo

Tipos de variablesDependiente algunas indep.

Prueba

Categórica Categórica Regresión log múltiple

Cuantitativa Categórica ANOVA

Cuantitativa Cuantitativa Regresión log lineal

DISTRIBUCIDISTRIBUCIÓÓN BINOMIALN BINOMIAL

DISTRIBUCION BINOMIAL

Distribución de

probabilidad

N ensayos

2 posibles resultados

Mutuamente excluyentes

Son independientes entre sí

C/resultado posible es la misma

DESARROLLO BINOMIAL

(P+Q)N

De donde:

P es la probabilidad de uno de los dos resultados posibles en un ensayoQ es la probabilidad del otro resultado posibleN es el número de ensayos

USO DE TABLA

BINOMIAL

Sustituto del desarrollo binomial.

Proporciona la distribución binomial para valores de N ( número de ensayo) hasta 20 en la primera columna y los resultados posibles están en la segunda columna, bajo el encabezado “Número de eventos P y Q.

El resto de columnas contienen datos de probabilidad para diversos valores de P o Q

USO DE TABLA

BINOMIAL

Ejemplo:

Si lanzo tres monedas que no están cargadas, una sola vez, ¿Cuál es la probabilidad de obtener 2 caras y una cruz? Suponga que cada moneda sólo puede caer en cara o en cruz.

Datos.

N= 3 (monedas)P= 2 (cara o cruz)p= 0.50

PRUEBA DE HIPÓTESISPRUEBA DE HIPÓTESIS

DISEÑO DE MEDIDAS

REPETIDAS

Característica

Son la existencia de resultados pareados en las condiciones y la elaboración de un estudio

que analiza la diferencia entre éstos.

HIPOTESIS ALTERNATIVA

Afirma que la diferencia de resultados entre las condiciones se debe a la variable

independiente.

Direccional No direccional

Cuando existe una buena base teórica y buena evidencia de apoyo literario

Cuando el experimento es

básico para determinar el

hecho

Evalúa con un valor de prob. De una

cola

Evalúa con un valor de prob. De

dos colas

HIPOTESIS NULA

Es la contraparte lógica de la alternativa, de modo que si la primera

es falsa, la segunda debe ser verdadera.

H1 no direccionada H0 especifica que la Var. Ind. No influye sobre la

Var. Dep.

H1 direccionada H0 establece que la Var. Ind. No influye sobre la Var.

Dep. en la dirección dada

PEGLA DE DECISION

Siempre evaluamos los resultados de un experimento evaluando la H0 porque

podemos calcular la prob. De los eventos aleatorios.

EVALUACION

H0 es V y si esta es menor o igual al nivel alfa o nivel de probabilidad crítica Rechazamos la Ho y aceptamos de manera indirecta la H1. Por lo tanto los resultados son significativos o confiables.

Si la prob. Obtenido es mayor al nivel alfa, conservamos la Ho

ERROR DE TIPO I Y DE

TIPO II

ERROR TIPO IRechazamos la H0 cuando esta

es verdadera

ERROR TIPO IINo rechazamos la H0 cuando

esta es falsa

CONCLUSION Estado realDecisión H0 (V) H0 (F)Aceptar Ho Decisión Correcta Error Tipo IIRechazar H0 Error Tipo I Decisión Correcta

NIVEL ALFA Y EL PROCESO

DE DECISION

Nivel al cual desean limitar la probabilidad de cometer un

Error Tipo I

CONCLUSION Estado realNivel Alfa Prob. Obt. Decisión H0 (V) H0 (F) 0.05 0.02 Aceptar Ho Decisión Correcta Error Tipo II 0.01 0.02 Rechazar H0 Error Tipo I Decisión Correcta

EVALUACION DE LA COLA

DE LA DISTRIBUCIO

N

H1 no direccionadaEvaluamos el resultado

obtenido en ambas direcciones o colas.

H1 direccionadaEvaluamos solamente la cola de

la distribución que está en la dirección dada por la H1

Necesitamos de Signos positivos y negativos y hemos

de incluir de los resultados positivos los tantos o valores

mas extremos.

EVALUACION DE LA COLA

DE LA DISTRIBUCIO

N

Ejemplo.N= 10 y p=0.50

Signos positivos: 9Tantos extremos: 0,1,9,10Tabla B

P(0,1,9,10)= p(0)+p(1)+p(9)+p(10) = 0.0010+0.0098+0.0098+0.0010 = 0.0216

EVALUACION DE

PROBABILIDADES PARA

UNA O DOS COLAS

Nivel alfa.Determina si la evaluación de la probabilidad debe ser de una o

dos colas.

Regla.La evaluación debe ser siempre

de dos colas, a menos que el experimentador conserve H0 cuando los resultados sean extremos en la dirección

opuesta a la prevista.

DISTRIBUCIONES MUESTRALESDISTRIBUCIONES MUESTRALES

Todos los valores que se pueden

asumir

Distribución Muestral

Conjunto real o teórico de datos si se realiza sobre toda la población y la variable independiente no

tuviese efectos.

Población de la hipótesis nula

La probabilidad de obtener cada valor

Una distribución muestral. Proporciona todos los valores que puede asumir un estadístico, junto con la probabilidad de obtener cada valor si el muestreo

es aleatorio a partir de la población de hipótesis nula.

La prueba (Z) de la desviación normalizada

Distribución muestral de la media

Se utiliza cuando conocemos los parámetros de la población de la H0.

Proporciona todos los valores que puede asumir la media, junto con la probabilidad de obtener cada

valor si el muestreo es aleatorio a partir de la población de H0

Características de la dist. Muestral de la media

a). Tiene una media y una desviación estándar. ux= es la media de la distribución muestral de la media Gx= es la desviación estándar de la distribución muestral de la media.b). Tiene una media igual a la media poblacional de datos crudos. ux= uc) Tiene una desviación estándar igual a la desviación estándar poblacional de datos crudos, dividida entre la raíz cuadrada de N (ensayos o población) Gx= G / Nd) Presenta una forma normal que depende de cómo se distribuya la población de datos crudos y del tamaño de la muestra.

Download - Estadística II (II Bimestre)