ESCUELA:
PONENTE:
BIMESTRE:
ESTADÍSTICA II
CICLO:
PSICOLOGÍA
II BIMESTRE
Ec. Miriam Guajala
ABRIL – AGOSTO 2007
PRUEBA DE T DE STUDENT PARA UNA MUESTRA
Pruebas de homogeneidad
Estudian si dos o más muestras que se diferencian en el valor de una característica proceden de poblaciones donde los parámetros que las definen son iguales.
Valoran si hay diferencias entre medias,varianzas,proporciones, etc.
• Pruebas de homogeneidad de dos medias• Pruebas de homogeneidad de dos
proporciones
2 Muestras 1: N1, x1
S21
2: N2, x2 S2
2
2 Poblaciones 1: 11 2: 2 2
• Se desea contrastar las hipótesis:
– Ho= 1 = 2 (1 - 2 = 0)
– H1= (1 2 )
Prueba de homogeneidad de dos medias
¿Pertenecen a 2 poblaciones de igual media?
La t de student, es una prueba práctica, bastante poderosa ampliamente utilizada en las ciencias del comportamiento.
Esta prueba es muy similar a la prueba Z y la diferencia radica en que Z utiliza la una desviación poblacional y la prueba t en cambio utiliza una desviación estándar muestra
QUE ES LA PRUEBA T DE STUDENT?
FORMULAS
N
xZobt
−
=N
xtobt
δ−
=
USO:
1. Probar hipótesis en experimentos con una sola muestra.
2. Estimar la media de la población al construir intervalos de confianza.
3. Probar la significancia de la r de Pearson.
• PROBAR HIPOTESIS EN EXPERIMENTOS CON UNA PROBAR HIPOTESIS EN EXPERIMENTOS CON UNA SOLA MUESTRA.SOLA MUESTRA.
La prueba t es adecuada cuando:
• Se conoce la media poblacional de la Ho y se desconoce la
N
xtobt
δ−
=
La distribución t, es una familia de curvas que varían con los grados de libertad asociados al cálculo de t. Existe N-1 grados de libertad asociados con la prueba t para una muestra.
Las curvas de la distribución muestral son simétricas, con forma de campana y media = 0.
La prueba t es adecuada cuando la distribución muestral de es normal. Para que la distribución muestral de sea normal, la población de datos debe poseer una distribución normal, o bien N<30
xx
Intervalos de confianza: Rango de valores que probablemente, contengan al valor poblacional.
Límites de confianza: Valores que delimitan al intervalo de confianza.
Significacia de la r de Pearson: Nos permite examinar el valor de la muestra para ver si existe una correlación de la población.
GRÁFICAS
Tipos de pruebas t
Prueba t para una muestra: prueba si la media de la muestra de una variable difiere significativamente de la media conocida de la población
Prueba t no pareada o independiente: prueba si las medias estimadas de la población por 2 muestras independientes difieren significativamente (grupo de hombres y grupo de mujeres)
Prueba t pareada: prueba si la media estimada de la población por muestras dependientes difieren significativamente (media de pre y post-tratamiento para el mismo grupo de pacientes.
La fórmula para grupos independientes x1 - x2
t = S2
1/N1 + S22/N2
Con un nº de grados de libertad de N1+N2-2
* Si t t,N se acepta la hipótesis nula * Si t > t,N se rechaza la hipótesis nula.
Nº de datos que pueden variar independientemente
para una determinada operación
Pruebas de independencia Ver si en un estudio de 2 ó más variables, éstas
relacionadas
Coeficiente de correlación de Pearson (r)
Designa la magnitud de la relación entre 2 variables
Sus valores absolutos oscilan entre 0 y 1.La correlación es perfecta positiva si su valor es +1La correlación es perfecta negativa si su valor es -1La relación entre 2 variables x e y es positiva cuando al aumentar una, aumenta la otra y negativa cuando al disminuir una disminuye la otra
VARIANZA - PRUEBA F VARIANZA - PRUEBA F (ANOVA)(ANOVA)
Es usada para descubrir el efecto principal y los efectos de interacción de variables categóricas independientes (llamados factores) sobre un intervalo de la variable dependiente
Tipos de anova
Anova de una forma prueba diferencias en un intervalo de la variable dependiente entre dos, tres o más grupos formados por las categorías de una variable categórica independiente.
Uno de las pruebas mas importantes que utiliza la varianza en la F, que básicamente es la razón de dos estimaciones independientes de la varianza de la misma poblacion.
Varian con los grados de libertad.
La distribución F: Está sesgada positivamente No tiene valores negativos Posee una mediana aproximadamente igual a 1 según la
n de las estimaciones.
La técnica del análisis de varianza se utiliza con los experimentos con más de dos grupos independientes.
Esta técnica permite comparar las medias de los distintos grupos en una sola evaluación y asi evita el aumento de probabilidad de cometer un error de tipo I.
– Si F < Ft: no existen diferencias en las varianzas
– Se compara con la Ft de la tabla, para (N-1) gº de libertad del numerador y denominador:
Cuando hay igualdad de varianzas: única estimación de la varianza poblacional en la diferencia de medias.
PRUEBA JI CUADRADOPRUEBA JI CUADRADO
Una de las técnicas de inferencia de uso más frecuente, para el análisis de datos nominales es la prueba no paramétrica llamada Ji – cuadrado. Es adecuada para el análisis de datos consistentes en frecuencias que provienen de una o dos variables.
Pruebas de homogeneidad de 2 proporciones (Prueba de χ2)
χ2 : Estadístico que indica, en general, la discrepancia entre ciertas frecuencias observadas (empíricas) de una variable cualitativa dividida en k categorías y la frecuencia teórica.
La Ji cuadrada mide, es esencia, la discrepancia entre la frecuencia observada y la frecuencia esperada, para cada una de las celdas en una tabla de doble entrada.
REQUERIMIENTOS
Datos deberán estar en forma de frecuencias El total número de observaciones deberá exceder 20 Frecuencia esperada en una categoría o en cualquier celda
deberá ser >5 (cuando un de las celdas tiene <5 observados se usa corrección de Yates o si tiene <5 de esperados se usa exacta de Fisher)
El grupo de comparación deberá ser aproximadamente igual.
Usada para probar la fuerza de asociación entre dos variables cualitativas
Usada para datos categóricos
• Se compara el valor de χ2 obtenido con el teórico que proporciona la tabla de su función de probabilidad:
– Si χ20> χ2
t , se rechaza Ho
– Si χ20 χ2t , se acepta Ho.
• Se obtiene el estadístico χ2
El valor de χ2 teórica depende de: Nivel de significación α Grados de libertad (k-1)(y-1)
k = nº de muestras y = nº de categorías
Al trabajar con una tabla de contingencia tetracórica de 2 X 2 el nº de gº de libertad es 1
1 2
A a1 a2NA
B b1 b2NB
N1 N2 N
1 2
A N1NA
N
N2NA
N
NA
B N1NB
N
N2NB
N
NB
N1 N2 N
Frecuencias esperadas o teóricas
Frecuencias observadas
Sumando cada diferencia:
χ2 = N (a1b2 – a2b1)
N1N2NANB
χ2
Como seleccionar la prueba estadística adecuada
Tipo de variables Cuantitativa (tensión arterial) Cualitativa (género)
Tipos de preguntas de investigación Asociación Comparación Factor de riesgo
•Estructura de datos•Independientes•Dependientes•Pareados
Pregunta de investigación Asociación de 2 variables (dep, indep)
Correlación Spearman Regresión lineal
CuantitativaCuantitativa
2 Prueba T +3 ANOVA
categóricaCuantitativa
Regresión logísticacuantitativacategórica
chi-cuadradacategóricacategórica
Prueba Tipos de variableDependiente independiente
Buscando el factor de riesgo
Tipos de variablesDependiente algunas indep.
Prueba
Categórica Categórica Regresión log múltiple
Cuantitativa Categórica ANOVA
Cuantitativa Cuantitativa Regresión log lineal
DISTRIBUCIDISTRIBUCIÓÓN BINOMIALN BINOMIAL
DISTRIBUCION BINOMIAL
Distribución de
probabilidad
N ensayos
2 posibles resultados
Mutuamente excluyentes
Son independientes entre sí
C/resultado posible es la misma
DESARROLLO BINOMIAL
(P+Q)N
De donde:
P es la probabilidad de uno de los dos resultados posibles en un ensayoQ es la probabilidad del otro resultado posibleN es el número de ensayos
USO DE TABLA
BINOMIAL
Sustituto del desarrollo binomial.
Proporciona la distribución binomial para valores de N ( número de ensayo) hasta 20 en la primera columna y los resultados posibles están en la segunda columna, bajo el encabezado “Número de eventos P y Q.
El resto de columnas contienen datos de probabilidad para diversos valores de P o Q
USO DE TABLA
BINOMIAL
Ejemplo:
Si lanzo tres monedas que no están cargadas, una sola vez, ¿Cuál es la probabilidad de obtener 2 caras y una cruz? Suponga que cada moneda sólo puede caer en cara o en cruz.
Datos.
N= 3 (monedas)P= 2 (cara o cruz)p= 0.50
PRUEBA DE HIPÓTESISPRUEBA DE HIPÓTESIS
DISEÑO DE MEDIDAS
REPETIDAS
Característica
Son la existencia de resultados pareados en las condiciones y la elaboración de un estudio
que analiza la diferencia entre éstos.
HIPOTESIS ALTERNATIVA
Afirma que la diferencia de resultados entre las condiciones se debe a la variable
independiente.
Direccional No direccional
Cuando existe una buena base teórica y buena evidencia de apoyo literario
Cuando el experimento es
básico para determinar el
hecho
Evalúa con un valor de prob. De una
cola
Evalúa con un valor de prob. De
dos colas
HIPOTESIS NULA
Es la contraparte lógica de la alternativa, de modo que si la primera
es falsa, la segunda debe ser verdadera.
H1 no direccionada H0 especifica que la Var. Ind. No influye sobre la
Var. Dep.
H1 direccionada H0 establece que la Var. Ind. No influye sobre la Var.
Dep. en la dirección dada
PEGLA DE DECISION
Siempre evaluamos los resultados de un experimento evaluando la H0 porque
podemos calcular la prob. De los eventos aleatorios.
EVALUACION
H0 es V y si esta es menor o igual al nivel alfa o nivel de probabilidad crítica Rechazamos la Ho y aceptamos de manera indirecta la H1. Por lo tanto los resultados son significativos o confiables.
Si la prob. Obtenido es mayor al nivel alfa, conservamos la Ho
ERROR DE TIPO I Y DE
TIPO II
ERROR TIPO IRechazamos la H0 cuando esta
es verdadera
ERROR TIPO IINo rechazamos la H0 cuando
esta es falsa
CONCLUSION Estado realDecisión H0 (V) H0 (F)Aceptar Ho Decisión Correcta Error Tipo IIRechazar H0 Error Tipo I Decisión Correcta
NIVEL ALFA Y EL PROCESO
DE DECISION
Nivel al cual desean limitar la probabilidad de cometer un
Error Tipo I
CONCLUSION Estado realNivel Alfa Prob. Obt. Decisión H0 (V) H0 (F) 0.05 0.02 Aceptar Ho Decisión Correcta Error Tipo II 0.01 0.02 Rechazar H0 Error Tipo I Decisión Correcta
EVALUACION DE LA COLA
DE LA DISTRIBUCIO
N
H1 no direccionadaEvaluamos el resultado
obtenido en ambas direcciones o colas.
H1 direccionadaEvaluamos solamente la cola de
la distribución que está en la dirección dada por la H1
Necesitamos de Signos positivos y negativos y hemos
de incluir de los resultados positivos los tantos o valores
mas extremos.
EVALUACION DE LA COLA
DE LA DISTRIBUCIO
N
Ejemplo.N= 10 y p=0.50
Signos positivos: 9Tantos extremos: 0,1,9,10Tabla B
P(0,1,9,10)= p(0)+p(1)+p(9)+p(10) = 0.0010+0.0098+0.0098+0.0010 = 0.0216
EVALUACION DE
PROBABILIDADES PARA
UNA O DOS COLAS
Nivel alfa.Determina si la evaluación de la probabilidad debe ser de una o
dos colas.
Regla.La evaluación debe ser siempre
de dos colas, a menos que el experimentador conserve H0 cuando los resultados sean extremos en la dirección
opuesta a la prevista.
DISTRIBUCIONES MUESTRALESDISTRIBUCIONES MUESTRALES
Todos los valores que se pueden
asumir
Distribución Muestral
Conjunto real o teórico de datos si se realiza sobre toda la población y la variable independiente no
tuviese efectos.
Población de la hipótesis nula
La probabilidad de obtener cada valor
Una distribución muestral. Proporciona todos los valores que puede asumir un estadístico, junto con la probabilidad de obtener cada valor si el muestreo
es aleatorio a partir de la población de hipótesis nula.
La prueba (Z) de la desviación normalizada
Distribución muestral de la media
Se utiliza cuando conocemos los parámetros de la población de la H0.
Proporciona todos los valores que puede asumir la media, junto con la probabilidad de obtener cada
valor si el muestreo es aleatorio a partir de la población de H0
Características de la dist. Muestral de la media
a). Tiene una media y una desviación estándar. ux= es la media de la distribución muestral de la media Gx= es la desviación estándar de la distribución muestral de la media.b). Tiene una media igual a la media poblacional de datos crudos. ux= uc) Tiene una desviación estándar igual a la desviación estándar poblacional de datos crudos, dividida entre la raíz cuadrada de N (ensayos o población) Gx= G / Nd) Presenta una forma normal que depende de cómo se distribuya la población de datos crudos y del tamaño de la muestra.