UNIVERSIDAD NACIONAL EXPERIMENTALDEL LOS LLANOS OCCIDENTALES
“EZEQUIEL ZAMORA”UNELLEZ – NÚCLEO TINAQUILLO
ANÁLISIS DE DATOS ESTADÍSTICOS DE LAACTIVIDAD FÍSICA
Coordinador de unidad de apoyo de estadística:
MSc Alexis Durá[email protected]
Desarrollado en 1.993 por Ross Ihaka y Robert Glenteman (University of Auckland, Nueva Zelanda).A partir de 1.995 comenzó a distribuirse gratuitamente (GNU, Free Software Foundation).
CARACTERÍSTICAS:
Es un conjunto integrado de programas.Efectiva manipulación y almacenamiento
de datos.Una amplia, coherente e integrada
colección de herramientas para el análisis de datos.
Posibilidades gráficas para el análisis de datos.
R – Commander (Rcmdr) Es una interfaz gráfica del programa R. Existe una dirección que descarga el R y el R-
Commader juntos para windows es la siguiente: http://knuth.uca.es/R/R-UCA
Se ejecuta normal como cualquier programa.Para abrir el programa se le da doble clic a la R azul.
Nota
• Algunas veces cuando el R-Commander se abre, el programa puede preguntar que si se quieren instalar otros paquetes, si disponen de tiempo e internet coloquen si, de lo contrario coloquen no.
Ventana de Instrucciones
Ventana de Resultados
CARGAR DATOS
Importar datos desde Excel
Colocar el nombre de la matriz ó
conjunto de datos y luego aceptan
Se busca el archivo y luego le da clic en abrir.
Aparece algo como esto:
Selecciona la hoja donde estén los datos dentro del archivo y le
das ok
ANÁLISIS INFERENCIAL
• Es el estudio que parte de una muestra pequeña y representativa de miembros de gran una colectivo, donde se extraen conclusiones que afectan a todos los elementos del mismo.
PRUEBAS DE HIPÓTESIS
Objetivo: Tratar de determinar cuándo es razonable concluir, que la población entera posee determinada propiedad y cuando esto no es razonable, a partir del análisis de una muestra.
Una hipótesis se define como una afirmación ó suposición que está sujeta a verificación o comprobación
La prueba de hipótesis es el procedimiento estadístico que parte de una suposición del comportamiento de la población (hipótesis) y en función del análisis de la(s) muestra(s) se comprobará su veracidad
TIPOS DE HIPOTESIS
El procedimiento de toma de decisiones en la prueba de hipótesis, se basa en la elección de una opción entre dos conjuntos posibles de valores del parámetro, es decir, en dos hipótesis estadísticas, que son: Hipótesis nula H0 Hipótesis alternativa H1
HIPOTESIS NULA y ALTERNATIVA
• Hipótesis nula corresponde a la ausencia de una modificación en la variable investigada, y por lo tanto se especifica de una forma exacta:
H0 : = 0 • Hipótesis alternativa se especifica de
manera más general : H1: 0
H1: > 0
H1: < 0.
CUADRO DE DECISIONES Y ERRORES
Ho CIERTA Ho FALSA
Rechazar Ho Incorrecto
error I Correcto
No Rechazar Ho
Correcto Incorrecto error II
MEDICIÓN DE LOS ERRORES
es la Probabilidad de cometer un Error tipo I. Se llama Nivel de significación (1-10 %) es la probabilidad de cometer un Error tipo II (5-20 %) Es deseable que estas dos probabilidades de error sean pequeñas.
P - VALOR•Es la Probabilidad de obtener una discrepancia mayor o igual que la observada en la muestra n cuando Ho es cierta.
•Es la probabilidad de observar un valor de prueba más extremo que el valor observado, dado que la hipótesis nula es verdadera.
•Si el valor p es más chico que el nivel de significación la hipótesis nula es rechazada. Por el contrario, si es más grande que el nivel de significación la hipótesis nula no es rechazada.
Pasos de una Prueba de Hipótesis
Paso 1 •Establecer las hipótesis (Nula y Alternativa)
Paso 2 •Seleccionar el nivel de significación (α)
Paso 3 •Selección del estadístico de prueba ó prueba estadística
Paso 4 •Procesar la información y tomar la decisión.
PRUEBAS PARA PROMEDIOS
• En primer lugar se debe hacer una análisis de normalidad a las variables para poder seleccionar el test adecuado.
• Siempre se quiere realizar test paramétricos por ser más objetivos que los no paramétricos.
Análisis de la Normalidad de los datos
• Se debe escribir lo siguiente en el programa en la ventana de instrucciones:
attach(Nombre del conjunto de datos) qqnorm(variable, xlab="Cuantiles Teóricos“, ylab="Cuantiles de la Muestra" ,main="Gráfico Q-Q de Probabilidad Normal")qqline(variable)
se sombrea y luego se da ejecutar y se obtiene:
ANÁLISIS GRÁFICO
-2 -1 0 1 2
1015
2025
3035
Normal Q-Q Plot
Cuantiles Teóricos
Cua
ntile
s de
la M
uest
ra• La recta indica la distribución teórica de una normal
• Las interpretaciones se hacen en función de los puntos con su cercanía en la línea recta.
• Entre los puntos estén mas cerca a la recta, mejor será su aproximación a una distribución normal.
-2 -1 0 1 2
1015
2025
3035
Normal Q-Q Plot
Cuantiles Teóricos
Cua
ntile
s de
la M
uest
ra
Pruebas de Normalidad
• Establece:Ho: existe normalidad en los datosH1: no existe normalidad en los datos
• Test de normalidad de Shapiro Wilk: se utiliza cuando la muestra es menor o igual a 50. En el programa:
• Para muestras mayores a 50, se utiliza el test de komogorov – Smirnov, en el programa se escribe en la ventana de instrucciones lo siguiente:
attach(Nombre del conjunto de datos)ks.test(variable, pnorm, mean(variable),
sd(variable))
Medias para una población
Ho H1
µ = Valorµ ≠ Valorµ < Valorµ > Valor
Para poblaciones normalesHipótesis
Prueba T-Student
Se selecciona la variable
Se selecciona la opción De la hipótesis alternativa
plateada
Se coloca el valor del promedio establecidoen la Hipótesis nula
Para poblaciones no normales:Test de Wilcoxon
• Se coloca en la ventana de instrucciones:attach(nombre del conjunto de datos)wilcox.test(variable, mu=valor, alternative = c("ver H1") )
H0 H1
Xme=ValorXme≠Valor ("two.sided") Xme<Valor ("less")Xme>Valor ("greater")
Hipótesis
NOTA: En caso de muestras grandes (Mayores de 30), de debe añadir correct=FALSE y quedaría:attach(nombre del conjunto de datos)wilcox.test(variable, mu=valor, alternative = c("ver H1"), correct=F)
Luego se sombrea y se ejecuta
Prueba de hipótesis entre dos poblaciones
• Muestras independientes y normalesHIPÓTESIS:
H0 H1
µ1=µ2
µ1≠µ2
µ1<µ2
µ1>µ2
Antes de realizar esta prueba se debe realizar una prueba para comparar las varianzas poblacionales que se necesitará más adelante
PRUEBA F DE FISHER
Hipótesis:
H0 H1
σ1=σ2 σ1≠σ2
La matriz que se debe introducir en R:
Grupo ó Tratamiento VariableA DATOSB DATOS
En el programa:
Se selecciona el grupo (debe ser cualitativo)
Se selecciona la Variable
Prueba de T-Student (poblaciones)
Hipótesis:
H0 H1
µ1=µ2
µ1≠µ2
µ1<µ2
µ1>µ2
En el programa:
Se selecciona el grupo (debe ser cualitativo)
Se selecciona la Variable
Se observa la Diferencia
Se marca Sí, para el caso que se acepte H0 en la
prueba F de Fisher, caso contrario si marca No
Se selecciona la opción planteada en la
hipótesis alternativa
Muestras dependientes y normales
Hipótesis:H0 H1
µi=µf
µi≠µf
µi<µf
µi>µf
Nota: recordar que se debe calcular la diferencia entre las condiciones iniciales y finales para hacer el análisis de la normalidad
La matriz que se debe introducir en R:
Variable (Condición Inicial)
Variable(Condición Final)
DATOS DATOS
En el programa:
Se coloca un nombre distinto para identificarla
Se le da doble clic primero a la variable inicial, se coloca el signo – y luego se le da doble clic a la variable final
La matriz que se debe introducir en R:
Variable (Condición Inicial)
Variable(Condición Final)
DATOS DATOS
En el programa:
Se selecciona la condición inicial
Se selecciona la condición final
Se selecciona la opción planteada en la
hipótesis alternativa
Muestras independientes y al menos una no normal
Prueba de Suma de Rangos de WilcoxonHipótesis:
H0 H1
Xme1=Xme2
Xme1≠Xme2
Xme1<Xme2
Xme1>Xme2
En el programa:
Se Selecciona la variable
Se Selecciona el grupo
Se observa la diferencia
Se selecciona la opción de la hipótesis alternativa planteada
Para muestras menores a 30, se marca la opción Por defecto, para muestras mayores a 30 se marca
Aproximación normal
Muestras dependientes y al menos una no normal
Prueba de Rangos con signos de Wilcoxon:Hipótesis:
H0 H1
Xmei=Xmef
Xmei≠Xmef
Xmei<Xmef
Xmei>Xmef
Se selecciona la condición inicial
Se selecciona la condición final
Se selecciona la opción de la hipótesis alternativa planteada
Para muestras menores a 30, se marca la opción Por defecto, para muestras mayores a 30 se marca
Aproximación normal