N o e l i a M a r m e s a t E s p e j o
G r u p o 1 4
Seminario 6
Paso 1: Se abre el programa R. Una vez abierto, pinchamos en R commander en el apartado “Datos”,
y posteriormente “Cargar conjunto de datos”.
Paso 2: Esto lo realizamos para importar el archivo que queremos. En este caso será “activossalud”.
Hacemos clic en “Abrir”.
Paso 3: Ya se encuentra nuestro archivo en el programa R. El primer ejercicio consiste en seleccionar dos variables
cualitativas-factor del fichero, describirlas en tablas de frecuencias e interpretar al menos 3 aspectos en relación a la
distribución de las mismas. Pinchamos en “Estadísticos”, que se encuentra en el margen superior de R commander.
Posteriormente hacemos clic en “Resúmenes”, y por último en “Distribución de frecuencias”.
Paso 4: Las variables que hemos elegido son dulces y refrescos.
Paso 5: Comenzaremos por la variable dulces. Hacemos clic en “dulces”, y posteriormente
en la opción “Aceptar”.
Paso 6: Tras haber elegido esta variable, obtenemos los siguientes resultado que se
observan en la pantalla de R commander.
Paso 7: Estos son los datos que obtenemos de la variable “dulces” en el archivo que hemos
importado a R.
A partir de estos datos podemos deducir la siguiente información:
20 personas consumen dulces a diario, lo que representa un 6’90% de la
población estudiada.
92 personas consumen dulces una vez a la semana, representando el 31’72%
de la población estudiada.
49 personas consumen dulces 3 o más veces en semana, representando el
16’90% de la población.
42 personas no consumen dulces nunca, y constituyen el 14’48% de la
población.
87 personas consumen dulces 1 o 2 veces en semana, y constituyen el 30% de
la población.
Paso 8: Ahora haremos lo mismo pero con la segunda variable que hemos elegido,
refrescos.
Paso 9: Obtenemos los siguientes datos que se observan en la pantalla de R
commander.
Paso 10: Estos son lo datos que obtenemos de la variable “refrescos”.
A partir de estos datos podemos deducir la siguiente información:
35 personas consumen refrescos a diario, representando el 12’03% de la
población tomada para el estudio.
73 personas consumen refrescos menos de una vez en semana, representando el
25’09% de la población.
43 personas consumen refrescos 3 o más veces en semana, representando el
14’78% de la población.
73 personas no consumen refrescos nunca, representando el 25’09% de la
población.
67 personas consumen refrescos 1 o 2 veces en semanas, representando el
23’02% de la población.
Paso 11: El segundo ejercicio consiste en seleccionar dos variables numéricas del fichero y mediante
resúmenes numéricos describir e interpretar la distribución de las mismas. Las variables elegidas son
medicalización y peso.
Paso 12: Marcamos la variable “medicalización”, y posteriormente, hacemos clic
en “Aceptar”.
Paso 13: Obtenemos los siguientes datos en la pantalla de R commander.
Paso 14: Obtenemos los siguientes datos de la distribución de la variable
“medicalización”.
A partir de estos datos podemos deducir la siguiente información:
La variable “medicalización” tiene una media de 9’912351 y una desviación
típica de 1’283856.
Existen 40 casos no disponibles.
La mediana es 10, y coincide con el segundo cuartil.
La variable es simétrica ya que la media y la mediana tiene valores muy
similares, prácticamente iguales.
Paso 15: Haremos lo mismo con la 2ª variable elegida, que en este caso es “peso”.
Paso 16: Obtenemos los siguientes datos de la distribución de la variable “peso”.
A partir de estos datos podemos deducir la siguiente información:
La media es 62’75571 y la desviación típica 12’65981. Esto quiere decir que
los valores de peso oscilan entre 50 y 75.
Existen 16 casos no disponibles.
La mediana sería 60, y coincide con el segundo cuartil.
La variable sería simétrica, ya que la mediana y la media tienen valores muy
similares, prácticamente iguales.
Paso 17: El tercer ejercicio consiste en realizar al menos un gráfico de cada tipo con variables adecuadamente
seleccionadas del fichero. Para las variables cualitativas-factor tenemos el gráfico de barras y el gráfico de sectores.
Primero vamos a realizar un gráfico de barras. Seleccionamos la opción “Gráficas” situada en el margen superior de
R commander, y posteriormente, “Gráfica de barras”.
Paso 18: Vamos a realizar un gráfico de barras para la variable “cerveza”. Marcamos la variable que
queremos y hacemos clic en “Aceptar”.
Paso 19: Posteriormente, aparecerá en la consola de R nuestra gráfica de barras
deseada.
Paso 20: Ahora seleccionaremos la opción “Gráficas” y posteriormente, “Gráficas
de sectores”.
Paso 21: Seleccionaremos una variable para representarla en la gráfica de
sectores. En este caso, elegiremos la variable “embutidos”, y hacemos clic en
“Aceptar”.
Paso 22: Posteriormente, aparece esta gráfica de sectores en la consola de R, la
cual representa el hábito de consumo de los embutidos en la población estudiada.
Paso 23: Podemos obtener diferentes tipos de gráficas, dependiendo de la variable que queramos
estudiar o nos interese. Ahora seleccionaremos la opción “Gráficas”, y posteriormente “Histograma”.
Paso 24: Seleccionaremos la variable que queremos representar en el gráfico. En este caso,
elegiremos la variable “mantenimientohogar”, y hacemos clic en “Aceptar”.
Paso 25: Obtendremos en la pantalla de la consola de R, esta representación de la variable
“mantenimientohogar” en forma de histograma.
Paso 26: Por último, haremos como ejemplo de las muchas variedades de gráficas que R puede
representar, un diagrama de caja. Seleccionaremos la opción “Gráficas” y posteriormente, “diagrama
de caja”.
Paso 27: Seleccionaremos la variable “altura” para representarla en el diagrama de caja.
Paso 28: Obtendremos en la pantalla de la consola de R el diagrama de caja de la
variable altura.
¡ESPERO QUE OS HAYA SIDO ÚTIL!