1−EPR−VARIABLES ESTADÍSTICAS UNIDIMENSIONALES 1
1 VARIABLES ESTADÍSTICAS UNIDIMENSIONALES 1 La tabla siguiente refleja la distribución por cursos de los alumnos matriculados en un Instituto:
Curso ni 1º de ESO 56 2º de ESO 90 3º de ESO 120 4º de ESO 88 1º de Bach. 114 2º de Bach. 112
N = 580
a) ¿De qué tipo es el carácter estadístico estudiado? b) Completar la tabla con las columnas de frecuencias relativas y porcentajes. c) Construir un diagrama rectangular y un diagrama de sectores.
Se trata de un carácter cualitativo (atributo) ordinal.
DIAGRAMA RECTANGULAR EN EXCEL
1. Introducir los datos. En una columna introducir los nombres de las modalidades (“categorías” en Excel). En la columna siguiente introducir la frecuencia absoluta o relativa de cada modalidad.
2. Hacer clic en Asistente para gráficos (o bien Insertar-Gráfico). 3. Ejecutar los cuatro pasos siguientes (para avanzar de un paso a otro pulsar
Siguiente)
Paso 1 Tipo de gráfico Seleccionar Columnas
Paso 2 Datos del gráfico Rango de datos: definir las celdas de las dos columnas donde están los datos (la de modalidades y la de frecuencias) Series en: escoger Columnas
Paso 3 Opciones de gráfico Título del gráfico Escribir Título deseado para el gráfico, así como para el Eje de categorías (X) y el Eje de valores (Y) Ejes Seleccionar Eje de categorías automático y Eje de valores
2 ESTADÍSTICA J. Sánchez - Mª. S. Sánchez
Líneas de división Seleccionar sólo Líneas de división principales en el eje Y Leyenda Desactivar Mostrar leyenda Rótulo de datos Seleccionar Valor Tabla de datos Desactivar Mostrar tabla de datos
Paso 4 Colocar el gráfico Como objeto en: Hoja 1 Finalizar
1−EPR−VARIABLES ESTADÍSTICAS UNIDIMENSIONALES 3
4 ESTADÍSTICA J. Sánchez - Mª. S. Sánchez
1−EPR−VARIABLES ESTADÍSTICAS UNIDIMENSIONALES 5
4. Se pueden efectuar modificaciones sobre el gráfico obtenido como cambiar el color del fondo o de las barras. Para cambiar el color de una barra se hacen dos clics sobre ella con el botón izquierdo; después, clic con botón derecho y se selecciona Formato de punto de datos. En Tramas se selecciona Borde y Área.
El resultado es el siguiente:
6 ESTADÍSTICA J. Sánchez - Mª. S. Sánchez
DIAGRAMA DE SECTORES EN EXCEL
1. Introducir los datos. En una columna introducir los nombres de las modalidades (“categorías” en Excel). En la columna siguiente introducir la frecuencia absoluta o relativa de cada modalidad.
2. Hacer clic en Asistente para gráficos (o bien Insertar-Gráfico). 3. Ejecutar los cuatro pasos siguientes (para avanzar de un paso a otro pulsar
Siguiente)
Paso 1 Tipo de gráfico Seleccionar Circular
Paso 2 Datos del gráfico Rango de datos: definir las celdas de las dos columnas donde están los datos (la de modalidades (categorías) y la de frecuencias) Series en: escoger Columnas
1−EPR−VARIABLES ESTADÍSTICAS UNIDIMENSIONALES 7
Paso 3 Opciones de gráfico Título del gráfico Escribir título deseado para el gráfico Leyenda Desactivar Mostrar leyenda Rótulo de datos Seleccionar Nombre de la categoría y Porcentaje Tabla de datos Desactivar Mostrar tabla de datos
Paso 4 Colocar el gráfico Como objeto en: Hoja 2 Finalizar
8 ESTADÍSTICA J. Sánchez - Mª. S. Sánchez
1−EPR−VARIABLES ESTADÍSTICAS UNIDIMENSIONALES 9
10 ESTADÍSTICA J. Sánchez - Mª. S. Sánchez
Se pueden efectuar modificaciones sobre el gráfico obtenido como cambiar el color del fondo o de los sectores. Se hace igual que en el diagrama rectangular. El resultado es el siguiente:
1−EPR−VARIABLES ESTADÍSTICAS UNIDIMENSIONALES 11
2 La tabla siguiente refleja las causas de los 250 incendios forestales ocurridos en Andalucía durante el año 2002:
Causa % Intencionados 32’2 Negligencias 32’3
Naturales 3’4 Accidentales 12’0
Desconocidas 20’1 100
a) ¿De qué tipo es el carácter estadístico estudiado? b) Completar la tabla con las columnas de frecuencias absolutas y relativas. c) Construir un diagrama rectangular y un diagrama de sectores.
Se trata de un carácter cualitativo (atributo). Procediendo como en el ejercicio anterior obtenemos la siguiente tabla y los correspondientes diagramas:
12 ESTADÍSTICA J. Sánchez - Mª. S. Sánchez
3 La distribución del grupo sanguíneo de 500 alumnos de una Universidad viene dada en la tabla:
Grupo ni A 150 B 75
AB 25 0 250 N = 500
a) ¿De qué tipo es el carácter estadístico estudiado? b) Completar la tabla con las columnas de frecuencias relativas y porcen-tajes. c) Construir un diagrama rectangular y un diagrama de sectores.
Se trata de un carácter cualitativo (atributo). Procediendo como en los ejercicios anteriores obtenemos la siguiente tabla y los correspondientes diagramas:
1−EPR−VARIABLES ESTADÍSTICAS UNIDIMENSIONALES 13
4 Clasificados los 150 asistentes a un curso de Informática según el grado de acuerdo del desarrollo del mismo con sus expectativas personales, se obtiene
Grado %
total desacuerdo 4 poco acuerdo 20 de acuerdo 70
totalmente de acuerdo 6 100
a) ¿De qué tipo es el carácter estadístico estudiado? b) Completar la tabla con las columnas de frecuencias relativas y absolutas. c) Construir un pictograma de repetición y uno de amplificación.
Se trata de un carácter cualitativo (atributo) ordinal. Procediendo como en los ejercicios anteriores obtenemos la siguiente tabla y los correspondientes diagramas:
14 ESTADÍSTICA J. Sánchez - Mª. S. Sánchez
5 Realizada una encuesta a 120 familias para conocer su número de hijos, se obtuvieron los siguientes resultados:
xi 1 2 3 4 5 6 7 ni 25 40 29 15 6 3 2 N = 120
a) ¿De qué tipo es el carácter estadístico estudiado? b) Construir el diagrama de barras de frecuencias absolutas. c) Definir y representar la función de distribución. d) Determinar la moda y los cuartiles. e) Calcular la media, la varianza, la desviación típica y el coeficiente de variación.
Se trata de un carácter cuantitativo discreto; esto es, una variable estadística discreta.
DIAGRAMA DE BARRAS EN EXCEL El diagrama de barras de frecuencias absolutas se construye en EXCEL exactamente igual que el diagrama rectangular del carácter cualitativo de los ejercicios anteriores. Sólo hay que hacer una corrección en cuanto al ancho de las barras. Puesto que ahora no se trata de rectángulos, sino de barras con base un punto, la abscisa xi, lo más que nos permite Excel es estrechar los rectángulos aumentando la distancia entre los mismos. Para ello, una vez construido el diagrama rectangular, hacemos clic izquierdo sobre un rectángulo y a continuación clic derecho, apareciendo un cuadro de diálogo en el que seleccionaremos Formato de serie de datos. En Opciones, pondremos Ancho de rango al máximo: 500. Con esto conseguimos el efecto de barra.
1−EPR−VARIABLES ESTADÍSTICAS UNIDIMENSIONALES 15
Completando la tabla dada obtenemos:
FUNCIÓN DE DISTRIBUCIÓN DE UNA V.A.D. EN EXCEL La obtención de la gráfica de la función de distribución acumulativa, N:R → R, definida por N(x)=”Número de individuos tales que X ≤ x” es más laboriosa. Sabemos que es una función constante a trozos: una función escalonada. En nuestro caso tiene ocho “peldaños”:
Si x ∈ ]−∞, 1[ , N(x) = 0 si x ∈ [1, 2[ , N(x) = N1 = 25 si x ∈ [2, 3[ , N(x) = N2 = 65 si x ∈ [3, 4[ , N(x) = N3 = 94 si x ∈ [4, 5[ , N(x) = N4 = 109 si x ∈ [5, 6[ , N(x) = N5 = 115 si x ∈ [6, 7[ , N(x) = N6 = 118 si x ∈ [7, +∞[ , N(x) = N7 = 120 =N
16 ESTADÍSTICA J. Sánchez - Mª. S. Sánchez
Cada peldaño implica introducir los datos en series como se muestra a continuación. Podemos dibujar un trozo del primer peldaño como el segmento que une los puntos de coordenadas (-1, 0) y (1, 0) (1ª serie); el segundo peldaño es el segmento de extremos los puntos (1, 25) y (2, 25) (2ª serie); y así sucesivamente:
Paso 1 Tipo de gráfico Una vez introducidos los datos como en las columnas A y B, seleccionamos en Gráfico, Tipo de gráfico XY (Dispersión) Con puntos de datos conectados por líneas
1−EPR−VARIABLES ESTADÍSTICAS UNIDIMENSIONALES 17
Paso 2 Datos del gráfico Serie: definir desde Serie1 hasta Serie8 como se indica
18 ESTADÍSTICA J. Sánchez - Mª. S. Sánchez
Paso 3 Opciones de gráfico Actuar sobre el siguiente cuadro para Títulos, Ejes, etc.
Paso 4 Colocar el gráfico
Como objeto en: Hoja activa y Finalizar
Una vez construido el gráfico, haremos clic en cada peldaño para eliminar marcadores:
1−EPR−VARIABLES ESTADÍSTICAS UNIDIMENSIONALES 19
1
Si queremos enfatizar que los puntos de coordenadas (xi, Ni) pertenecen a la gráfica de N(x) y los puntos de coordenadas (xi, Ni-1) no pertenecen, podemos definir las series 9ª y 10ª, como se muestra a continuación. Y en Formato de series de datos, Tramas, ponemos en Línea Ninguna y en Marcadores seleccionamos el Estilo y Tamaño (esto también se puede hacer sin eliminar antes los marcadores y modificándolos uno a uno):
20 ESTADÍSTICA J. Sánchez - Mª. S. Sánchez
El resultado final es:
1−EPR−VARIABLES ESTADÍSTICAS UNIDIMENSIONALES 21
6 La distribución del peso, en Kg, de una muestra de 25 alumnos varones de un Instituto viene dada por la tabla:
Ii ]←, 55] ]55, 65] ]65, 75] ]75, 85] ]85, →[ ni 2 4 11 5 3 N = 25
a) ¿De qué tipo es el carácter estadístico estudiado? b) Construir el histograma de frecuencias absolutas y el polígono de frecuencias. c) Definir y representar la función de distribución. d) Determinar la moda y los cuartiles. e) Calcular la media, la varianza, la desviación típica y el coeficiente de variación.
Se trata de un carácter cuantitativo continuo; esto es, una variable estadística continua. Los datos están agrupados en intervalos o clases de igual amplitud (consideraremos las clases extremas con la misma amplitud que las adyacentes). Éstos son las modalidades o categorías.
HISTOGRAMAS EN EXCEL (Amplitudes iguales)
El histograma de frecuencias absolutas se construye en EXCEL exactamente igual que el diagrama rectangular del carácter cualitativo de los ejercicios anteriores. Sólo hay que hacer una corrección en cuanto al ancho de los rectángulos. Puesto que ahora no se trata de rectángulos separados, sino de rectángulos adyacentes, Excel nos permite ensanchar los rectángulos disminuyendo la distancia entre ellos. Para ello, una vez construido el diagrama rectangular, hacemos clic izquierdo sobre un rectángulo y a continuación clic derecho, apareciendo un cuadro de diálogo en el que seleccionaremos Formato de serie de datos. En Opciones, pondremos Ancho del rango al mínimo, 0. Con esto conseguimos el efecto deseado:
Completando la tabla dada obtenemos:
22 ESTADÍSTICA J. Sánchez - Mª. S. Sánchez
FUNCIÓN DE DISTRIBUCIÓN DE UNA V.A.C. EN EXCEL La obtención de la gráfica de la función de distribución acumulativa, N:R → R, definida por N(x)=”Número de individuos tales que X ≤ x” se consigue fácilmente en Excel. Para nuestro ejercicio se tiene que:
si x ∈ ]−∞, 45 ] , N(x) = 0 si x = 55 , N(55) = N1 = 2 si x = 65 , N(65) = N2 = 6 si x = 75 , N(75) = N3 = 17 si x = 85 , N(85) = N4 = 22 si x ∈ [95, +∞ [ , N(x) = N5 = 25 = N
Lo anterior proporciona los únicos puntos “exactos” de la gráfica: los de los intervalos ]−∞, 45] y [95, +∞ [, de ordenadas 0 y N = 25, respectivamente, y los puntos
1−EPR−VARIABLES ESTADÍSTICAS UNIDIMENSIONALES 23
de coordenadas (55, 2), (65, 6), (75, 17) y (85, 22). En los puntos interiores de los intervalos ]45,55[, ]55,65[, ]65,75[, ]75,85[ y ]85,95[ se supone que la función se comporta linealmente.
Esto nos lleva a introducir los datos en Excel como se indica a continuación.
En Tipo de gráfico escogeremos XY(Dispersión) Con puntos de datos conectados por líneas
Después de definir Rango de datos, etc., obtenemos el resultado siguiente:
24 ESTADÍSTICA J. Sánchez - Mª. S. Sánchez
1−EPR−VARIABLES ESTADÍSTICAS UNIDIMENSIONALES 25
7 La distribución de las edades de los alumnos de un Instituto viene dada por
Ii ]11, 14] ]14, 16] ]16, 20] ni 130 260 190 N = 580
a) ¿De qué tipo es el carácter estadístico estudiado? b) Construir el histograma de frecuencias absolutas y el polígono de frecuencias. c) Definir y representar la función de distribución. d) Determinar la moda y los cuartiles. e) Calcular la media, la varianza, la desviación típica y el coeficiente de variación.
Se trata de un carácter cuantitativo continuo; esto es, una variable estadística continua. Los datos están agrupados en intervalos o clases de distinta amplitud. Éstos son las modalidades o categorías.
HISTOGRAMAS EN EXCEL (Amplitudes desiguales)
Al ser ahora las amplitudes distintas, hay que hacer correcciones en las alturas de los rectángulos. Llamamos “densidad de frecuencia” del intervalo Ii al cociente hi = ni/ai de su frecuencias por su amplitud. Ésta ya podría ser la altura asignada al rectángulo correspondiente. No obstante, tomaremos por altura Hi = K · hi, con K=12/10. Con esto conseguimos que las áreas de los rectángulos sean proporcionales a las frecuencias correspondientes (además tenemos unas alturas “razonables”).
Si procedemos como en el ejercicio anterior los tres rectángulos tendrían la misma base. Por eso, recurrimos al artificio de dividir el rectángulo de base 3 en tres rectángulos de base 1 y altura H1, el de base 2 en dos de base 1 y altura H2 y el de base 4 en cuatro de altura H3. Después se actúa como en el ejercicio anterior, eligiendo Columnas en Tipo de Gráfico y reduciendo a 0 la separación entre columnas. El rango de datos se introduce como se ve a continuación, a la vez que se muestra el resultado.
La primera columna del rango de datos queda vacía, pero es necesaria. Ésta es normalmente la que contiene las modalidades.
Para que aparezcan los valores del eje X, los extremos de los intervalos, usamos el cuadro de Título en el eje de categorías (X).
Se muestran también media, varianza, etc.
26 ESTADÍSTICA J. Sánchez - Mª. S. Sánchez
FUNCIÓN DE DISTRIBUCIÓN DE UNA V.A.C. EN EXCEL (Amplitudes desiguales)
La obtención de la gráfica de la función de distribución acumulativa, N:R → R, definida por N(x)=”Número de individuos tales que X ≤ x” se consigue fácilmente en Excel. Para nuestro ejercicio se tiene que:
si x ∈ ]−∞, 11], N(x) = 0 si x = 14, N(14) = N1 = 130 si x = 16, N(16) = N2 = 390 si x ∈ [20, +∞[, N(x) = N3 = 580 = N
1−EPR−VARIABLES ESTADÍSTICAS UNIDIMENSIONALES 27
Esto proporciona los únicos puntos “exactos” de la gráfica: los de los intervalos ]−∞,11] y [20,+∞ [, de ordenadas 0 y N = 580, respectivamente, y los puntos de coordenadas (14, 130), (16, 390) y (20, 580). En los puntos interiores de los intervalos ]11,14[, ]14,16[ y ]16,20[ se supone que la función se comporta linealmente.
28 ESTADÍSTICA J. Sánchez - Mª. S. Sánchez
8 En una zona de interés geológico del interior de la Tierra, se ha medido la temperatura máxima diaria durante 43 días, obteniendo la siguiente distribución:
ºC [70, 75[ [75, 80[ [80, 85[ [85, 90[ [90, 95[ [95, 100[ ni 3 7 10 12 8 3 N = 43
Calcular: a) La temperatura más habitual. b) La temperatura media. c) La temperatura mediana. d) La temperatura máxima del 30% de las temperaturas más bajas. e) La temperatura mínima del 40% de las temperaturas más elevadas. f) La temperatura máxima y mínima del 50% central de las temperaturas. g) El número de días en que la temperatura es inferior a 92ºC. h) El número de días en que la temperatura es superior a 82ºC. i) El número de días en que la temperatura oscila entre 82ºC y 92ºC. j) El número de días en que la temperatura oscila entre 79ºC y 87ºC. k) La varianza, desviación típica y coeficiente de variación.
a) La temperatura más habitual es la Moda. La moda pertenece al intervalo de mayor densidad de frecuencia, que es el de mayor altura en el histograma. En este caso, como todos los intervalos tienen la misma amplitud, dicho intervalo modal es el de mayor frecuencia: Mo ∈ [85, 90[.
)(º,, C678567085542285aeMo 1
21
11i =+=⋅
++=⋅
∆+∆∆
+= −
1−EPR−VARIABLES ESTADÍSTICAS UNIDIMENSIONALES 29
b) La temperatura media es: )(º,, C29854353367
Nxn
X ii === ∑
c) Para los apartados c) hasta j) será útil tener presente la gráfica de la función de distribución acumulativa, N:R → R. Puesto que los intervalos vienen dados cerrados por la izquierda y abiertos por la derecha, se define por
N(x)=”Número de individuos tales que X < x”
Puesto que 521243
2N ,== , el intervalo mediano es [85, 90[, y se adopta la
mediana por interpolación:
)(º,, C6385520322052185a
NN
N2N
eMe i1ii
1i
1i =⋅−−
+=⋅−
−+=
−
−
−
d) Para hallar la temperatura máxima del 30% de las temperaturas más bajas
determinaremos el percentil 30. Puesto que 9121004330
100N30 ,=
⋅= , el intervalo
que lo contiene es [80, 85[, y se adopta P30 por interpolación:
30 ESTADÍSTICA J. Sánchez - Mª. S. Sánchez
)(º,, C4581510201091280a
NN
N100N30
eP i1ii
1i
1i30 =⋅−−
+=⋅−
−+=
−
−
−
e) La temperatura mínima del 40% de las temperaturas más elevadas viene dada
por el percentil 60. Puesto que 8251004360
100N60 ,=
⋅= , el intervalo que lo
contiene es [85, 90[, y se adopta P60 por interpolación:
)(º,, C4287520322082585a
NN
N100N60
eP i1ii
1i
1i60 =⋅−−
+=⋅−
−+=
−
−
−
f) Las temperaturas mínima y máxima del 50% central de las temperaturas vienen dadas por los cuartiles Q1 y Q3, respectivamente:
7510443
4N ,== →∈→ [,[ 8580Q1
)(º,, C38805102010751080a
NN
N4N
eQ i1ii
1i
1i1 =⋅−
−+=⋅
−
−+=
−
−
−
25324433
4N3 ,=
⋅= →∈→ [,[ 9590Q3
)(º,, C10905324032253290a
NN
N4N3
eQ i1ii
1i
1i3 =⋅−
−+=⋅
−
−+=
−
−
−
g) Determinar el número de días en que la temperatura es inferior a 92ºC es determinar el valor de N(92).
En general, si x ∈ Ii = [ei-1, ei[, de amplitud ai y de frecuencia absoluta
acumulada Ni, por semejanza de triángulos, se tiene que
)()()(
1ii
1ii1i
i
1ii
1i
1i exaNN
NxNaNN
exNxN
−−
−−
−
− −⋅−
+=⇒−
=−
−
En nuestro caso, 92 ∈ I5 = [90, 95[, luego
1−EPR−VARIABLES ESTADÍSTICAS UNIDIMENSIONALES 31
)(,,)()()( días23523322583292N
58
23292N
53240
90923292N
=+=⋅+=⇒=−
⇒−
=−
−
h) Para determinar el número de días en que la temperatura es superior a 82ºC,
determinaremos primero N(82) como antes.
En nuestro caso, 82 ∈ I5 = [80, 55[, luego
)()()()( días1441025101082N
510
21082N
51020
80821082N
=+=⋅+=⇒=−
⇒−
=−
−
Entonces, el número de días en que la temperatura es superior a 82 es:
)()( días29144382N43 =−=−
i) El número de días en que la temperatura oscila entre 82ºC y 92ºC es:
)(,,)()( días2211423582N92N =−=−
j) El número de días en que la temperatura oscila entre 79ºC y 87ºC es
)(,,)()( días198582479N87N =−=−
k) Para el cálculo de la varianza, desviación típica y coeficiente de variación emplearemos los datos obtenidos en la tabla
32 ESTADÍSTICA J. Sánchez - Mª. S. Sánchez
=
−=−= ∑ 2
22
2
435,3367
4375,314718)(X
Nxn iiσ 44,66
68,666,44 =+=σ
0783,029,8568,6.. ===
XVC σ
La desviación típica es el 7,83% de la media; la distribución es bastante
homogénea y la media es muy representativa.
1−EPR−VARIABLES ESTADÍSTICAS UNIDIMENSIONALES 33
9 Un grupo de investigación trabaja en tres yacimientos de hierro. Se desea estudiar la calidad del mineral extraído a partir de la siguiente información:
Yacimiento Núm. de muestras Riqueza media en Fe (%) Varianza A 20 70 6’2 B 25 78 24’4 C 55 80 7’3
a) ¿Qué yacimiento presenta mayor homogeneidad en cuanto a la riqueza del
mineral extraído? b) Calcular la riqueza media para el total de las muestras extraídas. Completando la tabla con los elementos necesarios, se tiene
a) Comparando los coeficientes de variación de Pearson, se tiene
C.V.(C)< C.V.(A)< C.V.(B);
es decir, el yacimiento C es el más homogéneo (su media es más representativa).
b) La riqueza media global es : 50771007750
Nxn
X ii ,=== ∑ .
34 ESTADÍSTICA J. Sánchez - Mª. S. Sánchez
10 El resultado de medir la viscosidad de 20 fluidos se recoge en la tabla:
Viscosidad 0−2 2−4 4−7 Núm. de fluidos 7 8 5
Calcular:
a) La viscosidad media. b) La viscosidad más frecuente. Representar el histograma. c) La viscosidad mediana. d) ¿Qué tanto por ciento de fluidos presentan una viscosidad mayor que 5?
a) La viscosidad media es: 925220558
Nxn
X ii ,,=== ∑
b) La viscosidad más frecuente es la Moda. La moda pertenece al intervalo de mayor densidad de frecuencia, que es el de mayor altura en el histograma; esto es, el de mayor altura (que no tiene por qué coincidir con el de mayor frecuencia): Mo ∈ ]2, 4].
3523502214332aeMo 1
21
11i ,, =+=⋅
++=⋅
∆+∆∆
+= −
1−EPR−VARIABLES ESTADÍSTICAS UNIDIMENSIONALES 35
c) Para determinar la viscosidad mediana y para el apartado siguiente es útil tener presente la gráfica de la función de distribución acumulativa, N:R → R. Puesto que los intervalos vienen dados abiertos por la izquierda y cerrados por la derecha, se define por N(x)=”Número de individuos tales que X ≤ x”
Puesto que 10220
2N
== , el intervalo mediano es ]2, 4], y se adopta la mediana
por interpolación: i 1
i 1 ii i 1
N N 10 72Me e a 2 2 2,75N N 15 7
−
−−
− −= + ⋅ = + ⋅ =
− −
d) Se tiene que N( 5 ) " Núm.indiv. tales que X 5"= ≤ . Por interpolación (como en el apartado g) del ejercicio anterior),
3 22
2 3
N NN( 5 ) N N( 5 ) 15 5 N( 5 ) 15 1,67 16,675 e a 1 3
−− −= ⇒ = ⇒ = + =
−
Número de días 20 16,67 3,33= − = 3,33Porcentaje 0,1667 16,67%20
= = =
36 ESTADÍSTICA J. Sánchez - Mª. S. Sánchez
11 El número de goles marcados por dos equipos rivales en cada uno de los 16 partidos de un campeonato de fútbol fueron: Equipo A: 2, 1, 0, 3, 1, 4, 2, 3, 3, 5, 1, 0, 0, 2, 1, 5. Equipo B: 3, 5, 1, 2, 1, 0, 0, 4, 1, 1, 1, 2, 3, 4, 5, 2.
a) ¿Qué equipo obtuvo mejor media de goles? b) Calcular la moda de ambas distribuciones. c) ¿Qué equipo jugó con mayor regularidad? d) Dibujar un diagrama Box−Whisker para cada distribución y compararlas.
Equipo A Equipo B xi ni ni xi ni xi
2 Ni xi ni ni xi ni xi2 Ni
0 3 0 0 3 0 2 0 0 2 1 4 4 4 7 1 5 5 5 7 2 3 6 12 10 2 3 6 12 10 3 3 9 27 13 3 2 6 18 12 4 1 4 16 14 4 2 8 32 14 5 2 10 50 16 5 2 10 50 16 N=16 33 109 N=16 35 117
a) 062521633X A ,== 18752
1635X B ,== BA XX <
b) Mo(A) = 1 Mo(B) = 1
c) %,,, 78780X
CV61558521633
16109
A
AAA
22A ===→=→=
−=
σσσ
%,,, 73730X
CV591527321635
16117
B
BBB
22
B ===→=→=
−=
σσσ
A la vista de los coeficientes de variación, los dos equipos han sido muy irregulares. d) Los elementos del diagrama Box-Whisker son
Q1 Q2=Me Q3 RIQ FE f1 f2 VAI VAS A 1 2 3 2 3 -2 6 0 5 B 1 2 3,5 2,5 3,75 -2,75 7,25 0 5
1−EPR−VARIABLES ESTADÍSTICAS UNIDIMENSIONALES 37
12 Un curso está dividido en cuatro grupos de los que tenemos la siguiente información respecto a las calificaciones en Filosofía:
Grupo Núm. de alumnos Nota media Varianza A nA = 30 AX = 6’0 1’00
B nB = 40 BX = 6’5 1’69
C nC = 50 CX = 5’0 0’81 D nD = 60 DX = 4’0 0’64 180
a) Calcular la nota media del curso completo. b) Calcular el coeficiente de variación de cada grupo. c) Ordenar los grupos según la homogeneidad en las calificaciones.
Completando la tabla con las columnas necesarias, tenemos:
a) La nota media del curso completo es:
175180930
Nxn
X ii ,=== ∑
b) Ver tabla.
c) )()()()( DCVBCVCCVACV =<<
38 ESTADÍSTICA J. Sánchez - Mª. S. Sánchez
13 Mediante una encuesta por muestreo en cuatro fincas agrícolas se obtienen los siguientes datos relativos a sus producciones de trigo, en Tm, y los correspondientes rendimientos, en Tm/Ha. Calcular un promedio adecuado de los rendimientos.
Finca Producción (Tm) Rendimientos (Tm/Ha) A 200 20 B 500 15 C 1000 32 D 700 27
Completamos la tabla del modo siguiente:
Si el rendimiento de la finca i-ésima es de xi Tm/Ha, para producir 1 Tm se requieren 1/xi Ha; si ha producido ni Tm, su extensión será de ni·(1/xi ) Ha. Entonces, la
extensión global de las cuatro fincas será ∑ ⋅i
i x1n . Asimismo, la extensión total es
igual a la producción total, N = 2400, por romedioPR.
1. En definitiva:
∑ ⋅=⋅i
i xn
romedioPRN 1
.1
O sea, el rendimiento promedio es la media armónica de los rendimientos,
ponderados por las producciones:
)/(,. HaTm8823
271700
3211000
151500
201200
2400
x1n
NHProm.R
ii
=⋅+⋅+⋅+⋅
=⋅
==∑
1−EPR−VARIABLES ESTADÍSTICAS UNIDIMENSIONALES 39
14 Un jugador de bolsa compra 15000 € de acciones al precio de 250 €/acción, y 8000 € de acciones al precio de 50 €/acción. ¿Cuál es el precio medio de las acciones que ha comprado? Organicemos los datos en una tabla:
Gasto (€) Precio unitario (€/Acción) Acciones/€ Acciones ni xi 1/xi ni·(1/ xi)
15000 250 1/250 15000·(1/250) 8000 50 1/50 8000·(1/50)
N=23000 Precio promedio 1/Promedio N·(1/Promedio) Si 1 acción cuesta xi euros, por 1 euro se pueden comprar 1/xi acciones, y por ni euros se podrán comprar ni·(1/ xi) . Entonces, por N euros a 1/Promedio acciones por euro, se pueden comprar N·(1/Promedio) acciones. Así:
∑ ⋅=⋅i
i x1n
romedioP1N
O sea, el precio promedio es la media armónica de los precios unitarios,
ponderados por los gastos:
)/(€, Acción5510422023000
5018000
250115000
23000
x1n
NHProm.
ii
==⋅+⋅
=⋅
==∑
15 Se recorre el 80% de un trayecto a una velocidad media de 60 Km/h, y el 20% restante a una velocidad media de 20 Km/h. ¿Cuál es la velocidad media en el recorrido total?
Espacio (Km)
Velocidad (Km/h)
Tiempo por Km (h/Km)
Tiempo (h)
ni xi 1/xi ni·(1/ xi) 80 60 1/60 80·(1/60) 20 20 1/20 20·(1/20)
N=100 Velocidad media 1/V. media N·(1/V. media) También aquí la velocidad media es la media armónica de las velocidades medias, ponderadas por los espacios:
)/(,. hkm8642
20120
60180
100
x1n
NTiempoEspacioHmediaV
ii
=⋅+⋅
=⋅
===∑
40 ESTADÍSTICA J. Sánchez - Mª. S. Sánchez
16 “El lado de un cuadrado que tiene igual área que el rectángulo de lados a y b es la media aritmética de los lados”. ¿Verdadero o falso? FALSO: El área de un rectángulo de lados a y b es AR = a·b. El área de un cuadrado de lado x es AC = x2. Si ambas áreas son iguales, entonces x2 = a·b, y x es la media geométrica de a y b:
baGx ⋅== 17 El precio de un determinado artículo subió cada uno de los años 1990, 1991 y 1992 un 5%, durante cada uno de los años 1993 y 1994 subió un 8%, y durante cada uno de los años 1995, 1996, 1997, 1998 y 1999 subió un 10%. ¿Cuál es el porcentaje medio de subida en el decenio? Si x es el precio del bien a principio de 1990, al final de este año su precio será 1,05·x, y al final de 1992 será (1,05)3·x. A final de 1994 será de (1,05)3·(1,08)2 x y a final de 1999 será (1,05)3·(1,08)2·(1,10)5·x.
Si llamamos P al porcentaje medio por año (y p = P/100 al tanto por 1 medio), al final de 1999 el bien costará (1+p)10·x. Entonces:
(1+p)10·x = (1,05)3·(1,08)2·(1,10)5·x ⇒ 1+p = 08081101081(1,05)10 523 ,),(),( ≈⋅⋅ luego p = 0,0808 el porcentaje promedio es del P = 8,08%. El modo más adecuado de efectuar los cálculos anteriores consiste en emplear logaritmos:
10101508120513p1101081(1,05)p1 10 523 ),ln(),ln(),ln()ln(),(),( ++
=+⇒⋅⋅=+
Es decir, ln(1+p) es la media aritmética de ln(1+pi), ponderada por el número de años. Resulta p = 0,0808, luego el porcentaje promedio es P = 100·p = 8,08 %.
1−EPR−VARIABLES ESTADÍSTICAS UNIDIMENSIONALES 41
18 Una balanza tiene sus dos brazos de longitudes desiguales: a y L− a. Un objeto de masa M se coloca en uno de los platos y, para equilibrar la balanza, hay que colocar pesas de masa m1 (≠ M) en el otro. Se repite la operación cambiando M de plato; entonces son necesarias pesas de masa m2 (≠ M) para alcanzar el equilibrio. ¿Cuál es la masa real del objeto?
Para que se dé el equilibrio, se han de cumplir las igualdades de la figura. Dividiendo miembro a miembro, se tiene:
2121
2
1
2
mmMMm
mM
aLMaLm
amaM ·
)·()·(
··
=⇒=⇒−−
=
Esto es, M es la media geométrica de m1 y m2:
21 mmM ·=