5/17/2018 Estad stica Inform tica - slidepdf.com
http://slidepdf.com/reader/full/estadistica-informatica 1/19
Estadística
Concepto: La estadística estudia los métodos científicos para recoger, organizar, resumir y analizar datos
de tal manera de que se pueda sacar conclusiones validas y tomar decisiones razonables a base de tal
análisis
Población o Universo: Es un grupo entero, materia de estudio
Muestra: Es una pequeña parte de la población o universo
Población Finita: es aquella que posee un número definido de los actuantes en el estudio.
Población Infinita: es aquella que no posee un número determinado de los intervinientes en el estudio
por eje: los posibles resultados de los sucesivos lanzamientos (caras o cruces) de una moneda.
Estadística Inductiva o Inferencial: Es aquella que permite inferir importantes conclusiones sobre la
población partiendo del análisis de la muestra.
Estadística Descriptiva o Deductiva: La parte de la estadística que a solo se preocupa de describir yanalizar un grupo dado sin sacar conclusiones sobre un grupo mayor
Variable: es un símbolo que se representa de la siguiente manera H, Y, X, Z, x, o, B. Y que puede tomar
prefijado de valores llamado dominio por eje:
El numero G de galones de agua en una lavadora.
Dominio: cualquier valor entre 0 galones y la capacidad de la lavadora.
Ejercicio:
a)
Numero B de libros de una estantería. Dominio: cualquier valor entre 0 libros y la capacidad delibros que caben en la estantería. (V.D)
b) Suma S de los puntos obtenidos al lanzar un par de dados. Dominio: cualquier valor en 2 y 12 que
la suma mínima y la suma máxima al sumar los valores del dado. (V.D)
c) Diámetro D de una esfera. Dominio: cualquier valor positivo. (V.C)
d) Países P de Europa. Dominio: cualquier país de Europa y el número máximo de países de Europa.
(V.D)
Variable Constante: Es aquellas que puede tomar un solo valor.
Eje: X=1, Y=2, B=-3
Variable Discreta: es todo lo contrario a la variable continua X.
Eje: el numero N de hijos en una familia puede ser 0, 1, 2, 3 pero no puede ser 2.5 o 3.842.
Variable Continua: Es aquella que puede tomar cualquier valor entre 2 valores dados
Eje: (-2, 3) X=1
Ejercicios
5/17/2018 Estad stica Inform tica - slidepdf.com
http://slidepdf.com/reader/full/estadistica-informatica 2/19
1) Indicar en el ejemplo anterior cuales son las variables continuas y cuáles son las variables
discretas.
Decir cual de los cuales de los siguientes datos son discretos y cuales continuos
a) Numero de acciones vendidas en un día en la bolsa de valores (V.D)
b) Temperatura medida en un observatorio cada media hora (V.C)c) Vida media de los tubos de televisión producidos por una fábrica (V.C)
d) Ingreso anuales de los profesores de enseñanza media (V.D)
e) Longitud de 1000 tornillos producidos en una empresa (V.C)
Redondeo de Datos
Redondear cada número con la precisión establecida
a) 48.6 unidad 49
b) 136.5 unidad 137
c) 2.484 centésima 2.48
d) 0.0435 milésima 0.044
e) 4.50001 unidad 5
f) 143.95 decima 144.0
g) 368 centésima 400
h) 24.448 millares 24.000
i) 5.56500 centésima 5.57
j) 5.556501 centésima 5.57
Notación Científica
5000000 =
0,00032 =32
Expresar los siguientes números sin usar potencia 10
a) 4.832 48230000
b) 8.4 0,0000084
c) 3.80 0,000380
d) 1.86 186.000
e) 300 30000000000
f) 70,000 0,0000000070000
Efectuar las operaciones
a) ()( ) =
b)
= =
c) (4.000.000)(0,0000000002) = ()(2x) = 8x
d)
=
()()
=
= 12x
Cifras significativas:
5/17/2018 Estad stica Inform tica - slidepdf.com
http://slidepdf.com/reader/full/estadistica-informatica 3/19
Son los dígitos que se emplean aparte de los ceros necesarios para localizar el punto decimal.
65.4=3c.s
45300= 5c.s
0,0018=2c.s
0.001800=4c.s
¿Cuántas cifras significativas hay en cada uno de estos números suponiendo que han sido redondeados
correctamente?
a) 149,8 in=4c.s
b) 149,80 in=5c.s
c) 0,00280 in=3c.s
d) 0,0028 in=2c.s
e) 1,06280 m=6c.s
f) 9 gr=1c.s
g) 9 casas=1c.s
h) 4,0*10ᵌ lb.=4c.s
i) 7,58400*10 5 dinas=6c.s
¿Cuántas c.s hay en estos números?
a) 2,54 cm=3c.s
b) 0,004500 yd= 4c.s
c) 3.510000 bm= 7c.s
d) 3,51 millones =3c.s
e) 10,0000100 pies= 9c.s
f) 378 personas=3c.s
g) 100,00 mi=5c.s
h) 4,50*10 3 km=3c.s
i) 500,8*10 5 kg=4c.s
Distribuciones de frecuencia:
Fila de datos: una fila de datos consiste en datos recogidos que no han sido organizados numéricamente.
Eje: alturas de 100 estudiantes por letra alfabética.
Ordenación; es una conjunto de datos numéricos en orden creciente o decreciente.
Rango (a): es la diferencia entre el mayor valor de una serie y el valor menor.
Eje: 62 a= valor mayor- valor menor.
x menor:50 a:51 50, 70, 90, 101.
x mayor: 101
5/17/2018 Estad stica Inform tica - slidepdf.com
http://slidepdf.com/reader/full/estadistica-informatica 4/19
Frecuencia de clases (f): es el número de veces que se repite el valor.
Eje: 1,2,2,3,3,3,4,5,6,6,7,8,9
x f1 12 23 34 15 16 27 18 19 1
Intervalo de clase: un intervalo de clase es un símbolo que define una clase por eje: 60; 62
Límites de clases: son extremos de u intervalo de clases donde el valor mayor corresponde al límite
superior y el valor menor al límite inferior.
Límite superior: 62; límite inferior: 60.
Fronteras de clases: para calcular las fronteras de clases tomamos los límites y hacemos lo siguiente:
Frontera de clase superior (f.s): L.s+0.50
Frontera de clase inferior (f.i): Ll.i-0.50
Intervalo de clase abierto.- es aquel que teóricamente carece de límite superior o inferior indicado.
Eje: si nos referimos de las edades de las personas la clase 65 años o más corresponden a un intervalo de
clase abierto.
Ejercicios encuentre la frontera de clase del siguiente intervalo:
75-79
L.s=79 L.i=75
f.s=L.s+0.5 f.s=L.i-0.50
f.s=79+0.50 f.s=75-0.50
f.s=79.50 f.s=74.50
Tamaño o anchura de un intervalo (c): el tamaño o anchura de un intervalo clase es la diferencia entre las
fronteras superior o inferior.
f.s: 62.50 f.i:59.50
c= f.s-f.i
c= 62.50-59.50
5/17/2018 Estad stica Inform tica - slidepdf.com
http://slidepdf.com/reader/full/estadistica-informatica 5/19
c= 3
Marca de clase (Xm): corresponde al promedio entre los límites superior o inferior de clase.
612
6062
2
.
Lisl Xm
Ejercicio: con los datos de la siguiente tabla encontrar e indicar lo siguiente: límites de clase, fronteras de
clase, anchura de intervalos, marca de clase:
edad f L.s L.i f.s f.i c Xm18-19 121 19 18 19.5 17.5 2 18.520-24 2441 24 20 24.5 19.5 5 2225-29 5930 29 25 29.5 24.5 5 2730-34 6587 34 30 34.5 29.5 5 3235-44 11788 44 35 44.5 34.5 10 39.545-54 9049 54 45 54.5 44.5 10 49.555-64 874 64 55 64.5 65.5 10 59.565-74 5786 74 65 74.5 64.5 10 69.5
Reglas generales para formar distribuciones de frecuencia:
1) Determinar el mayor y el menor valor para calcular el rango.
x mayor; x menor
a=x mayor- x menor.
2) Numero de intervalos 1º c
ain 20º5 in
3) Para formar el primer valor del intervalo vamos a utilizar el valor mayor que va a corresponder al
límite superior y el límite inferior va hacer el resultado de restarle al límite superior el ancho (c) y
sumarle la unidad.
1. cs L Li Y los otros intervalos se obtienenc Li
c Ls
4) Se determina las frecuencias para cada intervalo.
Ejercicio:
Trabajar los siguientes datos y formas la tabla de distribución de frecuencia:
Calificaciones finales de matemáticas de 80 estudiantes.
).(6
816
421º
425395
redondeanosec
c
ain
a
90.
1695.
1..
i L
i L
cs Li L
90 62 88 76 93
93 71 59 85 7562 95 78 63 7277 69 74 68 6095 60 79 83 7185 76 65 71 7578 62 76 53 7463 76 75 85 77
5/17/2018 Estad stica Inform tica - slidepdf.com
http://slidepdf.com/reader/full/estadistica-informatica 6/19
intervalo f f.s f.i Xm95-90 5 95.5 89.5 92.589-84 4 89.5 83.5 86.583-78 4 83.5 77.5 80.577-72 12 77.5 71.5 74.571-66 5 71.5 65.5 68.5
65-60 8 65.5 59.5 62.559-54 1 59.5 53.5 56.553-48 1 53.5 47.5 50.5
Con los siguientes datos que
recogen los pesos de 40 estudiantes varones de la U. construir una distribución de frecuencia.
a=199-125
a=74
c=9
Ni= 919
74
Li=Ls-C+1
Li=199-9+1
Li=191
Representación gráfica de distribuciones es de frecuencia.
Histograma:
En un gráfico de barras que consiste en un conjunto de rectángulos con:
a) Base en el eje “x” centro en las marcas de clase y longitudes iguales a los tamaños de los
intervalos de clase
b) Área proporciones a las frecuencias de clase.
alturas f Xm
138 164 150 132 144 125 149 157146 158 140 147 136 148 152 144168 126 138 176 163 199 154 165
146 173 142 147 135 153 140 135
161 145 135 142 150 156 145 128
intervalo f fs fi Xm199-191 1 199.5 190.5 195190-182 0 190.5 181.5 186181-173 2 181.5 172.5 177172-164 3 172.5 163.5 168163-155 5 163.5 154.5 159154-146 11 154.5 145.5 150145-137 10 145.5 136.5 141136-128 6 136.5 127.5 132127-119 2 127.5 118.5 123
5/17/2018 Estad stica Inform tica - slidepdf.com
http://slidepdf.com/reader/full/estadistica-informatica 7/19
60-62 5 6163-65 18 6466-68 42 6769-71 27 7072-74 8 73total 100
Polígono de frecuencia:
Es un gráfico lineal puede obtenerse conectado los puntos medios de las partes superiores de los
rectángulos de histograma.
Formar un histograma y un polígono de frecuencia con los datos que obtuvieron con la tabla anterior.
Polígono de frecuencia:
Histograma:
5/17/2018 Estad stica Inform tica - slidepdf.com
http://slidepdf.com/reader/full/estadistica-informatica 8/19
Distribuciones de frecuencia relativas (fr):
La frecuencia relativa de una distribución es su frecuencia dividida por la frecuencia total de todos los
casos.
Frecuencia relativa porcentual (fr%):
Corresponde a la frecuencia multiplicada por 100.
altura # de estudiantes Fr. Fr%60-62 5 0.05 5%63-65 18 0.18 18%66-68 42 0.42 42%69-71 27 0.27 27%72-74 8 0.08 8%
Numero=100 1 100%
Ejercicio:
intervalo f fr fr%199-191 1 0.025 2.5
190-182 0 00 0181-173 2 0.05 5172-164 3 0.075 7.5163-155 5 0.125 12.5154-146 11 0.275 27.5145-137 10 0.25 25136-128 6 0.15 15127-119 2 0.05 5
1 100%
Distribuciones de frecuencia acumuladas u ojivas:
La frecuencia acumulada (fac) corresponde a la frecuencia total de todos los valores menores que la
frontera de clase superior de un intervalo de clase dado:
Altura fr far60-62 5 563-65 18 2366-68 42 6569-71 27 9272-74 8 100
N=100
5/17/2018 Estad stica Inform tica - slidepdf.com
http://slidepdf.com/reader/full/estadistica-informatica 9/19
Ojiva “menor que”
Es una grafico que recoge las frecuencias acumuladas por debajo de cualquier de las fronteras de clase
superior también se la llama polígono de frecuencia acumulada.
intervalo f fr fr% fac199-191 1 0.025 2.5 40190-182 0 00 0 39181-173 2 0.05 5 39172-164 3 0.075 7.5 37163-155 5 0.125 12.5 34154-146 11 0.275 27.5 29145-137 10 0.25 25 18136-128 6 0.15 15 8127-119 2 0.05 5 2
1
Medidas de tendencia central:
Son aquellos valores, promedios hacia los cuales tienden acercarse o alejarse los valores que integran
una serie la media aritmética, mediana, moda y media geométrica. Son conocidos como las medidas más
comunes, cada una de las cuales. Tiene sus propiedades y aplicaciones correspondientes.
Media Aritmética x :
Se la conoce también como termino medio y corresponde a la suma de varios valores dividida por el
número de ellos.
Constituye una medida de concentración siendo también el valor mas representativo de una seria.
Ejemplo: las notas de un estudiante en 6 materias fueron:
84, 91, 72, 68, 87, 78.
Hallar la media aritmética:
Fi Fac
59.5 062.5 565.5 2368.5 6571.5 9273.5 100
5/17/2018 Estad stica Inform tica - slidepdf.com
http://slidepdf.com/reader/full/estadistica-informatica 10/19
806
788768729184
N
x x
10 medidas de diámetro de una cilandro fueron anotadas por un científico como:
3.88, 4.09, 3.92, 3.97, 4.02, 3.95, 4.03, 3.92, 3.98, 4.06.
982.310
06.498.392.303.495.302.497.392.309.488.3
N
x x
Media Aritmética de una serie estática de frecuencia:
Para obtener la media aritmética de una serie estática de frecuencia multiplicamos la variable por la
frecuencia respectiva luego encontramos la suma de todos estos productos y dividimos por el número
de casos.
N
xf x
Las calificaciones finales en 4 asignaturas fueron 82, 86, 90, 70. Si los respectivos créditos otorgados a
esos cursos son 3, 5, 3, 1, determinar una calificación media apropiada.
66.8412
1)70()3(90)5(86)3(82
N
fx x
De entre 100 números 20 son 4, 40 son 5, 30 son 6 y los restantes. Hallar su medida aritmética.
3.5
100
)7(7)30(6)40(5)20(4
x
Media aritmética de una serie estadística de intervalo de frecuencia:
Primero método:
1) Obtenemos los puntos medios de todas las series.
2) Multiplicamos las frecuencias por los puntos medios respectivos.
3) Sumamos los productos de las frecuencias por los puntos medios.
4) Dividimos la suma anteriormente obtenida por el número de elementos de la serie.
Ejemplo:
45.67100
6745
N
fxm x
Altura (in) F xm Fxm60-62 5 61 30563-65 18 64 115266-68 42 67 281469-71 27 70 189072-74 8 73 584
N=100 Total:6745
5/17/2018 Estad stica Inform tica - slidepdf.com
http://slidepdf.com/reader/full/estadistica-informatica 11/19
Hallar:
125.14740
5885
N
fxm x
Segundo Método:
1) determinar los puntos medios.
2) Suponer un punto medio de preferencia el que tenga mayor frecuencia entre “Xms”
3) Calcular el ancho del intervalo
4) Establecer las diferencias (u) entre los puntos medios y el punto medio supuesto. Dividiendo
luego cada diferencia por el ancho del intervalo.c
Xms Xmu
5) Multiplicamos algebraicamente cada una de las frecuencias por su correspondiente diferencia.
6) c N
fu Xms x *
Eje:
975.146
025.2149
9
40
9149
x
x
x
Hallar la media aritmética por el primero método.
45.67
45.067
3*
100
1567
x
x
x
Peso (lb) f xm Fxm118-126 3 122 366127-135 5 131 655136-144 9 140 1260
145-153 12 149 1788154-162 5 158 790163-171 4 167 668172-180 2 179 358
N=40 Total:5885
Peso (lb) f xm Fxm Xms c u Fu118-126 3 122 366 9 -3 -9
127-135 5 131 655 9 -2 -10136-144 9 140 1260 9 -1 -9145-153 12 149 1788 149 9 0 0154-162 5 158 790 9 1 5163-171 4 167 668 9 2 8172-180 2 179 358 9 3 6
N=40 Total:5885 Total fu -9
Altura (in) F xm Fxm xms c u Fu60-62 5 61 305 3 -2 -10
63-65 18 64 1152 3 -1 -1866-68 42 67 2814 67 3 0 069-71 27 70 1890 3 1 2772-74 8 73 584 3 2 16
N=100 Total:6745 15
5/17/2018 Estad stica Inform tica - slidepdf.com
http://slidepdf.com/reader/full/estadistica-informatica 12/19
La siguiente tabla recoge una muestra de 40 notas en un examen de ámbito nacional. Formar la columna
de intervalos la madia aritmética por ambos métodos.
71 67 55 64 82 66 74 58 79 6178 46 84 93 72 54 78 86 48 5267 95 70 43 70 73 57 64 60 83
73 40 78 70 64 86 76 62 95 66
a=95-40 Ni= 717
43 Li=Ls-c+1
a=43 Li=95-7+1=89
intervalo f fs fi xm fxm xms c u Fu95-89 3 95.5 88.5 92 276 7 4 1288-82 5 88.5 81.5 85 425 7 3 1581-75 5 81.5 74.5 78 390 7 2 1074-68 8 74.5 67.5 71 568 7 1 867-61 9 67.5 60.5 64 576 64 7 0 060-54 5 60.5 53.5 57 285 7 -1 -553-47 2 53.5 46.5 50 100 7 -2 -446-40 3 46.5 39.5 43 129 7 -3 -9
Total=40 Tota=2749 N=27
72.6840
2749 x 725.68725.4647*
40
2764 x
5/17/2018 Estad stica Inform tica - slidepdf.com
http://slidepdf.com/reader/full/estadistica-informatica 13/19
La mediana (mdn):
La mediana de un conjunto de valores de números ordenados en magnitud es el valor central o la media
de los dos valores centrales.
Ejemplo:
El conjunto de números 3, 4, 4, 5, 6, 8, 8, 10 tiene media igual a=6.
Para números impares la media es el valor central.
5, 5, 7, 9, 11, 12, 15, 18 para valores pares la mediana es la media de los valores centrales.
)(102
20
2
119mdn x
Mediana de datos agrupados:
c fmediana
ef N
f i Mdc
2
Posición de la mediana =
56.278
1016
185.325.269
5.322
65
2
mdn
mdn
N
Hallar la mediana de 40 estudiantes utilizando los datos de la tabla.
75.146
912
17205.144
202
40
2
mdn
mdn
N
salarios # de empleados Fac250-259 8 8260-269 10 18270-279 16 34280-289 14 48290-299 10 58300-309 5 63310-319 2 65
N=65
Peso(lb) F Fac118-126 3 3127-135 5 8136-144 9 17145-153 12 29154-162 5 34163-171 4 38172-180 2 40
N=40
5/17/2018 Estad stica Inform tica - slidepdf.com
http://slidepdf.com/reader/full/estadistica-informatica 14/19
LA Moda (Mo):
Es un conjunto de números es el valor que ocurre con mayor frecuencia, es decir, el valor más frecuente
la moda no puede existir e incluso no ser única.
Encuentre la moda:
a) El conjunto 2, 2, 5, 7, 9, 9, 9, 10, 10, 11, 12 y 18. Unimodal.
b) El conjunto 3, 5, 8, 10, 12, 15 y 16. No tiene.
c) El conjunto 2, 3, 4, 4, 4, 5, 5, 7, 7, 7 y 9. Multimodal.
Moda de datos agrupados:
cd d
d f i Mo
21
1 fi=frontera inferior, 1d y 2d diferentes.
Ejercicio:
56.278
1016
65.269
11516
61016
2
1
Mo
Mo
d
d
Ejercicio 2:
salarios # de empleados250-259 8260-269 10270-279 16280-289 14290-299 10300-309 5310-319 2
N=65
Peso(lb) F118-126 3127-135 5136-144 9145-153 12154-162 5
1 4 7 . 5
5/17/2018 Estad stica Inform tica - slidepdf.com
http://slidepdf.com/reader/full/estadistica-informatica 15/19
5.147
973
35.144
7512
3912
2
1
Mo
Mo
d
d
La siguientes tabla muestra la distribución máxima en toneladas cortas (1 tonelada corta es igual a
2000lb) que soportan los cables producidos en ciertas fabricas determine la mediana y la moda.
Carga máxima (tonelada cortas) n. de cables Fac9.3-9.7 2 29.8-10.2 5 710.3-10.7 12 1910.8-11.2 17 3611.3-11.7 14 5011.8-12.2 6 56
12.3-12.7 3 5912.8-13.2 1 60
N=60
20.11
4.117
19303.10
30
60
2
Mdn
Mdn
N
20.11
4.135
53.10
41417
51217
2
1
Mo
Mo
d
d
Cuartiles:
Posiciones:
33.133
40
3
202
40
2
104
40
4
3
2
1
N P
N P
N P
163-171 4172-180 2
Peso(lb) F Fac118-126 3 3127-135 5 8136-144 9 17145-153 12 29154-162 5 34163-171 4 38172-180 2 40
N=40
5/17/2018 Estad stica Inform tica - slidepdf.com
http://slidepdf.com/reader/full/estadistica-informatica 16/19
83.14099
833.135.1353
75.146912
17205.1442
5.13799
8105.1354
3
2
1
c f
fac N
f iQ
c f
fac N
f iQ
c f
fac N
f iQ
Deciles:
10
9;
10
8;
10
7;
10
6;
10
5;
10
4;
10
3;
10
2;
10
987654321
N P
N P
N P
N P
N P
N P
N P
N P
N P
c f
facP fi D
1
Peso(lb) F Fac118-126 3 3127-135 5 8136-144 9 17145-153 12 29154-162 5 34163-171 4 38
172-180 2 40N=40
5/17/2018 Estad stica Inform tica - slidepdf.com
http://slidepdf.com/reader/full/estadistica-informatica 17/19
3610
360
10
9
3210320
108
2810
280
10
7
2410
240
10
6
2010
200
10
5
1610
160
10
4
1210
120
10
3
810
80
10
2
410
40
10
9
8
7
6
5
4
3
2
1
N P
N P
N P
N P
N P
N P
N
P
N P
N P
3.12895
345.126
1
D
5.14399
8165.1354
D
5.1359
9
885.1352
D 5.1469
12
17205.1445
D
5.13999
8125.135
3
D 5.1499
12
17245.144
6
D
75.152912
17285.144
7
D 9.1589
5
29325.153
8
D
16794
34365.162
6
D
Centiles o percentiles: divide una serie en 100 partes iguales:
100
75;
100
50;
100
35;
100
20;
100
107550352010
N P
N P
N P
N P
N P
c f
facP fiC
5/17/2018 Estad stica Inform tica - slidepdf.com
http://slidepdf.com/reader/full/estadistica-informatica 18/19
75100
7500
100
75
50100
5000
100
50
14100
1400
100
35
8100
800
100
20
4100
400
100
10
75
50
35
20
10
N P
N P
N P
N P
N P
3.12895
345.126
10
C 5.1359
9
885.135
20
C
5.14199
8145.135
35
C 75.1469
12
17205.144
50
C
3.15595
29305.153
75
C 1679
4
34365.162
90
C
Peso(lb) F Fac118-126 3 3127-135 5 8136-144 9 17145-153 12 29154-162 5 34
163-171 4 38172-180 2 40
N=40
Altura (in) F Fac60-62 5 563-65 18 2366-68 42 6569-71 27 9272-74 8 100
N=100
5/17/2018 Estad stica Inform tica - slidepdf.com
http://slidepdf.com/reader/full/estadistica-informatica 19/19
90100
9000
100
90
75100
7500
100
75
50100
5000
100
50
35100
3500
100
35
20100
2000
100
20
4100
400
100
10
90
75
50
35
20
10
N P
N P
N P
N
P
N P
N P
3.633
18
5105.6210
C 653
18
5205.6220
C
35.66342
23355.6535
C 42.673
42
23505.6550
C
6.69327
65755.6875
C 27.743
27
65905.7190
C