Date post: | 03-Jul-2015 |
Category: |
Science |
Upload: | rocio-meza |
View: | 250 times |
Download: | 2 times |
Estadıstica descriptiva: medidas numericas.
Rocıo Meza MorenoUniversidad Autonoma Metropolitana, Iztapalapa
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Cuando se estudia un conjunto de datos es importantedeterminar las siguientes caracterısticas:
1 Valor central: es un valor representativo que indica lalocalizacion de la mitad del conjunto de los datos.
2 Variacion: medida de que tanto varıan los datos enrtre sı.
3 Distribucion: forma en que se distribuyen los datos(simetricamente o con sesgo).
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Cuando se estudia un conjunto de datos es importantedeterminar las siguientes caracterısticas:
1 Valor central: es un valor representativo que indica lalocalizacion de la mitad del conjunto de los datos.
2 Variacion: medida de que tanto varıan los datos enrtre sı.
3 Distribucion: forma en que se distribuyen los datos(simetricamente o con sesgo).
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Cuando se estudia un conjunto de datos es importantedeterminar las siguientes caracterısticas:
1 Valor central: es un valor representativo que indica lalocalizacion de la mitad del conjunto de los datos.
2 Variacion: medida de que tanto varıan los datos enrtre sı.
3 Distribucion: forma en que se distribuyen los datos(simetricamente o con sesgo).
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Cuando se estudia un conjunto de datos es importantedeterminar las siguientes caracterısticas:
1 Valor central: es un valor representativo que indica lalocalizacion de la mitad del conjunto de los datos.
2 Variacion: medida de que tanto varıan los datos enrtre sı.
3 Distribucion: forma en que se distribuyen los datos(simetricamente o con sesgo).
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Definiciones
Un parametro es una medicion numerica que describealguna caracterıstica de una poblacion.
Un estadıstico es una medicion numerica que describealguna caracterıstica de una muestra.
En estadıstica inferencial, al estadıstico muestral se le conocecomo el estimador del correspondiente parametro poblacional.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Definiciones
Un parametro es una medicion numerica que describealguna caracterıstica de una poblacion.
Un estadıstico es una medicion numerica que describealguna caracterıstica de una muestra.
En estadıstica inferencial, al estadıstico muestral se le conocecomo el estimador del correspondiente parametro poblacional.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Definiciones
Un parametro es una medicion numerica que describealguna caracterıstica de una poblacion.
Un estadıstico es una medicion numerica que describealguna caracterıstica de una muestra.
En estadıstica inferencial, al estadıstico muestral se le conocecomo el estimador del correspondiente parametro poblacional.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Ejemplos
1 Segun datos del INEGI, en 2010 la poblacion de Mexicoascendıa a 112,336,538 de habitantes, 54,855,231 hombres y57,481,307 mujeres. Esto significa que en 2010, el 51 % dela poblacion eran mujeres. La cifra del 51 % es unparametro pues se obtuvo a partir de informacion detodos los habitantes del paıs.
2 Con base en una muestra de 877 ejecutivos encuestados, seencontro que el 45 % de ellos no contratarıa a alguien conun error ortografico en su solicitud de empleo. Esta cifra del45 % es un estadıstico, ya que esta basada en una muestray no en la poblacion completa de todos los ejecutivos.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Ejemplos
1 Segun datos del INEGI, en 2010 la poblacion de Mexicoascendıa a 112,336,538 de habitantes, 54,855,231 hombres y57,481,307 mujeres. Esto significa que en 2010, el 51 % dela poblacion eran mujeres. La cifra del 51 % es unparametro pues se obtuvo a partir de informacion detodos los habitantes del paıs.
2 Con base en una muestra de 877 ejecutivos encuestados, seencontro que el 45 % de ellos no contratarıa a alguien conun error ortografico en su solicitud de empleo. Esta cifra del45 % es un estadıstico, ya que esta basada en una muestray no en la poblacion completa de todos los ejecutivos.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Medidas de tendencia central
Una medida de tendencia central es un valor que seencuentra al centro o a la mitad de un conjunto de datos.
Son medidas de tendencia central la media, la mediana, lamoda y la mitad del rango.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Medidas de tendencia central
Una medida de tendencia central es un valor que seencuentra al centro o a la mitad de un conjunto de datos.
Son medidas de tendencia central la media, la mediana, lamoda y la mitad del rango.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Media (aritmetica)
Es la medida de tendencia central que se calcula al sumar losvalores de la totalidad de los datos y dividir el resultado entrela cantidad de estos.
La media, tambien conocida como promedio, es la medidanumerica mas importante para describir datos.
Cuando la media se calcula a partir de los datos de unamuestra se denota por x (estadıstico) y cuando se calcula apartir de los datos de una poblacion se denota por µ(parametro).
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Media (aritmetica)
Es la medida de tendencia central que se calcula al sumar losvalores de la totalidad de los datos y dividir el resultado entrela cantidad de estos.
La media, tambien conocida como promedio, es la medidanumerica mas importante para describir datos.
Cuando la media se calcula a partir de los datos de unamuestra se denota por x (estadıstico) y cuando se calcula apartir de los datos de una poblacion se denota por µ(parametro).
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Media (aritmetica)
Es la medida de tendencia central que se calcula al sumar losvalores de la totalidad de los datos y dividir el resultado entrela cantidad de estos.
La media, tambien conocida como promedio, es la medidanumerica mas importante para describir datos.
Cuando la media se calcula a partir de los datos de unamuestra se denota por x (estadıstico) y cuando se calcula apartir de los datos de una poblacion se denota por µ(parametro).
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
En sımbolos, si x1, x2, x3, . . . , xn son los valores de lasobservaciones de una muestra, entonces
x =
n∑i=1
xi
n=x1 + x2 + · · ·+ xn
n
Y si x1, x2, x3, . . . , xN son los valores de las observaciones deuna poblacion, entonces
µ =
N∑i=1
xi
N=x1 + x2 + · · ·+ xN
N
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
En sımbolos, si x1, x2, x3, . . . , xn son los valores de lasobservaciones de una muestra, entonces
x =
n∑i=1
xi
n=x1 + x2 + · · ·+ xn
n
Y si x1, x2, x3, . . . , xN son los valores de las observaciones deuna poblacion, entonces
µ =
N∑i=1
xi
N=x1 + x2 + · · ·+ xN
N
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Ejemplo
Una asociacion recaba informacion sobre los sueldos anualesiniciales de los recien egresados de universidades de acuerdo consu especialidad. A continuacion se presentan muestras de lossueldos anuales iniciales de especialistas en marketing y encontadurıa (los datos estan en miles de dolares):
Egresados de marketing:
34.2 45.0 39.5 28.4 37.7 35.8 30.6 35.2 34.2 42.4
Egresados de contadurıa:
33.5 57.1 49.7 40.2 44.2 45.2 47.8 38.0 53.9 41.141.7 40.8 55.5 43.5 49.1 49.9
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Ejemplo
Una asociacion recaba informacion sobre los sueldos anualesiniciales de los recien egresados de universidades de acuerdo consu especialidad. A continuacion se presentan muestras de lossueldos anuales iniciales de especialistas en marketing y encontadurıa (los datos estan en miles de dolares):
Egresados de marketing:
34.2 45.0 39.5 28.4 37.7 35.8 30.6 35.2 34.2 42.4
Egresados de contadurıa:
33.5 57.1 49.7 40.2 44.2 45.2 47.8 38.0 53.9 41.141.7 40.8 55.5 43.5 49.1 49.9
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
El sueldo promedio de los egresados en marketing es:
xm =34.2 + 45.0 + 39.5 + · · ·+ 42.4
10
= 36.3
Y el sueldo promedio de los egresados en contadurıa es:
xc =33.5 + 57.1 + 49.7 + · · ·+ 49.9
16= 45.7
Se observa que el sueldo inicial promedio de un egresado encontadurıa supera al sueldo inicial promedio de un egresado enmarketing por
45, 700− 36300 = 9400
es decir, por aproximadamente 9000 dolares.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
El sueldo promedio de los egresados en marketing es:
xm =34.2 + 45.0 + 39.5 + · · ·+ 42.4
10= 36.3
Y el sueldo promedio de los egresados en contadurıa es:
xc =33.5 + 57.1 + 49.7 + · · ·+ 49.9
16= 45.7
Se observa que el sueldo inicial promedio de un egresado encontadurıa supera al sueldo inicial promedio de un egresado enmarketing por
45, 700− 36300 = 9400
es decir, por aproximadamente 9000 dolares.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
El sueldo promedio de los egresados en marketing es:
xm =34.2 + 45.0 + 39.5 + · · ·+ 42.4
10= 36.3
Y el sueldo promedio de los egresados en contadurıa es:
xc =33.5 + 57.1 + 49.7 + · · ·+ 49.9
16
= 45.7
Se observa que el sueldo inicial promedio de un egresado encontadurıa supera al sueldo inicial promedio de un egresado enmarketing por
45, 700− 36300 = 9400
es decir, por aproximadamente 9000 dolares.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
El sueldo promedio de los egresados en marketing es:
xm =34.2 + 45.0 + 39.5 + · · ·+ 42.4
10= 36.3
Y el sueldo promedio de los egresados en contadurıa es:
xc =33.5 + 57.1 + 49.7 + · · ·+ 49.9
16= 45.7
Se observa que el sueldo inicial promedio de un egresado encontadurıa supera al sueldo inicial promedio de un egresado enmarketing por
45, 700− 36300 = 9400
es decir, por aproximadamente 9000 dolares.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
El sueldo promedio de los egresados en marketing es:
xm =34.2 + 45.0 + 39.5 + · · ·+ 42.4
10= 36.3
Y el sueldo promedio de los egresados en contadurıa es:
xc =33.5 + 57.1 + 49.7 + · · ·+ 49.9
16= 45.7
Se observa que el sueldo inicial promedio de un egresado encontadurıa supera al sueldo inicial promedio de un egresado enmarketing por
45, 700− 36300 = 9400
es decir, por aproximadamente 9000 dolares.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Propiedades de la media
1 La media puede calcularse para conjuntos de datos connivel de medicion de intervalo o de razon.
2 Todos los datos se toman en cuenta en el calculo de lamedia.
3 La suma de las desviaciones de cada valor de la media escero, en sımbolos,
n∑i=1
(xi − x) = 0
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Propiedades de la media
1 La media puede calcularse para conjuntos de datos connivel de medicion de intervalo o de razon.
2 Todos los datos se toman en cuenta en el calculo de lamedia.
3 La suma de las desviaciones de cada valor de la media escero, en sımbolos,
n∑i=1
(xi − x) = 0
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Propiedades de la media
1 La media puede calcularse para conjuntos de datos connivel de medicion de intervalo o de razon.
2 Todos los datos se toman en cuenta en el calculo de lamedia.
3 La suma de las desviaciones de cada valor de la media escero,
en sımbolos,
n∑i=1
(xi − x) = 0
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Propiedades de la media
1 La media puede calcularse para conjuntos de datos connivel de medicion de intervalo o de razon.
2 Todos los datos se toman en cuenta en el calculo de lamedia.
3 La suma de las desviaciones de cada valor de la media escero, en sımbolos,
n∑i=1
(xi − x) = 0
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Por ejemplo, la media de 6, 4, 3, 9 y 7 es
x = (6 + 4 + 3 + 9 + 7)/5 = 5.8
Ası que la suma de las desviaciones es:
(6− 5.8) + (4− 5.8) + (3− 5.8) + (9− 5.8) + (7− 5.8) =
= 0.2− 1.8− 2.8 + 3.2 + 1.2 = 0
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Por ejemplo, la media de 6, 4, 3, 9 y 7 es
x = (6 + 4 + 3 + 9 + 7)/5 = 5.8
Ası que la suma de las desviaciones es:
(6− 5.8) + (4− 5.8) + (3− 5.8) + (9− 5.8) + (7− 5.8) =
= 0.2− 1.8− 2.8 + 3.2 + 1.2 = 0
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Por ejemplo, la media de 6, 4, 3, 9 y 7 es
x = (6 + 4 + 3 + 9 + 7)/5 = 5.8
Ası que la suma de las desviaciones es:
(6− 5.8) + (4− 5.8) + (3− 5.8) + (9− 5.8) + (7− 5.8) =
= 0.2− 1.8− 2.8 + 3.2 + 1.2
= 0
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Por ejemplo, la media de 6, 4, 3, 9 y 7 es
x = (6 + 4 + 3 + 9 + 7)/5 = 5.8
Ası que la suma de las desviaciones es:
(6− 5.8) + (4− 5.8) + (3− 5.8) + (9− 5.8) + (7− 5.8) =
= 0.2− 1.8− 2.8 + 3.2 + 1.2 = 0
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Una desventaja importante de la media es que es muysensible a valores extremos, esto es, valores muy pequenos oconsiderablemente grandes.
Por ejemplo, suponga que un estudiante entrego todas lastareas del trimestre menos una y que sus calificaciones son:
10 9.2 10 9 9.5 0
El promedio de sus calificaciones es entonces:
10 + 9.2 + 10 + 9 + 9.5 + 0
6= 7.95
La mediana resuelve en gran medida este problema.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Una desventaja importante de la media es que es muysensible a valores extremos, esto es, valores muy pequenos oconsiderablemente grandes.
Por ejemplo, suponga que un estudiante entrego todas lastareas del trimestre menos una y que sus calificaciones son:
10 9.2 10 9 9.5 0
El promedio de sus calificaciones es entonces:
10 + 9.2 + 10 + 9 + 9.5 + 0
6= 7.95
La mediana resuelve en gran medida este problema.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Una desventaja importante de la media es que es muysensible a valores extremos, esto es, valores muy pequenos oconsiderablemente grandes.
Por ejemplo, suponga que un estudiante entrego todas lastareas del trimestre menos una y que sus calificaciones son:
10 9.2 10 9 9.5 0
El promedio de sus calificaciones es entonces:
10 + 9.2 + 10 + 9 + 9.5 + 0
6= 7.95
La mediana resuelve en gran medida este problema.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Una desventaja importante de la media es que es muysensible a valores extremos, esto es, valores muy pequenos oconsiderablemente grandes.
Por ejemplo, suponga que un estudiante entrego todas lastareas del trimestre menos una y que sus calificaciones son:
10 9.2 10 9 9.5 0
El promedio de sus calificaciones es entonces:
10 + 9.2 + 10 + 9 + 9.5 + 0
6= 7.95
La mediana resuelve en gran medida este problema.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Mediana
Es el valor intermedio de un conjunto de datos que estanordenados en forma ascendente.
Se acostumbra denotar la mediana por el sımbolo x. Paracalcularla se ordenan los datos de menor a mayor y seconsideran los siguientes casos:
1 Si el numero de datos es impar, la mediana es el valor quese encuentra justo a la mitad de la lista.
2 Si el numero de valores es par, la mediana es el promediode los dos valores que estan a la mitad.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Mediana
Es el valor intermedio de un conjunto de datos que estanordenados en forma ascendente.
Se acostumbra denotar la mediana por el sımbolo x. Paracalcularla se ordenan los datos de menor a mayor y seconsideran los siguientes casos:
1 Si el numero de datos es impar, la mediana es el valor quese encuentra justo a la mitad de la lista.
2 Si el numero de valores es par, la mediana es el promediode los dos valores que estan a la mitad.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Mediana
Es el valor intermedio de un conjunto de datos que estanordenados en forma ascendente.
Se acostumbra denotar la mediana por el sımbolo x. Paracalcularla se ordenan los datos de menor a mayor y seconsideran los siguientes casos:
1 Si el numero de datos es impar, la mediana es el valor quese encuentra justo a la mitad de la lista.
2 Si el numero de valores es par, la mediana es el promediode los dos valores que estan a la mitad.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Mediana
Es el valor intermedio de un conjunto de datos que estanordenados en forma ascendente.
Se acostumbra denotar la mediana por el sımbolo x. Paracalcularla se ordenan los datos de menor a mayor y seconsideran los siguientes casos:
1 Si el numero de datos es impar, la mediana es el valor quese encuentra justo a la mitad de la lista.
2 Si el numero de valores es par, la mediana es el promediode los dos valores que estan a la mitad.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Considere los datos del ejemplo anterior:
10 9.2 10 9 9.5 0
que ordenados quedan:
0 9 9.2 9.5 10 10
Como el numero de datos es par, la mediana es
x =9.2 + 9.5
2= 9.35
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Considere los datos del ejemplo anterior:
10 9.2 10 9 9.5 0
que ordenados quedan:
0 9 9.2 9.5 10 10
Como el numero de datos es par, la mediana es
x =9.2 + 9.5
2= 9.35
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Considere los datos del ejemplo anterior:
10 9.2 10 9 9.5 0
que ordenados quedan:
0 9 9.2 9.5 10 10
Como el numero de datos es par, la mediana es
x =9.2 + 9.5
2= 9.35
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Suponga, por ejemplo, que el estudiante tuvo la oportunidadde entregar la tarea faltante pero no obtuvo una buena nota,digamos que saco 6,
entonces su promedio serıa
x =6 + 9 + 9.2 + 9.5 + 10 + 10
6= 9.85
que es considerablemente mejor que el anterior. Sin embargo elvalor de la mediana seguirıa siendo 9.35.
Este ejemplo muestra que la media se ve muy afectada porvalores extremos pero la mediana no. Por esta razon la medianasuele utilizarse para conjuntos de datos que tienen un numerorelativamente pequeno de valores extremos.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Suponga, por ejemplo, que el estudiante tuvo la oportunidadde entregar la tarea faltante pero no obtuvo una buena nota,digamos que saco 6, entonces su promedio serıa
x =6 + 9 + 9.2 + 9.5 + 10 + 10
6= 9.85
que es considerablemente mejor que el anterior. Sin embargo elvalor de la mediana seguirıa siendo 9.35.
Este ejemplo muestra que la media se ve muy afectada porvalores extremos pero la mediana no. Por esta razon la medianasuele utilizarse para conjuntos de datos que tienen un numerorelativamente pequeno de valores extremos.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Suponga, por ejemplo, que el estudiante tuvo la oportunidadde entregar la tarea faltante pero no obtuvo una buena nota,digamos que saco 6, entonces su promedio serıa
x =6 + 9 + 9.2 + 9.5 + 10 + 10
6= 9.85
que es considerablemente mejor que el anterior. Sin embargo elvalor de la mediana seguirıa siendo 9.35.
Este ejemplo muestra que la media se ve muy afectada porvalores extremos pero la mediana no. Por esta razon la medianasuele utilizarse para conjuntos de datos que tienen un numerorelativamente pequeno de valores extremos.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Suponga, por ejemplo, que el estudiante tuvo la oportunidadde entregar la tarea faltante pero no obtuvo una buena nota,digamos que saco 6, entonces su promedio serıa
x =6 + 9 + 9.2 + 9.5 + 10 + 10
6= 9.85
que es considerablemente mejor que el anterior. Sin embargo elvalor de la mediana seguirıa siendo 9.35.
Este ejemplo muestra que la media se ve muy afectada porvalores extremos pero la mediana no. Por esta razon la medianasuele utilizarse para conjuntos de datos que tienen un numerorelativamente pequeno de valores extremos.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Suponga, por ejemplo, que el estudiante tuvo la oportunidadde entregar la tarea faltante pero no obtuvo una buena nota,digamos que saco 6, entonces su promedio serıa
x =6 + 9 + 9.2 + 9.5 + 10 + 10
6= 9.85
que es considerablemente mejor que el anterior. Sin embargo elvalor de la mediana seguirıa siendo 9.35.
Este ejemplo muestra que la media se ve muy afectada porvalores extremos pero la mediana no. Por esta razon la medianasuele utilizarse para conjuntos de datos que tienen un numerorelativamente pequeno de valores extremos.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Propiedades de la mediana
1 La mediana puede calcularse para conjuntos de datos connivel de medicion de intervalo o de razon.
2 No influyen en la mediana valores extremadamente grandeso pequenos en los datos.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Propiedades de la mediana
1 La mediana puede calcularse para conjuntos de datos connivel de medicion de intervalo o de razon.
2 No influyen en la mediana valores extremadamente grandeso pequenos en los datos.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Moda
Es el valor que se presenta con mayor frecuencia en unconjunto de datos.
Observaciones:
1 Cuando dos valores se presentan con la misma frecuencia yesta es la mas alta, ambos valores son modas y en este casose dice que el conjunto de datos es bimodal.
2 Cuando mas de dos valores se presentan con la mismafrecuencia y esta es la mas alta, todos esos valores sonmodas, y el conjunto de datos se llama es multimodal.
3 Cuando ningun valor se repite, se dice que no hay moda.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Moda
Es el valor que se presenta con mayor frecuencia en unconjunto de datos.
Observaciones:
1 Cuando dos valores se presentan con la misma frecuencia yesta es la mas alta, ambos valores son modas y en este casose dice que el conjunto de datos es bimodal.
2 Cuando mas de dos valores se presentan con la mismafrecuencia y esta es la mas alta, todos esos valores sonmodas, y el conjunto de datos se llama es multimodal.
3 Cuando ningun valor se repite, se dice que no hay moda.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Ejemplos
1 En el ejemplo anterior la moda es 10, pues este valoraparece dos veces en la lista.
2 Para el siguiente conjunto de datos
5 1 -10 -6 5 12 7 8 2 5 -1 11 5
la moda es 5, pues ese valor aparece 4 veces.
3 Para los siguientes datos
27 27 27 55 55 55 88 88 99
27 y 55 son ambos modas, pues ambos se presentan 3 veces.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Ejemplos
1 En el ejemplo anterior la moda es 10, pues este valoraparece dos veces en la lista.
2 Para el siguiente conjunto de datos
5 1 -10 -6 5 12 7 8 2 5 -1 11 5
la moda es 5, pues ese valor aparece 4 veces.
3 Para los siguientes datos
27 27 27 55 55 55 88 88 99
27 y 55 son ambos modas, pues ambos se presentan 3 veces.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Ejemplos
1 En el ejemplo anterior la moda es 10, pues este valoraparece dos veces en la lista.
2 Para el siguiente conjunto de datos
5 1 -10 -6 5 12 7 8 2 5 -1 11 5
la moda es 5, pues ese valor aparece 4 veces.
3 Para los siguientes datos
27 27 27 55 55 55 88 88 99
27 y 55 son ambos modas, pues ambos se presentan 3 veces.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Ejemplos
1 En el ejemplo anterior la moda es 10, pues este valoraparece dos veces en la lista.
2 Para el siguiente conjunto de datos
5 1 -10 -6 5 12 7 8 2 5 -1 11 5
la moda es 5, pues ese valor aparece 4 veces.
3 Para los siguientes datos
27 27 27 55 55 55 88 88 99
27 y 55 son ambos modas, pues ambos se presentan 3 veces.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Ejemplos
1 En el ejemplo anterior la moda es 10, pues este valoraparece dos veces en la lista.
2 Para el siguiente conjunto de datos
5 1 -10 -6 5 12 7 8 2 5 -1 11 5
la moda es 5, pues ese valor aparece 4 veces.
3 Para los siguientes datos
27 27 27 55 55 55 88 88 99
27 y 55 son ambos modas, pues ambos se presentan 3 veces.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Propiedades de la moda
1 La moda puede calcularse para datos con cualquier nivel demedicion: nominal, ordinal, de intervalo y de razon.
2 La moda tampoco se ve afectada por valores muy grandeso muy pequenos en los datos.
3 La moda es de especial utilidad para resumir datos de nivelnominal.
4 En conjuntos de datos que resultan multimodales, la modaresulta poco util para describir la localizacion de los datos.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Propiedades de la moda
1 La moda puede calcularse para datos con cualquier nivel demedicion: nominal, ordinal, de intervalo y de razon.
2 La moda tampoco se ve afectada por valores muy grandeso muy pequenos en los datos.
3 La moda es de especial utilidad para resumir datos de nivelnominal.
4 En conjuntos de datos que resultan multimodales, la modaresulta poco util para describir la localizacion de los datos.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Propiedades de la moda
1 La moda puede calcularse para datos con cualquier nivel demedicion: nominal, ordinal, de intervalo y de razon.
2 La moda tampoco se ve afectada por valores muy grandeso muy pequenos en los datos.
3 La moda es de especial utilidad para resumir datos de nivelnominal.
4 En conjuntos de datos que resultan multimodales, la modaresulta poco util para describir la localizacion de los datos.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Propiedades de la moda
1 La moda puede calcularse para datos con cualquier nivel demedicion: nominal, ordinal, de intervalo y de razon.
2 La moda tampoco se ve afectada por valores muy grandeso muy pequenos en los datos.
3 La moda es de especial utilidad para resumir datos de nivelnominal.
4 En conjuntos de datos que resultan multimodales, la modaresulta poco util para describir la localizacion de los datos.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Mitad del rango
Es la medida de tendencia central que constituye el valor (queno necesariamente es un dato) que esta a la mitad, entre elvalor maximo y el valor mınimo de un conjunto de datos.
En sımbolos,
mitad del rango =valor maximo + valor mınimo
2
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Mitad del rango
Es la medida de tendencia central que constituye el valor (queno necesariamente es un dato) que esta a la mitad, entre elvalor maximo y el valor mınimo de un conjunto de datos.
En sımbolos,
mitad del rango =valor maximo + valor mınimo
2
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Ejemplo
La mitad del rango del siguiente conjunto de datos
5 2 -10 -6 5 12 7 8 2 5 -1 11 5
es12 + (−10)
2= 1.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Propiedades de la mitad del rango
1 Puede calcularse para datos con nivel de medicion deintervalo o de razon.
2 Es facil de calcular.
3 Ayuda a reforzar la importante idea de que hay variasmaneras de definir el centro de un conjunto de datos.
4 Se emplea pocas veces pues solo se utilizan dos datos en suobtencion.
5 Es comun utilizar la mitad del rango incorrectamente envez de la mediana. Esto se evita teniendo claras ambasdefiniciones.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Propiedades de la mitad del rango
1 Puede calcularse para datos con nivel de medicion deintervalo o de razon.
2 Es facil de calcular.
3 Ayuda a reforzar la importante idea de que hay variasmaneras de definir el centro de un conjunto de datos.
4 Se emplea pocas veces pues solo se utilizan dos datos en suobtencion.
5 Es comun utilizar la mitad del rango incorrectamente envez de la mediana. Esto se evita teniendo claras ambasdefiniciones.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Propiedades de la mitad del rango
1 Puede calcularse para datos con nivel de medicion deintervalo o de razon.
2 Es facil de calcular.
3 Ayuda a reforzar la importante idea de que hay variasmaneras de definir el centro de un conjunto de datos.
4 Se emplea pocas veces pues solo se utilizan dos datos en suobtencion.
5 Es comun utilizar la mitad del rango incorrectamente envez de la mediana. Esto se evita teniendo claras ambasdefiniciones.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Propiedades de la mitad del rango
1 Puede calcularse para datos con nivel de medicion deintervalo o de razon.
2 Es facil de calcular.
3 Ayuda a reforzar la importante idea de que hay variasmaneras de definir el centro de un conjunto de datos.
4 Se emplea pocas veces pues solo se utilizan dos datos en suobtencion.
5 Es comun utilizar la mitad del rango incorrectamente envez de la mediana. Esto se evita teniendo claras ambasdefiniciones.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Propiedades de la mitad del rango
1 Puede calcularse para datos con nivel de medicion deintervalo o de razon.
2 Es facil de calcular.
3 Ayuda a reforzar la importante idea de que hay variasmaneras de definir el centro de un conjunto de datos.
4 Se emplea pocas veces pues solo se utilizan dos datos en suobtencion.
5 Es comun utilizar la mitad del rango incorrectamente envez de la mediana. Esto se evita teniendo claras ambasdefiniciones.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
¿Cual es la mejor medida de tendencia central?
1 Depende del conjunto de datos. No hay criterios objetivospara determinar la medida mas representativa para todoslos conjuntos de datos.
2 Las diferentes medidas de tendencia central ofrecendiversas ventajas y desventajas
3 Las medias muestrales tienden a ser mas consistentes queotras medidas de tendencia central, es decir, las medias demuestras obtenidas de la misma poblacion no varıan tantocomo las otras medidas de tendencia central.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
¿Cual es la mejor medida de tendencia central?
1 Depende del conjunto de datos. No hay criterios objetivospara determinar la medida mas representativa para todoslos conjuntos de datos.
2 Las diferentes medidas de tendencia central ofrecendiversas ventajas y desventajas
3 Las medias muestrales tienden a ser mas consistentes queotras medidas de tendencia central, es decir, las medias demuestras obtenidas de la misma poblacion no varıan tantocomo las otras medidas de tendencia central.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
¿Cual es la mejor medida de tendencia central?
1 Depende del conjunto de datos. No hay criterios objetivospara determinar la medida mas representativa para todoslos conjuntos de datos.
2 Las diferentes medidas de tendencia central ofrecendiversas ventajas y desventajas
3 Las medias muestrales tienden a ser mas consistentes queotras medidas de tendencia central, es decir, las medias demuestras obtenidas de la misma poblacion no varıan tantocomo las otras medidas de tendencia central.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Medidas de variacion (dispersion)
Considerense los siguientes tres conjuntos de datos
Muestra 1: 6 6 6Muestra 2: 3 7.5 7.5Muestra 3: 1 7 10
Los tres conjuntos tienen media 6. Sin embargo se observaque la variacion en los datos es muy distinta en las tresmuestras de datos.
Ası pues, las medidas de tendencia central no son suficientespara describir a un conjunto de datos y por lo tanto es necesarioestablecer algunas formas de medir la variacion.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Medidas de variacion (dispersion)
Considerense los siguientes tres conjuntos de datos
Muestra 1: 6 6 6Muestra 2: 3 7.5 7.5Muestra 3: 1 7 10
Los tres conjuntos tienen media 6.
Sin embargo se observaque la variacion en los datos es muy distinta en las tresmuestras de datos.
Ası pues, las medidas de tendencia central no son suficientespara describir a un conjunto de datos y por lo tanto es necesarioestablecer algunas formas de medir la variacion.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Medidas de variacion (dispersion)
Considerense los siguientes tres conjuntos de datos
Muestra 1: 6 6 6Muestra 2: 3 7.5 7.5Muestra 3: 1 7 10
Los tres conjuntos tienen media 6. Sin embargo se observaque la variacion en los datos es muy distinta en las tresmuestras de datos.
Ası pues, las medidas de tendencia central no son suficientespara describir a un conjunto de datos y por lo tanto es necesarioestablecer algunas formas de medir la variacion.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Medidas de variacion (dispersion)
Considerense los siguientes tres conjuntos de datos
Muestra 1: 6 6 6Muestra 2: 3 7.5 7.5Muestra 3: 1 7 10
Los tres conjuntos tienen media 6. Sin embargo se observaque la variacion en los datos es muy distinta en las tresmuestras de datos.
Ası pues, las medidas de tendencia central no son suficientespara describir a un conjunto de datos y por lo tanto es necesarioestablecer algunas formas de medir la variacion.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Rango
Es la medida de dispersion mas simple y se define como ladiferencia entre el valor maximo y el valor mınimo de los datos.
Esto es:
rango = valor maximo− valor mınimo
Para los datos anteriores, tenemos
Rango
Muestra 1: 6 6 6 0Muestra 2: 3 7.5 7.5 4.5Muestra 3: 1 7 10 9
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Rango
Es la medida de dispersion mas simple y se define como ladiferencia entre el valor maximo y el valor mınimo de los datos.
Esto es:
rango = valor maximo− valor mınimo
Para los datos anteriores, tenemos
Rango
Muestra 1: 6 6 6 0Muestra 2: 3 7.5 7.5 4.5Muestra 3: 1 7 10 9
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Rango
Es la medida de dispersion mas simple y se define como ladiferencia entre el valor maximo y el valor mınimo de los datos.
Esto es:
rango = valor maximo− valor mınimo
Para los datos anteriores, tenemos
Rango
Muestra 1: 6 6 6 0Muestra 2: 3 7.5 7.5 4.5Muestra 3: 1 7 10 9
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
La principal caracterıstica del rango es que es facil decalcular, pero al depender solo de dos valores del conjunto dedatos, no es tan util como otras medidas de variacion.
Veremos a continuacion medidas de dispersion que tomen encuenta la variacion de todos los datos.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
La principal caracterıstica del rango es que es facil decalcular, pero al depender solo de dos valores del conjunto dedatos, no es tan util como otras medidas de variacion.
Veremos a continuacion medidas de dispersion que tomen encuenta la variacion de todos los datos.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Desviacion media
Es el promedio de los valores absolutos de las desviacionescon respecto a la media aritmetica.
En sımbolos:
dm =
n∑i=1
|xi − x|
n
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Desviacion media
Es el promedio de los valores absolutos de las desviacionescon respecto a la media aritmetica.
En sımbolos:
dm =
n∑i=1
|xi − x|
n
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Ejemplo [2]
Se muestra el numero de capuchinos que se vendieron en ellocal de Starbucks de los aeropuertos de Orange County yOntario, California, entre las 4 y las 5 de la tarde durante 5 dıasdel mes pasado.
Aeropuertos
Orange County Ontario
20 2040 4950 5060 5180 80
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Las medidas de tendencia central para este conjunto de datosson
Orange County Ontario
Media 50 50Mediana 50 50Mitad del rango 50 50
Las tres medidas son exactamente iguales, ¿podemos concluirque no hay diferencias entre los conjuntos de datos?
Para responder esta pregunta calculemos las medidas devariacion que hemos visto. El rango es, en ambos casos
80− 20 = 60.
Para la desviacion media calculamos,
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Las medidas de tendencia central para este conjunto de datosson
Orange County Ontario
Media 50 50Mediana 50 50Mitad del rango 50 50
Las tres medidas son exactamente iguales, ¿podemos concluirque no hay diferencias entre los conjuntos de datos?
Para responder esta pregunta calculemos las medidas devariacion que hemos visto. El rango es, en ambos casos
80− 20 = 60.
Para la desviacion media calculamos,
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Las medidas de tendencia central para este conjunto de datosson
Orange County Ontario
Media 50 50Mediana 50 50Mitad del rango 50 50
Las tres medidas son exactamente iguales, ¿podemos concluirque no hay diferencias entre los conjuntos de datos?
Para responder esta pregunta calculemos las medidas devariacion que hemos visto.
El rango es, en ambos casos
80− 20 = 60.
Para la desviacion media calculamos,
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Las medidas de tendencia central para este conjunto de datosson
Orange County Ontario
Media 50 50Mediana 50 50Mitad del rango 50 50
Las tres medidas son exactamente iguales, ¿podemos concluirque no hay diferencias entre los conjuntos de datos?
Para responder esta pregunta calculemos las medidas devariacion que hemos visto. El rango es, en ambos casos
80− 20 = 60.
Para la desviacion media calculamos,
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Las medidas de tendencia central para este conjunto de datosson
Orange County Ontario
Media 50 50Mediana 50 50Mitad del rango 50 50
Las tres medidas son exactamente iguales, ¿podemos concluirque no hay diferencias entre los conjuntos de datos?
Para responder esta pregunta calculemos las medidas devariacion que hemos visto. El rango es, en ambos casos
80− 20 = 60.
Para la desviacion media calculamos,
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Orange County Ontario
xi xi − x |xi − x| xi xi − x |xi − x|20 -30 30 20 -30 3040 -10 10 49 -1 150 0 0 50 0 060 10 10 51 1 180 30 30 80 30 30
Total 80 Total 62
Ası pues, la desviacion media para Orange County es
dm =80
5= 16
y la de Ontario es
dm =62
5= 12.4
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Orange County Ontario
xi xi − x |xi − x| xi xi − x |xi − x|20 -30 30 20 -30 3040 -10 10 49 -1 150 0 0 50 0 060 10 10 51 1 180 30 30 80 30 30
Total 80 Total 62
Ası pues, la desviacion media para Orange County es
dm =80
5=
16
y la de Ontario es
dm =62
5= 12.4
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Orange County Ontario
xi xi − x |xi − x| xi xi − x |xi − x|20 -30 30 20 -30 3040 -10 10 49 -1 150 0 0 50 0 060 10 10 51 1 180 30 30 80 30 30
Total 80 Total 62
Ası pues, la desviacion media para Orange County es
dm =80
5= 16
y la de Ontario es
dm =62
5= 12.4
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Orange County Ontario
xi xi − x |xi − x| xi xi − x |xi − x|20 -30 30 20 -30 3040 -10 10 49 -1 150 0 0 50 0 060 10 10 51 1 180 30 30 80 30 30
Total 80 Total 62
Ası pues, la desviacion media para Orange County es
dm =80
5= 16
y la de Ontario es
dm =62
5=
12.4
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Orange County Ontario
xi xi − x |xi − x| xi xi − x |xi − x|20 -30 30 20 -30 3040 -10 10 49 -1 150 0 0 50 0 060 10 10 51 1 180 30 30 80 30 30
Total 80 Total 62
Ası pues, la desviacion media para Orange County es
dm =80
5= 16
y la de Ontario es
dm =62
5= 12.4
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Concluimos entonces que los valores de las ventas delStarbukcs Ontario estan mas concentrados cerca de la mediaque los valores de las ventas de la tienda de Orange County.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
La principal desventaja de la desviacion media es que, debidoa que se calcula usando valores absolutos, carece de unapropiedad aditiva.
Ademas, es un estadıstico sesgado, es decir, cuando se tomala desviacion media para varias muestras de una poblacion,estos valores no tienden a ser cercanos a la desviacion mediapoblacional.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
La principal desventaja de la desviacion media es que, debidoa que se calcula usando valores absolutos, carece de unapropiedad aditiva.
Ademas, es un estadıstico sesgado, es decir, cuando se tomala desviacion media para varias muestras de una poblacion,estos valores no tienden a ser cercanos a la desviacion mediapoblacional.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Varianza
Es la medida de variacion que se define como el promedio delas desviaciones de la media elevadas al cuadrado.
Varianza poblacional: se denota por el sımbolo σ2 y secalcula por medio de la formula:
σ2 =
N∑i=1
(xi − µ)2
N
Observe que para calcular la varianza es indispensableconocer el valor de la media.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Varianza
Es la medida de variacion que se define como el promedio delas desviaciones de la media elevadas al cuadrado.
Varianza poblacional: se denota por el sımbolo σ2 y secalcula por medio de la formula:
σ2 =
N∑i=1
(xi − µ)2
N
Observe que para calcular la varianza es indispensableconocer el valor de la media.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Varianza
Es la medida de variacion que se define como el promedio delas desviaciones de la media elevadas al cuadrado.
Varianza poblacional: se denota por el sımbolo σ2 y secalcula por medio de la formula:
σ2 =
N∑i=1
(xi − µ)2
N
Observe que para calcular la varianza es indispensableconocer el valor de la media.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Ejemplo (calculo de la varianza poblacional)
El informe anual de cierta empresa incluyo las siguientesganancias primarias por accion comun durante los pasados 5anos: $2.68, $1.03, $2.26, $4.30 y $3.58. Suponiendo que estosson los valores poblacionales, para calcular la varianza:
Primero se obtiene el valor de la media:
µ =
N∑i=1
xi
N=
2.68 + 1.03 + 2.26 + 4.30 + 3.58
5=
13.85
5= 2.77
y despues se calcula
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Ejemplo (calculo de la varianza poblacional)
El informe anual de cierta empresa incluyo las siguientesganancias primarias por accion comun durante los pasados 5anos: $2.68, $1.03, $2.26, $4.30 y $3.58. Suponiendo que estosson los valores poblacionales, para calcular la varianza:
Primero se obtiene el valor de la media:
µ =
N∑i=1
xi
N=
2.68 + 1.03 + 2.26 + 4.30 + 3.58
5=
13.85
5= 2.77
y despues se calcula
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Ejemplo (calculo de la varianza poblacional)
El informe anual de cierta empresa incluyo las siguientesganancias primarias por accion comun durante los pasados 5anos: $2.68, $1.03, $2.26, $4.30 y $3.58. Suponiendo que estosson los valores poblacionales, para calcular la varianza:
Primero se obtiene el valor de la media:
µ =
N∑i=1
xi
N=
2.68 + 1.03 + 2.26 + 4.30 + 3.58
5=
13.85
5= 2.77
y despues se calcula
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Ejemplo (calculo de la varianza poblacional)
El informe anual de cierta empresa incluyo las siguientesganancias primarias por accion comun durante los pasados 5anos: $2.68, $1.03, $2.26, $4.30 y $3.58. Suponiendo que estosson los valores poblacionales, para calcular la varianza:
Primero se obtiene el valor de la media:
µ =
N∑i=1
xi
N=
2.68 + 1.03 + 2.26 + 4.30 + 3.58
5=
13.85
5=
2.77
y despues se calcula
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Ejemplo (calculo de la varianza poblacional)
El informe anual de cierta empresa incluyo las siguientesganancias primarias por accion comun durante los pasados 5anos: $2.68, $1.03, $2.26, $4.30 y $3.58. Suponiendo que estosson los valores poblacionales, para calcular la varianza:
Primero se obtiene el valor de la media:
µ =
N∑i=1
xi
N=
2.68 + 1.03 + 2.26 + 4.30 + 3.58
5=
13.85
5= 2.77
y despues se calcula
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Ejemplo (calculo de la varianza poblacional)
El informe anual de cierta empresa incluyo las siguientesganancias primarias por accion comun durante los pasados 5anos: $2.68, $1.03, $2.26, $4.30 y $3.58. Suponiendo que estosson los valores poblacionales, para calcular la varianza:
Primero se obtiene el valor de la media:
µ =
N∑i=1
xi
N=
2.68 + 1.03 + 2.26 + 4.30 + 3.58
5=
13.85
5= 2.77
y despues se calcula
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
xi xi − µ (xi − µ)2
2.68
-0.09 0.0081
1.03
-1.74 3.0276
2.26
-0.51 0.2601
4.30
1.53 2.3409
3.58
0.81 0.6561
Total 0 6.2928
finalmente, la varianza es:
σ2 =
N∑i=1
(xi − µ)2
N=
6.2928
5= 1.256
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
xi xi − µ (xi − µ)2
2.68 -0.09
0.0081
1.03
-1.74 3.0276
2.26
-0.51 0.2601
4.30
1.53 2.3409
3.58
0.81 0.6561
Total 0 6.2928
finalmente, la varianza es:
σ2 =
N∑i=1
(xi − µ)2
N=
6.2928
5= 1.256
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
xi xi − µ (xi − µ)2
2.68 -0.09
0.0081
1.03 -1.74
3.0276
2.26 -0.51
0.2601
4.30 1.53
2.3409
3.58 0.81
0.6561
Total 0 6.2928
finalmente, la varianza es:
σ2 =
N∑i=1
(xi − µ)2
N=
6.2928
5= 1.256
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
xi xi − µ (xi − µ)2
2.68 -0.09 0.00811.03 -1.74
3.0276
2.26 -0.51
0.2601
4.30 1.53
2.3409
3.58 0.81
0.6561
Total 0 6.2928
finalmente, la varianza es:
σ2 =
N∑i=1
(xi − µ)2
N=
6.2928
5= 1.256
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
xi xi − µ (xi − µ)2
2.68 -0.09 0.00811.03 -1.74 3.02762.26 -0.51 0.26014.30 1.53 2.34093.58 0.81 0.6561
Total 0 6.2928
finalmente, la varianza es:
σ2 =
N∑i=1
(xi − µ)2
N=
6.2928
5= 1.256
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
xi xi − µ (xi − µ)2
2.68 -0.09 0.00811.03 -1.74 3.02762.26 -0.51 0.26014.30 1.53 2.34093.58 0.81 0.6561
Total
0 6.2928
finalmente, la varianza es:
σ2 =
N∑i=1
(xi − µ)2
N=
6.2928
5= 1.256
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
xi xi − µ (xi − µ)2
2.68 -0.09 0.00811.03 -1.74 3.02762.26 -0.51 0.26014.30 1.53 2.34093.58 0.81 0.6561
Total 0
6.2928
finalmente, la varianza es:
σ2 =
N∑i=1
(xi − µ)2
N=
6.2928
5= 1.256
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
xi xi − µ (xi − µ)2
2.68 -0.09 0.00811.03 -1.74 3.02762.26 -0.51 0.26014.30 1.53 2.34093.58 0.81 0.6561
Total 0 6.2928
finalmente, la varianza es:
σ2 =
N∑i=1
(xi − µ)2
N=
6.2928
5= 1.256
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
xi xi − µ (xi − µ)2
2.68 -0.09 0.00811.03 -1.74 3.02762.26 -0.51 0.26014.30 1.53 2.34093.58 0.81 0.6561
Total 0 6.2928
finalmente, la varianza es:
σ2 =
N∑i=1
(xi − µ)2
N=
6.2928
5= 1.256
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
xi xi − µ (xi − µ)2
2.68 -0.09 0.00811.03 -1.74 3.02762.26 -0.51 0.26014.30 1.53 2.34093.58 0.81 0.6561
Total 0 6.2928
finalmente, la varianza es:
σ2 =
N∑i=1
(xi − µ)2
N=
6.2928
5=
1.256
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
xi xi − µ (xi − µ)2
2.68 -0.09 0.00811.03 -1.74 3.02762.26 -0.51 0.26014.30 1.53 2.34093.58 0.81 0.6561
Total 0 6.2928
finalmente, la varianza es:
σ2 =
N∑i=1
(xi − µ)2
N=
6.2928
5= 1.256
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Consideraciones sobre el redondeo
1 No se deben redondear valores a la mitad de un calculo, seredondea solo la respuesta final.
2 Al redondear, se recomienda aumentar una posiciondecimal a las que hay en el conjunto original de datos.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Varianza muestral: se denota por el sımbolo s2 y se calculapor medio de la formula:
s2 =
n∑i=1
(xi − x)2
(n− 1)
Se divide entre n− 1 pues de esta manera se logra que s2 seaun estimador insesgado de la σ2, es decir, al tomar diferentesmuestras de una misma poblacion, los valores de la varianzamuestral tienden a igualar el valor de la varianza poblacional.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Varianza muestral: se denota por el sımbolo s2 y se calculapor medio de la formula:
s2 =
n∑i=1
(xi − x)2
(n− 1)
Se divide entre n− 1 pues de esta manera se logra que s2 seaun estimador insesgado de la σ2, es decir, al tomar diferentesmuestras de una misma poblacion, los valores de la varianzamuestral tienden a igualar el valor de la varianza poblacional.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Ejemplo
Calculemos la varianza muestral para los datos del ejemplo delas tiendas Starbucks.
Orange County Ontario
xi xi − x (xi − x)2 xi xi − x (xi − x)2
20
-30 900
20
-30 900
40
-10 100
49
-1 1
50
0 0
50
0 0
60
10 100
51
1 1
80
30 900
80
30 900
Total 2000 Total 1802
Las varianzas muestrales son entonces:
s2oc =2000
4= 500 y s2o =
1802
4= 450.5
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Ejemplo
Calculemos la varianza muestral para los datos del ejemplo delas tiendas Starbucks.
Orange County Ontario
xi xi − x (xi − x)2 xi xi − x (xi − x)2
20 -30
900
20
-30 900
40
-10 100
49
-1 1
50
0 0
50
0 0
60
10 100
51
1 1
80
30 900
80
30 900
Total 2000 Total 1802
Las varianzas muestrales son entonces:
s2oc =2000
4= 500 y s2o =
1802
4= 450.5
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Ejemplo
Calculemos la varianza muestral para los datos del ejemplo delas tiendas Starbucks.
Orange County Ontario
xi xi − x (xi − x)2 xi xi − x (xi − x)2
20 -30
900
20
-30 900
40 -10
100
49
-1 1
50 0
0
50
0 0
60 10
100
51
1 1
80 30
900
80
30 900
Total 2000 Total 1802
Las varianzas muestrales son entonces:
s2oc =2000
4= 500 y s2o =
1802
4= 450.5
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Ejemplo
Calculemos la varianza muestral para los datos del ejemplo delas tiendas Starbucks.
Orange County Ontario
xi xi − x (xi − x)2 xi xi − x (xi − x)2
20 -30 900 20
-30 900
40 -10
100
49
-1 1
50 0
0
50
0 0
60 10
100
51
1 1
80 30
900
80
30 900
Total 2000 Total 1802
Las varianzas muestrales son entonces:
s2oc =2000
4= 500 y s2o =
1802
4= 450.5
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Ejemplo
Calculemos la varianza muestral para los datos del ejemplo delas tiendas Starbucks.
Orange County Ontario
xi xi − x (xi − x)2 xi xi − x (xi − x)2
20 -30 900 20
-30 900
40 -10 100 49
-1 1
50 0 0 50
0 0
60 10 100 51
1 1
80 30 900 80
30 900
Total 2000 Total 1802
Las varianzas muestrales son entonces:
s2oc =2000
4= 500 y s2o =
1802
4= 450.5
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Ejemplo
Calculemos la varianza muestral para los datos del ejemplo delas tiendas Starbucks.
Orange County Ontario
xi xi − x (xi − x)2 xi xi − x (xi − x)2
20 -30 900 20 -30
900
40 -10 100 49
-1 1
50 0 0 50
0 0
60 10 100 51
1 1
80 30 900 80
30 900
Total 2000 Total 1802
Las varianzas muestrales son entonces:
s2oc =2000
4= 500 y s2o =
1802
4= 450.5
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Ejemplo
Calculemos la varianza muestral para los datos del ejemplo delas tiendas Starbucks.
Orange County Ontario
xi xi − x (xi − x)2 xi xi − x (xi − x)2
20 -30 900 20 -30
900
40 -10 100 49 -1
1
50 0 0 50 0
0
60 10 100 51 1
1
80 30 900 80 30
900
Total 2000 Total 1802
Las varianzas muestrales son entonces:
s2oc =2000
4= 500 y s2o =
1802
4= 450.5
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Ejemplo
Calculemos la varianza muestral para los datos del ejemplo delas tiendas Starbucks.
Orange County Ontario
xi xi − x (xi − x)2 xi xi − x (xi − x)2
20 -30 900 20 -30 90040 -10 100 49 -1
1
50 0 0 50 0
0
60 10 100 51 1
1
80 30 900 80 30
900
Total 2000 Total 1802
Las varianzas muestrales son entonces:
s2oc =2000
4= 500 y s2o =
1802
4= 450.5
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Ejemplo
Calculemos la varianza muestral para los datos del ejemplo delas tiendas Starbucks.
Orange County Ontario
xi xi − x (xi − x)2 xi xi − x (xi − x)2
20 -30 900 20 -30 90040 -10 100 49 -1 150 0 0 50 0 060 10 100 51 1 180 30 900 80 30 900
Total 2000 Total 1802
Las varianzas muestrales son entonces:
s2oc =2000
4= 500 y s2o =
1802
4= 450.5
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Ejemplo
Calculemos la varianza muestral para los datos del ejemplo delas tiendas Starbucks.
Orange County Ontario
xi xi − x (xi − x)2 xi xi − x (xi − x)2
20 -30 900 20 -30 90040 -10 100 49 -1 150 0 0 50 0 060 10 100 51 1 180 30 900 80 30 900
Total 2000 Total 1802
Las varianzas muestrales son entonces:
s2oc =2000
4= 500 y s2o =
1802
4= 450.5
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Ejemplo
Calculemos la varianza muestral para los datos del ejemplo delas tiendas Starbucks.
Orange County Ontario
xi xi − x (xi − x)2 xi xi − x (xi − x)2
20 -30 900 20 -30 90040 -10 100 49 -1 150 0 0 50 0 060 10 100 51 1 180 30 900 80 30 900
Total 2000 Total 1802
Las varianzas muestrales son entonces:
s2oc =2000
4=
500 y s2o =1802
4= 450.5
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Ejemplo
Calculemos la varianza muestral para los datos del ejemplo delas tiendas Starbucks.
Orange County Ontario
xi xi − x (xi − x)2 xi xi − x (xi − x)2
20 -30 900 20 -30 90040 -10 100 49 -1 150 0 0 50 0 060 10 100 51 1 180 30 900 80 30 900
Total 2000 Total 1802
Las varianzas muestrales son entonces:
s2oc =2000
4= 500
y s2o =1802
4= 450.5
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Ejemplo
Calculemos la varianza muestral para los datos del ejemplo delas tiendas Starbucks.
Orange County Ontario
xi xi − x (xi − x)2 xi xi − x (xi − x)2
20 -30 900 20 -30 90040 -10 100 49 -1 150 0 0 50 0 060 10 100 51 1 180 30 900 80 30 900
Total 2000 Total 1802
Las varianzas muestrales son entonces:
s2oc =2000
4= 500 y s2o =
1802
4=
450.5
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Ejemplo
Calculemos la varianza muestral para los datos del ejemplo delas tiendas Starbucks.
Orange County Ontario
xi xi − x (xi − x)2 xi xi − x (xi − x)2
20 -30 900 20 -30 90040 -10 100 49 -1 150 0 0 50 0 060 10 100 51 1 180 30 900 80 30 900
Total 2000 Total 1802
Las varianzas muestrales son entonces:
s2oc =2000
4= 500 y s2o =
1802
4= 450.5
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Propiedades de la varianza
1 La varianza es un estadıstico importante que se utiliza enalgunos metodos estadısticos relevantes.
2 Toma en cuenta las variaciones de todos los datos conrespecto de la media.
3 La varianza es un valor que nunca es negativo y solo escero cuando todos los valores de los datos son iguales.
4 Una desventaja de la varianza es que no esta en las mismasunidades que el conjunto original de datos.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Propiedades de la varianza
1 La varianza es un estadıstico importante que se utiliza enalgunos metodos estadısticos relevantes.
2 Toma en cuenta las variaciones de todos los datos conrespecto de la media.
3 La varianza es un valor que nunca es negativo y solo escero cuando todos los valores de los datos son iguales.
4 Una desventaja de la varianza es que no esta en las mismasunidades que el conjunto original de datos.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Propiedades de la varianza
1 La varianza es un estadıstico importante que se utiliza enalgunos metodos estadısticos relevantes.
2 Toma en cuenta las variaciones de todos los datos conrespecto de la media.
3 La varianza es un valor que nunca es negativo y solo escero cuando todos los valores de los datos son iguales.
4 Una desventaja de la varianza es que no esta en las mismasunidades que el conjunto original de datos.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Propiedades de la varianza
1 La varianza es un estadıstico importante que se utiliza enalgunos metodos estadısticos relevantes.
2 Toma en cuenta las variaciones de todos los datos conrespecto de la media.
3 La varianza es un valor que nunca es negativo y solo escero cuando todos los valores de los datos son iguales.
4 Una desventaja de la varianza es que no esta en las mismasunidades que el conjunto original de datos.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Desviacion estandar
Es la raız cuadrada de la varianza.
La desviacion estandar se denota por σ cuando se trata de unvalor poblacional y por s cuando es un valor muestral. Tenemospor definicion que:
σ =
√√√√√√N∑i=1
(xi − µ)2
Ny s =
√√√√√√n∑
i=1
(xi − x)2
(n− 1)
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Desviacion estandar
Es la raız cuadrada de la varianza.
La desviacion estandar se denota por σ cuando se trata de unvalor poblacional y por s cuando es un valor muestral.
Tenemospor definicion que:
σ =
√√√√√√N∑i=1
(xi − µ)2
Ny s =
√√√√√√n∑
i=1
(xi − x)2
(n− 1)
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Desviacion estandar
Es la raız cuadrada de la varianza.
La desviacion estandar se denota por σ cuando se trata de unvalor poblacional y por s cuando es un valor muestral. Tenemospor definicion que:
σ =
√√√√√√N∑i=1
(xi − µ)2
Ny s =
√√√√√√n∑
i=1
(xi − x)2
(n− 1)
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Desviacion estandar
Es la raız cuadrada de la varianza.
La desviacion estandar se denota por σ cuando se trata de unvalor poblacional y por s cuando es un valor muestral. Tenemospor definicion que:
σ =
√√√√√√N∑i=1
(xi − µ)2
N
y s =
√√√√√√n∑
i=1
(xi − x)2
(n− 1)
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Desviacion estandar
Es la raız cuadrada de la varianza.
La desviacion estandar se denota por σ cuando se trata de unvalor poblacional y por s cuando es un valor muestral. Tenemospor definicion que:
σ =
√√√√√√N∑i=1
(xi − µ)2
Ny s =
√√√√√√n∑
i=1
(xi − x)2
(n− 1)
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Para el ejemplo de las tiendas Starbucks,
soc =√
500 = 22.4 y so =√
450.5 = 21.2
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Formula alternativa para la desviacion estandar de unamuestra:
s =
√√√√√√n
n∑i=1
(x2i )−
(n∑
i=1
xi
)2
n(n− 1)
Esta forumla es mas facil de usar y elimina los errores deredondeo intermedios que se introducen en el calculo de ladesviacion estandar, cuando no se utiliza el valor exacto de lamedia.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Formula alternativa para la desviacion estandar de unamuestra:
s =
√√√√√√n
n∑i=1
(x2i )−
(n∑
i=1
xi
)2
n(n− 1)
Esta forumla es mas facil de usar y elimina los errores deredondeo intermedios que se introducen en el calculo de ladesviacion estandar, cuando no se utiliza el valor exacto de lamedia.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Ejemplo.
Usemos la formula anterior para calcular nuevamente ladesviacion estandar para los datos de la tienda Starbucks delaeropuerto de Orange County:
Orange County
xi xi − x (xi − x)2 xi x2i20 -30 900 20
400
40 -10 100 40
1600
50 0 0 50
2500
60 10 100 60
3600
80 30 900 80
6400
Total 2000 250 14500
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Ejemplo.
Usemos la formula anterior para calcular nuevamente ladesviacion estandar para los datos de la tienda Starbucks delaeropuerto de Orange County:
Orange County
xi xi − x (xi − x)2 xi x2i20 -30 900 20 40040 -10 100 40
1600
50 0 0 50
2500
60 10 100 60
3600
80 30 900 80
6400
Total 2000 250 14500
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Ejemplo.
Usemos la formula anterior para calcular nuevamente ladesviacion estandar para los datos de la tienda Starbucks delaeropuerto de Orange County:
Orange County
xi xi − x (xi − x)2 xi x2i20 -30 900 20 40040 -10 100 40 160050 0 0 50 250060 10 100 60 360080 30 900 80 6400
Total 2000 250 14500
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Ejemplo.
Usemos la formula anterior para calcular nuevamente ladesviacion estandar para los datos de la tienda Starbucks delaeropuerto de Orange County:
Orange County
xi xi − x (xi − x)2 xi x2i20 -30 900 20 40040 -10 100 40 160050 0 0 50 250060 10 100 60 360080 30 900 80 6400
Total 2000 250 14500
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Ası
s =
√5(14500)− (250)2
5(5− 1)
=
√10000
20
=√
500
= 22.4
que es el valor obtenido antes.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Ası
s =
√5(14500)− (250)2
5(5− 1)
=
√10000
20
=√
500
= 22.4
que es el valor obtenido antes.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Ası
s =
√5(14500)− (250)2
5(5− 1)
=
√10000
20
=√
500
= 22.4
que es el valor obtenido antes.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Ası
s =
√5(14500)− (250)2
5(5− 1)
=
√10000
20
=√
500
= 22.4
que es el valor obtenido antes.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Ası
s =
√5(14500)− (250)2
5(5− 1)
=
√10000
20
=√
500
= 22.4
que es el valor obtenido antes.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Propiedades de la desviacion estandar
1 Toma en cuenta las variaciones de todos los datos conrespecto de la media.
2 La desviacion estandar nunca es negativa y solo es cerocuando todos los valores de los datos son iguales.
3 A mayor valor de s se tiene mayor variacion en los datos.
4 El valor de la desviacion estandar puede aumentardrasticamente si se incluyen uno o mas valores extremos.
5 Las unidades de la desviacion estandar son las mismas quelas unidades del conjunto original de datos.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Propiedades de la desviacion estandar
1 Toma en cuenta las variaciones de todos los datos conrespecto de la media.
2 La desviacion estandar nunca es negativa y solo es cerocuando todos los valores de los datos son iguales.
3 A mayor valor de s se tiene mayor variacion en los datos.
4 El valor de la desviacion estandar puede aumentardrasticamente si se incluyen uno o mas valores extremos.
5 Las unidades de la desviacion estandar son las mismas quelas unidades del conjunto original de datos.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Propiedades de la desviacion estandar
1 Toma en cuenta las variaciones de todos los datos conrespecto de la media.
2 La desviacion estandar nunca es negativa y solo es cerocuando todos los valores de los datos son iguales.
3 A mayor valor de s se tiene mayor variacion en los datos.
4 El valor de la desviacion estandar puede aumentardrasticamente si se incluyen uno o mas valores extremos.
5 Las unidades de la desviacion estandar son las mismas quelas unidades del conjunto original de datos.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Propiedades de la desviacion estandar
1 Toma en cuenta las variaciones de todos los datos conrespecto de la media.
2 La desviacion estandar nunca es negativa y solo es cerocuando todos los valores de los datos son iguales.
3 A mayor valor de s se tiene mayor variacion en los datos.
4 El valor de la desviacion estandar puede aumentardrasticamente si se incluyen uno o mas valores extremos.
5 Las unidades de la desviacion estandar son las mismas quelas unidades del conjunto original de datos.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Propiedades de la desviacion estandar
1 Toma en cuenta las variaciones de todos los datos conrespecto de la media.
2 La desviacion estandar nunca es negativa y solo es cerocuando todos los valores de los datos son iguales.
3 A mayor valor de s se tiene mayor variacion en los datos.
4 El valor de la desviacion estandar puede aumentardrasticamente si se incluyen uno o mas valores extremos.
5 Las unidades de la desviacion estandar son las mismas quelas unidades del conjunto original de datos.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Interpretacion de la desviacion estandar
La desviacion estandar se utiliza para medir la variacion entrelos valores de un conjunto de datos. Si los valores son cercanosentre sı, la desviacion estandar sera pequena, pero si los datosestan muy dispersos, la desviacion estandar sera mas grande.
Tambien se usa para comparar la variacion de dos o masconjuntos de datos.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Interpretacion de la desviacion estandar
La desviacion estandar se utiliza para medir la variacion entrelos valores de un conjunto de datos. Si los valores son cercanosentre sı, la desviacion estandar sera pequena, pero si los datosestan muy dispersos, la desviacion estandar sera mas grande.
Tambien se usa para comparar la variacion de dos o masconjuntos de datos.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Coeficiente de variacion
Como la desviacion estandar tiene las mismas unidades que elconjunto original de datos, su uso para comparar la variacion devalores tomados de distintas poblaciones es restringido.
Un valor que resuelve este problema, pues carece de unidades,es el coeficiente de variacion.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Coeficiente de variacion
Como la desviacion estandar tiene las mismas unidades que elconjunto original de datos, su uso para comparar la variacion devalores tomados de distintas poblaciones es restringido.
Un valor que resuelve este problema, pues carece de unidades,es el coeficiente de variacion.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Coeficiente de variacion
Es un porcentaje que indica que tan grande es la desviacionestandar en relacion con la media, puede calcularse tanto paradatos muestrales como para datos poblacionales. Se denota porCV y se define como
CV =desviacion estandar
media· 100 %
Esto es,
Para una muestra: CV =s
x· 100 %
Para una poblacion: CV =σ
µ· 100 %
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Coeficiente de variacion
Es un porcentaje que indica que tan grande es la desviacionestandar en relacion con la media, puede calcularse tanto paradatos muestrales como para datos poblacionales. Se denota porCV y se define como
CV =desviacion estandar
media· 100 %
Esto es,
Para una muestra: CV =s
x· 100 %
Para una poblacion: CV =σ
µ· 100 %
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Ejemplo
A continuacion se muestran los valores de las estataturas (encm) de 40 hombres seleccionados al azar [3],
179.8 168.1 182.1 174.5 171.7 175.8 168.9 170.7 173.5 166.6160.0 173.5 185.7 171.7 172.7 180.3 155.7 193.5 168.4 177.0166.1 177.8 159.8 174.0 173.5 176.3 175.8 172.7 182.6 167.9
183.9 185.4 172.7 174.5 178.6 161.8 180.6 166.6 173.5 168.4
y sus correspondientes estaturas (en kg),
76.7 65.4 81.3 79.7 69.2 75.7 61.2 91.4 79.5 63.070.9 84.6 86.7 68.6 95.0 107.5 80.1 100.1 75.3 62.374.5 73.7 68.9 65.4 92.8 87.9 78.4 73.4 79.3 77.096.8 89.8 78.6 97.3 62.2 54.2 85.8 74.7 77.2 68.5
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Ejemplo
A continuacion se muestran los valores de las estataturas (encm) de 40 hombres seleccionados al azar [3],
179.8 168.1 182.1 174.5 171.7 175.8 168.9 170.7 173.5 166.6160.0 173.5 185.7 171.7 172.7 180.3 155.7 193.5 168.4 177.0166.1 177.8 159.8 174.0 173.5 176.3 175.8 172.7 182.6 167.9
183.9 185.4 172.7 174.5 178.6 161.8 180.6 166.6 173.5 168.4
y sus correspondientes estaturas (en kg),
76.7 65.4 81.3 79.7 69.2 75.7 61.2 91.4 79.5 63.070.9 84.6 86.7 68.6 95.0 107.5 80.1 100.1 75.3 62.374.5 73.7 68.9 65.4 92.8 87.9 78.4 73.4 79.3 77.096.8 89.8 78.6 97.3 62.2 54.2 85.8 74.7 77.2 68.5
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Para estos datos tenemos
Media (x) Desviacion estandar (s)
Estatura 173.57 7.67Peso 78.27 11.94
Por tanto, los coeficientes de variacion son:
Estatura: CV =s
x· 100 % =
7.67
173.57· 100 % = 4.42 %
Peso: CV =s
x· 100 % =
11.94
78.27· 100 % = 15.25 %
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Para estos datos tenemos
Media (x) Desviacion estandar (s)
Estatura 173.57 7.67Peso 78.27 11.94
Por tanto, los coeficientes de variacion son:
Estatura: CV =s
x· 100 % =
7.67
173.57· 100 % = 4.42 %
Peso: CV =s
x· 100 % =
11.94
78.27· 100 % = 15.25 %
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Para estos datos tenemos
Media (x) Desviacion estandar (s)
Estatura 173.57 7.67Peso 78.27 11.94
Por tanto, los coeficientes de variacion son:
Estatura: CV =s
x· 100 % =
7.67
173.57· 100 % = 4.42 %
Peso: CV =s
x· 100 % =
11.94
78.27· 100 % = 15.25 %
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Para estos datos tenemos
Media (x) Desviacion estandar (s)
Estatura 173.57 7.67Peso 78.27 11.94
Por tanto, los coeficientes de variacion son:
Estatura: CV =s
x· 100 % =
7.67
173.57· 100 % = 4.42 %
Peso: CV =s
x· 100 % =
11.94
78.27· 100 % = 15.25 %
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Observese que las desviaciones estandar de estos conjuntos dedatos no pueden compararse directamente pues la primeraesta en centımetros y la segunda en kilogramos.
Sin embargo, comparando los coeficientes de variacion deambas muestras, vemos que las estaturas (CV = 4.42 %) tienenuna variacion considerablemente menor que los pesos(CV = 15.26 %). ¿Tiene sentido esta observacion?
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Observese que las desviaciones estandar de estos conjuntos dedatos no pueden compararse directamente pues la primeraesta en centımetros y la segunda en kilogramos.
Sin embargo, comparando los coeficientes de variacion deambas muestras, vemos que las estaturas (CV = 4.42 %) tienenuna variacion considerablemente menor que los pesos(CV = 15.26 %).
¿Tiene sentido esta observacion?
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Observese que las desviaciones estandar de estos conjuntos dedatos no pueden compararse directamente pues la primeraesta en centımetros y la segunda en kilogramos.
Sin embargo, comparando los coeficientes de variacion deambas muestras, vemos que las estaturas (CV = 4.42 %) tienenuna variacion considerablemente menor que los pesos(CV = 15.26 %). ¿Tiene sentido esta observacion?
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Sesgo
En datos con sesgo a la izquierda, la media y la mediana seencuentran a la izquierda de la moda. (Los datos sesgados a laizquierda suelen tener una media menor a la mediana).
En datos con sesgo a la derecha, la media y la mediana seencuentran a la derecha de la moda. (En los datos sesgados a laderecha la media suele estar a la derecha de la mediana).
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Sesgo
En datos con sesgo a la izquierda, la media y la mediana seencuentran a la izquierda de la moda. (Los datos sesgados a laizquierda suelen tener una media menor a la mediana).
En datos con sesgo a la derecha, la media y la mediana seencuentran a la derecha de la moda. (En los datos sesgados a laderecha la media suele estar a la derecha de la mediana).
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
La siguiente figura fue tomada de [3].
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Regla empırica para datos con distribucion normal
En un conjunto de datos con una distribucionaproximadamente normal, se cumplen las siguientespropiedades:
1 Aproximadamente el 68 % de todos los valores estan dentrode una desviacion estandar de la media.
2 Aproximadamente el 95 % de todos los valores estan dentrode 2 desviaciones estandar de la media.
3 Aproximadamente el 99.7 % (practicamente todos) de losvalores estan dentro de 3 desviaciones estandar de la media.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Regla empırica para datos con distribucion normal
En un conjunto de datos con una distribucionaproximadamente normal, se cumplen las siguientespropiedades:
1 Aproximadamente el 68 % de todos los valores estan dentrode una desviacion estandar de la media.
2 Aproximadamente el 95 % de todos los valores estan dentrode 2 desviaciones estandar de la media.
3 Aproximadamente el 99.7 % (practicamente todos) de losvalores estan dentro de 3 desviaciones estandar de la media.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Regla empırica para datos con distribucion normal
En un conjunto de datos con una distribucionaproximadamente normal, se cumplen las siguientespropiedades:
1 Aproximadamente el 68 % de todos los valores estan dentrode una desviacion estandar de la media.
2 Aproximadamente el 95 % de todos los valores estan dentrode 2 desviaciones estandar de la media.
3 Aproximadamente el 99.7 % (practicamente todos) de losvalores estan dentro de 3 desviaciones estandar de la media.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Regla empırica para datos con distribucion normal
En un conjunto de datos con una distribucionaproximadamente normal, se cumplen las siguientespropiedades:
1 Aproximadamente el 68 % de todos los valores estan dentrode una desviacion estandar de la media.
2 Aproximadamente el 95 % de todos los valores estan dentrode 2 desviaciones estandar de la media.
3 Aproximadamente el 99.7 % (practicamente todos) de losvalores estan dentro de 3 desviaciones estandar de la media.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
La siguiente figura ilustra la regla empırica [3].
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Ejemplo
Las puntuaciones de CI tienen una distribucion normal, conuna media de 100 y una desviacion estandar de 15. Con estainformacion se pueden responder preguntas como las siguientes:
1 ¿Entre que puntuaciones se encuentra el CI del 68 % de laspersonas?
2 ¿Que porcentaje de las puntuaciones se ubican entre 70 y130?
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Ejemplo
Las puntuaciones de CI tienen una distribucion normal, conuna media de 100 y una desviacion estandar de 15. Con estainformacion se pueden responder preguntas como las siguientes:
1 ¿Entre que puntuaciones se encuentra el CI del 68 % de laspersonas?
2 ¿Que porcentaje de las puntuaciones se ubican entre 70 y130?
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Ejemplo
Las puntuaciones de CI tienen una distribucion normal, conuna media de 100 y una desviacion estandar de 15. Con estainformacion se pueden responder preguntas como las siguientes:
1 ¿Entre que puntuaciones se encuentra el CI del 68 % de laspersonas?
2 ¿Que porcentaje de las puntuaciones se ubican entre 70 y130?
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Para responder las preguntas, usamos la regla empırica. Deacuerdo con esta, el 68 % de las puntuaciones se encuentradentro de una desviacion estandar de la media, es decir, entrelos valores
100− 15 y 100 + 15,
se concluye que el 68 % de las puntuaciones se encuentran entre85 y 115.
Para la segunda pregunta, observamos que
70 = 100− 2(15) y 130 = 100 + 2(15),
es decir, 70 y 130 estan exactamente a dos desviacionesestandar de la media, ası que de la regla empırica concluimosque el 95 % de las puntuaciones estan entre 70 y 130.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Para responder las preguntas, usamos la regla empırica. Deacuerdo con esta, el 68 % de las puntuaciones se encuentradentro de una desviacion estandar de la media, es decir, entrelos valores
100− 15 y 100 + 15,
se concluye que el 68 % de las puntuaciones se encuentran entre85 y 115.
Para la segunda pregunta, observamos que
70 = 100− 2(15) y 130 = 100 + 2(15),
es decir, 70 y 130 estan exactamente a dos desviacionesestandar de la media, ası que de la regla empırica concluimosque el 95 % de las puntuaciones estan entre 70 y 130.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Para responder las preguntas, usamos la regla empırica. Deacuerdo con esta, el 68 % de las puntuaciones se encuentradentro de una desviacion estandar de la media, es decir, entrelos valores
100− 15 y 100 + 15,
se concluye que el 68 % de las puntuaciones se encuentran entre85 y 115.
Para la segunda pregunta, observamos que
70 = 100− 2(15) y 130 = 100 + 2(15),
es decir, 70 y 130 estan exactamente a dos desviacionesestandar de la media, ası que de la regla empırica concluimosque el 95 % de las puntuaciones estan entre 70 y 130.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Teorema de Chebyshev
En cualquer conjunto de datos, si z es un valor positivo mayorque 1, la proporcion de los valores que se encuentran dentro dez desviaciones estandar de la media es por lo menos 1− 1/z2.
Por ejemplo, la proporcion de valores que se encuentran a dosdesviaciones estandar de la media es por lo menos:
1− 1
z2= 1− 1
4= 3/4,
esto es, por lo menos el 75 % de los valores.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Teorema de Chebyshev
En cualquer conjunto de datos, si z es un valor positivo mayorque 1, la proporcion de los valores que se encuentran dentro dez desviaciones estandar de la media es por lo menos 1− 1/z2.
Por ejemplo, la proporcion de valores que se encuentran a dosdesviaciones estandar de la media es por lo menos:
1− 1
z2= 1− 1
4= 3/4,
esto es, por lo menos el 75 % de los valores.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
La proporcion de valores que se encuentran a tresdesviaciones estandar de la media es por lo menos:
1− 1
z2= 1− 1
9= 8/9,
es decir, por lo menos el 89 % de los valores.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Ejemplo
Suponga que en las calificaciones obtenidas por 100 estudiantesen un examen de estadıstica la media es 70 y la desviacionestandar es 5. El teorema de Chebyshev permite responderpreguntas como las siguientes:
1 ¿Que proporcion de los estudiantes obtuvo puntuacionesentre 60 y 80?
2 ¿Que proporcion obtuvo puntuaciones entre 58 y 82?
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Ejemplo
Suponga que en las calificaciones obtenidas por 100 estudiantesen un examen de estadıstica la media es 70 y la desviacionestandar es 5. El teorema de Chebyshev permite responderpreguntas como las siguientes:
1 ¿Que proporcion de los estudiantes obtuvo puntuacionesentre 60 y 80?
2 ¿Que proporcion obtuvo puntuaciones entre 58 y 82?
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Para responder la primera pregunta, se observa que 60esta dos desviacones estandar por debajo de la media y 80esta dos desviaciones estandar sobre la media.
El teorema deChebyshev nos dice que la proporcion de estudiantes cuyapuntuacion esta entre 60 y 80 es por lo menos
1− 1
4= 3/4,
es decir, por lo menos el 75 % de los estudiantes tienenuna puntuacion entre 60 y 80.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Para responder la primera pregunta, se observa que 60esta dos desviacones estandar por debajo de la media y 80esta dos desviaciones estandar sobre la media. El teorema deChebyshev nos dice que la proporcion de estudiantes cuyapuntuacion esta entre 60 y 80 es por lo menos
1− 1
4= 3/4,
es decir, por lo menos el 75 % de los estudiantes tienenuna puntuacion entre 60 y 80.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Para la segunda pregunta, debemos determinar a cuantasdesviaciones estandar de la media se encuentran los valores 58 y82. Para ello resolvemos las ecuaciones:
58 = 70− 5z y 82 = 70 + 5z
esto es
z = (70− 58)/5 = 2.4 y z = (82− 70)/5 = 2.4
ası que 58 se encuentra 2.4 desviaciones estandar por debajo dela media y 82 dos desviaciones estandar por arriba. El teoremade Chebyshev nos dice que la proporcion de estudiantes cuyapuntuacion esta entre 58 y 82 es por lo menos
1− 1
(2.4)2= 0.826,
es decir, por lo menos el 82.6 % de los estudiantes tienenuna puntuacion entre 58 y 82.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Para la segunda pregunta, debemos determinar a cuantasdesviaciones estandar de la media se encuentran los valores 58 y82. Para ello resolvemos las ecuaciones:
58 = 70− 5z y 82 = 70 + 5z
esto es
z = (70− 58)/5 = 2.4 y z = (82− 70)/5 = 2.4
ası que 58 se encuentra 2.4 desviaciones estandar por debajo dela media y 82 dos desviaciones estandar por arriba. El teoremade Chebyshev nos dice que la proporcion de estudiantes cuyapuntuacion esta entre 58 y 82 es por lo menos
1− 1
(2.4)2= 0.826,
es decir, por lo menos el 82.6 % de los estudiantes tienenuna puntuacion entre 58 y 82.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Para la segunda pregunta, debemos determinar a cuantasdesviaciones estandar de la media se encuentran los valores 58 y82. Para ello resolvemos las ecuaciones:
58 = 70− 5z y 82 = 70 + 5z
esto es
z = (70− 58)/5 = 2.4 y z = (82− 70)/5 = 2.4
ası que 58 se encuentra 2.4 desviaciones estandar por debajo dela media y 82 dos desviaciones estandar por arriba.
El teoremade Chebyshev nos dice que la proporcion de estudiantes cuyapuntuacion esta entre 58 y 82 es por lo menos
1− 1
(2.4)2= 0.826,
es decir, por lo menos el 82.6 % de los estudiantes tienenuna puntuacion entre 58 y 82.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Para la segunda pregunta, debemos determinar a cuantasdesviaciones estandar de la media se encuentran los valores 58 y82. Para ello resolvemos las ecuaciones:
58 = 70− 5z y 82 = 70 + 5z
esto es
z = (70− 58)/5 = 2.4 y z = (82− 70)/5 = 2.4
ası que 58 se encuentra 2.4 desviaciones estandar por debajo dela media y 82 dos desviaciones estandar por arriba. El teoremade Chebyshev nos dice que la proporcion de estudiantes cuyapuntuacion esta entre 58 y 82 es por lo menos
1− 1
(2.4)2= 0.826,
es decir, por lo menos el 82.6 % de los estudiantes tienenuna puntuacion entre 58 y 82.
Rocıo Meza Moreno Estadıstica descriptiva
Medidas numericasDefiniciones previasMedidas de tendencia centralMedidas de variacion
Referencias
[1] Anderson, D., Sweeney D. y Thomas W., Estadıstica paraadministracion y economıa, Thompson Editores, Mexico,2008.
[2] Lind, D., Marchal, W. y Wathen, S., Estadıstica aplicada alos negocios y la economıa, McGraw-Hill interamericana,Mexico, 2012.
[3] Triola, M., Estadıstica, Pearson Educacion, Mexico, 2009,pp. 75-86.
Rocıo Meza Moreno Estadıstica descriptiva