Estadística aplicada a la Educación

Post on 03-Jul-2015

823 views 2 download

transcript

Estadística aplicada a la Educación

Universidad Nacional Mayor de San Marcos

Facultad de Educación

Mg. Jessica G. Zavaleta M.

Introducción

Estadística J. Neyman (1977: 58) «Estadistica trata de

problemas relativos a las caracteristicas operatorias de las reglas de comportamiento inductivo basado en experimentos aleatorios»

H. Crammer (1985:46) afirma que «el principal objeto de la teoría estadística consiste en la investigación de la posibilidad de obtener inferencias válidas a partir de datos estadisticos y en la construcción de metodos para realizar dichas inferencias»

Estadística

Es un método científico por medio del cual podemos recolectar, organizar, presentar y analizar datos numéricos relativos a un conjunto de individuos u observaciones que nos permiten extraer conclusiones válidas y efectuar decisiones basadas en dichos análisis.

Historia de la Estadistica

Se pueden distinguir tres etapas: Censos y empadronamientos (abarca

hasta el siglo XV)

De la descripción de poblaciones , a la aritmética política ( desde el siglo XVI hasta el siglo XVIII)

Teoría estadística y el cálculo de probabilidades (desde el siglo XIX hasta la actualidad)

Conceptos básicos

Población

Conjunto de elementos (personas, plantas, organismos, objetos, etc.) que contienen una o más características o atributos comunes observables, acerca del cual deseamos obtener conclusiones o tomar decisiones.

Para la investigación, es el conjunto sobre el que recae la investigación y de cuyos elementos obtendremos datos de sus características o atributos.

Toda población debe delimitarse temporal y espacialmente.

Ejemplos de población

Todos los empleados del sector público .

Todos los docentes de la UGEL 05

Todos los estudiantes de una institución educativa.

Censo

Implica la recolección de datos de toda la población bajo investigación.

Un censo se realiza generalmente por política de estado. Son costosos y sus resultados son la base para investigaciones mas especificas.

Muestra

Subconjunto de la población seleccionada de acuerdo a una planificación previa.

La muestra debe ser representativa de la población y esto significa que debe ser de tamaño adecuado y que tenga las mismas propiedades de la población.

Ejemplo de muestra: 100 docentes del sector educación

Unidad Estadística

Objeto elemental o elemento invisible sobre la base del cual se obtienen los datos.

También se le llama unidad de observación si los datos han sido recolectado mediante la observación y se le llama unidad experimental si los datos han sido recolectados a través de la experimentación.

Dato

Según el diccionario de la Lengua Española, es un antecedente para llegar al conocimiento exacto de un hecho.

Es una magnitud o caracterización de algo.

Son exactos, no cambian una vez obtenidos. Cuando se les procesa y presenta en un contexto apropiado pueden generar entendimiento.

Información

Es la reseña, representación o concepción derivada de la observación, lectura o instrucción.

Variable

Caracteristica o atributo que posee la poblacion.

Puede tomar diferentes valores o expresados en varias categorias

Ejemplo: Variable : «edades» de los alumnos de una

institucion educativa y los valores de la variable serian: 13, 14, 15 años de edad

Variable: «profesión» y los valores a adoptar serían : abogado, médico, profesor, etc

Escalas de medición de una variable

Nominal

Ordinal Intervalar

De razón

Escala Nominal

Son las variables que establecen la distinción de los elementos en diversas categorías, sin implicar algún orden entre ellas.

Distribuye a la unidad de análisis en dos o más categorías.

Ejemplos: Sexo Estado civil Deporte que práctica Religión Lugar de nacimiento.

Escala Ordinal

Variables que implican orden entre ellas, están referidas a un orden o jerarquía, donde las categorías expresan una posición de orden.

Ejemplos: Grado de instrucción Clases sociales Grado de simpatía Rango de agresividad.

Escala Intervalar

Suponen orden y grado de distancia iguales entre las diversas categorías, pero no tienen un origen natural, sino convencional.

La unidad de medida no necesariamente tiene que partir del valor cero, solo sirve como punto o valor de comparación.

Ejemplos: Coeficiente de inteligencia Temperatura Puntuación obtenida en una escuela. Presión arterial. Rendimiento escolar.

Escala de Razón

Comprenden a la vez a todos los casos anteriores, distinción, orden, distancia.

Es de origen natural único, el valor se expresa con un número real. ( la unidad de medida necesariamente tiene que partir del valor cero)

Ejemplos: Edad Peso Ingresos Número de hijos Accidentes de tránsito.

Clasificación de las variables

Variables

Variable Cualitativa

Variable Cuantitativa

Variable Cuantitativa

Discreta

Variable Cuantitativa

Continua

Variable Cualitativa o Categórica o De atributos

Si la variable expresa mediante una característica, cualidad o atributo.

Se mide mediante escala nominal u ordinal

Ejemplos: Lugar de Nacimiento Estado civil Religión

Variables Cuantitativas o Numéricas

Es cuando esta asociado a un valor numérico. Se miden mediante escala intervalar o de razón

Pueden ser de dos clases: discretas y continuas

Ejemplos: Número de carpetas de un aula Las estaturas de los estudiantes de una institución

educativa. Número de instituciones educativas Número de docentes de inglés de una UGEL

Variables Cuantitativas Discretas

Sus valores se expresan en números enteros.

Ejemplos

Número de alumnos por sección Número de libros en la biblioteca de

Educación Número de registros por docente

Variables Cuantitativas Continuas

Sus valores pueden expresarse mediante números reales

Ejemplos: Los pesos de los niños: 48,5 kg; 56,25

kg, etc Los haberes mensuales de los docentes

S/. 625,78; S/. 1235,50 ; etc Las tallas de los alumnos: 1,56 m; 1,62

m ; etc.

Practiquemos …..

En el siguiente enunciado: «En una institución educativa se aplicó una encuesta a 70 alumnos para averiguar el número de hermanos que tiene cada uno».

Averiguar : Población, muestra, variable, clase de variable, dato

Solución

• Todos los alumnos de la institución educativa Población

• 70 alumnos de la institución educativa Muestra

• Número de hermanos Variable

• Cuantitativa discreta Clase de variable

• Podría ser 3 hermanos Dato

Clasificación de la Estadística

• Trata del resumen y presentación de datos, mediante métodos adecuados.

• Su objetivo la caracterización de los datos (mediante gráficos o de forma analítica) donde se resalta las propiedades de los elementos bajo estudio.

Estadística

Descriptiva

• Estudia el comportamiento y propiedades de las muestras, pero de carácter aleatoria.

• Su objetivo generalizar las propiedades de la población bajo estudio, basado en los resultados de la muestra aleatoria.

Estadística

Inferencial

Estadística Descriptiva

Tablas y Gráficos de Frecuencia

Tabla de frecuencia o distribucion de frecuencia. Presenta datos recolectados donde se puede observar las diferencias para los posibles valores de las variables o niveles o categorias. Condensan datos obtenidos.

Los gráficos es una representacion visual de la totalidad de datos. Transmiten informacion cuantitativa

Tablas de Frecuencia o Distribución

Son tablas de trabajo estadístico, que presentan la distribución de un conjunto de elementos de acuerdo a las categorías de una variable.

En ella se observa la frecuencia o repetición de cada uno de los valores de la variable, que se obtienen después de realizar la operación de tabulación.

Las tablas presentan diversos tipos de frecuencia (Absoluta simple, Absoluta acumulada, Relativa simple, Relativa acumulada).

Ejemplo

Cuadro N° 1

Edades fi Fi hi Hi

[10 – 15> 12,5 8 8 0.16 0.16

[15 – 20> 17,5 12 20 0.24 0.40

[20 – 25> 22,5 2 22 0.04 0.44

[25 – 30> 27,5 3 25 0 0.50

[30 – 35> 32,5 10 35 0.20 0.70

[35 – 40> 37,5 5 40 0.10 0.80

[40 – 45> 42,5 10 50 0.20 1.00

    50   1.00  

x

Frecuencia absoluta (fi).

Se llama frecuencia absoluta de un valor de variable, al número de veces que se repite dicho valor en el conjunto de datos.

Frecuencia absoluta acumulada (Fi).

Es la suma de las frecuencias relativas correspondientes a los datos menores e iguales al dato en referencia.

Frecuencia Relativa (hi).

La frecuencia relativa de un valor, es el cociente de su frecuencia absoluta entre el tamaño de la muestra.

hi=

Frecuencia Relativa Acumulada (Hi).

La frecuencia relativa acumulada de un dato, es el cociente de su frecuencia absoluta acumulada entre el tamaño de la muestra

Hi=

Practiquemos

El número de hijos por familia de un grupo de docentes de inglés de la UGEL 02 es como sigue:

Elaborar una tabla de frecuencias e interpretar

Graficar las frecuencias empleando el gráfico circular.

1,2,4,0,2,3,1,4,3,5,2,2,3,2,2,3,1,2,3,2,0,1,1,

2,0,3,2,3,3,2

Distribución de número de hijos de los docentes de inglés de la UGEL 02.

Número de hijos

Frecuencia (fi)

Frecuencia Absoluta

Acumulada (Fi)

Frecuencia Relativa (hi)

Frecuencia Relativa

Acumulada (Hi)

Frecuencia Porcentual

(hi *100)

0 3 3 0.100 0.100 10%

1 5 8 0.167 0.267 17%2 11 19 0.367 0.633 37%3 8 27 0.267 0.900 27%4 2 29 0.067 0.967 7%5 1 30 0.033 1.000 3%

30 1.000

Interpretación : La mayoría de docentes de inglés de la UGEL 02 , 37% tienen 02 hijos

Gráfico 1.1: Distribución de número de hijos de los docentes de inglés de la UGEL 02

10%

17%

37%

27%

7% 3%

Número de hijos

012345

Medidas de Resumen para datos de una variable cuantitativa

Medidas de Posición

Medidas de Dispersión

Medidas de Forma

Medidas de Posición o Medidas de Tendencia Central También se les conoce como estadígrafos de

posición, su propósito es de obtener valores que representen dicho punto central o centro de gravedad de los datos, es decir, describen la posición que ocupa una distribución de frecuencias respecto a un solo valor de la variable.

Representan en un solo valor, a una serie de datos y además describe en forma resumida al conjunto de observaciones.

Los de uso más frecuente son la media, la mediana y la moda, existen además los cuartíles, deciles, percentiles, etc.

Media aritmética ()

Se denomina simplemente Media o Promedio.

Viene a ser la suma ponderada de los valores de la variable por sus frecuencias relativas y lo denotaremos por y se calcula mediante la expresión:

Media Aritmética =

En términos matemáticos: Para una variable x Valor de la variable: x1; x2; x3; x4; ……xn

Media aritmética ()

Para datos sin agrupar , se utiliza :

Media aritmética ()

Características de la media aritmética

Para su cálculo

intervienen todos

los datos.

Toma en cuenta el número

de datos.

Es afectada por los valores

extremos.

Media aritmética ()

La media aritmética

de una constante es

igual a la misma

constante.

La media aritmética

del producto de una

constante por una

variable, es igual al

producto de la constante por la media

de la variable.

La media aritmética de la suma

de dos o más variables, es

igual a la suma de las medias de

cada una de dichas

variables.

La media de una variable

mas una constante,

es igual a la media de la variable más la constante.

Propiedades de la Media Aritmética

Ejemplo 1

Los puntajes obtenidos en 5 exámenes de estadística por Francoise son:

x1 = 13; x2 = 10; x3 = 14; x4 = 11; x5 = 10

Halla el promedio de notas e interpreta.

Solución:

Interpretación: El puntaje promedio obtenido por Francoise en el curso

de estadística es 11.6.

Ejemplo 2

El sueldo mensual de 5 profesores del Programa de Licenciatura en Lenguas Extranjeras sin titulo pedagógico son S/ 5 400, S/ 4 800, S/ 1 200, S/ 800, S/ 800 soles. Halla el promedio de los sueldos e interpreta.

Solución:

Interpretación El sueldo promedio mensual de los 5 profesores del

Programa de Licenciatura en Lenguas Extranjeras sin titulo pedagógico es de S/ 2 600.

Mediana (Me)

Es el valor que divide al total de las observaciones, previamente ordenadas o tabuladas, en dos partes de igual tamaño, en donde cada una de las partes contiene el mismo número de elementos.

Mediana (Me)

Para datos sin agrupar:

Cuando se tiene un número impar de datos▪ Entonces la mediana es igual al valor del término

central.

  Cuando se tiene un número par de

datos▪ Entonces la mediana es igual al promedio de los

dos términos centrales.

Mediana (Me) C

ara

cte

rísti

cas d

e

la M

ed

ian

a

Para su cálculo no intervienen todos los datos.

No está afectada por los valores extremos.

La mediana depende del número de datos y no de los valores de estos datos.

La mediana no necesariamente será un valor de los datos de la lista original.

Como estadígrafo de posición, la mediana le sigue en importancia y usos a la media.

Es una medida única, es decir, una distribución de datos tiene solamente una mediana.

Ejemplo 1

Dado las edades de 7 profesores 27, 30, 26, 24, 35, 25, 40 años. Halla la mediana e interpreta.

Solución:1º Ordenamos los datos en forma ascendente: 24, 25, 26, 27, 30, 35, 40.

2º Ubicamos el valor central: Me = 27  INTERPRETACIÓN

El 50% inferior de los profesores tiene edades iguales o menores que 27 y el otro 50% superior tiene edades iguales o mayores a 27 años.

Ejemplo 2

Los siguientes datos corresponden a las calificaciones obtenidas por Peter en el ciclo 2009-1 del curso de Gramática: 12 – 13 – 08 – 10 – 10 – 14 – 14 – 16 – 11 – 18.

Solución:1º ordenamos los datos: 08 – 10 – 10 – 11 – 12 – 13 – 14 – 14 – 16 – 18. 2º como el número de datos es par realizamos la semisuma de los valores centrales

Interpretación El 50% inferior de las calificaciones obtenidas por Peter en el

curso de Gramática son menores o iguales a 12,5 puntos y el otro 50% superior de las calificaciones son mayores o iguales a 12,5. 

Moda (Mo)

La moda es el valor que se repite con más frecuencia absoluta en un conjunto de datos de una variable.

También puede suceder que la distribución no tenga moda, en este caso se dice que la distribución es amodal.

Moda (Mo) – Características

Le sigue en

importancia a la

media y la mediana.

Es un estadígrafo muy útil cuando los datos son

de tipo cualitativo

s.

No es una medida única.

El cálculo de la moda

es independiente del valor de

los datos.

Ejemplos

EJEMPLO 1 El conjunto de valores 2, 2, 5, 7, 9, 9, 9, 10, 10, 11

tiene una moda igual a 9▪ Es decir, Mo = 9 ( es unimodal)

EJEMPLO 2 El conjunto de valores 12, 13, 13, 13, 13, 14, 14, 14,

15, 15, 15, 15 tiene dos modas el 13 y el 15, es decir, es bimodal.

  EJEMPLO 3

El conjunto de valores 5, 7, 8, 9, 11, 24, 31, 35 no tiene moda, es decir, es amodal.

Cuartiles, Deciles , Percentiles

Los cuartíles, deciles y percentiles son estadígrafos de posición que dividen al total de datos, previamente ordenados o tabulados, en proporciones.

Se usan frecuentemente para describir el comportamiento de una población. Los valores se expresan en forma porcentual

Cuartiles ( Qk )

Son estadígrafos que dividen al total de la información previamente ordenados (en forma ascendente o descendente) o tabulados en cuatro partes iguales.

Deciles ( Dk )

Son estadígrafos que dividen al total de la información previamente ordenados (en forma ascendente o descendente) o tabulados en diez partes iguales.

Percentiles ( Pk )

Son estadígrafos que dividen al total de la información previamente ordenados (en forma ascendente o descendente) o tabulados en cien partes iguales.

Percentiles ( Pk )

• Del grafico se puede inferir que la mediana ocupa el mismo lugar que el cuartíl Q2, el decil D5 y el percentil P50

Me = Q2 = D5 = P50

• Para hallar el percentil Pk se sigue el siguiente procedimiento.

1º Primero se ordenan los datos en forma ascendente o descendente.2º Se calcula el k% de n. (ubicación del dato nk)3º Si el resultado es un número entero. Pk = 4º Si el resultado no es entero Pk =

Medidas de Dispersión

Las medidas de dispersión con respecto al centro tienen una finalidad de ampliar la descripción de los datos, de comparar dos o más conjuntos de datos. Estas medidas de dispersión son números que miden el grado de separación de los datos con respecto a un valor central, que generalmente es la media aritmética.

Clasificación de las Medidas de Dispersión

MEDIDA DE

DISPERSIÓN ABSOL

UTA

• Se expresan en unidades de la variable, siendo las más usadas: Rango o Amplitud, Varianza, Desviación Estándar llamada también Desviación Típica, y Rango Intercuartílico.

MEDIDA DE

DISPERSIÓN RELAT

IVA

• No se expresan en unidades de la variable, siendo la más usada, el Coeficiente de Variación.

• Permiten identificar la concentración de los datos, respecto a una medida de posición, indica que a menor dispersión o variabilidad, mayor es la concentración de los datos respecto alrededor de esa medida de posición

Rango o Amplitud (R)

Es la diferencia entre el valor máximo y y el valor mínimo de las observaciones, es decir:

Características del Rango

El rango es de fácil manejo.

Para su cálculo no

intervienen todos los

datos, solo los valores extremos.

No toma en cuenta el

número de datos.

Ejemplo 1

El ingreso mensual de 4 profesores de estadística, contratados en un colegio particular son S/424, S/ 424.50, S/424 y S/ 423.50.

Solución:R = X Máximo – X mínimo

R = 424.50 – 423.50 R = 1

Interpretación Los datos tienen un rango o amplitud igual a 1. Es

decir es una muestra homogénea.

Ejemplo 2

El ingreso mensual de 4 profesores de estadística, contratados en un colegio estatal son S/424, S/ 373, S/424 y S/ 475

Solución:R = X Máximo – X mínimo

R = 475 - 373 R = 102

Interpretación Los datos tienen una amplitud igual a 102. Es decir es

una muestra dispersa.

Varianza ( S2)

Es el promedio de la suma de los cuadrados de las desviaciones de los valores de una variable respecto a su media aritmética.

Mide la dispersión de los datos respecto a su media aritmética.

Se calcula:

 

Varianza ( S2)

Cuanto mayor sea la varianza de una variable mayor dispersión existirá y por tanto menor representatividad tendrá la media aritmética. Esto sucede sobretodo cuando la media aritmética está afectada por valores extremos.

La varianza se expresa en las mismas unidades de la variable analizada, pero elevadas al cuadrado.

Características de la varianza

Es un número real no negativo.

Se expresa en unidades cuadráticas.

Ejemplo 1

Los datos corresponden a la estatura de 5 profesores 1.70, 1.64, 1.60, 1.62, 1.64. Halla la varianza e interpreta.

Solución: 1º Necesitamos el valor de la media aritmética.

Ejemplo 1

Luego, la varianza estará dado por: 

 

Interpretación Las estaturas de los profesores se dispersan en promedio

0.00112 m2, con respecto al valor central.

Ejemplo 2 Halla la varianza de los siguientes números 2, 3, 6, 8, 11.

Solución: 1º Hallamos la media aritmética

2º Una vez hallado la media reemplazamos en la fórmula:

Interpretación Los datos se dispersan en promedio 10.8 u2, con respecto al valor

central.

Desviación Estándar ( S )

Se define como la raíz positiva de la varianza.

Ejemplo 1

El tiempo que utilizan 6 niños de igual edad para desarrollar la misma tarea es 16, 12, 15, 18, 13, 14 minutos.

Solución:

2º Hallamos

Interpretación El tiempo utilizado por los niños para desarrollar las tareas se dispersa en promedio

1.97 minutos con respecto al valor central.

Rango intercuartílico ( IQR )

Se define como la diferencia que existe entre los cuartíles Q3 y Q1, por lo tanto es el intervalo que contiene el 50% central de los datos.

IQR = Q3 – Q1

Se usa como medida de dispersión cuando se ha empleado la mediana como medida de posición.

Ejemplo 1

El curso de estadística se dicta en 2 grupos, se desea determinar la dispersión del rendimiento en este curso a partir de la siguiente información:

Calcula el rango intercuartílico para ambos turnos e interpreta.

TURNO Q1 Q3

MAÑANA

12.3 22.7

NOCHE 15.6 21.6

Solución del ejemplo 1

Turno Mañana:1º IQRM = Q3 – Q1

2º IQRM = 22.7 – 12.3

3º IQRM = 10.4

Turno Noche:1º IQRN = Q3 – Q1

2º IQRN = 21.6 – 15.6

3º IQRN = 6

  Interpretación

El grupo que tiene rendimiento más homogéneo con respecto a la mediana es el turno de la noche por tener menor rango intercuartílico.

Coeficiente de variación

Es la desviacion estandar como un porcentaje de la media aritmetica.

CV (X) =

Características del coeficiente de variación

Se puede expresar sin considerar la unidad de la

variable

Compara la dispersión

de datos de variables

diferentes

No es recomendabl

e calcular cuando la

media tiende al valor cero o variables con valores negativas

Ejemplo 1

Las calificaciones de la primera unidad del curso de Literatura Inglesa de dos alumnos es como sigue :

¿Quién rinde en forma mas heterogénea?

Obs 1 2 3 4 5 6 7 8 9 10Alumno 1 12 16 12 11 10 14 10 10 15 12Alumno 2 11 12 15 10 16 16 15 16 16 16

Solución

Para el alumno 1 1° Calculamos la media aritmetica

= 12,27 2° Calculamos la desviación estandar

S= 1,95 Luego el coeficiente de variacion para el alumno 1 es :

CV (X) = = x 100 = 15,88%

Solución

Para el alumno 21° Calculamos la media aritmetica

= 14,602° Calculamos la desviación estandar

S= 1,99 Luego el coeficiente de variacion para el alumno 1 es :

CV (X) = = x 100 = 13,65 %

Interpretación del ejemplo 1

Se observa que el CV del alumno 2 es menor que el alumno 1, por tanto es más homogeneo o menos disperso, respecto a su media

Medida de Forma

Permite tener una idea de la forma de la distribucion de una variable cuantitativa