Date post: | 20-Feb-2017 |
Category: |
Documents |
Upload: | ariel-aranda |
View: | 411 times |
Download: | 0 times |
Conceptos básicos deEstadística Aplicada
Mario Ariel Aranda
Estadísticas
La recopilación y la interpretación de losdatos obtenidos en un estudio es tarea de laestadística, considerada como una rama dela matemática. Las estadísticas (el resultadode la aplicación de un algoritmo estadístico a ungrupo de datos) permiten la toma de decisionesdentro del ámbito gubernamental, pero tambiénen el mundo de los negocios y el comercio.
Población
Es el conjunto de todos los elementosque presentan una característica comúndeterminada, observable y medible. Porejemplo, si el elemento es una persona,se puede estudiar las característicasedad, peso, nacionalidad, sexo, etc.Las características de la población seresumen en valores llamados parámetros.
Muestra
La mayoría de los estudios estadísticos, serealizan no sobre la población, sino sobre unsubconjunto o una parte de ella, llamadomuestra, partiendo del supuesto de que estesubconjunto presenta el mismo comportamientoy características que la población. En general eltamaño de la muestra es mucho menor altamaño de la población.
Población y Muestra
Frecuencia
• Se llama frecuencia a la cantidad de veces quese repite un determinado valor de la variable.
• Frecuencia absoluta es el número de vecesque este valor aparece en el estudio. A mayortamaño de la muestra aumentará el tamaño dela frecuencia absoluta.
• Frecuencia relativa (fi), es el cociente entre lafrecuencia absoluta y el tamaño de la muestra(N). Es decir:
Problema
• Se detallan los valores de glucemia obtenidasen una guardia del Hospital Gandulfo:110-98-400-130-100-95-85-250-130-200-100-110-300-130-550-99-130-110-120-89
Se pide:a) analizar las frecuencias absolutas de cada
resultadob) analizar las frecuencias absolutas de cada
resultado
Variable
Se llama variable a una característica quese observa en una población o muestra, ya la cual se desea estudiar.La variable puede tomar diferentes valoresdependiendo de cada individuo.Una variable se puede clasificar de lasiguiente manera.
Tipos de Variables
• Continua: son valores reales. Puedentomar cualquier valor dentro de unintervalo. Ej. Peso, estatura, sueldos.
• Discreta: toma valores enteros. Ej. N° dehijos de una familia, n° de alumnos de uncurso.
Variable-Población y Muestra
Se pretende averiguar cuantos Alumnosde los que concurren al instituto deFormación docencia viven en capitalfederal
Población: todos los alumnos queconcurren al instituto
Muestra: alumnos de primer año-Hemoterapia
Variable: los alumnos que viven en capitalfederal
Sucesos-Espacio-Tiempo
Al extraer una carta de una baraja, lanzar unamoneda, tirar un dado, y en otros ejemplos análogos,no podemos saber de antemano el resultado que seva a obtener. Son experimentos aleatorios, aquellosen los que no se puede predecir el resultado y de ellosse trata aquí.El conjunto de todos los posibles resultados de unexperimento aleatorio se llama espacio muestral, ycada uno de esos posibles resultados es un sucesoelemental.
Definición
Un suceso es cualquier subconjunto delespacio muestral, se verifica cuandoocurre cualquiera de los sucesoselementales que lo forman.
Ejemplo
• Se lanza un dado y se observa elresultado obtenido:
• Espacio muestral: 1-2-3-4-5-6• Suceso elemental: 1• Suceso Vacío o imposible: 0-7-8….• Suceso cierto: es aquel que siempre se
verifica, numero mayor que cero peromenor que siete
Probabilidad
Se dice que un suceso A es másprobable que otro B si al realizar elexperimento muchas veces, A ocurresignificativamente más veces que B.La probabilidad se mide entre 0(probabilidad del suceso imposible) y 1 o100% (probabilidad del suceso seguro).
Cuando en un experimento aleatorio todos lossucesos elementales tienen la mismaprobabilidad, equiprobables, para calcular laprobabilidad de un suceso cualquiera A, bastacontar y hacer el cociente entre el nº de sucesoselementales que componen A (casosfavorables) y el nº de sucesos elementalesdel espacio muestral (casos posibles) espacio.
Definiciones
• Experimento: se denomina experimento a unproceso de observación o medición cualquiera.Por ejemplo, lanzar 2 dados y anotar susresultados
• Espacio muestral: es el conjunto de todos losposibles resultados de un experimento, elespacio muestral dellanzamiento de los 2 dados, son todos los paresordenados que se pueden formar con los 2dados, es decir (1,1), (1,2), (1,3),..., (6,6). Entotal 36 pares. Se designa por E.
Definiendo…
• Evento: es un subconjunto del espacio muestral.Son elementos del espacio muestral quecumplen con alguna condición dada. Porejemplo, el evento “que los dados sumen7”. Lospares ordenados que cumplen esta condiciónson: (2,5), (5,2), (3,4) y (4,3).Los eventos se anotan con letras del abecedariomayúsculas, ejemplo A, B,C,..., etc.
Definiendo…
• Probabilidad de un evento: Los eventosque designaron con las letras A, B,C,...tienen una probabilidad asociada a cadauno de ellos y se designa como P(A),P(B), P(C),..., etc.
• La probabilidad de un evento es unnúmero real no negativo y no superior a 1,que mide la posibilidad que suceda dichoevento
Propiedades
• Se cumple que:• a) P(A) ≥ 0• b) P(E) =1• c) 0 ≤ P(A) ≤ 1• d) P(A) + P(A’)=1 donde A’ es el
complemento de A.
P(A) = Nº de casos posibles del evento ANº de casos totales
Ejemplo…
• Cual es la probabilidad de que si tiro lamoneda sale" cara ”?
Definición
• Eventos mutuamente excluyentes: dos omás eventos son mutuamenteExcluyentes si y solo si no pueden ocurriral mismo tiempo, es decir, la ocurrenciade un evento A impide automáticamente laocurrencia de un evento B.
Ej.: Al extraer una carta de un naipe de 52 cartas. Sea A = sacar unas. B = sacar un rey.
Desvío estándar
• La desviación estándar (σ) mide cuánto seseparan los datos.
• La fórmula: es la raíz cuadrada dela varianza. Así que, "¿qué es lavarianza?"
Varianza
la varianza ( es el cuadrado de la desviaciónestándar: σ2)
Es la media de las diferencias con lamedia elevadas al cuadrado.En otras palabras, sigue estos pasos:1. Calcula la media (el promedio de losnúmeros)2. Ahora, por cada número resta la media yeleva el resultado al cuadrado (la diferenciaelevada al cuadrado).3. Ahora calcula la media de esas diferencias alcuadrado. (¿Por qué al cuadrado?)
Varianza
• Esta medida nos permite identificar ladiferencia promedio que hay entre cadauno de los valores respecto a su puntocentral (Media ).
Media
• La media aritmética es el promedio de unconjunto de números, a1, a2, a3, . . ., an,obtenida sumando todos los números ydividiéndola entre n. (media aritmética) =(a1+a2+a3+ . . . +an)/n
Formula del desvío estándar
Mediana
• Es el valor medio en un conjunto de valores ordenados.• Sean los datos de una muestra ordenada en orden creciente y
designando la mediana como , distinguimos dos casos:
• a) Si n es impar, la mediana es el valor que ocupa la posición unavez que los datos han sido ordenados (en orden creciente odecreciente), porque éste es el valor central.
• b) Si n es par, la mediana es la media aritmética de los dos valores
centrales.
Problema
• Los datos representan la edad de losmiembros de un grupo de niños queasisten a un servicio de pediatría en elmes de enero del 2013.
4, 1, 11, 13, 2, 7 , 12, 5, 8,Hallar :a) La mediab) La Medianac) El desvío estándar
Respuestas:
Media: 7 años
Mediana: 7 años
Desvío: 4,36 años
Problema
• Las notas de inglés de una clase de 40alumnos han sido las siguientes:
• Calcular: frecuencia, Media, mediana,Varianza, desvío estándar
• Cual es la probabilidad de obtener un 7?
1 7 9 2 5 4 4 3 7 84 5 6 7 6 4 3 1 5 92 6 4 6 5 2 2 8 3 64 5 2 4 3 5 6 5 2 4
Varianza-Ejemplo
• Hallar la desviación media, la varianza yla desviación estandar de la series denúmeros siguientes:
a) 2, 3, 6, 8, 11.b) 12, 6, 7, 3, 15, 10, 18, 5.
Respuestas: a) Media=6, Var=10.8, σ=3.28
b) Media=9.7, Var=23.75, σ=4.87
Coeficiente de Variación
El Coeficiente de variación (CV) es unamedida de la dispersión relativa de unconjunto de datos, que se obtienedividiendo la desviación estándar delconjunto entre su media aritmética y seexpresa generalmente en términosporcentuales.
Coeficiente de Variación/ Desvíoestándar
• CV:El coeficiente de variación esuna medida que indica, quétan dispersos o separadosestán los datos, unos conrespecto a otros. Un CVcercano a cero indica que losdatos están muy juntos (o sonmuy similares), mientras queun CV muy grande (cercano a100% o a 1, o mayor a estosvalores) indica que los datosestán muy dispersos o sonmuy diversos.
• DS:La desviación estándar da unamedida de lo que, enpromedio, se aleja cada datode la media.
Problema
• Dos Contadores hematológicosutilizados durante un día registran sobrelas mismas muestras los siguientesvalores de GR
Equipo 1: x(106) 4,5-5,0-3,5-5,3-4,3-3,8-5,2Equipo 2: x(106) 3,9-4,8-4,2-4,2-4,8-3,3-4,6Se pide:a) Analizar el CV para ambos contadoresb) Cual seria el mas apto? fundamente
Distribución Normal
La mas utilizada de las distribuciones continuases la distribución normal. Esta distribución conun gráfico como campana se centra en el valorpromedio, denominado μ y su dispersiónrespecto a él, se denomina σ, llamadadesviación estándar.La función normal describe de forma aproximadamuchos fenómenos que suceden en lanaturaleza tales como la estatura de laspersonas, el coeficiente intelectual en los niños,etc.
Gráficos
Área bajo la curva = 1
Gráficos
• Una propiedad importante de ladistribución normal, es que cualquierfunción lineal de una variable aleatoriadistribuida normal, también tienedistribución normal, es decir, si x ∼ N.Entonces y = ax + b, también y ∼ N.Se denota x ∼ N (μ, σ2)Si y = ax + b ⇒ y ∼ N(aμ + b; a2σ2)
Puede existir un nº infinito dedistribuciones normales posibles, cadauna con su propia media y su desviaciónestándar ya que obviamente no se puedeanalizar un nº tan grande de posibilidades,es necesario convertir todas estasdistribuciones normales a la formaestándar. Esta conversión se hace através de la variable Z.
Estandarización
Z =σ− μX
Donde Z es una variable aleatoria normal con media ceroy varianza 1.La variable Z se define como el nº de desviacionesestándar a las una observación está de la media.
Ej.: Un curso tiene un promedio de 1,75 m de estatura, condesviación de 2 m.Si un alumno tiene una estatura de 1.8 m entoncesZ = 1.80 – 1.75 Z= 0.93
2esto quiere decir que su estatura esta a 0.93 desviación estándarpor sobre de la media
Estandarización
• Estandarizar una distribución normalpermite determinar mas fácilmente laprobabilidad de que ocurra cierto evento.
• La probabilidad de un evento estarelacionado con el área bajo la curvanormal estándar en el punto Z.
Otro ejemplo
• La edad de los estudiantes de Técnico enhemoterapia de la capital federal sigueuna distribución normal con x ∼ N (25, 10)
• Cual es la probabilidad de que encuentrea un alumno con 40 años?
Z=40 – 25 = 1.510
La probabilidad es el área bajola curva desde Z=1.5 hacia laizquierda
Una curva normal queda completamentedeterminada una vez que se especifica μ yσ2
Formas de los gráficos
Este gráfico muestra la curva normal manteniendo la mismavariabilidad pero distinta media
Formas de los gráficos
A diferencia del anterior se observan distinta curvasnormales con la misma media y diferentes variabilidades.Mientras más alta es la variabilidad la curva se aplana.
Otras formas de curvas
Propiedades
• La simetría se da conla recta vertical x = μ
• El 99,73% de lasobservacionesquedan incluidas enel intervalo μ - 3σ, μ +3σ
• P(μ − 3σ < x < μ + 3σ ) = 0,9973• P(μ − 2σ < x < μ + 2σ ) = 0.9594• P(μ − σ < x < μ + σ ) = 0.6845
Utilidad
• El laboratorio deberealizarla verificaciónde los métodos yevidenciar si cumplencon las característicasde desempeño en lascondiciones dellaboratorio.
• Linealidad.• Precisión.• Veracidad.• Incertidumbre.
Linealidad
Evaluar el intervaloanalítico del métodoen el laboratorio.• El comportamientolineal.• La verificación debetomar en cuenta lospuntos de decisiónclínica.
Exactitud
Expresa la cercanía entre elvalor que es aceptado, seacomo unvalor convencional verdadero(material de referencia internode la firma), sea como un valordereferencia aceptado (materialde referencia certificado oestándar de una farmacopea)y el valorencontrado (valor promedio)obtenido al aplicar elprocedimiento de análisis uncierto número deveces.(Sistematico).
Precisión
Expresa la cercanía decoincidencia (grado dedispersión) entre unaserie de medicionesobtenidas de múltiplesmuestreos de una mismamuestra homogénea bajocondiciones establecidas.
Resumiendo
Evaluemos dos métodos analíticos
Método unoMedia: 70.5Desvío estándar: 0.005
Método dosMedia: 100.1Desvío Estándar: 10
Se analizan dos métodos de fundamento distinto para evaluar glucosa ensangre, se utiliza un estándar o patrón con un valor de fabrica de90.9g/dl
a) Dibuje en un mismo par de ejes las dos curvas esperadas
b) Elija el método mas conveniente y justifique
Evaluemos dos métodos analíticos