Post on 25-Jan-2016
transcript
La Estadística Inferencial en el Proceso Investigativo
Henry Gallardo Pérez
La UFPS soy yo, eres tú, somos todos
La UFPS soy yo, eres tú, somos todos
ObjetivosObjetivos
•Identificar las propiedades de los estimadores y aplicarlas en la solución de problemas•Utilizar métodos formales para realizar estimaciones y pruebas de hipótesis•Establecer criterios de evaluación, especificación y verificación del modelo estadístico•Establecer fundamentos básicos para la toma de decisiones con base en las inferencias obtenidas a partir del modelo
•Identificar las propiedades de los estimadores y aplicarlas en la solución de problemas•Utilizar métodos formales para realizar estimaciones y pruebas de hipótesis•Establecer criterios de evaluación, especificación y verificación del modelo estadístico•Establecer fundamentos básicos para la toma de decisiones con base en las inferencias obtenidas a partir del modelo
Especialización en Estadística AplicadaEstadística Inferencial
Contenidos TemáticosContenidos Temáticos
•Introducción•Población y Muestra•Estimación
•Estimadores
•Estimación puntual
•Estimación por intervalo
•Pruebas de Hipótesis•Pruebas paramétricas
•Pruebas no paramétricas
•Introducción•Población y Muestra•Estimación
•Estimadores
•Estimación puntual
•Estimación por intervalo
•Pruebas de Hipótesis•Pruebas paramétricas
•Pruebas no paramétricas
Especialización en Estadística AplicadaEstadística Inferencial
BibliografíaBibliografía
•PEÑA SANCHEZ DE RIVERA, DANIEL. Estadística Modelos y Métodos, 1. Fundamentos, Alianza Editorial, Madrid•BICKEL, PETER. Matematical Statistics, Prentice Hall, New Jersey•MENDENHALL, W., SCHEAFFER, WACKERLY. Estadísica Matemática con Aplicaciones, Editorial Iberoamérica, México•WALPOLE, R., R. MYERS, S. MIERS. Probabilidad y Estadística para Ingenieros, Pearson, Ed.
•PEÑA SANCHEZ DE RIVERA, DANIEL. Estadística Modelos y Métodos, 1. Fundamentos, Alianza Editorial, Madrid•BICKEL, PETER. Matematical Statistics, Prentice Hall, New Jersey•MENDENHALL, W., SCHEAFFER, WACKERLY. Estadísica Matemática con Aplicaciones, Editorial Iberoamérica, México•WALPOLE, R., R. MYERS, S. MIERS. Probabilidad y Estadística para Ingenieros, Pearson, Ed.
Especialización en Estadística AplicadaEstadística Inferencial
¿Para qué sirve la Estadística?¿Para qué sirve la Estadística?
La Ciencia se ocupa en general de fenómenos observablesLa Ciencia se desarrolla observando hechos, formulando leyes que los explican y realizando experimentos para validar o rechazar dichas leyesLos modelos que crea la ciencia son de tipo determinista o aleatorio (estocástico)La Estadística se utiliza como tecnología al servicio de las ciencias donde la variabilidad y la incertidumbre forman parte de su naturaleza
La Ciencia se ocupa en general de fenómenos observablesLa Ciencia se desarrolla observando hechos, formulando leyes que los explican y realizando experimentos para validar o rechazar dichas leyesLos modelos que crea la ciencia son de tipo determinista o aleatorio (estocástico)La Estadística se utiliza como tecnología al servicio de las ciencias donde la variabilidad y la incertidumbre forman parte de su naturaleza
Especialización en Estadística AplicadaEstadística Inferencial
¿Para qué sirve la Estadística?¿Para qué sirve la Estadística?
La Estadística es la Ciencia de la
•Sistematización, recolección, ordenación y presentación de los datos referentes a un fenómeno que presenta variabilidad o incertidumbre para su estudio metódico, con objeto de
•deducir las leyes que rigen esos fenómenos,
•y poder de esa forma hacer previsiones sobre los mismos, tomar decisiones u obtener conclusiones.
La Estadística es la Ciencia de la
•Sistematización, recolección, ordenación y presentación de los datos referentes a un fenómeno que presenta variabilidad o incertidumbre para su estudio metódico, con objeto de
•deducir las leyes que rigen esos fenómenos,
•y poder de esa forma hacer previsiones sobre los mismos, tomar decisiones u obtener conclusiones.
Especialización en Estadística AplicadaEstadística Inferencial
Descrip
tiva
Probabili
dad
Infe
rencia
DefiniciónDefinición
Estadística es la ciencia de: Recolectar Describir Organizar Interpretar
para transformarlos en información, para la toma mas eficiente de decisiones.
Estadística es la ciencia de: Recolectar Describir Organizar Interpretar
para transformarlos en información, para la toma mas eficiente de decisiones.
Especialización en Estadística AplicadaEstadística Inferencial
Datos
Tipos de EstadísticaTipos de Estadística
Estadística Descriptiva: Método de recolectar, organizar, resumir y presentar los datos en forma informativa.
Estadística inferencial: Métodos usados para determinar algo acerca de la población, basado en una muestra.
Estadística Descriptiva: Método de recolectar, organizar, resumir y presentar los datos en forma informativa.
Estadística inferencial: Métodos usados para determinar algo acerca de la población, basado en una muestra.
Especialización en Estadística AplicadaEstadística Inferencial
Método Científico y EstadísticaMétodo Científico y Estadística
Especialización en Estadística AplicadaEstadística Inferencial
Teoría o Conocimiento Actual
Observaciones
Resultados
Conclusiones
Hipótesis operativa
Hipótesis conceptual
Identificación de un problema
Diseño
Recolección de datos
Análisis
Interpreta-ción
Generalización
Método Científico y EstadísticaMétodo Científico y Estadística
Especialización en Estadística AplicadaEstadística Inferencial
Plantear hipótesis
Obtenerconclusiones
Recoger datosy analizarlos
Diseñar experimento
Especialización en Estadística AplicadaEstadística Inferencial
Problema realProblema realProblema realProblema real
Depuración de los datosDepuración de los datos(Análisis de datos)(Análisis de datos)
Depuración de los datosDepuración de los datos(Análisis de datos)(Análisis de datos)
Estimación de los parámetrosEstimación de los parámetros(Teoría de la estimación)(Teoría de la estimación)
Estimación de los parámetrosEstimación de los parámetros(Teoría de la estimación)(Teoría de la estimación)
Modelos EstadísticosModelos Estadísticos(Cálculo de probabilidades)(Cálculo de probabilidades)
Modelos EstadísticosModelos Estadísticos(Cálculo de probabilidades)(Cálculo de probabilidades)
Planteamiento del problemaPlanteamiento del problemaObjetos y mediosObjetos y medios
Planteamiento del problemaPlanteamiento del problemaObjetos y mediosObjetos y medios
Recolección de información muestralRecolección de información muestral(Técnicas de muestreo ; diseño de experimentos)(Técnicas de muestreo ; diseño de experimentos)
Recolección de información muestralRecolección de información muestral(Técnicas de muestreo ; diseño de experimentos)(Técnicas de muestreo ; diseño de experimentos)
Especialización en Estadística AplicadaEstadística Inferencial
Contrastes de SimplificaciónContrastes de Simplificación(Contrastes de hipótesis)(Contrastes de hipótesis)
Crítica y Diagnosis del ModeloCrítica y Diagnosis del Modelo(Análisis de datos)(Análisis de datos)
Nuevo Conocimiento Nuevo Conocimiento
PrevisionesPrevisiones DecisionesDecisiones
La UFPS soy yo, eres tú, somos todos
Universo de EstudioUniverso de Estudio
Universo Ideal:
Conjunto sobre el cual el investigador, pretende obtener alguna información.
Sobre el cual recaerán las consecuencias de las decisiones basadas en los resultados de la encuesta
Universo Ideal:
Conjunto sobre el cual el investigador, pretende obtener alguna información.
Sobre el cual recaerán las consecuencias de las decisiones basadas en los resultados de la encuesta
Especialización en Estadística AplicadaEstadística Inferencial
Universo de EstudioUniverso de Estudio
Población Objetivo:
Conjunto de elementos que partiendo del universo ideal puede realmente ser alcanzado por el investigador.
Se obtiene de los ajustes y/o recortes por operatividad, razones políticas, económicas o sociales
Población Objetivo:
Conjunto de elementos que partiendo del universo ideal puede realmente ser alcanzado por el investigador.
Se obtiene de los ajustes y/o recortes por operatividad, razones políticas, económicas o sociales
Especialización en Estadística AplicadaEstadística Inferencial
Universo de EstudioUniverso de Estudio
Marco de Muestreo:
Dispositivo que permite identificar y ubicar los sujetos que toman parte en los diferentes procesos de selección al azar.
Tipos de Marco: Lista o área.
Marco de Muestreo:
Dispositivo que permite identificar y ubicar los sujetos que toman parte en los diferentes procesos de selección al azar.
Tipos de Marco: Lista o área.
Especialización en Estadística AplicadaEstadística Inferencial
Universo de EstudioUniverso de Estudio
Población susceptible de encuesta:
Conjunto de elementos del marco muestral con probabilidad mayor a cero de ser incluidos en la muestra.
Esto, porque el hecho de ubicar los elementos no implica tener acceso a ellos.
Población susceptible de encuesta:
Conjunto de elementos del marco muestral con probabilidad mayor a cero de ser incluidos en la muestra.
Esto, porque el hecho de ubicar los elementos no implica tener acceso a ellos.
Especialización en Estadística AplicadaEstadística Inferencial
Universo de EstudioUniverso de Estudio
La meta del muestrista es encontrar mecanismos que cierren la brecha entre el universo ideal del investigador y la población susceptible de encuesta.
Considerar diferentes marcos de muestreo y planear formas de acceso adecuadas para diversos subconjuntos del universo
La meta del muestrista es encontrar mecanismos que cierren la brecha entre el universo ideal del investigador y la población susceptible de encuesta.
Considerar diferentes marcos de muestreo y planear formas de acceso adecuadas para diversos subconjuntos del universo
Especialización en Estadística AplicadaEstadística Inferencial
Población y MuestraPoblación y Muestra
Población: Conjunto de todas las unidades de análisis de interés para una investigación
Muestra: Subconjunto de la población
Una muestra es representativa si es de un tamaño suficientemente grande y mantiene una estructura similar a la de la población
Población: Conjunto de todas las unidades de análisis de interés para una investigación
Muestra: Subconjunto de la población
Una muestra es representativa si es de un tamaño suficientemente grande y mantiene una estructura similar a la de la población
Especialización en Estadística AplicadaEstadística Inferencial
Población y MuestraPoblación y Muestra
Especialización en Estadística AplicadaEstadística Inferencial
Población
Muestra
Criterios de Inclusión y de exclusiónCriterios de Inclusión y de exclusión
Criterios de inclusión: son las características necesarias para que las unidades de análisis formen parte de la población de estudio.
Criterios de exclusión: son las características no necesarias o excluyentes para que las unidades de análisis formen parte de la población de estudio.
Criterios de inclusión: son las características necesarias para que las unidades de análisis formen parte de la población de estudio.
Criterios de exclusión: son las características no necesarias o excluyentes para que las unidades de análisis formen parte de la población de estudio.
Especialización en Estadística AplicadaEstadística Inferencial
Parámetro y EstadísticaParámetro y Estadística
• Parámetro: Es un indicador de la población calculado con base en la información de todas las unidades de análisis
• Estadística: Indicador de la población calculado con base en la información suministrada por la muestra
• Parámetro: Es un indicador de la población calculado con base en la información de todas las unidades de análisis
• Estadística: Indicador de la población calculado con base en la información suministrada por la muestra
Especialización en Estadística AplicadaEstadística Inferencial
Muestra RepresentativaMuestra Representativa
•Reúne las características principales de la población en relación a la variable o condición particular que se estudia, por lo tanto, los resultados y conclusiones obtenidos en esta muestra se pueden generalizar a la población de la cual fue extraída.•La representatividad de una muestra está dada por:
•Su tamaño•El tipo de muestreo que garantiza la inclusión de las variables relevantes presentes en la población
•Reúne las características principales de la población en relación a la variable o condición particular que se estudia, por lo tanto, los resultados y conclusiones obtenidos en esta muestra se pueden generalizar a la población de la cual fue extraída.•La representatividad de una muestra está dada por:
•Su tamaño•El tipo de muestreo que garantiza la inclusión de las variables relevantes presentes en la población
Especialización en Estadística AplicadaEstadística Inferencial
Plan de MuestreoPlan de Muestreo
•Definición concreta y clara de los objetivos de la encuesta o estudio.
•Traducción de los objetivos del estudio en resultados estadísticos.
•Especificación de la Población Objetivo.
•Construcción, revisión del marco muestral.
•Inventario de Recursos disponibles.
•Definición concreta y clara de los objetivos de la encuesta o estudio.
•Traducción de los objetivos del estudio en resultados estadísticos.
•Especificación de la Población Objetivo.
•Construcción, revisión del marco muestral.
•Inventario de Recursos disponibles.
Especialización en Estadística AplicadaEstadística Inferencial
Plan de MuestreoPlan de Muestreo
•Especificaciones de los acuerdos necesarios con el usuario.
•Especificaciones de los métodos de recolección de Información, elaboración de los instrumentos de recolección, cuestionarios, manuales, capacitación, mapas.
•Especificación del diseño muestral, mecanismos de selección, varianza de los estimadores.
•Especificaciones de los acuerdos necesarios con el usuario.
•Especificaciones de los métodos de recolección de Información, elaboración de los instrumentos de recolección, cuestionarios, manuales, capacitación, mapas.
•Especificación del diseño muestral, mecanismos de selección, varianza de los estimadores.
Especialización en Estadística AplicadaEstadística Inferencial
Plan de MuestreoPlan de Muestreo
•Determinación del tipo de procesamiento a realizar, critica e imputación.
•Especificación de las fórmulas de estimación y de las medidas de calidad.
•Planear el trabajo de campo
•Diseño del plan de control y evaluación.
•Determinación del tipo de procesamiento a realizar, critica e imputación.
•Especificación de las fórmulas de estimación y de las medidas de calidad.
•Planear el trabajo de campo
•Diseño del plan de control y evaluación.
Especialización en Estadística AplicadaEstadística Inferencial
Investigación Total y ParcialInvestigación Total y Parcial
Dependiendo del objetivo que se persiga, puede realizarse una investigación exhaustiva o una parcial. • EXHAUSTIVA: Se observan todas las unidades que constituyen la población o universo, objeto de investigación. • La enumeración total de toda la población en un tiempo dado, recibe el nombre de CENSO (censo de población, de industria manufacturera de tiendas del sector agropecuario, de establecimientos educativos, etc.)
Dependiendo del objetivo que se persiga, puede realizarse una investigación exhaustiva o una parcial. • EXHAUSTIVA: Se observan todas las unidades que constituyen la población o universo, objeto de investigación. • La enumeración total de toda la población en un tiempo dado, recibe el nombre de CENSO (censo de población, de industria manufacturera de tiendas del sector agropecuario, de establecimientos educativos, etc.)
Especialización en Estadística AplicadaEstadística Inferencial
Cuándo no se recomienda un censoCuándo no se recomienda un censo
• Cuando la población sea infinita. • Cuando aún siendo finita es muy numerosa• Por motivos de tiempo• Cuando el costo es superior a los recursos disponibles• Cuando la observación implique destrucción de los elementos.• Cuando se desea obtener información especializada.• Cuando la característica sea homogénea
• Cuando la población sea infinita. • Cuando aún siendo finita es muy numerosa• Por motivos de tiempo• Cuando el costo es superior a los recursos disponibles• Cuando la observación implique destrucción de los elementos.• Cuando se desea obtener información especializada.• Cuando la característica sea homogénea
Especialización en Estadística AplicadaEstadística Inferencial
Error en la InvestigaciónError en la Investigación
Especialización en Estadística AplicadaEstadística Inferencial
Error de
M uestreo
S ust itución de la inf ormación
M edición - A nálisis de datos
Defi nición de la población
Estructura de la muestra
Errores del
I nvest igador
S elección de los entrevistados
Preguntar
Registro
Engaño
Errores del
Entrevistador
I ncapacidad
Falta de voluntad
Errores del
Entrevistado
Error en la Respuesta Error de no Respuesta
Error N o de
muestreo
ERRO R T O T A L
VariablesVariables
•Una variable es un aspecto, rasgo, cualidad o característica de un sujeto, objeto o fenómeno que, por su misma naturaleza, tiende a variar o a adoptar distintas magnitudes, medibles cuantitativamente o cualitativamente •Son manifestaciones de la realidad. Por intermedio de ellas podemos conocer y medir la realidad, el hecho o fenómeno. •La información que disponemos de cada individuo es resumida en variables
•Una variable es un aspecto, rasgo, cualidad o característica de un sujeto, objeto o fenómeno que, por su misma naturaleza, tiende a variar o a adoptar distintas magnitudes, medibles cuantitativamente o cualitativamente •Son manifestaciones de la realidad. Por intermedio de ellas podemos conocer y medir la realidad, el hecho o fenómeno. •La información que disponemos de cada individuo es resumida en variables
Especialización en Estadística AplicadaEstadística Inferencial
Variables de InterésVariables de Interés
Existe una diferencia importante entre la variable ideal del investigador y la variable operacional, es decir aquella que está en condiciones de ser observada y ser objeto de medición.
Encontrar la forma en que la variable operacional refleje lo más cercanamente posible el concepto que el investigador pretende estudiar.
Existe una diferencia importante entre la variable ideal del investigador y la variable operacional, es decir aquella que está en condiciones de ser observada y ser objeto de medición.
Encontrar la forma en que la variable operacional refleje lo más cercanamente posible el concepto que el investigador pretende estudiar.
Especialización en Estadística AplicadaEstadística Inferencial
Operacionalización de VariablesOperacionalización de Variables
Especialización en Estadística AplicadaEstadística Inferencial
Características de las VariablesCaracterísticas de las Variables
1. Ser parte de un todo: El conjunto de variables constituye el todo objeto de la investigación; o el todo, con fines de análisis investigativo, se descompone en variables, cuya estructura y evolución hay que estudiar.
2. Ser observable.- directa o indirectamente.
3. Ser susceptibles de variación cuantitativa o cualitativa: ser una magnitud en proceso.
1. Ser parte de un todo: El conjunto de variables constituye el todo objeto de la investigación; o el todo, con fines de análisis investigativo, se descompone en variables, cuya estructura y evolución hay que estudiar.
2. Ser observable.- directa o indirectamente.
3. Ser susceptibles de variación cuantitativa o cualitativa: ser una magnitud en proceso.
Especialización en Estadística AplicadaEstadística Inferencial
Funciones de las Variables en el Proceso de Investigación
Funciones de las Variables en el Proceso de Investigación
1. Analiza la realidad objeto de investigación.Para conocer la realidad, hay que seguir un proceso analítico, descomponiéndola en variables. Un esfuerzo de síntesis posterior será restituir el todo.
1. Analiza la realidad objeto de investigación.Para conocer la realidad, hay que seguir un proceso analítico, descomponiéndola en variables. Un esfuerzo de síntesis posterior será restituir el todo.
Especialización en Estadística AplicadaEstadística Inferencial
Funciones de las Variables en el Proceso de Investigación
Funciones de las Variables en el Proceso de Investigación
2. Orienta el establecimiento de indicadores. Un riesgo que constantemente se vive en el proceso de investigación es el de dudar. Este riesgo se supera si se tienen establecidas las variables, las que provienen de un marco teórico bien fundamentado. De las variables determinadas provienen las indicaciones, que nos señalan cual es la información que necesitamos para llegar a conclusiones científicas.
2. Orienta el establecimiento de indicadores. Un riesgo que constantemente se vive en el proceso de investigación es el de dudar. Este riesgo se supera si se tienen establecidas las variables, las que provienen de un marco teórico bien fundamentado. De las variables determinadas provienen las indicaciones, que nos señalan cual es la información que necesitamos para llegar a conclusiones científicas.
Especialización en Estadística AplicadaEstadística Inferencial
Funciones de las Variables en el Proceso de Investigación
Funciones de las Variables en el Proceso de Investigación
3. Permiten descubrir las fuentes de información.Las variables e indicadores nos señalan cuál es la información que necesitamos y donde podemos encontrarla.
3. Permiten descubrir las fuentes de información.Las variables e indicadores nos señalan cuál es la información que necesitamos y donde podemos encontrarla.
Especialización en Estadística AplicadaEstadística Inferencial
Funciones de las Variables en el Proceso de Investigación
Funciones de las Variables en el Proceso de Investigación
4. Miden el grado de variabilidad del problema de investigación.Todo está en permanente movimiento, al momento de investigar se debe identificar el ritmo de este movimiento en el fenómeno o hecho de investigación.
4. Miden el grado de variabilidad del problema de investigación.Todo está en permanente movimiento, al momento de investigar se debe identificar el ritmo de este movimiento en el fenómeno o hecho de investigación.
Especialización en Estadística AplicadaEstadística Inferencial
Clases de VariablesClases de Variables
Existen innumerables tipos de variables, vamos a describir las más útiles:
I.- Según como se expresan los valores o por naturaleza de su medición pueden ser:a) Categórica – cualitativa b) Cuantitativa – numérica
Variable discreta o discontinua Variable continua
Existen innumerables tipos de variables, vamos a describir las más útiles:
I.- Según como se expresan los valores o por naturaleza de su medición pueden ser:a) Categórica – cualitativa b) Cuantitativa – numérica
Variable discreta o discontinua Variable continua
Especialización en Estadística AplicadaEstadística Inferencial
Clases de VariablesClases de Variables
II.- Según la búsqueda de obtener explicación causal del problema o fenómeno estudiado o la relación entre las mismas variables.
a) Variable independiente b) Variable dependiente.c) Variable interviniente d) Variable de control e) Variables de confusión
II.- Según la búsqueda de obtener explicación causal del problema o fenómeno estudiado o la relación entre las mismas variables.
a) Variable independiente b) Variable dependiente.c) Variable interviniente d) Variable de control e) Variables de confusión
Especialización en Estadística AplicadaEstadística Inferencial
Escalas de MediciónEscalas de Medición
Escalas de medición de variables:Escala nominalEscala ordinal.Escala de intervalo.Escala de razón
Escalas de medición de variables:Escala nominalEscala ordinal.Escala de intervalo.Escala de razón
Especialización en Estadística AplicadaEstadística Inferencial
Escalas de MediciónEscalas de Medición
Escala Nominal: Es la escala más rudimentaria donde los objetos se distinguen con base en su nombre, en ocasiones dado por un número
Escala Ordinal: Las mediciones sólo indican orden (“ranking”). Los objetos se distinguen con base en una cantidad relativa de una característica que poseen
Escala de Intervalo: Cuando las diferencias entre objetos tiene sentido, es decir que la unidad de medida es fija. Generalmente tienen un cero, aunque este es arbitrario
Escala de Razón: Cuando; además de los anterior, los cocientes (razones) de valores tienen sentido, la escala es racional. El cero es absoluto en esta escala.
Escala Nominal: Es la escala más rudimentaria donde los objetos se distinguen con base en su nombre, en ocasiones dado por un número
Escala Ordinal: Las mediciones sólo indican orden (“ranking”). Los objetos se distinguen con base en una cantidad relativa de una característica que poseen
Escala de Intervalo: Cuando las diferencias entre objetos tiene sentido, es decir que la unidad de medida es fija. Generalmente tienen un cero, aunque este es arbitrario
Escala de Razón: Cuando; además de los anterior, los cocientes (razones) de valores tienen sentido, la escala es racional. El cero es absoluto en esta escala.
Especialización en Estadística AplicadaEstadística Inferencial
Tipos de Variables y Escalas de Medición
Tipos de Variables y Escalas de Medición
Especialización en Estadística AplicadaEstadística Inferencial
N om in a l
O rd in a l
E sca la d e m ed ic ió n
C u a lita t iva o A trib u to
In te rva lo
R azó n
E sca la d e m ed ic ió n
D isc re ta
C on tin u a
C u an tita tiva o N ú m erica
V ariab les
La UFPS soy yo, eres tú, somos todos
Inferencia EstadísticaInferencia Estadística
Estimación: Aproximación del valor del parámetro poblacional a partir de la estadística calculada con base en la información de la muestra
Prueba de Hipótesis: Con base en los resultados obtenidos a partir de la información de la muestra se acepta o rechaza una afirmación acerca de uno o varios parámetros o sobre la forma de la distribución
Estimación: Aproximación del valor del parámetro poblacional a partir de la estadística calculada con base en la información de la muestra
Prueba de Hipótesis: Con base en los resultados obtenidos a partir de la información de la muestra se acepta o rechaza una afirmación acerca de uno o varios parámetros o sobre la forma de la distribución
Especialización en Estadística AplicadaEstadística Inferencial
Características de un Buen Estimador
Características de un Buen Estimador
Insesgado: Si el valor esperado del mismo es igual al parámetro poblacional.Eficiente: Se refiere a lo cerca que se encuentre el valor estimado del parámetro.Consistente: Se obtiene cuando el tamaño de la muestra se incrementa en tal forma que la varianza disminuya.Suficiente: Es un estimador que utiliza toda la información que posee una muestra para estimar el parámetro.
Insesgado: Si el valor esperado del mismo es igual al parámetro poblacional.Eficiente: Se refiere a lo cerca que se encuentre el valor estimado del parámetro.Consistente: Se obtiene cuando el tamaño de la muestra se incrementa en tal forma que la varianza disminuya.Suficiente: Es un estimador que utiliza toda la información que posee una muestra para estimar el parámetro.
Especialización en Estadística AplicadaEstadística Inferencial
HipótesisHipótesis
Hipótesis: Afirmación o conjetura acerca de una o más poblaciones
Prueba Estadística: Con base en la información obtenida a partir de una muestra (estadísticas) se ACEPTA o se RECHAZA la hipótesis
La aceptación de una hipótesis indica tan sólo que los datos no proporcionan evidencia suficiente para refutarla
El rechazo implica que la evidencia de la muestra refuta la hipótesis
Hipótesis: Afirmación o conjetura acerca de una o más poblaciones
Prueba Estadística: Con base en la información obtenida a partir de una muestra (estadísticas) se ACEPTA o se RECHAZA la hipótesis
La aceptación de una hipótesis indica tan sólo que los datos no proporcionan evidencia suficiente para refutarla
El rechazo implica que la evidencia de la muestra refuta la hipótesis
Especialización en Estadística AplicadaEstadística Inferencial
La UFPS soy yo, eres tú, somos todos
EstimadorEstimador
Regla que establece cómo calcular una estimación basada en las mediciones contenidas en la muestra.
Cualesquier estadística (función de variables aleatorias) observable, que es también una variable aleatoria, cuyos valores se usan para estimar un parámetro θ o una función del parámetro θ.
Regla que establece cómo calcular una estimación basada en las mediciones contenidas en la muestra.
Cualesquier estadística (función de variables aleatorias) observable, que es también una variable aleatoria, cuyos valores se usan para estimar un parámetro θ o una función del parámetro θ.
Especialización en Estadística AplicadaEstadística Inferencial
Propiedades: 1. InsesgamientoPropiedades: 1. Insesgamiento
es estimador insesgado de si
En caso contrario, es sesgado
Ejemplos
es estimador insesgado de si
En caso contrario, es sesgado
Ejemplos
Especialización en Estadística AplicadaEstadística Inferencial
ˆE
ˆˆ ESesgo
XE 22 SE
Cuadrado Medio del ErrorCuadrado Medio del Error
Especialización en Estadística AplicadaEstadística Inferencial
2ˆˆ ECME
ˆvarˆˆ 2 sesgoCME
Propiedades: 2. ConsistenciaPropiedades: 2. Consistencia
Si se aumenta el tamaño de la muestra, se espera que el valor del estimador se acerque al verdadero valor
Un estimador es un estimador consistente de si converge estocásticamente a cuando
Si se aumenta el tamaño de la muestra, se espera que el valor del estimador se acerque al verdadero valor
Un estimador es un estimador consistente de si converge estocásticamente a cuando
Especialización en Estadística AplicadaEstadística Inferencial
n
Propiedades: 2. ConsistenciaPropiedades: 2. Consistencia
converge estocásticamente a cuando si para dos números positivos arbitrariamente pequeños, se puede tomar una muestra suficientemente grande tal que
es estimador consistente de
converge estocásticamente a cuando si para dos números positivos arbitrariamente pequeños, se puede tomar una muestra suficientemente grande tal que
es estimador consistente de
Especialización en Estadística AplicadaEstadística Inferencial
ˆP
n ,
X
Desigualdad de ChebyshevDesigualdad de Chebyshev
Sea X una variable aleatoria continua con función de densidad de probabilidad , media , varianza Para dado:
Sea X una variable aleatoria continua con función de densidad de probabilidad , media , varianza Para dado:
Especialización en Estadística AplicadaEstadística Inferencial
f
2
1
XP
02
2
11
XP
Propiedades: 3. Eficiencia (precisión)Propiedades: 3. Eficiencia (precisión)
es un estimador eficiente de si:
• se aproxima a la normal cuando
• Para cualesquier otro estimador para el cual se aproxime a la normal se cumple que
La eficiencia de respecto a está dada por
es un estimador eficiente de si:
• se aproxima a la normal cuando
• Para cualesquier otro estimador para el cual se aproxime a la normal se cumple que
La eficiencia de respecto a está dada por
Especialización en Estadística AplicadaEstadística Inferencial
ˆn 2,0 N
n
ˆ ˆn
2,0 N 22
ˆ 2
2
Ef
Propiedades: 4. SuficienciaPropiedades: 4. Suficiencia
es un estimador suficiente de :
• Si aporta toda la posible información que le provee la muestra
• Si y sólo si la distribución condicional de dado no depende de
• Si se conoce ya se tiene toda la información de
es un estimador suficiente de :
• Si aporta toda la posible información que le provee la muestra
• Si y sólo si la distribución condicional de dado no depende de
• Si se conoce ya se tiene toda la información de
Especialización en Estadística AplicadaEstadística Inferencial
nXXX ,...,, 21
Criterio de factorizaciónCriterio de factorización
Se emplea para encontrar estimadores suficientes
Sea una muestra aleatoria de tamaño n de una densidad , donde el parámetro puede ser un vector
Una estadística es suficiente si y sólo si la densidad conjunta de (la cual es, )
se puede escribir así:
Se emplea para encontrar estimadores suficientes
Sea una muestra aleatoria de tamaño n de una densidad , donde el parámetro puede ser un vector
Una estadística es suficiente si y sólo si la densidad conjunta de (la cual es, )
se puede escribir así:
Especialización en Estadística AplicadaEstadística Inferencial
nXXX ,...,, 21
f
nXXXT ,...,, 21
nXXX ,...,, 21
n
iixf
1
;
Criterio de factorizaciónCriterio de factorización
donde es no negativa y no envuelve el parámetro y la función es no negativa y depende de y la estadística
donde es no negativa y no envuelve el parámetro y la función es no negativa y depende de y la estadística
Especialización en Estadística AplicadaEstadística Inferencial
nnnXXX XXXtgXXXhXXXfn
,...,,,*,...,,,...,, 212121,...,, 21
hg
nXXXt ,...,, 21
Propiedades: 5. Robustez (resistencia)
Propiedades: 5. Robustez (resistencia)
es un estimador robusto de :
si continúa siendo razonablemente bueno como estimador de si el modelo experimenta una pequeña modificación
• Los estimadores robustos no son tan eficientes como los óptimos cuando el modelo es correcto, pero el cambio en sus propiedades es leve ante contaminaciones o alteraciones en la función de densidad de la variable
es un estimador robusto de :
si continúa siendo razonablemente bueno como estimador de si el modelo experimenta una pequeña modificación
• Los estimadores robustos no son tan eficientes como los óptimos cuando el modelo es correcto, pero el cambio en sus propiedades es leve ante contaminaciones o alteraciones en la función de densidad de la variable
Especialización en Estadística AplicadaEstadística Inferencial
Función de verosimilitudFunción de verosimilitud
La función de verosimilitud de n variables aleatorias se define como la densidad conjunta de las n variables, esto es: , la cual se considera como una función de
En particular, si es una muestra aleatoria de , entonces la función de verosimilitud es
La función de verosimilitud de n variables aleatorias se define como la densidad conjunta de las n variables, esto es: , la cual se considera como una función de
En particular, si es una muestra aleatoria de , entonces la función de verosimilitud es
Especialización en Estadística AplicadaEstadística Inferencial
f
nXXX ,...,, 21
,,...,, 21,...,, 21 nXXX XXXf
n
n
iiXfXL
1
,
nXXXX ,...,, 21
Método de máxima verosimilitudMétodo de máxima verosimilitud
Un estimador máximo verosímil satisfaceUn estimador máximo verosímil satisface
Especialización en Estadística AplicadaEstadística Inferencial
0
,
XL
0
,ln
XL
La UFPS soy yo, eres tú, somos todos
Modelos ProbabilísticosModelos Probabilísticos
El resultado de un experimento aleatorio puede ser descrito en ocasiones como una cantidad numérica.
En estos casos aparece la noción de variable aleatoria: Función que asigna a cada suceso un número.
Las variables aleatorias pueden ser discretas o continuas.
El resultado de un experimento aleatorio puede ser descrito en ocasiones como una cantidad numérica.
En estos casos aparece la noción de variable aleatoria: Función que asigna a cada suceso un número.
Las variables aleatorias pueden ser discretas o continuas.
Especialización en Estadística AplicadaEstadística Inferencial
Modelos Probabilísticos
Función de masa (v. a. discreta)
Modelos Probabilísticos
Función de masa (v. a. discreta)
Asigna a cada posible valor de una variable discreta su probabilidad.
EjemploNúmero de caras al lanzar 3 monedas.
Asigna a cada posible valor de una variable discreta su probabilidad.
EjemploNúmero de caras al lanzar 3 monedas.
Especialización en Estadística AplicadaEstadística Inferencial
0%
5%
10%
15%
20%
25%
30%
35%
40%
0 1 2 3
Modelos Probabilísticos
Función de densidad (v. a. continua)
Modelos Probabilísticos
Función de densidad (v. a. continua)
Definición•Es una función no negativa •Su integral (el área bajo la curva) es 1.
Puede verse como la generalización del histograma de frecuencias relativas para variables continuas.
Definición•Es una función no negativa •Su integral (el área bajo la curva) es 1.
Puede verse como la generalización del histograma de frecuencias relativas para variables continuas.
Especialización en Estadística AplicadaEstadística Inferencial
Modelos Probabilísticos
¿para qué sirve la función de densidad?
Modelos Probabilísticos
¿para qué sirve la función de densidad?
Muchos procesos aleatorios vienen descritos por variables de forma que son conocidas sus funciones de densidad de probabilidad
Identificamos la probabilidad de que la v. a. tome valores en un intervalo con el área bajo la función de densidad.
Muchos procesos aleatorios vienen descritos por variables de forma que son conocidas sus funciones de densidad de probabilidad
Identificamos la probabilidad de que la v. a. tome valores en un intervalo con el área bajo la función de densidad.
Especialización en Estadística AplicadaEstadística Inferencial
Modelos Probabilísticos
Función de Distribución
Modelos Probabilísticos
Función de Distribución
•Es la función que asocia a cada valor de una variable, la probabilidad acumulada de los valores inferiores o iguales.•La generalización de las frecuencias acumuladas.
A los valores extremadamente bajos les corresponden valores de la función de distribución cercanos a cero.A los valores extremadamente altos les corresponden valores de la función de distribución cercanos a uno.
•La encontraremos en los artículos y aplicaciones en forma de “p-valor”, significación,…
•Es la función que asocia a cada valor de una variable, la probabilidad acumulada de los valores inferiores o iguales.•La generalización de las frecuencias acumuladas.
A los valores extremadamente bajos les corresponden valores de la función de distribución cercanos a cero.A los valores extremadamente altos les corresponden valores de la función de distribución cercanos a uno.
•La encontraremos en los artículos y aplicaciones en forma de “p-valor”, significación,…
Especialización en Estadística AplicadaEstadística Inferencial
Modelos Probabilísticos
Distribución Normal o de Gauss
Modelos Probabilísticos
Distribución Normal o de Gauss
Aparece de manera natural:Errores de medida.Distancia de frenado. Altura, peso, CI, Pruebas de estado, … Distribuciones binomiales con n grande (n>30) y ‘p ni pequeño’ (np>5) ‘ni grande’ (nq>5).
Está caracterizada por dos parámetros: La media, μ, y la desviación típica, σ.Su función de densidad es:
Aparece de manera natural:Errores de medida.Distancia de frenado. Altura, peso, CI, Pruebas de estado, … Distribuciones binomiales con n grande (n>30) y ‘p ni pequeño’ (np>5) ‘ni grande’ (nq>5).
Está caracterizada por dos parámetros: La media, μ, y la desviación típica, σ.Su función de densidad es:
Especialización en Estadística AplicadaEstadística Inferencial
2
2
1
2
1)(
x
exf
Modelos Probabilísticos
N(μ, σ2): Interpretación Geométrica
Modelos Probabilísticos
N(μ, σ2): Interpretación Geométrica
La media se interpreta como un factor de traslación.
La desviación estándar como un factor de escala, grado de dispersión,
La media se interpreta como un factor de traslación.
La desviación estándar como un factor de escala, grado de dispersión,
Especialización en Estadística AplicadaEstadística Inferencial
Modelos Probabilísticos
N(μ, σ2): Interpretación Probabilística
Modelos Probabilísticos
N(μ, σ2): Interpretación Probabilística
Entre la media y una desviación estándar tenemos siempre la misma probabilidad: aprox. 68%
Entre la media y dos desviaciones estándar aprox. 95%
Entre la media y una desviación estándar tenemos siempre la misma probabilidad: aprox. 68%
Entre la media y dos desviaciones estándar aprox. 95%
Especialización en Estadística AplicadaEstadística Inferencial
Modelos Probabilísticos
Algunas características de N(μ, σ2)
Modelos Probabilísticos
Algunas características de N(μ, σ2)
La función de densidad es simétrica, mesocúrtica y unimodal.
Media, mediana y moda coinciden.Los puntos de inflexión de la función de densidad están a distancia σ de μ.Si tomamos intervalos centrados en μ, y cuyos extremos están…
a distancia σ, tenemos probabilidad 68,26%a distancia 2 σ, tenemos probabilidad 95,45%a distancia 3 σ tenemos probabilidad 99,73%
No es posible calcular la probabilidad de un intervalo simplemente usando la primitiva de la función de densidad, ya que no tiene primitiva expresable en términos de funciones ‘comunes’.Todas las distribuciones normales N(μ, σ2), pueden ponerse mediante una traslación μ, y un cambio de escala σ, como N(0,1). Esta distribución especial se llama normal estandarizada o tipificada.
La función de densidad es simétrica, mesocúrtica y unimodal.
Media, mediana y moda coinciden.Los puntos de inflexión de la función de densidad están a distancia σ de μ.Si tomamos intervalos centrados en μ, y cuyos extremos están…
a distancia σ, tenemos probabilidad 68,26%a distancia 2 σ, tenemos probabilidad 95,45%a distancia 3 σ tenemos probabilidad 99,73%
No es posible calcular la probabilidad de un intervalo simplemente usando la primitiva de la función de densidad, ya que no tiene primitiva expresable en términos de funciones ‘comunes’.Todas las distribuciones normales N(μ, σ2), pueden ponerse mediante una traslación μ, y un cambio de escala σ, como N(0,1). Esta distribución especial se llama normal estandarizada o tipificada.
Especialización en Estadística AplicadaEstadística Inferencial
Modelos Probabilísticos
Estandarización o Tipificación
Modelos Probabilísticos
Estandarización o Tipificación
Dada una variable de media μ y desviación estándar σ, se denomina valor tipificado o valor estandarizado, z, de una observación x, a la distancia (con signo) con respecto a la media, medida en desviaciones estándar, es decir
En el caso de variable X normal, la interpretación es clara: Asigna a todo valor de N(μ, σ2), un valor de N(0,1) que deja exáctamente la misma probabilidad por debajo (acumulada).
Nos permite así comparar entre valores de distribuciones normales diferentes
Dada una variable de media μ y desviación estándar σ, se denomina valor tipificado o valor estandarizado, z, de una observación x, a la distancia (con signo) con respecto a la media, medida en desviaciones estándar, es decir
En el caso de variable X normal, la interpretación es clara: Asigna a todo valor de N(μ, σ2), un valor de N(0,1) que deja exáctamente la misma probabilidad por debajo (acumulada).
Nos permite así comparar entre valores de distribuciones normales diferentes
Especialización en Estadística AplicadaEstadística Inferencial
x
z
EjemploEjemplo
Se quiere dar una beca a uno de dos estudiantes de sistemas educativos diferentes. Se asignará al que tenga mejor expediente académico.
El estudiante A tiene una calificación de 8 en un sistema donde la calificación de los alumnos se comporta como N(6,1).El estudiante B tiene una calificación de 80 en un sistema donde la calificación de los alumnos se comporta como N(70,102).
SoluciónNo podemos comparar directamente 8 puntos de A frente a los 80 de B, pero como ambas poblaciones se comportan de modo normal, podemos estandarizar y observar las puntuaciones sobre una distribución de referencia N(0,1)
Como ZA>ZB, podemos decir que el porcentaje de compañeros del mismo sistema de estudios que ha superado en calificación el estudiante A es mayor que el que ha superado B. Podríamos pensar en principio que A es mejor candidato para la beca.
Se quiere dar una beca a uno de dos estudiantes de sistemas educativos diferentes. Se asignará al que tenga mejor expediente académico.
El estudiante A tiene una calificación de 8 en un sistema donde la calificación de los alumnos se comporta como N(6,1).El estudiante B tiene una calificación de 80 en un sistema donde la calificación de los alumnos se comporta como N(70,102).
SoluciónNo podemos comparar directamente 8 puntos de A frente a los 80 de B, pero como ambas poblaciones se comportan de modo normal, podemos estandarizar y observar las puntuaciones sobre una distribución de referencia N(0,1)
Como ZA>ZB, podemos decir que el porcentaje de compañeros del mismo sistema de estudios que ha superado en calificación el estudiante A es mayor que el que ha superado B. Podríamos pensar en principio que A es mejor candidato para la beca.
Especialización en Estadística AplicadaEstadística Inferencial
110
7080
21
68
B
xz
xz
BBB
A
AAA
Distribución NormalDistribución Normal
Especialización en Estadística AplicadaEstadística Inferencial
2
2
1
2
1)(
Z
ezf
zy
dyzZPzF e2
2
1
2
1
12
1 2
2
111 dzZPF
z
e
Distribución NormalDistribución Normal
Especialización en Estadística AplicadaEstadística Inferencial
Resultados ECAES Ingeniería de Sistemas, Año 2003
Resultados ECAES Ingeniería de Sistemas, Año 2004
¿Por qué es importante la distribución normal?
¿Por qué es importante la distribución normal?
Las propiedades que tiene la distribución normal son interesantes, pero todavía no hemos hablado de por qué es una distribución especialmente importante.
La razón es que aunque una v.a. no posea distribución normal, ciertos estadísticos/estimadores calculados sobre muestras elegidas al azar es posible que posean una distribución normal.
Es decir, tengan las distribución que tengan nuestros datos, los ‘objetos’ que resumen la información de una muestra, posiblemente pueden tener distribución normal (o una distribución asociada).
Las propiedades que tiene la distribución normal son interesantes, pero todavía no hemos hablado de por qué es una distribución especialmente importante.
La razón es que aunque una v.a. no posea distribución normal, ciertos estadísticos/estimadores calculados sobre muestras elegidas al azar es posible que posean una distribución normal.
Es decir, tengan las distribución que tengan nuestros datos, los ‘objetos’ que resumen la información de una muestra, posiblemente pueden tener distribución normal (o una distribución asociada).
Especialización en Estadística AplicadaEstadística Inferencial
La distribución de la Media Aritmética Muestral
La distribución de la Media Aritmética Muestral
Como ilustración mostramos una variable que presenta valores distribuidos más o menos uniformemente sobre el intervalo 150-190.
Como es de esperar la media es cercana a 170. El histograma no se parece en nada a una distribución normal con la misma media y desviación estándar.
Como ilustración mostramos una variable que presenta valores distribuidos más o menos uniformemente sobre el intervalo 150-190.
Como es de esperar la media es cercana a 170. El histograma no se parece en nada a una distribución normal con la misma media y desviación estándar.
Especialización en Estadística AplicadaEstadística Inferencial
La distribución de la Media Aritmética MuestralLa distribución de la Media Aritmética Muestral
A continuación elegimos aleatoriamente grupos de 10 observaciones de las anteriores y calculamos el promedio.
Para cada grupo de 10 obtenemos entonces una nueva medición, que vamos a llamar promedio muestral.
Observemos que las nuevas cantidades están más o menos cerca de la media de la variable original.
Repitamos el proceso un número elevado de veces. En la siguiente transparencia estudiamos la distribución de la nueva variable.
A continuación elegimos aleatoriamente grupos de 10 observaciones de las anteriores y calculamos el promedio.
Para cada grupo de 10 obtenemos entonces una nueva medición, que vamos a llamar promedio muestral.
Observemos que las nuevas cantidades están más o menos cerca de la media de la variable original.
Repitamos el proceso un número elevado de veces. En la siguiente transparencia estudiamos la distribución de la nueva variable.
Especialización en Estadística AplicadaEstadística Inferencial
MuestraMuestra
1ª1ª 2ª2ª 3ª3ª185185 190190 179179
174174 169169 163163
167167 170170 167167
160160 159159 152152
172172 179179 178178
183183 175175 183183
188188 159159 155155
178178 152152 165165
152152 185185 185185
175175 152152 152152
173 169 168 …
La distribución de la Media Aritmética MuestralLa distribución de la Media Aritmética Muestral
La distribución de los promedios muestrales tiene distribución aproximadamente normal.
La media de esta nueva variable (promedio de la distribución muestral) es muy parecida a la de la variable original.
Las observaciones de la nueva variable están menos dispersas. (Observar el rango).
La desviación estándar es aproximadamente ‘raiz de 10’ veces más pequeña. Llamamos error estándar a la desviación estándar de esta nueva variable.
La distribución de los promedios muestrales tiene distribución aproximadamente normal.
La media de esta nueva variable (promedio de la distribución muestral) es muy parecida a la de la variable original.
Las observaciones de la nueva variable están menos dispersas. (Observar el rango).
La desviación estándar es aproximadamente ‘raiz de 10’ veces más pequeña. Llamamos error estándar a la desviación estándar de esta nueva variable.
Especialización en Estadística AplicadaEstadística Inferencial
…
Teorema del Límite CentralTeorema del Límite Central
Dada una v.a. cualquiera, si extraemos muestras de tamaño n, y calculamos los promedios muestrales, entonces:•dichos promedios tienen distribución aproximadamente normal;•La media de los promedios muestrales es la misma que la de la variable original.•La desviación estándar de los promedios disminuye en un factor “raíz de n” (error estándar).Las aproximaciones anteriores se hacen exactas cuando n tiende a infinito.
Dada una v.a. cualquiera, si extraemos muestras de tamaño n, y calculamos los promedios muestrales, entonces:•dichos promedios tienen distribución aproximadamente normal;•La media de los promedios muestrales es la misma que la de la variable original.•La desviación estándar de los promedios disminuye en un factor “raíz de n” (error estándar).Las aproximaciones anteriores se hacen exactas cuando n tiende a infinito.
Especialización en Estadística AplicadaEstadística Inferencial
Teorema del Límite CentralTeorema del Límite Central
A medida que n aumenta, la distribución de la media se aproxima más a la normalA medida que n aumenta, la distribución de la media se aproxima más a la normal
Especialización en Estadística AplicadaEstadística Inferencial
Distribuciones asociadas a la NormalDistribuciones asociadas a la Normal
Al hacer inferencia estadística, la distribución normal aparece de forma casi inevitable.
Dependiendo del problema, podemos encontrar otras (asociadas):
X2 (chi cuadrado)t - studentF de Fisher
Estas distribuciones resultan directamente de operar con distribuciones normales. Típicamente aparecen como distribuciones de ciertos estadísticos.
Al hacer inferencia estadística, la distribución normal aparece de forma casi inevitable.
Dependiendo del problema, podemos encontrar otras (asociadas):
X2 (chi cuadrado)t - studentF de Fisher
Estas distribuciones resultan directamente de operar con distribuciones normales. Típicamente aparecen como distribuciones de ciertos estadísticos.
Especialización en Estadística AplicadaEstadística Inferencial
La distribución chi cuadrado La distribución chi cuadrado
Tiene un sólo parámetro denominado grados de libertad.
La función de densidad es asimétrica positiva. Sólo tienen densidad los valores positivos.
La función de densidad se hace más simétrica incluso casi gausiana cuando aumenta el número de grados de libertad.
Consideraremos atípicos aquellos valores de la variable de la “cola de la derecha”.
Tiene un sólo parámetro denominado grados de libertad.
La función de densidad es asimétrica positiva. Sólo tienen densidad los valores positivos.
La función de densidad se hace más simétrica incluso casi gausiana cuando aumenta el número de grados de libertad.
Consideraremos atípicos aquellos valores de la variable de la “cola de la derecha”.
Especialización en Estadística AplicadaEstadística Inferencial
…
La distribución t - studentLa distribución t - student
Tiene un parámetro denominado grados de libertad.
Cuando aumentan los grados de libertad, más se acerca a N(0,1).
Es simétrica con respecto al cero.
Se consideran valores atípicos los que se alejan de cero (positivos o negativos).
Tiene un parámetro denominado grados de libertad.
Cuando aumentan los grados de libertad, más se acerca a N(0,1).
Es simétrica con respecto al cero.
Se consideran valores atípicos los que se alejan de cero (positivos o negativos).
Especialización en Estadística AplicadaEstadística Inferencial
…
La distribución FisherLa distribución Fisher
Tiene dos parámetros denominados grados de libertad.
Sólo toma valores positivos. Es asimétrica positiva.
Se consideran valores atípicos los de la cola de la derecha.
Tiene dos parámetros denominados grados de libertad.
Sólo toma valores positivos. Es asimétrica positiva.
Se consideran valores atípicos los de la cola de la derecha.
Especialización en Estadística AplicadaEstadística Inferencial
…
La UFPS soy yo, eres tú, somos todos
Estimación por IntervaloEstimación por Intervalo
Una muestra aleatoria de una densidad Dos estadísticas yque satisfacenTal que
Entonces, el intervalo aleatorio:
se llama un intervalo de confianza para
Una muestra aleatoria de una densidad Dos estadísticas yque satisfacenTal que
Entonces, el intervalo aleatorio:
se llama un intervalo de confianza para
Especialización en Estadística AplicadaEstadística Inferencial
nXXX ,...,, 21
f nXXXT ,...,, 211 nXXXT ,...,, 212
21 TT
121 TTP
21,TT
%1001
Estimación por IntervaloEstimación por Intervalo
Alrededor del estimador se construye un intervalo dentro del cual se afirma que está el parámetro, con una cierta probabilidad
Nivel de confianza: (1-α) Probabilidad de que el parámetro esté dentro del intervalo construido alrededor del estimador
Alrededor del estimador se construye un intervalo dentro del cual se afirma que está el parámetro, con una cierta probabilidad
Nivel de confianza: (1-α) Probabilidad de que el parámetro esté dentro del intervalo construido alrededor del estimador
Especialización en Estadística AplicadaEstadística Inferencial
Nivel de ConfianzaNivel de Confianza
Especialización en Estadística AplicadaEstadística Inferencial
2Z 2Z
2
1 - 1 - αα
2
Intervalo de Confianza para estimar la Media Aritmética Poblacional: µ
(σ conocida)
Intervalo de Confianza para estimar la Media Aritmética Poblacional: µ
(σ conocida)
Confiabilidad (1-α) Intervalo de Confianza:
Si el tamaño de la población es muy grande o no se conoce o el muestreo se realiza con reposición:
Confiabilidad (1-α) Intervalo de Confianza:
Si el tamaño de la población es muy grande o no se conoce o el muestreo se realiza con reposición:
Especialización en Estadística AplicadaEstadística Inferencial
12/
N
nN
nZX
nZX
2/
Intervalo de Confianza para estimar la Media Aritmética Poblacional: µ
(σ desconocida)
Intervalo de Confianza para estimar la Media Aritmética Poblacional: µ
(σ desconocida)
Confiabilidad (1-α) Intervalo de Confianza:
Si el tamaño de la población es muy grande o no se conoce o el muestreo se realiza con reposición:
Confiabilidad (1-α) Intervalo de Confianza:
Si el tamaño de la población es muy grande o no se conoce o el muestreo se realiza con reposición:
Especialización en Estadística AplicadaEstadística Inferencial
12/,1
N
nN
n
StX n
n
StX n 2/,1
Ejemplo 1Ejemplo 1
Los siguientes datos son los puntajes obtenidos para 45 personas de una escala de depresión (mayor puntaje significa mayor depresión). 2 5 6 8 8 9 9 10 11
11 11 13 13 14 14 14 14 14 14 15 15 16 16 16 16 16 16 16 16 17 17 17 18 18 18 19 19 19 19 19 19 19 19 20 20
Para construir un intervalo de confianza para el puntaje promedio poblacional, asumamos que los datos tienen distribución normal, con varianza poblacional desconocida.
Los siguientes datos son los puntajes obtenidos para 45 personas de una escala de depresión (mayor puntaje significa mayor depresión). 2 5 6 8 8 9 9 10 11
11 11 13 13 14 14 14 14 14 14 15 15 16 16 16 16 16 16 16 16 17 17 17 18 18 18 19 19 19 19 19 19 19 19 20 20
Para construir un intervalo de confianza para el puntaje promedio poblacional, asumamos que los datos tienen distribución normal, con varianza poblacional desconocida.
Especialización en Estadística AplicadaEstadística Inferencial
Ejemplo 1Ejemplo 1
Como σ2 es desconocido, lo estimamos por S2=18,7. Luego, un intervalo de confianza aproximado es:
En consecuencia, el intervalo de confianza para µ es (13,2 , 15,8). Es decir, el puntaje promedio poblacional se encuentra entre 13,2 y 15,8 con una confianza 95%.
Como σ2 es desconocido, lo estimamos por S2=18,7. Luego, un intervalo de confianza aproximado es:
En consecuencia, el intervalo de confianza para µ es (13,2 , 15,8). Es decir, el puntaje promedio poblacional se encuentra entre 13,2 y 15,8 con una confianza 95%.
Especialización en Estadística AplicadaEstadística Inferencial
Ejemplo 2Ejemplo 2
Una muestra de ocho cigarrillos de cierta marca, arroja los siguientes contenidos de alquitrán:
20, 17, 21, 19, 22, 21, 20 y 16 mg.
Se desea estimar el contenido promedio de alquitrán en los cigarrillos de esta marca, con una confiabilidad de 95%
Una muestra de ocho cigarrillos de cierta marca, arroja los siguientes contenidos de alquitrán:
20, 17, 21, 19, 22, 21, 20 y 16 mg.
Se desea estimar el contenido promedio de alquitrán en los cigarrillos de esta marca, con una confiabilidad de 95%
Especialización en Estadística AplicadaEstadística Inferencial
Ejemplo 2Ejemplo 2
Especialización en Estadística AplicadaEstadística Inferencial
mg 2,09S 5,19 mgX
365,2 t71-8gl 95%-1 7,0.025
8
2,072,36519,5
21,2317,77
73,119,5
Estimación de la diferencia entre dos promedios
Estimación de la diferencia entre dos promedios
Intervalo para µ1-µ2; σ1
2, σ22 conocidas
Intervalo para µ1-µ2; σ1
2=σ22 desconocidas
(poblaciones normales)
Intervalo para µ1-µ2; σ1
2, σ22 conocidas
Intervalo para µ1-µ2; σ1
2=σ22 desconocidas
(poblaciones normales)
Especialización en Estadística AplicadaEstadística Inferencial
21)2/,(21
11X
nnStX p
2.. 21 nnlg
2
11
21
222
2112
nn
SnSnS p
2
22
1
21
2/21Xnn
ZX
Estimación de la diferencia entre dos promedios
Estimación de la diferencia entre dos promedios
Intervalo para µ1-µ2
σ12≠σ2
2 desconocidas
(poblaciones normales)
Intervalo para µ1-µ2
σ12≠σ2
2 desconocidas
(poblaciones normales)
Especialización en Estadística AplicadaEstadística Inferencial
11 2
2
2
22
1
2
1
21
2
2
22
1
21
nnS
nnS
nS
nS
2
22
1
21
)2/,(21Xn
S
n
StX
Ejemplo 3Ejemplo 3
Los siguientes datos corresponden a los resultados en una prueba diagnóstica de una muestra de estudiantes de los cursos 7ºA y 7ºB
7ºA: 83, 64, 87, 75
7ºB: 78, 86, 85, 68, 89, 94
Estime la diferencia entre los promedios para ambos grupos
Los siguientes datos corresponden a los resultados en una prueba diagnóstica de una muestra de estudiantes de los cursos 7ºA y 7ºB
7ºA: 83, 64, 87, 75
7ºB: 78, 86, 85, 68, 89, 94
Estime la diferencia entre los promedios para ambos grupos
Especialización en Estadística AplicadaEstadística Inferencial
Observaciones pareadasObservaciones pareadas
Cada unidad experimental tiene un par de observaciones, una para cada poblaciónCada unidad experimental tiene un par de observaciones, una para cada población
Especialización en Estadística AplicadaEstadística Inferencial
n
St dn )2/,1(d
iii XXD 21
Ejemplo 4Ejemplo 4
Un proyecto de investigación pretende establecer el avance de los estudiantes en manejo de operaciones matemáticas básicas. Para ello se seleccionan 12 estudiantes de 4º grado, se les aplica una prueba diagnóstica y los resultados se comparan con los obtenidos en una prueba similar aplicada al final.
Un proyecto de investigación pretende establecer el avance de los estudiantes en manejo de operaciones matemáticas básicas. Para ello se seleccionan 12 estudiantes de 4º grado, se les aplica una prueba diagnóstica y los resultados se comparan con los obtenidos en una prueba similar aplicada al final.
Especialización en Estadística AplicadaEstadística Inferencial
Ejemplo 4Ejemplo 4
Los resultados fueron:Los resultados fueron:
Especialización en Estadística AplicadaEstadística Inferencial
IniIni 3344
2255
3355
3355
2277
3311
3333
3311
2277
2288
2299
3311
FiFinn
3388
4422
2299
4444
3366
3300
3388
2244
2277
3311
3366
4400
Estimación de una proporciónEstimación de una proporción
Un estimador puntual de la proporción P en un experimento binomial es p=x/n, donde x es el número de éxitos en n ensayos
Intervalo de confianza para estimar P de una muestra grande
Un estimador puntual de la proporción P en un experimento binomial es p=x/n, donde x es el número de éxitos en n ensayos
Intervalo de confianza para estimar P de una muestra grande
Especialización en Estadística AplicadaEstadística Inferencial
n
PQ
n
PPp
12 1,0~ˆˆ
ˆN
nqp
PpZ
Pp
n
qpZp
ˆˆˆ 2/
1
ˆˆˆ 2/
N
nN
n
qpZp
Estimación de la diferencia entre dos proporciones
Estimación de la diferencia entre dos proporciones
Especialización en Estadística AplicadaEstadística Inferencial
2
22
1
112/21
ˆˆˆˆˆˆ
n
qp
n
qpZpp
Estimación de la varianzaEstimación de la varianza
Especialización en Estadística AplicadaEstadística Inferencial
212
2
~1
n
Sn
2
21,1
22
22,1
2 11
nn
SnSn
Estimación de la razón de dos varianzas
Estimación de la razón de dos varianzas
Especialización en Estadística AplicadaEstadística Inferencial
1,1,22
21
21
22
22
22
21
21
2121~
S
S
S
S nnFF
2121 ,,2122
21
22
21
,,222
21 11
FS
S
FS
S
12
21
,,222
21
22
21
,,222
21 1
F
S
S
FS
S
Tamaño de la muestra (n)Tamaño de la muestra (n)
Es la decisión mas importante que se debe tomar en una investigación por muestreo.
Una muestra debe ser pequeña a un costo bajo y bastante grande para que el error de muestreo sea admisible.
Algunos creen que el tamaño de la muestra crece indefinidamente a medida que aumenta el tamaño poblacional pero eso no es cierto, ya que existe un punto en el cual el tamaño de la muestra permanece constante, así el tamaño poblacional aumente.
Es la decisión mas importante que se debe tomar en una investigación por muestreo.
Una muestra debe ser pequeña a un costo bajo y bastante grande para que el error de muestreo sea admisible.
Algunos creen que el tamaño de la muestra crece indefinidamente a medida que aumenta el tamaño poblacional pero eso no es cierto, ya que existe un punto en el cual el tamaño de la muestra permanece constante, así el tamaño poblacional aumente.
Especialización en Estadística AplicadaEstadística Inferencial
Tamaño de la muestra (n)Tamaño de la muestra (n)
En el calculo del tamaño óptimo se debe tener en cuenta los siguientes componentes:•El error máximo admisible.•El nivel de confianza.•El error de muestreo.•El error de no-muestreo.•La varianza, grado de variabilidad de la característica principal.
En el calculo del tamaño óptimo se debe tener en cuenta los siguientes componentes:•El error máximo admisible.•El nivel de confianza.•El error de muestreo.•El error de no-muestreo.•La varianza, grado de variabilidad de la característica principal.
Especialización en Estadística AplicadaEstadística Inferencial
Error de MuestreoError de Muestreo
Es la diferencia entre el valor poblacional (Parámetro) y la estimación misma (Estadística) obtenida por medio de una muestra aleatoria.
El tamaño óptimo solo se puede conseguir a partir del conocimiento de la población (variabilidad); se debe prefijar el error máximo admisible que representa la precisión mínima a exigir de los resultados y el coeficiente de seguridad ó confianza.
Es la diferencia entre el valor poblacional (Parámetro) y la estimación misma (Estadística) obtenida por medio de una muestra aleatoria.
El tamaño óptimo solo se puede conseguir a partir del conocimiento de la población (variabilidad); se debe prefijar el error máximo admisible que representa la precisión mínima a exigir de los resultados y el coeficiente de seguridad ó confianza.
Especialización en Estadística AplicadaEstadística Inferencial
Error no de muestreoError no de muestreo
Son los errores ajenos al muestreo que no se pueden medir, se consideran como el resultado de instrumentos de medición incorrectos o mal aplicados, cuestionarios mal definidos, errores que comete el entrevistador al efectuar las preguntas o al interpretar las respuestas, preguntas vagas o ambiguas, en otros casos son una mala planeación del trabajo de campo y falta de definición en los estándares de calidad del trabajo de campo.
Son los errores ajenos al muestreo que no se pueden medir, se consideran como el resultado de instrumentos de medición incorrectos o mal aplicados, cuestionarios mal definidos, errores que comete el entrevistador al efectuar las preguntas o al interpretar las respuestas, preguntas vagas o ambiguas, en otros casos son una mala planeación del trabajo de campo y falta de definición en los estándares de calidad del trabajo de campo.
Especialización en Estadística AplicadaEstadística Inferencial
Fuentes potenciales de errorFuentes potenciales de error
•Estimación de la varianza Población•Carencia de Marco de Muestreo•Poblaciones con características Heterogéneas, alta variabilidad.
•Estimación de la varianza Población•Carencia de Marco de Muestreo•Poblaciones con características Heterogéneas, alta variabilidad.
Especialización en Estadística AplicadaEstadística Inferencial
Error totalError total
Variación entre el valor real de la medida en la población de la variable que se estudia y el valor de la medida observada en la investigación.
Variación entre el valor real de la medida en la población de la variable que se estudia y el valor de la medida observada en la investigación.
Especialización en Estadística AplicadaEstadística Inferencial
Tamaño de muestra para estimar la media aritmética
Tamaño de muestra para estimar la media aritmética
Cuando se conoce el tamaño poblacional
Cuando el tamaño de la población es desconocido
Cuando se conoce el tamaño poblacional
Cuando el tamaño de la población es desconocido
Especialización en Estadística AplicadaEstadística Inferencial
2
2
SZ
n
222
2
22
2
)1(
NSZ
NSZn
Tamaño de muestra para estimar la media aritmética
Tamaño de muestra para estimar la media aritmética
Para obtener una estimación inicial de la desviación estándar se puede recurrir a cualesquiera de las siguientes tres alternativas:•Usar la desviación estándar obtenida en un estudio anterior
•Estimar inicialmente la desviación estándar a partir de una muestra piloto
•Asumir inicialmente: S=Rango/4 , esto es, asumir que la desviación estándar es aproximadamente igual a la cuarta parte del rango de los datos
Para obtener una estimación inicial de la desviación estándar se puede recurrir a cualesquiera de las siguientes tres alternativas:•Usar la desviación estándar obtenida en un estudio anterior
•Estimar inicialmente la desviación estándar a partir de una muestra piloto
•Asumir inicialmente: S=Rango/4 , esto es, asumir que la desviación estándar es aproximadamente igual a la cuarta parte del rango de los datos
Especialización en Estadística AplicadaEstadística Inferencial
Tamaño de muestra para estimar la proporción
Tamaño de muestra para estimar la proporción
Cuando se conoce el tamaño poblacional
Cuando el tamaño de la población es desconocido
Cuando se conoce el tamaño poblacional
Cuando el tamaño de la población es desconocido
Especialización en Estadística AplicadaEstadística Inferencial
2
2
2)1(
ppZ
n
22
2
2
2
)1()1(
)1(
NppZ
NppZn
Tamaño de muestra para estimar la proporción
Tamaño de muestra para estimar la proporción
Para obtener una estimación inicial de la proporción se puede recurrir a cualesquiera de las siguientes tres alternativas:•Usar la proporción obtenida en un estudio anterior•Estimar inicialmente la proporción a partir de una muestra piloto•Asumir inicialmente: P=0.5 , esto es, asumir que la proporción, o probabilidad de observar el suceso, es del 50%. Con este supuesto se obtiene el máximo valor de p(1-p), lo cual garantiza que se toma una muestra de tamaño ligeramente mayor de lo necesario.
Para obtener una estimación inicial de la proporción se puede recurrir a cualesquiera de las siguientes tres alternativas:•Usar la proporción obtenida en un estudio anterior•Estimar inicialmente la proporción a partir de una muestra piloto•Asumir inicialmente: P=0.5 , esto es, asumir que la proporción, o probabilidad de observar el suceso, es del 50%. Con este supuesto se obtiene el máximo valor de p(1-p), lo cual garantiza que se toma una muestra de tamaño ligeramente mayor de lo necesario.
Especialización en Estadística AplicadaEstadística Inferencial
La UFPS soy yo, eres tú, somos todos
HipótesisHipótesis
¿Qué son las Hipótesis?• Son conjeturas lógicas acerca
de la solución de un problema. • Son explicaciones tentativas
del fenómeno investigado formuladas a manera de proposiciones.
• Nos indican lo que estamos buscando o tratando de probar.
¿Qué son las Hipótesis?• Son conjeturas lógicas acerca
de la solución de un problema. • Son explicaciones tentativas
del fenómeno investigado formuladas a manera de proposiciones.
• Nos indican lo que estamos buscando o tratando de probar.
Especialización en Estadística AplicadaEstadística Inferencial
HipótesisHipótesis
¿Qué características debe tener una hipótesis?
• Las hipótesis deben referirse a una situación real.
• La relación entre las variables debe de ser clara y verosímil.
• Deben ser medibles y observables.
• Deben estar relacionadas con técnicas disponibles para probarlas.
¿Qué características debe tener una hipótesis?
• Las hipótesis deben referirse a una situación real.
• La relación entre las variables debe de ser clara y verosímil.
• Deben ser medibles y observables.
• Deben estar relacionadas con técnicas disponibles para probarlas.
Especialización en Estadística AplicadaEstadística Inferencial
HipótesisHipótesis
• Las hipótesis pueden ser o no verdaderas. Por eso están sujetas a comprobación.
• Son proposiciones tentativas acerca de las relaciones entre dos o más variables y se apoyan en conocimientos organizados y sistematizados
• Una investigación puede tener una, dos o varias hipótesis; como también no tenerla.
• Las hipótesis pueden ser o no verdaderas. Por eso están sujetas a comprobación.
• Son proposiciones tentativas acerca de las relaciones entre dos o más variables y se apoyan en conocimientos organizados y sistematizados
• Una investigación puede tener una, dos o varias hipótesis; como también no tenerla.
Especialización en Estadística AplicadaEstadística Inferencial
HipótesisHipótesis
Hipótesis: Afirmación o conjetura acerca de una o más poblaciones
Prueba Estadística: Con base en la información obtenida a partir de una muestra (estadísticas) se ACEPTA o se RECHAZA la hipótesis
• La aceptación de una hipótesis indica tan sólo que los datos no proporcionan evidencia suficiente para refutarla• El rechazo implica que la evidencia de la muestra refuta la hipótesis
Hipótesis: Afirmación o conjetura acerca de una o más poblaciones
Prueba Estadística: Con base en la información obtenida a partir de una muestra (estadísticas) se ACEPTA o se RECHAZA la hipótesis
• La aceptación de una hipótesis indica tan sólo que los datos no proporcionan evidencia suficiente para refutarla• El rechazo implica que la evidencia de la muestra refuta la hipótesis
Especialización en Estadística AplicadaEstadística Inferencial
Tipos de HipótesisTipos de Hipótesis
Hipótesis Nula (H0): Es la hipótesis que se desea probar. Se formula para indicar la estructura de la población
Hipótesis Alternativa (H1): Es la hipótesis que se acepta en caso de rechazar H0
Hipótesis Nula (H0): Es la hipótesis que se desea probar. Se formula para indicar la estructura de la población
Hipótesis Alternativa (H1): Es la hipótesis que se acepta en caso de rechazar H0
Especialización en Estadística AplicadaEstadística Inferencial
Formulación de HipótesisFormulación de Hipótesis
Partes de una HipótesisVariable 1 y variable 2 o variable
independiente y variable dependiente.
Unidad de análisis. Conectores lógicos
Partes de una HipótesisVariable 1 y variable 2 o variable
independiente y variable dependiente.
Unidad de análisis. Conectores lógicos
Especialización en Estadística AplicadaEstadística Inferencial
Formulación de HipótesisFormulación de Hipótesis
¿Qué tipos de hipótesis hay?• Hipótesis de Investigación. • Hipótesis nula. • Hipótesis alternativas. • Hipótesis “estadísticas”.
¿Qué tipos de hipótesis hay?• Hipótesis de Investigación. • Hipótesis nula. • Hipótesis alternativas. • Hipótesis “estadísticas”.
Especialización en Estadística AplicadaEstadística Inferencial
Formulación de HipótesisFormulación de Hipótesis
Hipótesis de Investigación (Hi)Hipótesis descriptiva del valor de
una variable o variables.Hipótesis de asociaciónHipótesis CorrelacionalesHipótesis que establecen
relaciones de causalidadHipótesis de la diferencia entre
grupos
Hipótesis de Investigación (Hi)Hipótesis descriptiva del valor de
una variable o variables.Hipótesis de asociaciónHipótesis CorrelacionalesHipótesis que establecen
relaciones de causalidadHipótesis de la diferencia entre
grupos
Especialización en Estadística AplicadaEstadística Inferencial
Formulación de HipótesisFormulación de Hipótesis
Hipótesis Nula (H0)Sirven para refutar o negar lo que
afirma la hipótesis de investigación.
Hay tantos tipos de hipótesis nulas como de investigación.
Establecen que no existe diferencia entre el valor del parámetro y el valor supuesto a investigar.
Hipótesis Nula (H0)Sirven para refutar o negar lo que
afirma la hipótesis de investigación.
Hay tantos tipos de hipótesis nulas como de investigación.
Establecen que no existe diferencia entre el valor del parámetro y el valor supuesto a investigar.
Especialización en Estadística AplicadaEstadística Inferencial
Formulación de HipótesisFormulación de Hipótesis
Hipótesis alternativas (Ha o H1)Son posibilidades “alternas” ante
las hipótesis de investigación y nula.
Pueden ser más de una. Son las hipótesis que se aceptan
en caso de rechazar la hipótesis nula
Hipótesis alternativas (Ha o H1)Son posibilidades “alternas” ante
las hipótesis de investigación y nula.
Pueden ser más de una. Son las hipótesis que se aceptan
en caso de rechazar la hipótesis nula
Especialización en Estadística AplicadaEstadística Inferencial
Formulación de HipótesisFormulación de Hipótesis
Hipótesis “Estadísticas”.Son las transformaciones de las
hipótesis de investigación, nulas y alternativas en símbolos estadísticos.
• Del valor de una variable• De asociación.• De correlación.• De relaciones causales.• De diferencia de grupos.
Hipótesis “Estadísticas”.Son las transformaciones de las
hipótesis de investigación, nulas y alternativas en símbolos estadísticos.
• Del valor de una variable• De asociación.• De correlación.• De relaciones causales.• De diferencia de grupos.
Especialización en Estadística AplicadaEstadística Inferencial
Prueba de HipótesisPrueba de Hipótesis
Prueba Estadística: Con base en el resultado de una muestra se acepta o se rechaza la hipótesis nula
Errores•Error tipo I: Rechazar afirmaciones (H0) verdaderas
•Error tipo II: Aceptar afirmaciones (H1) falsas
Prueba Estadística: Con base en el resultado de una muestra se acepta o se rechaza la hipótesis nula
Errores•Error tipo I: Rechazar afirmaciones (H0) verdaderas
•Error tipo II: Aceptar afirmaciones (H1) falsas
Especialización en Estadística AplicadaEstadística Inferencial
Prueba de HipótesisPrueba de Hipótesis
Especialización en Estadística AplicadaEstadística Inferencial
Estado de la Naturaleza
Decisión
Aceptar Ho Rechazar Ho
Ho verdaderaDecisión correcta
Error tipo I
Ho falsaError tipo II Decisión
correcta
Prueba de HipótesisPrueba de Hipótesis
•Nivel de Significación (α): Probabilidad de rechazar una hipótesis nula verdadera•Potencia de la prueba (1-β): Probabilidad de rechazar H0 dado que H1 es verdadera
•α = P(E.T.I)•β = p(E.T.II)•Valor p: Nivel más bajo (de significación) en el cual el valor observado del estadístico de prueba es significativo
•Nivel de Significación (α): Probabilidad de rechazar una hipótesis nula verdadera•Potencia de la prueba (1-β): Probabilidad de rechazar H0 dado que H1 es verdadera
•α = P(E.T.I)•β = p(E.T.II)•Valor p: Nivel más bajo (de significación) en el cual el valor observado del estadístico de prueba es significativo
Especialización en Estadística AplicadaEstadística Inferencial
Proceso para Prueba de HipótesisProceso para Prueba de Hipótesis
•Establecer H0: θ = θ0
•Seleccionar H1: H1: θ ≠ θ0 ; H1: θ < θ0 ; H1: θ > θ0
•Seleccionar el nivel de significación: α
•Seleccionar el estadístico de prueba apropiado y establecer la región crítica
•Calcular el valor del estadístico de prueba con los datos muestrales
•Tomar la decisión
•Establecer H0: θ = θ0
•Seleccionar H1: H1: θ ≠ θ0 ; H1: θ < θ0 ; H1: θ > θ0
•Seleccionar el nivel de significación: α
•Seleccionar el estadístico de prueba apropiado y establecer la región crítica
•Calcular el valor del estadístico de prueba con los datos muestrales
•Tomar la decisión
Especialización en Estadística AplicadaEstadística Inferencial
Razonamiento BásicoRazonamiento Básico
Especialización en Estadística AplicadaEstadística Inferencial
4020X
Si supongo que H0 es cierta...
... el resultado del experimento sería improbable. Sin embargo ocurrió.
¿qué hace un científico cuando su teoría no coincide con sus predicciones?
Razonamiento BásicoRazonamiento Básico
Especialización en Estadística AplicadaEstadística Inferencial
4020X
Si supongo que H0 es cierta...
... el resultado del experimento sería improbable. Sin embargo ocurrió.
Rechazo que H0 sea cierta.
Razonamiento BásicoRazonamiento Básico
Especialización en Estadística AplicadaEstadística Inferencial
4038X
Si supongo que H0 es cierta...
... el resultado del experimento es coherente.
• No hay evidencia contra H0
•No se rechaza H0
•El experimento no es concluyente•El contraste no es significativo
¿Si una teoría hace predicciones con éxito, queda probado que es cierta?
Región crítica y nivel de significaciónRegión crítica y nivel de significación
Especialización en Estadística AplicadaEstadística Inferencial
Región crítica• Valores ‘improbables’ si...• Es conocida antes de realizar el
experimento: resultados experimentales que refutarían H0
Nivel de significación: • Número pequeño: 1% , 5%• Fijado de antemano por el
investigador• Es la probabilidad de rechazar
H0 cuando es cierta
No rechazo H0
Reg. Crit.Reg. Crit.
=5%
=40
Contrastes unilateral y bilateralContrastes unilateral y bilateral
Especialización en Estadística AplicadaEstadística Inferencial
La posición de la región crítica depende de la hipótesis alternativa
Unilateral Unilateral
Bilateral
H1: <40 H1: >40
H1: 40
Significación pSignificación p
Especialización en Estadística AplicadaEstadística Inferencial
H0: =40
Significación pSignificación p
Especialización en Estadística AplicadaEstadística Inferencial
43X
No se rechazaH0: =40
H0: =40
Significación pSignificación p
Especialización en Estadística AplicadaEstadística Inferencial
43X
No se rechazaH0: =40
Es la probabilidad que tendría una región crítica que comenzase exactamente en el valor del estadístico obtenido de la muestra. Es la probabilidad de tener una muestra que discrepe aún más que la nuestra de H0. Es la probabilidad de que por puro azar obtengamos una muestra “más extraña” que la obtenida.p es conocido después de realizar el experimento aleatorioEl contraste es no significativo cuando p>
P
P
Significación pSignificación p
Especialización en Estadística AplicadaEstadística Inferencial
50X
Se rechaza H0: =40
Se acepta H1: >40
Significación pSignificación p
Especialización en Estadística AplicadaEstadística Inferencial
P
P
50X
Se rechaza H0: =40
Se acepta H1: >40
El contraste es estadísticamente significativo cuando p<Es decir, si el resultado experimental discrepa más de “lo tolerado” a priori.