La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres...

transcript

La Estadística Inferencial en el Proceso Investigativo

Henry Gallardo Pérez

La UFPS soy yo, eres tú, somos todos

ObjetivosObjetivos

•Identificar las propiedades de los estimadores y aplicarlas en la solución de problemas•Utilizar métodos formales para realizar estimaciones y pruebas de hipótesis•Establecer criterios de evaluación, especificación y verificación del modelo estadístico•Establecer fundamentos básicos para la toma de decisiones con base en las inferencias obtenidas a partir del modelo

Especialización en Estadística AplicadaEstadística Inferencial

Contenidos TemáticosContenidos Temáticos

•Introducción•Población y Muestra•Estimación

•Estimadores

•Estimación puntual

•Estimación por intervalo

•Pruebas de Hipótesis•Pruebas paramétricas

•Pruebas no paramétricas

•Introducción•Población y Muestra•Estimación

•Estimadores

•Estimación puntual

•Estimación por intervalo

•Pruebas de Hipótesis•Pruebas paramétricas

•Pruebas no paramétricas

BibliografíaBibliografía

•PEÑA SANCHEZ DE RIVERA, DANIEL. Estadística Modelos y Métodos, 1. Fundamentos, Alianza Editorial, Madrid•BICKEL, PETER. Matematical Statistics, Prentice Hall, New Jersey•MENDENHALL, W., SCHEAFFER, WACKERLY. Estadísica Matemática con Aplicaciones, Editorial Iberoamérica, México•WALPOLE, R., R. MYERS, S. MIERS. Probabilidad y Estadística para Ingenieros, Pearson, Ed.

¿Para qué sirve la Estadística?¿Para qué sirve la Estadística?

La Ciencia se ocupa en general de fenómenos observablesLa Ciencia se desarrolla observando hechos, formulando leyes que los explican y realizando experimentos para validar o rechazar dichas leyesLos modelos que crea la ciencia son de tipo determinista o aleatorio (estocástico)La Estadística se utiliza como tecnología al servicio de las ciencias donde la variabilidad y la incertidumbre forman parte de su naturaleza

¿Para qué sirve la Estadística?¿Para qué sirve la Estadística?

La Estadística es la Ciencia de la

•Sistematización, recolección, ordenación y presentación de los datos referentes a un fenómeno que presenta variabilidad o incertidumbre para su estudio metódico, con objeto de

•deducir las leyes que rigen esos fenómenos,

•y poder de esa forma hacer previsiones sobre los mismos, tomar decisiones u obtener conclusiones.

La Estadística es la Ciencia de la

•Sistematización, recolección, ordenación y presentación de los datos referentes a un fenómeno que presenta variabilidad o incertidumbre para su estudio metódico, con objeto de

•deducir las leyes que rigen esos fenómenos,

•y poder de esa forma hacer previsiones sobre los mismos, tomar decisiones u obtener conclusiones.

Descrip

Probabili

rencia

DefiniciónDefinición

Estadística es la ciencia de: Recolectar Describir Organizar Interpretar

para transformarlos en información, para la toma mas eficiente de decisiones.

Estadística es la ciencia de: Recolectar Describir Organizar Interpretar

para transformarlos en información, para la toma mas eficiente de decisiones.

Tipos de EstadísticaTipos de Estadística

Estadística Descriptiva: Método de recolectar, organizar, resumir y presentar los datos en forma informativa.

Estadística inferencial: Métodos usados para determinar algo acerca de la población, basado en una muestra.

Estadística Descriptiva: Método de recolectar, organizar, resumir y presentar los datos en forma informativa.

Estadística inferencial: Métodos usados para determinar algo acerca de la población, basado en una muestra.

Método Científico y EstadísticaMétodo Científico y Estadística

Teoría o Conocimiento Actual

Observaciones

Resultados

Conclusiones

Hipótesis operativa

Hipótesis conceptual

Identificación de un problema

Diseño

Recolección de datos

Análisis

Interpreta-ción

Generalización

Método Científico y EstadísticaMétodo Científico y Estadística

Plantear hipótesis

Obtenerconclusiones

Recoger datosy analizarlos

Diseñar experimento

Problema realProblema realProblema realProblema real

Depuración de los datosDepuración de los datos(Análisis de datos)(Análisis de datos)

Estimación de los parámetrosEstimación de los parámetros(Teoría de la estimación)(Teoría de la estimación)

Modelos EstadísticosModelos Estadísticos(Cálculo de probabilidades)(Cálculo de probabilidades)

Planteamiento del problemaPlanteamiento del problemaObjetos y mediosObjetos y medios

Recolección de información muestralRecolección de información muestral(Técnicas de muestreo ; diseño de experimentos)(Técnicas de muestreo ; diseño de experimentos)

Contrastes de SimplificaciónContrastes de Simplificación(Contrastes de hipótesis)(Contrastes de hipótesis)

Crítica y Diagnosis del ModeloCrítica y Diagnosis del Modelo(Análisis de datos)(Análisis de datos)

Nuevo Conocimiento Nuevo Conocimiento

PrevisionesPrevisiones DecisionesDecisiones

Universo de EstudioUniverso de Estudio

Universo Ideal:

Conjunto sobre el cual el investigador, pretende obtener alguna información.

Sobre el cual recaerán las consecuencias de las decisiones basadas en los resultados de la encuesta

Universo Ideal:

Conjunto sobre el cual el investigador, pretende obtener alguna información.

Sobre el cual recaerán las consecuencias de las decisiones basadas en los resultados de la encuesta

Población Objetivo:

Conjunto de elementos que partiendo del universo ideal puede realmente ser alcanzado por el investigador.

Se obtiene de los ajustes y/o recortes por operatividad, razones políticas, económicas o sociales

Población Objetivo:

Conjunto de elementos que partiendo del universo ideal puede realmente ser alcanzado por el investigador.

Se obtiene de los ajustes y/o recortes por operatividad, razones políticas, económicas o sociales

Marco de Muestreo:

Dispositivo que permite identificar y ubicar los sujetos que toman parte en los diferentes procesos de selección al azar.

Tipos de Marco: Lista o área.

Marco de Muestreo:

Dispositivo que permite identificar y ubicar los sujetos que toman parte en los diferentes procesos de selección al azar.

Tipos de Marco: Lista o área.

Población susceptible de encuesta:

Conjunto de elementos del marco muestral con probabilidad mayor a cero de ser incluidos en la muestra.

Esto, porque el hecho de ubicar los elementos no implica tener acceso a ellos.

Población susceptible de encuesta:

Conjunto de elementos del marco muestral con probabilidad mayor a cero de ser incluidos en la muestra.

Esto, porque el hecho de ubicar los elementos no implica tener acceso a ellos.

La meta del muestrista es encontrar mecanismos que cierren la brecha entre el universo ideal del investigador y la población susceptible de encuesta.

Considerar diferentes marcos de muestreo y planear formas de acceso adecuadas para diversos subconjuntos del universo

La meta del muestrista es encontrar mecanismos que cierren la brecha entre el universo ideal del investigador y la población susceptible de encuesta.

Considerar diferentes marcos de muestreo y planear formas de acceso adecuadas para diversos subconjuntos del universo

Población y MuestraPoblación y Muestra

Población: Conjunto de todas las unidades de análisis de interés para una investigación

Muestra: Subconjunto de la población

Una muestra es representativa si es de un tamaño suficientemente grande y mantiene una estructura similar a la de la población

Población: Conjunto de todas las unidades de análisis de interés para una investigación

Muestra: Subconjunto de la población

Una muestra es representativa si es de un tamaño suficientemente grande y mantiene una estructura similar a la de la población

Población y MuestraPoblación y Muestra

Población

Muestra

Criterios de Inclusión y de exclusiónCriterios de Inclusión y de exclusión

Criterios de inclusión: son las características necesarias para que las unidades de análisis formen parte de la población de estudio.

Criterios de exclusión: son las características no necesarias o excluyentes para que las unidades de análisis formen parte de la población de estudio.

Criterios de inclusión: son las características necesarias para que las unidades de análisis formen parte de la población de estudio.

Criterios de exclusión: son las características no necesarias o excluyentes para que las unidades de análisis formen parte de la población de estudio.

Parámetro y EstadísticaParámetro y Estadística

• Parámetro: Es un indicador de la población calculado con base en la información de todas las unidades de análisis

• Estadística: Indicador de la población calculado con base en la información suministrada por la muestra

• Parámetro: Es un indicador de la población calculado con base en la información de todas las unidades de análisis

• Estadística: Indicador de la población calculado con base en la información suministrada por la muestra

Muestra RepresentativaMuestra Representativa

•Reúne las características principales de la población en relación a la variable o condición particular que se estudia, por lo tanto, los resultados y conclusiones obtenidos en esta muestra se pueden generalizar a la población de la cual fue extraída.•La representatividad de una muestra está dada por:

•Su tamaño•El tipo de muestreo que garantiza la inclusión de las variables relevantes presentes en la población

•Reúne las características principales de la población en relación a la variable o condición particular que se estudia, por lo tanto, los resultados y conclusiones obtenidos en esta muestra se pueden generalizar a la población de la cual fue extraída.•La representatividad de una muestra está dada por:

•Su tamaño•El tipo de muestreo que garantiza la inclusión de las variables relevantes presentes en la población

Plan de MuestreoPlan de Muestreo

•Definición concreta y clara de los objetivos de la encuesta o estudio.

•Traducción de los objetivos del estudio en resultados estadísticos.

•Especificación de la Población Objetivo.

•Construcción, revisión del marco muestral.

•Inventario de Recursos disponibles.

•Definición concreta y clara de los objetivos de la encuesta o estudio.

•Traducción de los objetivos del estudio en resultados estadísticos.

•Especificación de la Población Objetivo.

•Construcción, revisión del marco muestral.

•Inventario de Recursos disponibles.

•Especificaciones de los acuerdos necesarios con el usuario.

•Especificaciones de los métodos de recolección de Información, elaboración de los instrumentos de recolección, cuestionarios, manuales, capacitación, mapas.

•Especificación del diseño muestral, mecanismos de selección, varianza de los estimadores.

•Especificaciones de los acuerdos necesarios con el usuario.

•Especificaciones de los métodos de recolección de Información, elaboración de los instrumentos de recolección, cuestionarios, manuales, capacitación, mapas.

•Especificación del diseño muestral, mecanismos de selección, varianza de los estimadores.

•Determinación del tipo de procesamiento a realizar, critica e imputación.

•Especificación de las fórmulas de estimación y de las medidas de calidad.

•Planear el trabajo de campo

•Diseño del plan de control y evaluación.

•Determinación del tipo de procesamiento a realizar, critica e imputación.

•Especificación de las fórmulas de estimación y de las medidas de calidad.

•Planear el trabajo de campo

•Diseño del plan de control y evaluación.

Investigación Total y ParcialInvestigación Total y Parcial

Dependiendo del objetivo que se persiga, puede realizarse una investigación exhaustiva o una parcial. • EXHAUSTIVA: Se observan todas las unidades que constituyen la población o universo, objeto de investigación. • La enumeración total de toda la población en un tiempo dado, recibe el nombre de CENSO (censo de población, de industria manufacturera de tiendas del sector agropecuario, de establecimientos educativos, etc.)

Cuándo no se recomienda un censoCuándo no se recomienda un censo

• Cuando la población sea infinita. • Cuando aún siendo finita es muy numerosa• Por motivos de tiempo• Cuando el costo es superior a los recursos disponibles• Cuando la observación implique destrucción de los elementos.• Cuando se desea obtener información especializada.• Cuando la característica sea homogénea

Error en la InvestigaciónError en la Investigación

Error de

M uestreo

S ust itución de la inf ormación

M edición - A nálisis de datos

Defi nición de la población

Estructura de la muestra

Errores del

I nvest igador

S elección de los entrevistados

Preguntar

Registro

Engaño

Errores del

Entrevistador

I ncapacidad

Falta de voluntad

Errores del

Entrevistado

Error en la Respuesta Error de no Respuesta

Error N o de

muestreo

ERRO R T O T A L

VariablesVariables

•Una variable es un aspecto, rasgo, cualidad o característica de un sujeto, objeto o fenómeno que, por su misma naturaleza, tiende a variar o a adoptar distintas magnitudes, medibles cuantitativamente o cualitativamente •Son manifestaciones de la realidad. Por intermedio de ellas podemos conocer y medir la realidad, el hecho o fenómeno. •La información que disponemos de cada individuo es resumida en variables

Variables de InterésVariables de Interés

Existe una diferencia importante entre la variable ideal del investigador y la variable operacional, es decir aquella que está en condiciones de ser observada y ser objeto de medición.

Encontrar la forma en que la variable operacional refleje lo más cercanamente posible el concepto que el investigador pretende estudiar.

Existe una diferencia importante entre la variable ideal del investigador y la variable operacional, es decir aquella que está en condiciones de ser observada y ser objeto de medición.

Encontrar la forma en que la variable operacional refleje lo más cercanamente posible el concepto que el investigador pretende estudiar.

Operacionalización de VariablesOperacionalización de Variables

Características de las VariablesCaracterísticas de las Variables

1. Ser parte de un todo: El conjunto de variables constituye el todo objeto de la investigación; o el todo, con fines de análisis investigativo, se descompone en variables, cuya estructura y evolución hay que estudiar.

2. Ser observable.- directa o indirectamente.

3. Ser susceptibles de variación cuantitativa o cualitativa: ser una magnitud en proceso.

1. Ser parte de un todo: El conjunto de variables constituye el todo objeto de la investigación; o el todo, con fines de análisis investigativo, se descompone en variables, cuya estructura y evolución hay que estudiar.

2. Ser observable.- directa o indirectamente.

3. Ser susceptibles de variación cuantitativa o cualitativa: ser una magnitud en proceso.

Funciones de las Variables en el Proceso de Investigación

1. Analiza la realidad objeto de investigación.Para conocer la realidad, hay que seguir un proceso analítico, descomponiéndola en variables. Un esfuerzo de síntesis posterior será restituir el todo.

2. Orienta el establecimiento de indicadores. Un riesgo que constantemente se vive en el proceso de investigación es el de dudar. Este riesgo se supera si se tienen establecidas las variables, las que provienen de un marco teórico bien fundamentado. De las variables determinadas provienen las indicaciones, que nos señalan cual es la información que necesitamos para llegar a conclusiones científicas.

3. Permiten descubrir las fuentes de información.Las variables e indicadores nos señalan cuál es la información que necesitamos y donde podemos encontrarla.

4. Miden el grado de variabilidad del problema de investigación.Todo está en permanente movimiento, al momento de investigar se debe identificar el ritmo de este movimiento en el fenómeno o hecho de investigación.

Clases de VariablesClases de Variables

Existen innumerables tipos de variables, vamos a describir las más útiles:

I.- Según como se expresan los valores o por naturaleza de su medición pueden ser:a) Categórica – cualitativa b) Cuantitativa – numérica

Variable discreta o discontinua Variable continua

Existen innumerables tipos de variables, vamos a describir las más útiles:

I.- Según como se expresan los valores o por naturaleza de su medición pueden ser:a) Categórica – cualitativa b) Cuantitativa – numérica

Variable discreta o discontinua Variable continua

Clases de VariablesClases de Variables

II.- Según la búsqueda de obtener explicación causal del problema o fenómeno estudiado o la relación entre las mismas variables.

a) Variable independiente b) Variable dependiente.c) Variable interviniente d) Variable de control e) Variables de confusión

II.- Según la búsqueda de obtener explicación causal del problema o fenómeno estudiado o la relación entre las mismas variables.

a) Variable independiente b) Variable dependiente.c) Variable interviniente d) Variable de control e) Variables de confusión

Escalas de MediciónEscalas de Medición

Escalas de medición de variables:Escala nominalEscala ordinal.Escala de intervalo.Escala de razón

Escalas de MediciónEscalas de Medición

Escala Nominal: Es la escala más rudimentaria donde los objetos se distinguen con base en su nombre, en ocasiones dado por un número

Escala Ordinal: Las mediciones sólo indican orden (“ranking”). Los objetos se distinguen con base en una cantidad relativa de una característica que poseen

Escala de Intervalo: Cuando las diferencias entre objetos tiene sentido, es decir que la unidad de medida es fija. Generalmente tienen un cero, aunque este es arbitrario

Escala de Razón: Cuando; además de los anterior, los cocientes (razones) de valores tienen sentido, la escala es racional. El cero es absoluto en esta escala.

Escala Nominal: Es la escala más rudimentaria donde los objetos se distinguen con base en su nombre, en ocasiones dado por un número

Escala Ordinal: Las mediciones sólo indican orden (“ranking”). Los objetos se distinguen con base en una cantidad relativa de una característica que poseen

Escala de Intervalo: Cuando las diferencias entre objetos tiene sentido, es decir que la unidad de medida es fija. Generalmente tienen un cero, aunque este es arbitrario

Escala de Razón: Cuando; además de los anterior, los cocientes (razones) de valores tienen sentido, la escala es racional. El cero es absoluto en esta escala.

Tipos de Variables y Escalas de Medición

N om in a l

O rd in a l

E sca la d e m ed ic ió n

C u a lita t iva o A trib u to

In te rva lo

R azó n

E sca la d e m ed ic ió n

D isc re ta

C on tin u a

C u an tita tiva o N ú m erica

V ariab les

Inferencia EstadísticaInferencia Estadística

Estimación: Aproximación del valor del parámetro poblacional a partir de la estadística calculada con base en la información de la muestra

Prueba de Hipótesis: Con base en los resultados obtenidos a partir de la información de la muestra se acepta o rechaza una afirmación acerca de uno o varios parámetros o sobre la forma de la distribución

Estimación: Aproximación del valor del parámetro poblacional a partir de la estadística calculada con base en la información de la muestra

Prueba de Hipótesis: Con base en los resultados obtenidos a partir de la información de la muestra se acepta o rechaza una afirmación acerca de uno o varios parámetros o sobre la forma de la distribución

Características de un Buen Estimador

Insesgado: Si el valor esperado del mismo es igual al parámetro poblacional.Eficiente: Se refiere a lo cerca que se encuentre el valor estimado del parámetro.Consistente: Se obtiene cuando el tamaño de la muestra se incrementa en tal forma que la varianza disminuya.Suficiente: Es un estimador que utiliza toda la información que posee una muestra para estimar el parámetro.

HipótesisHipótesis

Hipótesis: Afirmación o conjetura acerca de una o más poblaciones

Prueba Estadística: Con base en la información obtenida a partir de una muestra (estadísticas) se ACEPTA o se RECHAZA la hipótesis

La aceptación de una hipótesis indica tan sólo que los datos no proporcionan evidencia suficiente para refutarla

El rechazo implica que la evidencia de la muestra refuta la hipótesis

La aceptación de una hipótesis indica tan sólo que los datos no proporcionan evidencia suficiente para refutarla

El rechazo implica que la evidencia de la muestra refuta la hipótesis

EstimadorEstimador

Regla que establece cómo calcular una estimación basada en las mediciones contenidas en la muestra.

Cualesquier estadística (función de variables aleatorias) observable, que es también una variable aleatoria, cuyos valores se usan para estimar un parámetro θ o una función del parámetro θ.

Regla que establece cómo calcular una estimación basada en las mediciones contenidas en la muestra.

Cualesquier estadística (función de variables aleatorias) observable, que es también una variable aleatoria, cuyos valores se usan para estimar un parámetro θ o una función del parámetro θ.

Propiedades: 1. InsesgamientoPropiedades: 1. Insesgamiento

es estimador insesgado de si

En caso contrario, es sesgado

Ejemplos

es estimador insesgado de si

En caso contrario, es sesgado

Ejemplos

ˆˆ ESesgo

XE 22 SE

Cuadrado Medio del ErrorCuadrado Medio del Error

2ˆˆ ECME

ˆvarˆˆ 2 sesgoCME

Propiedades: 2. ConsistenciaPropiedades: 2. Consistencia

Si se aumenta el tamaño de la muestra, se espera que el valor del estimador se acerque al verdadero valor

Un estimador es un estimador consistente de si converge estocásticamente a cuando

Si se aumenta el tamaño de la muestra, se espera que el valor del estimador se acerque al verdadero valor

Un estimador es un estimador consistente de si converge estocásticamente a cuando

Propiedades: 2. ConsistenciaPropiedades: 2. Consistencia

converge estocásticamente a cuando si para dos números positivos arbitrariamente pequeños, se puede tomar una muestra suficientemente grande tal que

es estimador consistente de

converge estocásticamente a cuando si para dos números positivos arbitrariamente pequeños, se puede tomar una muestra suficientemente grande tal que

es estimador consistente de

Desigualdad de ChebyshevDesigualdad de Chebyshev

Sea X una variable aleatoria continua con función de densidad de probabilidad , media , varianza Para dado:

Propiedades: 3. Eficiencia (precisión)Propiedades: 3. Eficiencia (precisión)

es un estimador eficiente de si:

• se aproxima a la normal cuando

• Para cualesquier otro estimador para el cual se aproxime a la normal se cumple que

La eficiencia de respecto a está dada por

es un estimador eficiente de si:

• se aproxima a la normal cuando

• Para cualesquier otro estimador para el cual se aproxime a la normal se cumple que

La eficiencia de respecto a está dada por

ˆn 2,0 N

ˆ ˆn

2,0 N 22

Propiedades: 4. SuficienciaPropiedades: 4. Suficiencia

es un estimador suficiente de :

• Si aporta toda la posible información que le provee la muestra

• Si y sólo si la distribución condicional de dado no depende de

• Si se conoce ya se tiene toda la información de

es un estimador suficiente de :

• Si aporta toda la posible información que le provee la muestra

• Si y sólo si la distribución condicional de dado no depende de

• Si se conoce ya se tiene toda la información de

nXXX ,...,, 21

Criterio de factorizaciónCriterio de factorización

Se emplea para encontrar estimadores suficientes

Sea una muestra aleatoria de tamaño n de una densidad , donde el parámetro puede ser un vector

Una estadística es suficiente si y sólo si la densidad conjunta de (la cual es, )

se puede escribir así:

Se emplea para encontrar estimadores suficientes

Sea una muestra aleatoria de tamaño n de una densidad , donde el parámetro puede ser un vector

Una estadística es suficiente si y sólo si la densidad conjunta de (la cual es, )

se puede escribir así:

nXXX ,...,, 21

nXXXT ,...,, 21

nXXX ,...,, 21

Criterio de factorizaciónCriterio de factorización

donde es no negativa y no envuelve el parámetro y la función es no negativa y depende de y la estadística

nnnXXX XXXtgXXXhXXXfn

,...,,,*,...,,,...,, 212121,...,, 21

nXXXt ,...,, 21

Propiedades: 5. Robustez (resistencia)

es un estimador robusto de :

si continúa siendo razonablemente bueno como estimador de si el modelo experimenta una pequeña modificación

• Los estimadores robustos no son tan eficientes como los óptimos cuando el modelo es correcto, pero el cambio en sus propiedades es leve ante contaminaciones o alteraciones en la función de densidad de la variable

es un estimador robusto de :

si continúa siendo razonablemente bueno como estimador de si el modelo experimenta una pequeña modificación

• Los estimadores robustos no son tan eficientes como los óptimos cuando el modelo es correcto, pero el cambio en sus propiedades es leve ante contaminaciones o alteraciones en la función de densidad de la variable

Función de verosimilitudFunción de verosimilitud

La función de verosimilitud de n variables aleatorias se define como la densidad conjunta de las n variables, esto es: , la cual se considera como una función de

En particular, si es una muestra aleatoria de , entonces la función de verosimilitud es

La función de verosimilitud de n variables aleatorias se define como la densidad conjunta de las n variables, esto es: , la cual se considera como una función de

En particular, si es una muestra aleatoria de , entonces la función de verosimilitud es

nXXX ,...,, 21

,,...,, 21,...,, 21 nXXX XXXf

iiXfXL

nXXXX ,...,, 21

Método de máxima verosimilitudMétodo de máxima verosimilitud

Un estimador máximo verosímil satisfaceUn estimador máximo verosímil satisface

Modelos ProbabilísticosModelos Probabilísticos

El resultado de un experimento aleatorio puede ser descrito en ocasiones como una cantidad numérica.

En estos casos aparece la noción de variable aleatoria: Función que asigna a cada suceso un número.

Las variables aleatorias pueden ser discretas o continuas.

El resultado de un experimento aleatorio puede ser descrito en ocasiones como una cantidad numérica.

En estos casos aparece la noción de variable aleatoria: Función que asigna a cada suceso un número.

Las variables aleatorias pueden ser discretas o continuas.

Modelos Probabilísticos

Función de masa (v. a. discreta)

Asigna a cada posible valor de una variable discreta su probabilidad.

EjemploNúmero de caras al lanzar 3 monedas.

Asigna a cada posible valor de una variable discreta su probabilidad.

EjemploNúmero de caras al lanzar 3 monedas.

0 1 2 3

Función de densidad (v. a. continua)

Definición•Es una función no negativa •Su integral (el área bajo la curva) es 1.

Puede verse como la generalización del histograma de frecuencias relativas para variables continuas.

Definición•Es una función no negativa •Su integral (el área bajo la curva) es 1.

Puede verse como la generalización del histograma de frecuencias relativas para variables continuas.

¿para qué sirve la función de densidad?

Muchos procesos aleatorios vienen descritos por variables de forma que son conocidas sus funciones de densidad de probabilidad

Identificamos la probabilidad de que la v. a. tome valores en un intervalo con el área bajo la función de densidad.

Muchos procesos aleatorios vienen descritos por variables de forma que son conocidas sus funciones de densidad de probabilidad

Identificamos la probabilidad de que la v. a. tome valores en un intervalo con el área bajo la función de densidad.

Función de Distribución

•Es la función que asocia a cada valor de una variable, la probabilidad acumulada de los valores inferiores o iguales.•La generalización de las frecuencias acumuladas.

A los valores extremadamente bajos les corresponden valores de la función de distribución cercanos a cero.A los valores extremadamente altos les corresponden valores de la función de distribución cercanos a uno.

•La encontraremos en los artículos y aplicaciones en forma de “p-valor”, significación,…

•Es la función que asocia a cada valor de una variable, la probabilidad acumulada de los valores inferiores o iguales.•La generalización de las frecuencias acumuladas.

A los valores extremadamente bajos les corresponden valores de la función de distribución cercanos a cero.A los valores extremadamente altos les corresponden valores de la función de distribución cercanos a uno.

•La encontraremos en los artículos y aplicaciones en forma de “p-valor”, significación,…

Distribución Normal o de Gauss

Aparece de manera natural:Errores de medida.Distancia de frenado. Altura, peso, CI, Pruebas de estado, … Distribuciones binomiales con n grande (n>30) y ‘p ni pequeño’ (np>5) ‘ni grande’ (nq>5).

Está caracterizada por dos parámetros: La media, μ, y la desviación típica, σ.Su función de densidad es:

Aparece de manera natural:Errores de medida.Distancia de frenado. Altura, peso, CI, Pruebas de estado, … Distribuciones binomiales con n grande (n>30) y ‘p ni pequeño’ (np>5) ‘ni grande’ (nq>5).

Está caracterizada por dos parámetros: La media, μ, y la desviación típica, σ.Su función de densidad es:

N(μ, σ2): Interpretación Geométrica

La media se interpreta como un factor de traslación.

La desviación estándar como un factor de escala, grado de dispersión,

La media se interpreta como un factor de traslación.

La desviación estándar como un factor de escala, grado de dispersión,

N(μ, σ2): Interpretación Probabilística

Entre la media y una desviación estándar tenemos siempre la misma probabilidad: aprox. 68%

Entre la media y dos desviaciones estándar aprox. 95%

Entre la media y una desviación estándar tenemos siempre la misma probabilidad: aprox. 68%

Entre la media y dos desviaciones estándar aprox. 95%

Algunas características de N(μ, σ2)

La función de densidad es simétrica, mesocúrtica y unimodal.

Media, mediana y moda coinciden.Los puntos de inflexión de la función de densidad están a distancia σ de μ.Si tomamos intervalos centrados en μ, y cuyos extremos están…

a distancia σ, tenemos probabilidad 68,26%a distancia 2 σ, tenemos probabilidad 95,45%a distancia 3 σ tenemos probabilidad 99,73%

No es posible calcular la probabilidad de un intervalo simplemente usando la primitiva de la función de densidad, ya que no tiene primitiva expresable en términos de funciones ‘comunes’.Todas las distribuciones normales N(μ, σ2), pueden ponerse mediante una traslación μ, y un cambio de escala σ, como N(0,1). Esta distribución especial se llama normal estandarizada o tipificada.

La función de densidad es simétrica, mesocúrtica y unimodal.

Media, mediana y moda coinciden.Los puntos de inflexión de la función de densidad están a distancia σ de μ.Si tomamos intervalos centrados en μ, y cuyos extremos están…

a distancia σ, tenemos probabilidad 68,26%a distancia 2 σ, tenemos probabilidad 95,45%a distancia 3 σ tenemos probabilidad 99,73%

No es posible calcular la probabilidad de un intervalo simplemente usando la primitiva de la función de densidad, ya que no tiene primitiva expresable en términos de funciones ‘comunes’.Todas las distribuciones normales N(μ, σ2), pueden ponerse mediante una traslación μ, y un cambio de escala σ, como N(0,1). Esta distribución especial se llama normal estandarizada o tipificada.

Estandarización o Tipificación

Dada una variable de media μ y desviación estándar σ, se denomina valor tipificado o valor estandarizado, z, de una observación x, a la distancia (con signo) con respecto a la media, medida en desviaciones estándar, es decir

En el caso de variable X normal, la interpretación es clara: Asigna a todo valor de N(μ, σ2), un valor de N(0,1) que deja exáctamente la misma probabilidad por debajo (acumulada).

Nos permite así comparar entre valores de distribuciones normales diferentes

Dada una variable de media μ y desviación estándar σ, se denomina valor tipificado o valor estandarizado, z, de una observación x, a la distancia (con signo) con respecto a la media, medida en desviaciones estándar, es decir

En el caso de variable X normal, la interpretación es clara: Asigna a todo valor de N(μ, σ2), un valor de N(0,1) que deja exáctamente la misma probabilidad por debajo (acumulada).

Nos permite así comparar entre valores de distribuciones normales diferentes

EjemploEjemplo

Se quiere dar una beca a uno de dos estudiantes de sistemas educativos diferentes. Se asignará al que tenga mejor expediente académico.

El estudiante A tiene una calificación de 8 en un sistema donde la calificación de los alumnos se comporta como N(6,1).El estudiante B tiene una calificación de 80 en un sistema donde la calificación de los alumnos se comporta como N(70,102).

SoluciónNo podemos comparar directamente 8 puntos de A frente a los 80 de B, pero como ambas poblaciones se comportan de modo normal, podemos estandarizar y observar las puntuaciones sobre una distribución de referencia N(0,1)

Como ZA>ZB, podemos decir que el porcentaje de compañeros del mismo sistema de estudios que ha superado en calificación el estudiante A es mayor que el que ha superado B. Podríamos pensar en principio que A es mejor candidato para la beca.

Se quiere dar una beca a uno de dos estudiantes de sistemas educativos diferentes. Se asignará al que tenga mejor expediente académico.

El estudiante A tiene una calificación de 8 en un sistema donde la calificación de los alumnos se comporta como N(6,1).El estudiante B tiene una calificación de 80 en un sistema donde la calificación de los alumnos se comporta como N(70,102).

SoluciónNo podemos comparar directamente 8 puntos de A frente a los 80 de B, pero como ambas poblaciones se comportan de modo normal, podemos estandarizar y observar las puntuaciones sobre una distribución de referencia N(0,1)

Como ZA>ZB, podemos decir que el porcentaje de compañeros del mismo sistema de estudios que ha superado en calificación el estudiante A es mayor que el que ha superado B. Podríamos pensar en principio que A es mejor candidato para la beca.

Distribución NormalDistribución Normal

dyzZPzF e2

111 dzZPF

Distribución NormalDistribución Normal

Resultados ECAES Ingeniería de Sistemas, Año 2003

Resultados ECAES Ingeniería de Sistemas, Año 2004

¿Por qué es importante la distribución normal?

Las propiedades que tiene la distribución normal son interesantes, pero todavía no hemos hablado de por qué es una distribución especialmente importante.

La razón es que aunque una v.a. no posea distribución normal, ciertos estadísticos/estimadores calculados sobre muestras elegidas al azar es posible que posean una distribución normal.

Es decir, tengan las distribución que tengan nuestros datos, los ‘objetos’ que resumen la información de una muestra, posiblemente pueden tener distribución normal (o una distribución asociada).

Las propiedades que tiene la distribución normal son interesantes, pero todavía no hemos hablado de por qué es una distribución especialmente importante.

La razón es que aunque una v.a. no posea distribución normal, ciertos estadísticos/estimadores calculados sobre muestras elegidas al azar es posible que posean una distribución normal.

Es decir, tengan las distribución que tengan nuestros datos, los ‘objetos’ que resumen la información de una muestra, posiblemente pueden tener distribución normal (o una distribución asociada).

La distribución de la Media Aritmética Muestral

Como ilustración mostramos una variable que presenta valores distribuidos más o menos uniformemente sobre el intervalo 150-190.

Como es de esperar la media es cercana a 170. El histograma no se parece en nada a una distribución normal con la misma media y desviación estándar.

Como ilustración mostramos una variable que presenta valores distribuidos más o menos uniformemente sobre el intervalo 150-190.

Como es de esperar la media es cercana a 170. El histograma no se parece en nada a una distribución normal con la misma media y desviación estándar.

La distribución de la Media Aritmética MuestralLa distribución de la Media Aritmética Muestral

A continuación elegimos aleatoriamente grupos de 10 observaciones de las anteriores y calculamos el promedio.

Para cada grupo de 10 obtenemos entonces una nueva medición, que vamos a llamar promedio muestral.

Observemos que las nuevas cantidades están más o menos cerca de la media de la variable original.

Repitamos el proceso un número elevado de veces. En la siguiente transparencia estudiamos la distribución de la nueva variable.

A continuación elegimos aleatoriamente grupos de 10 observaciones de las anteriores y calculamos el promedio.

Para cada grupo de 10 obtenemos entonces una nueva medición, que vamos a llamar promedio muestral.

Observemos que las nuevas cantidades están más o menos cerca de la media de la variable original.

Repitamos el proceso un número elevado de veces. En la siguiente transparencia estudiamos la distribución de la nueva variable.

MuestraMuestra

1ª1ª 2ª2ª 3ª3ª185185 190190 179179

174174 169169 163163

167167 170170 167167

160160 159159 152152

172172 179179 178178

183183 175175 183183

188188 159159 155155

178178 152152 165165

152152 185185 185185

175175 152152 152152

173 169 168 …

La distribución de la Media Aritmética MuestralLa distribución de la Media Aritmética Muestral

La distribución de los promedios muestrales tiene distribución aproximadamente normal.

La media de esta nueva variable (promedio de la distribución muestral) es muy parecida a la de la variable original.

Las observaciones de la nueva variable están menos dispersas. (Observar el rango).

La desviación estándar es aproximadamente ‘raiz de 10’ veces más pequeña. Llamamos error estándar a la desviación estándar de esta nueva variable.

La distribución de los promedios muestrales tiene distribución aproximadamente normal.

La media de esta nueva variable (promedio de la distribución muestral) es muy parecida a la de la variable original.

Las observaciones de la nueva variable están menos dispersas. (Observar el rango).

La desviación estándar es aproximadamente ‘raiz de 10’ veces más pequeña. Llamamos error estándar a la desviación estándar de esta nueva variable.

Teorema del Límite CentralTeorema del Límite Central

Dada una v.a. cualquiera, si extraemos muestras de tamaño n, y calculamos los promedios muestrales, entonces:•dichos promedios tienen distribución aproximadamente normal;•La media de los promedios muestrales es la misma que la de la variable original.•La desviación estándar de los promedios disminuye en un factor “raíz de n” (error estándar).Las aproximaciones anteriores se hacen exactas cuando n tiende a infinito.

Teorema del Límite CentralTeorema del Límite Central

A medida que n aumenta, la distribución de la media se aproxima más a la normalA medida que n aumenta, la distribución de la media se aproxima más a la normal

Distribuciones asociadas a la NormalDistribuciones asociadas a la Normal

Al hacer inferencia estadística, la distribución normal aparece de forma casi inevitable.

Dependiendo del problema, podemos encontrar otras (asociadas):

X2 (chi cuadrado)t - studentF de Fisher

Estas distribuciones resultan directamente de operar con distribuciones normales. Típicamente aparecen como distribuciones de ciertos estadísticos.

Al hacer inferencia estadística, la distribución normal aparece de forma casi inevitable.

Dependiendo del problema, podemos encontrar otras (asociadas):

X2 (chi cuadrado)t - studentF de Fisher

Estas distribuciones resultan directamente de operar con distribuciones normales. Típicamente aparecen como distribuciones de ciertos estadísticos.

La distribución chi cuadrado La distribución chi cuadrado

Tiene un sólo parámetro denominado grados de libertad.

La función de densidad es asimétrica positiva. Sólo tienen densidad los valores positivos.

La función de densidad se hace más simétrica incluso casi gausiana cuando aumenta el número de grados de libertad.

Consideraremos atípicos aquellos valores de la variable de la “cola de la derecha”.

Tiene un sólo parámetro denominado grados de libertad.

La función de densidad es asimétrica positiva. Sólo tienen densidad los valores positivos.

La función de densidad se hace más simétrica incluso casi gausiana cuando aumenta el número de grados de libertad.

Consideraremos atípicos aquellos valores de la variable de la “cola de la derecha”.

La distribución t - studentLa distribución t - student

Tiene un parámetro denominado grados de libertad.

Cuando aumentan los grados de libertad, más se acerca a N(0,1).

Es simétrica con respecto al cero.

Se consideran valores atípicos los que se alejan de cero (positivos o negativos).

Tiene un parámetro denominado grados de libertad.

Cuando aumentan los grados de libertad, más se acerca a N(0,1).

Es simétrica con respecto al cero.

Se consideran valores atípicos los que se alejan de cero (positivos o negativos).

La distribución FisherLa distribución Fisher

Tiene dos parámetros denominados grados de libertad.

Sólo toma valores positivos. Es asimétrica positiva.

Se consideran valores atípicos los de la cola de la derecha.

Tiene dos parámetros denominados grados de libertad.

Sólo toma valores positivos. Es asimétrica positiva.

Se consideran valores atípicos los de la cola de la derecha.

Estimación por IntervaloEstimación por Intervalo

Una muestra aleatoria de una densidad Dos estadísticas yque satisfacenTal que

Entonces, el intervalo aleatorio:

se llama un intervalo de confianza para

Una muestra aleatoria de una densidad Dos estadísticas yque satisfacenTal que

Entonces, el intervalo aleatorio:

se llama un intervalo de confianza para

nXXX ,...,, 21

f nXXXT ,...,, 211 nXXXT ,...,, 212

121 TTP

Estimación por IntervaloEstimación por Intervalo

Alrededor del estimador se construye un intervalo dentro del cual se afirma que está el parámetro, con una cierta probabilidad

Nivel de confianza: (1-α) Probabilidad de que el parámetro esté dentro del intervalo construido alrededor del estimador

Alrededor del estimador se construye un intervalo dentro del cual se afirma que está el parámetro, con una cierta probabilidad

Nivel de confianza: (1-α) Probabilidad de que el parámetro esté dentro del intervalo construido alrededor del estimador

Nivel de ConfianzaNivel de Confianza

1 - 1 - αα

Intervalo de Confianza para estimar la Media Aritmética Poblacional: µ

(σ conocida)

Confiabilidad (1-α) Intervalo de Confianza:

Si el tamaño de la población es muy grande o no se conoce o el muestreo se realiza con reposición:

(σ desconocida)

StX n 2/,1

Ejemplo 1Ejemplo 1

Los siguientes datos son los puntajes obtenidos para 45 personas de una escala de depresión (mayor puntaje significa mayor depresión). 2 5 6 8 8 9 9 10 11

11 11 13 13 14 14 14 14 14 14 15 15 16 16 16 16 16 16 16 16 17 17 17 18 18 18 19 19 19 19 19 19 19 19 20 20

Para construir un intervalo de confianza para el puntaje promedio poblacional, asumamos que los datos tienen distribución normal, con varianza poblacional desconocida.

Los siguientes datos son los puntajes obtenidos para 45 personas de una escala de depresión (mayor puntaje significa mayor depresión). 2 5 6 8 8 9 9 10 11

11 11 13 13 14 14 14 14 14 14 15 15 16 16 16 16 16 16 16 16 17 17 17 18 18 18 19 19 19 19 19 19 19 19 20 20

Para construir un intervalo de confianza para el puntaje promedio poblacional, asumamos que los datos tienen distribución normal, con varianza poblacional desconocida.

Ejemplo 1Ejemplo 1

Como σ2 es desconocido, lo estimamos por S2=18,7. Luego, un intervalo de confianza aproximado es:

En consecuencia, el intervalo de confianza para µ es (13,2 , 15,8). Es decir, el puntaje promedio poblacional se encuentra entre 13,2 y 15,8 con una confianza 95%.

Como σ2 es desconocido, lo estimamos por S2=18,7. Luego, un intervalo de confianza aproximado es:

En consecuencia, el intervalo de confianza para µ es (13,2 , 15,8). Es decir, el puntaje promedio poblacional se encuentra entre 13,2 y 15,8 con una confianza 95%.

Ejemplo 2Ejemplo 2

Una muestra de ocho cigarrillos de cierta marca, arroja los siguientes contenidos de alquitrán:

20, 17, 21, 19, 22, 21, 20 y 16 mg.

Se desea estimar el contenido promedio de alquitrán en los cigarrillos de esta marca, con una confiabilidad de 95%

Una muestra de ocho cigarrillos de cierta marca, arroja los siguientes contenidos de alquitrán:

20, 17, 21, 19, 22, 21, 20 y 16 mg.

Se desea estimar el contenido promedio de alquitrán en los cigarrillos de esta marca, con una confiabilidad de 95%

Ejemplo 2Ejemplo 2

mg 2,09S 5,19 mgX

365,2 t71-8gl 95%-1 7,0.025

2,072,36519,5

21,2317,77

73,119,5

Estimación de la diferencia entre dos promedios

Intervalo para µ1-µ2; σ1

2, σ22 conocidas

2=σ22 desconocidas

(poblaciones normales)

2, σ22 conocidas

2=σ22 desconocidas

21)2/,(21

nnStX p

2.. 21 nnlg

SnSnS p

2/21Xnn

Estimación de la diferencia entre dos promedios

Intervalo para µ1-µ2

σ12≠σ2

2 desconocidas

Intervalo para µ1-µ2

σ12≠σ2

2 desconocidas

)2/,(21Xn

Ejemplo 3Ejemplo 3

Los siguientes datos corresponden a los resultados en una prueba diagnóstica de una muestra de estudiantes de los cursos 7ºA y 7ºB

7ºA: 83, 64, 87, 75

7ºB: 78, 86, 85, 68, 89, 94

Estime la diferencia entre los promedios para ambos grupos

Los siguientes datos corresponden a los resultados en una prueba diagnóstica de una muestra de estudiantes de los cursos 7ºA y 7ºB

7ºA: 83, 64, 87, 75

7ºB: 78, 86, 85, 68, 89, 94

Estime la diferencia entre los promedios para ambos grupos

Observaciones pareadasObservaciones pareadas

Cada unidad experimental tiene un par de observaciones, una para cada poblaciónCada unidad experimental tiene un par de observaciones, una para cada población

St dn )2/,1(d

iii XXD 21

Ejemplo 4Ejemplo 4

Un proyecto de investigación pretende establecer el avance de los estudiantes en manejo de operaciones matemáticas básicas. Para ello se seleccionan 12 estudiantes de 4º grado, se les aplica una prueba diagnóstica y los resultados se comparan con los obtenidos en una prueba similar aplicada al final.

Ejemplo 4Ejemplo 4

Los resultados fueron:Los resultados fueron:

IniIni 3344

FiFinn

Estimación de una proporciónEstimación de una proporción

Un estimador puntual de la proporción P en un experimento binomial es p=x/n, donde x es el número de éxitos en n ensayos

Intervalo de confianza para estimar P de una muestra grande

Un estimador puntual de la proporción P en un experimento binomial es p=x/n, donde x es el número de éxitos en n ensayos

Intervalo de confianza para estimar P de una muestra grande

12 1,0~ˆˆ

ˆˆˆ 2/

Estimación de la diferencia entre dos proporciones

112/21

ˆˆˆˆˆˆ

Estimación de la varianzaEstimación de la varianza

Estimación de la razón de dos varianzas

1,1,22

S nnFF

2121 ,,2122

Tamaño de la muestra (n)Tamaño de la muestra (n)

Es la decisión mas importante que se debe tomar en una investigación por muestreo.

Una muestra debe ser pequeña a un costo bajo y bastante grande para que el error de muestreo sea admisible.

Algunos creen que el tamaño de la muestra crece indefinidamente a medida que aumenta el tamaño poblacional pero eso no es cierto, ya que existe un punto en el cual el tamaño de la muestra permanece constante, así el tamaño poblacional aumente.

Es la decisión mas importante que se debe tomar en una investigación por muestreo.

Una muestra debe ser pequeña a un costo bajo y bastante grande para que el error de muestreo sea admisible.

Algunos creen que el tamaño de la muestra crece indefinidamente a medida que aumenta el tamaño poblacional pero eso no es cierto, ya que existe un punto en el cual el tamaño de la muestra permanece constante, así el tamaño poblacional aumente.

Tamaño de la muestra (n)Tamaño de la muestra (n)

En el calculo del tamaño óptimo se debe tener en cuenta los siguientes componentes:•El error máximo admisible.•El nivel de confianza.•El error de muestreo.•El error de no-muestreo.•La varianza, grado de variabilidad de la característica principal.

Error de MuestreoError de Muestreo

Es la diferencia entre el valor poblacional (Parámetro) y la estimación misma (Estadística) obtenida por medio de una muestra aleatoria.

El tamaño óptimo solo se puede conseguir a partir del conocimiento de la población (variabilidad); se debe prefijar el error máximo admisible que representa la precisión mínima a exigir de los resultados y el coeficiente de seguridad ó confianza.

Es la diferencia entre el valor poblacional (Parámetro) y la estimación misma (Estadística) obtenida por medio de una muestra aleatoria.

El tamaño óptimo solo se puede conseguir a partir del conocimiento de la población (variabilidad); se debe prefijar el error máximo admisible que representa la precisión mínima a exigir de los resultados y el coeficiente de seguridad ó confianza.

Error no de muestreoError no de muestreo

Son los errores ajenos al muestreo que no se pueden medir, se consideran como el resultado de instrumentos de medición incorrectos o mal aplicados, cuestionarios mal definidos, errores que comete el entrevistador al efectuar las preguntas o al interpretar las respuestas, preguntas vagas o ambiguas, en otros casos son una mala planeación del trabajo de campo y falta de definición en los estándares de calidad del trabajo de campo.

Fuentes potenciales de errorFuentes potenciales de error

•Estimación de la varianza Población•Carencia de Marco de Muestreo•Poblaciones con características Heterogéneas, alta variabilidad.

Error totalError total

Variación entre el valor real de la medida en la población de la variable que se estudia y el valor de la medida observada en la investigación.

Tamaño de muestra para estimar la media aritmética

Cuando se conoce el tamaño poblacional

Cuando el tamaño de la población es desconocido

Tamaño de muestra para estimar la media aritmética

Para obtener una estimación inicial de la desviación estándar se puede recurrir a cualesquiera de las siguientes tres alternativas:•Usar la desviación estándar obtenida en un estudio anterior

•Estimar inicialmente la desviación estándar a partir de una muestra piloto

•Asumir inicialmente: S=Rango/4 , esto es, asumir que la desviación estándar es aproximadamente igual a la cuarta parte del rango de los datos

Para obtener una estimación inicial de la desviación estándar se puede recurrir a cualesquiera de las siguientes tres alternativas:•Usar la desviación estándar obtenida en un estudio anterior

•Estimar inicialmente la desviación estándar a partir de una muestra piloto

•Asumir inicialmente: S=Rango/4 , esto es, asumir que la desviación estándar es aproximadamente igual a la cuarta parte del rango de los datos

Tamaño de muestra para estimar la proporción

)1()1(

Tamaño de muestra para estimar la proporción

Para obtener una estimación inicial de la proporción se puede recurrir a cualesquiera de las siguientes tres alternativas:•Usar la proporción obtenida en un estudio anterior•Estimar inicialmente la proporción a partir de una muestra piloto•Asumir inicialmente: P=0.5 , esto es, asumir que la proporción, o probabilidad de observar el suceso, es del 50%. Con este supuesto se obtiene el máximo valor de p(1-p), lo cual garantiza que se toma una muestra de tamaño ligeramente mayor de lo necesario.

¿Qué son las Hipótesis?• Son conjeturas lógicas acerca

de la solución de un problema. • Son explicaciones tentativas

del fenómeno investigado formuladas a manera de proposiciones.

• Nos indican lo que estamos buscando o tratando de probar.

¿Qué son las Hipótesis?• Son conjeturas lógicas acerca

de la solución de un problema. • Son explicaciones tentativas

del fenómeno investigado formuladas a manera de proposiciones.

• Nos indican lo que estamos buscando o tratando de probar.

¿Qué características debe tener una hipótesis?

• Las hipótesis deben referirse a una situación real.

• La relación entre las variables debe de ser clara y verosímil.

• Deben ser medibles y observables.

• Deben estar relacionadas con técnicas disponibles para probarlas.

¿Qué características debe tener una hipótesis?

• Las hipótesis deben referirse a una situación real.

• La relación entre las variables debe de ser clara y verosímil.

• Deben ser medibles y observables.

• Deben estar relacionadas con técnicas disponibles para probarlas.

• Las hipótesis pueden ser o no verdaderas. Por eso están sujetas a comprobación.

• Son proposiciones tentativas acerca de las relaciones entre dos o más variables y se apoyan en conocimientos organizados y sistematizados

• Una investigación puede tener una, dos o varias hipótesis; como también no tenerla.

• Las hipótesis pueden ser o no verdaderas. Por eso están sujetas a comprobación.

• Son proposiciones tentativas acerca de las relaciones entre dos o más variables y se apoyan en conocimientos organizados y sistematizados

• Una investigación puede tener una, dos o varias hipótesis; como también no tenerla.

• La aceptación de una hipótesis indica tan sólo que los datos no proporcionan evidencia suficiente para refutarla• El rechazo implica que la evidencia de la muestra refuta la hipótesis

Tipos de HipótesisTipos de Hipótesis

Hipótesis Nula (H0): Es la hipótesis que se desea probar. Se formula para indicar la estructura de la población

Hipótesis Alternativa (H1): Es la hipótesis que se acepta en caso de rechazar H0

Hipótesis Nula (H0): Es la hipótesis que se desea probar. Se formula para indicar la estructura de la población

Hipótesis Alternativa (H1): Es la hipótesis que se acepta en caso de rechazar H0

Formulación de HipótesisFormulación de Hipótesis

Partes de una HipótesisVariable 1 y variable 2 o variable

independiente y variable dependiente.

Unidad de análisis. Conectores lógicos

Partes de una HipótesisVariable 1 y variable 2 o variable

independiente y variable dependiente.

Unidad de análisis. Conectores lógicos

¿Qué tipos de hipótesis hay?• Hipótesis de Investigación. • Hipótesis nula. • Hipótesis alternativas. • Hipótesis “estadísticas”.

Hipótesis de Investigación (Hi)Hipótesis descriptiva del valor de

una variable o variables.Hipótesis de asociaciónHipótesis CorrelacionalesHipótesis que establecen

relaciones de causalidadHipótesis de la diferencia entre

grupos

Hipótesis de Investigación (Hi)Hipótesis descriptiva del valor de

una variable o variables.Hipótesis de asociaciónHipótesis CorrelacionalesHipótesis que establecen

relaciones de causalidadHipótesis de la diferencia entre

grupos

Hipótesis Nula (H0)Sirven para refutar o negar lo que

afirma la hipótesis de investigación.

Hay tantos tipos de hipótesis nulas como de investigación.

Establecen que no existe diferencia entre el valor del parámetro y el valor supuesto a investigar.

Hipótesis Nula (H0)Sirven para refutar o negar lo que

afirma la hipótesis de investigación.

Hay tantos tipos de hipótesis nulas como de investigación.

Establecen que no existe diferencia entre el valor del parámetro y el valor supuesto a investigar.

Hipótesis alternativas (Ha o H1)Son posibilidades “alternas” ante

las hipótesis de investigación y nula.

Pueden ser más de una. Son las hipótesis que se aceptan

en caso de rechazar la hipótesis nula

Hipótesis alternativas (Ha o H1)Son posibilidades “alternas” ante

las hipótesis de investigación y nula.

Pueden ser más de una. Son las hipótesis que se aceptan

en caso de rechazar la hipótesis nula

Hipótesis “Estadísticas”.Son las transformaciones de las

hipótesis de investigación, nulas y alternativas en símbolos estadísticos.

• Del valor de una variable• De asociación.• De correlación.• De relaciones causales.• De diferencia de grupos.

Hipótesis “Estadísticas”.Son las transformaciones de las

hipótesis de investigación, nulas y alternativas en símbolos estadísticos.

• Del valor de una variable• De asociación.• De correlación.• De relaciones causales.• De diferencia de grupos.

Prueba de HipótesisPrueba de Hipótesis

Prueba Estadística: Con base en el resultado de una muestra se acepta o se rechaza la hipótesis nula

Errores•Error tipo I: Rechazar afirmaciones (H0) verdaderas

•Error tipo II: Aceptar afirmaciones (H1) falsas

Prueba Estadística: Con base en el resultado de una muestra se acepta o se rechaza la hipótesis nula

Errores•Error tipo I: Rechazar afirmaciones (H0) verdaderas

•Error tipo II: Aceptar afirmaciones (H1) falsas

Estado de la Naturaleza

Decisión

Aceptar Ho Rechazar Ho

Ho verdaderaDecisión correcta

Error tipo I

Ho falsaError tipo II Decisión

correcta

•Nivel de Significación (α): Probabilidad de rechazar una hipótesis nula verdadera•Potencia de la prueba (1-β): Probabilidad de rechazar H0 dado que H1 es verdadera

•α = P(E.T.I)•β = p(E.T.II)•Valor p: Nivel más bajo (de significación) en el cual el valor observado del estadístico de prueba es significativo

•Nivel de Significación (α): Probabilidad de rechazar una hipótesis nula verdadera•Potencia de la prueba (1-β): Probabilidad de rechazar H0 dado que H1 es verdadera

•α = P(E.T.I)•β = p(E.T.II)•Valor p: Nivel más bajo (de significación) en el cual el valor observado del estadístico de prueba es significativo

Proceso para Prueba de HipótesisProceso para Prueba de Hipótesis

•Establecer H0: θ = θ0

•Seleccionar H1: H1: θ ≠ θ0 ; H1: θ < θ0 ; H1: θ > θ0

•Seleccionar el nivel de significación: α

•Seleccionar el estadístico de prueba apropiado y establecer la región crítica

•Calcular el valor del estadístico de prueba con los datos muestrales

•Tomar la decisión

•Establecer H0: θ = θ0

•Seleccionar H1: H1: θ ≠ θ0 ; H1: θ < θ0 ; H1: θ > θ0

•Seleccionar el nivel de significación: α

•Seleccionar el estadístico de prueba apropiado y establecer la región crítica

•Calcular el valor del estadístico de prueba con los datos muestrales

•Tomar la decisión

Razonamiento BásicoRazonamiento Básico

Si supongo que H0 es cierta...

... el resultado del experimento sería improbable. Sin embargo ocurrió.

¿qué hace un científico cuando su teoría no coincide con sus predicciones?

... el resultado del experimento sería improbable. Sin embargo ocurrió.

Rechazo que H0 sea cierta.

... el resultado del experimento es coherente.

• No hay evidencia contra H0

•No se rechaza H0

•El experimento no es concluyente•El contraste no es significativo

¿Si una teoría hace predicciones con éxito, queda probado que es cierta?

Región crítica y nivel de significaciónRegión crítica y nivel de significación

Región crítica• Valores ‘improbables’ si...• Es conocida antes de realizar el

experimento: resultados experimentales que refutarían H0

Nivel de significación: • Número pequeño: 1% , 5%• Fijado de antemano por el

investigador• Es la probabilidad de rechazar

H0 cuando es cierta

No rechazo H0

Reg. Crit.Reg. Crit.

Contrastes unilateral y bilateralContrastes unilateral y bilateral

La posición de la región crítica depende de la hipótesis alternativa

Unilateral Unilateral

Bilateral

H1: <40 H1: >40

H1: 40

Significación pSignificación p

H0: =40

No se rechazaH0: =40

H0: =40

No se rechazaH0: =40

Es la probabilidad que tendría una región crítica que comenzase exactamente en el valor del estadístico obtenido de la muestra. Es la probabilidad de tener una muestra que discrepe aún más que la nuestra de H0. Es la probabilidad de que por puro azar obtengamos una muestra “más extraña” que la obtenida.p es conocido después de realizar el experimento aleatorioEl contraste es no significativo cuando p>

Se rechaza H0: =40

Se acepta H1: >40

Se rechaza H0: =40

Se acepta H1: >40

El contraste es estadísticamente significativo cuando p<Es decir, si el resultado experimental discrepa más de “lo tolerado” a priori.

La Estadística Inferencial en el Proceso Investigativo Henry Gallardo Pérez La UFPS soy yo, eres...

Documents