Date post: | 09-Jul-2015 |
Category: |
Documents |
Upload: | tatiizz-rg |
View: | 650 times |
Download: | 0 times |
UNIVERSIDAD POLITÉCNICA ESTATAL DEL CARCHI
ESCUELA DE COMERCIO EXTERIOR Y NEGOCIACIÓN INTERNACIONAL
TEMA: MANUAL SPSS
INTEGRANTE
Tatiana rosero
Nivel: sexto Paralelo: “a” noche
semestre
Marzo-agosto-2012
INTRODUCCIÓN
Para mucha gente, estadística significa descripciones numéricas. Esto puede
verificarse fácilmente al escuchar, un domingo cualquiera, a un comentarista de
televisión narrar un juego de fútbol. Sin embargo, en términos más precisos, la
estadística es el estudio de los fenómenos aleatorios. En este sentido la ciencia de
la estadística tiene, virtualmente, un alcance ilimitado de aplicaciones en un espectro
tan amplio de disciplinas que van desde las ciencias y la ingeniería hasta las leyes y
la medicina. El aspecto más importante de la estadística es la obtención de
conclusiones basadas en los datos experimentales.
Este proceso se conoce como inferencia estadística. Si una conclusión dada
pertenece a un indicador económico importante o a una posible concentración
peligrosa de cierto contaminante, o bien, si se pretende establecer una relación entre
la incidencia de cáncer pulmonar y el fumar, es muy común que la conclusión esté
basada en la inferencia estadística.
Para comprender la naturaleza de la inferencia estadística, es necesario entender
las nociones de población y muestra. La población es la colección de toda la posible
información que caracteriza a un fenómeno. En estadística, población es un
concepto mucho más general del que tiene la acepción común de esta palabra. En
este sentido, una población es cualquier colección ya sea de un número finito de
mediciones o una colección grande, virtualmente infinita, de datos acerca de algo de
interés. Por otro lado, la muestra es un subconjunto representativo seleccionado de
una población. La palabra representativo es la clave de esta idea. Una buena
muestra es aquella que refleja las características esenciales de la población de la
cual se obtuvo. En estadística, el objetivo de las técnicas de muestreo es asegurar
que cada observación en la población tiene una .oportunidad igual e independiente
de ser incluida en la muestra. Tales procesos de muestreo conducen a una muestra
aleatoria.
Las observaciones de la muestra aleatoria se usan para calcular ciertas
características de la muestra denominadas estadísticas. Las estadísticas se usan
como base para hacer inferencias acerca de ciertas características de la población,
que reciben el nombre de parámetros. Así, muchas veces se analiza la información
que contiene una muestra aleatoria con el propósito principal de hacer inferencias
sobre la naturaleza de la población de la cual se obtuvo la muestra.
En estadística la inferencia es inductiva porque se proyecta de lo específico
(muestra) hacia lo general (población). En un procedimiento de esta naturaleza
siempre existe la posibilidad de error. Nunca podrá tenerse el 100% de seguridad
sobre una proposición que se base en la inferencia estadística. Sin embargo, lo que
hace que la estadística sea una ciencia (separándola del arte de adivinar la fortuna)
es que, unida a cualquier proposición, existe una medida de la confiabilidad de ésta.
En estadística la confiabilidad se mide en términos de probabilidad. En otras
palabras, para cada inferencia estadística se identifica la probabilidad de que la
inferencia sea correcta.
Virtualmente cada área de la investigación científica seria puede beneficiarse del
análisis estadístico. Para quien formula las políticas económicas y para quien
asesora al presidente y a otros funcionarios públicos sobre procedimientos
económicos apropiados, la estadística ha demostrado ser una herramienta valiosa.
Las decisiones sobre las tasas tributarias, los programas sociales, el gasto de
defensa y muchos otros asuntos pueden hacerse de manera inteligente tan sólo con
la ayuda del análisis estadístico.
Los hombres y mujeres de negocios, en su eterna búsqueda de la rentabilidad,
consideran que la estadística es esencial en el proceso de toma de decisiones. Los
esfuerzos en control de calidad, minimización de costos, combinación de productos
e inventarios, y una gran cantidad de otros asuntos empresariales, pueden
manejarse efectivamente a través del uso de procedimientos estadísticos
comprobados.
Para quienes están en el área de la investigación de mercados, la estadística es de
gran ayuda en el momento de determinar qué tan probable es que un producto
nuevo sea exitoso. La estadística también es muy útil para evaluar las oportunidades
de inversión por parte de asesores financieros. Los contadores, los jefes de
personal, y los fabricantes encuentran oportunidades ilimitadas de beneficiarse con
el uso del análisis estadístico. Incluso un investigador en el campo de la medicina,
interesado en la efectividad de un nuevo medicamento, considera la estadística una
aliada imprescindible.
Tales aplicaciones y muchas otras se ilustran a lo largo de este texto. Se mostrará
cómo utilizar la estadística en el mejoramiento del desempeño laboral y en muchos
otros aspectos de la vida diaria.
En repetidas ocasiones se ha enfatizado la utilidad de la estadística y la amplia
variedad de problemas que puede resolver. Para ilustrar de manera más completa
esta amplia aplicabilidad, es necesario analizar las diversas funciones de la
estadística. La estadística es la ciencia que tiene que ver con la (1) recolección, (2)
organización, (3) presentación, (4) análisis, e (5) interpretación de datos.
Aunque en todo estudio estadístico el primer paso es la recolección de datos, es
usual en un curso básico de estadística asumir que los datos ya han sido
recolectados y que ahora están disponibles. Por consiguiente, el trabajo comienza
con el esfuerzo por organizar y presentar estos datos de manera significativa y
descriptiva. Los datos deben colocarse en un orden lógico que revele rápida y
fácilmente el mensaje que contienen. Este procedimiento constituye el proceso de la
estadística. Luego de que los datos se han organizado y se han presentado para su
revisión, el estadístico debe analizarlos e interpretarlos. Estos procedimientos se
basan en la estadística inferencial y constituyen un importante beneficio para el
análisis estadístico, mediante la ayuda en el proceso de toma de decisiones y
solución de problemas.
TEMA: Aplicación de Estadística inferencial y estadística descriptiva en el programa
SPSS
PROBLEMA: El escaso conocimiento de programas estadísticos nos ha restringido
aplicar nuestros conocimientos en dichos programas
OBJETIVOS
OBJETIVO GENERAL:
Aplicar los datos estadísticos en el programa SPSS que permita resolver
problemas relacionados al comercio exterior
OBJETIVO ESPECIFICO:
Investigar la aplicación de los Estadísticos en el programa SPSS para
resolver problemas de Comercio Exterior
Conocer en su totalidad la aplicación de los Estadísticos en el programa
SPSS
Analizar la aplicación de Estadísticos en el programa SPSS para resolver
problemas de Comercio Exterior y realizar la respectiva toma de decisiones.
JUSTIFICACION
Con esta investigación se quiere conocer los programas que hoy en la actualidad
permiten aplicar problemas y ejercicios que surgen en el comercio exterior, en este
caso queremos interpretar los diferentes estadísticos que manejamos dentro de la
estadística inferencial, utilizando el programa SPSS 17, el cual permite calcular
resultados de una forma más rápida y precisa.
Con la aplicación de los estadísticos en este programa buscamos que la forma para
tomar y analizar resultados, sea más factible para la persona que requiere de esta
información.
En este proyecto esta detallado cada paso que se deberá tomar al momento de
calcular los diferentes estadísticos de manera que sea entendible y practico.
ESTADISTICA
La estadística es la ciencia formada por un conjunto de teorías y técnicas
cuantitativas, que tiene por objeto la organización, presentación, descripción,
resumen y comparación de conjuntos de datos numéricos, obtenidos de poblaciones
en su conjunto de individuos o fenómenos o bien de muestras que representan las
poblaciones estudiadas, así como el estudio de su variación, propiedades,
relaciones, comportamiento probabilístico de dichos datos y la estimación, inferencia
o generalización de los resultados obtenidos de muestras, respecto a las
poblaciones que aquéllas representan. La estadística en la investigación científica,
dada la necesidad de manejar y tratar en ellas grandes cantidades, progresivamente
crecientes, de datos”. (http://www.AulaFacil.com)
Irma Nocedo de León et al (2001), anotan que “la estadística es la ciencia encargada
de suministrar las diferentes técnicas y procedimientos que permiten desde
organizar la recolección de datos hasta su elaboración, análisis e interpretación.
Abarca dos campos fundamentales la estadística descriptiva y la estadística
inferencial. (http://www.Wikipedia: Estadísticas.)
CLASIFICACIÓN DE LA ESTADÍSTICA
Dependiendo de cómo se analizan los datos, la Estadística se clasifica como:
ESTDISTICA DESCRIPTIVA
Estadística Descriptiva.- Rama de la estadística que trata sobre la descripción y
análisis estadístico de una población, que resume y presenta datos obtenidos de la
población o de una muestra, mediante métodos adecuados. Tiene como objetivo
caracterizar los datos, de manera gráfica o analítica, para resaltar las propiedades
de los elementos bajo estudio. (http://www.Wikipedia: Estadísticas.).
FRECUENCIA:
Es el número de veces que se repite un dato.
Es el número de repeticiones que presenta una observación. Se representa
por ni. http://www.mitecnologico.com
Es el número de veces que aparece cualquier valor de la variable. Se
representa por fi. En algunos libros de texto nos la encontraremos
representada por ni. http://www.quequieredecir.
DISTRIBUCIÓN DE FRECUENCIAS ABSOLUTAS Y RELATIVAS
Las primeras tareas de la Estadística descriptiva son ordenar, clasificar y resumir los
datos obtenidos en la investigación de campo, para ello se concentran en tablas de
frecuencia y éstas pueden ser:
a) Absoluta.
b) Relativa.
c) Acumulada.
Con el análisis de las frecuencias podemos determinar la tendencia de la variable en
estudio que como ya se dijo, ésta puede ser nominal, ordinal o cuantitativa y sus
respectivas escalas de medición: nominal, ordinal o por intervalos, respectivamente.
EJEMPLO: La maestra de orientación del Plantel 11 dio una conferencia al grupo
603 sobre las características y bondades de las carreras de Ingeniería, Química
Metalúrgica y Actuaría. Al final de la conferencia pidió que llenaran un cuestionario
donde especificaron además de los datos personales, la carrera de preferencia. Se
obtuvieron los siguientes resultados:
I, A, M, Q, Q, M, A, I, M, Q, A, Q, I, Q, M,
Q, M, M, A, Q, I, Q, M, I, I, Q, M, M, A, I,
M, A, A, Q, I, M, Q, Q, A, M, A, Q, M, A, Q,
Tabla De Frecuencias:
Carrera que prefieren los alumnos del grupo 603 del Plantel 11 del Colegio de
Bachilleres.
Encuesta realizada por la maestra de orientación del Plantel 11, el 12 de septiembre
de 1993.
El número de columnas de una tabla es variable y depende de la información
que se quiera registrar.
En nuestro ejemplo podemos suprimir la columna 2 que representa el conteo
de la variable el cual se puede realizar en otras hojas de trabajo.
En la tercera columna se registra la frecuencia.
FRECUENCIA ABSOLUTA
En una muestra estadística, número de veces que aparece un determinado carácter.
http://nuestrosalud.com/ frecuencia-absoluta.html
El número de los miembros de una serie estadística, que es al intervalo determinado
de los significados de la cantidad variable dada casual; en particular, el número de
los casos con dado o los valores dados del elemento durante todo el tiempo de las
observaciones.
http://www.quequieredecir.org/frecuencia
FRECUENCIA RELATIVA:
Cociente entre la frecuencia absoluta y el número de casos de una muestra.
http://www.quequieredecir.org/frecuencia/
FRECUENCIAS ABSOLUTAS
Simple (Ni) Acumulada (Ni)
Ni ni
n2 ni+n2
n3 ni+n2+n3
.
.
.
.
Nn n
La frecuencia relativa es el cociente entre la frecuencia absoluta de un
determinado valor y el número total de datos.
http://www.mitecnologico.com/Main/FrecuenciaRelativa
FORMA DE CÁLCULO
EJEMPLO
La puntuación obtenida en un examen que se aplicó a 100 obreros de la fábrica de
vidrio el Fanal, es la que se muestra en la siguiente tabla de frecuencias: 46
Resultados del examen aplicado a 100 obreros de la fábrica de vidrio el
Fanal.
FRECUENCIA RELATIVA
Simple Acumulada
hi=n1|n h1
h2=n2|n h1+h2
.
.
.
.
hn= nn/n h
Investigación realizada por el jefe del departamento de capacitación de la fábrica de
vidrio el Fanal, el 5 de septiembre de 1993.
FRECUENCIA ACUMULADA
La frecuencia acumulada (Fi) es otra característica de la muestra que nos permitirá
determinar la posición de un caso particular que nos interese en comparación con el
total de los elementos. ((Levin Richard & Rubin David, 1996:p.140).)
DEFINICIÓN:
Su definición matemática es:
Al calcular la frecuencia acumulada (F1) podemos determinar su frecuencia relativa
acumulada (Fr) en la forma ya explicada mediante la ecuación (1), esto es: n
Regresemos al problema (11) de las llamadas telefónicas y calculemos la frecuencia
acumulada (f1) y la frecuencia relativa acumulada (Fr). Frecuencia acumulada (Fi)
de una clase es la que se obtiene sumando las frecuencias de las clases anteriores
con la frecuencia de ésta.
La frecuencia acumulada para la 4ta. Clase es F = 45; de este valor se infiere que
hasta esta clase corresponden 45 de las 60 observaciones realizadas. También se
infiere que a esta clase corresponden un número menor o igual a 43 llamadas
telefónicas. La frecuencia relativa de esta clase es F = 0.75. Este valor significa que
hasta esta clase corresponde el 75% de todas las llamadas.
}
GRÁFICAS
Al representar en una gráfica la información concentrada en la tabla de frecuencias,
ésta es un recurso visual que nos permite tener una idea clara, precisa, global y
rápida acerca de las observaciones de una muestra o población. Existen muchos
tipos de gráficas en las que se pueden representar la frecuencia absoluta (fi), relativa
(fr) y acumulada (Fi) y con ellas podemos estimar algunos valores con la simple
observación.
HISTOGRAMA
Es uno de los medios expresada en % con mayor frecuencia, es una representación
gráfica de la distribución de frecuencias.
Se utilizan para representar tablas de frecuencias con datos agrupados en
intervalos. Si los intervalos son todos iguales, cada uno de ellos es la base de un
rectángulo cuya altura es proporcional a la frecuencia correspondiente.
http://www.monografias.com/ conceptos-de-estadistica.shtml
En estadística, un histograma es una representación gráfica de una variable en
forma de barras, donde la superficie de cada barra es proporcional a la frecuencia de
los valores representados. En el eje vertical se representan las frecuencias, y en el
eje horizontal los valores de las variables, normalmente señalando las marcas de
clase. http://es.wikipedia.org/wiki/Histograma
HISTOGRAMA Y POLÍGONO DE FRECUENCIAS.
El histograma es la forma más usual para analizar las características
observables de una variable continua.
(http://www.monografias.com/trabajos30/conceptos-de-estadistica/conceptos-de-estadistica.shtml)
Histograma es la representación gráfica en el plano coordenado de las
características concentradas en la tabla de frecuencias de una variable
continua. (http://www.monografia.com/estadistica)
Para trazar el histograma, la secuencia de operaciones es:
1. En los ejes coordenados del plano cartesiano representamos los datos de la
siguiente forma:
a) En el eje de las abscisas (horizontal) se representan las clases con sus límites
reales de clase y las marcas de clase (Mi) de cada intervalo.
b) En el eje de las ordenadas (vertical) representamos las frecuencias absolutas
en que ocurre la variable.
CORRELACIÓN LINEAL
El análisis de correlación se dirige sobre todo a medir la fuerza de una relación entre
variables. El coeficiente de correlación lineal, r, es la medida de la fuerza de la
relación lineal entre dos variables. La fortaleza de la relación se determina mediante
la magnitud del efecto que cualquier cambio en una variable ejerce sobre la otra.
(JOHNSON, 1990)
Si X o Y son las dos variables en cuestión, un diagrama de la dispersión muestra la
localización de los puntos (X,Y) sobre un sistema rectangular de coordenadas. Si
todos los puntos del diagrama de dispersión parecen estar en una recta, como la
figura 14(a) y 14(b) la correlación se llama lineal. (SPIEGEL, 1992)
REGRESIÓN LINEAL
Fases del modelo de regresión lineal
La recta de regresión y el coeficiente de correlación tienen sentido en tanto en
cuanto son instrumento para inferir la relación de las variables en la población.
El conocimiento exacto del coeficiente de correlación solo es posible si analizamos
la totalidad de la población. Sin embargo, a la hora de evaluarlo, nos encontramos
con el problema habitual de tener que inferirlo desde la estimación que proporcionan
los datos de una muestra.
La recta de regresión lineal y=a+bx, es una estimación de la recta de regresión lineal
de la población y=α+ßx. Los parámetros α y ß son evaluados a partir de los datos de
una muestra, y es fundamental tener unas garantías de que los valores a y b
estimados no difieren significativamente de los parámetros poblacionales α y ß.
El proceso que se sigue en la construcción del modelo de regresión se compone de
tres fases o etapas. En la primera fase, se comprueba si la relación entre las
variables que componen el modelo está de acuerdo con la propia forma del modelo.
La segunda fase consiste en la estimación de los parámetros de acuerdo con el
criterio elegido (en nuestro caso, el método de mínimos cuadrados).
La última fase es fundamental para el investigador, que debe comprobar si las
inferencias o pronósticos que se pueden hacer de la relación encontrada entre las
variables se ajustan a los datos. (VARGAS, 1995).
PRUEBA DE HIPÓTESIS
La prueba de hipótesis comienza con una suposición, llamada hipótesis, que
hacemos acerca de un parámetro de población. Después recolectamos datos de
muestra, producimos estadísticas muéstrales y usamos esta información para decidir
qué tan probable es que nuestro parámetro de población hipotético sea correcto.
Digamos que suponemos un cierto valor para una medida de población, para probar
validez de esa suposición recolectamos datos de muestra y determinamos la
diferencia entre el valor hipotético y el valor real de la media de la muestra. Después
juzgamos si la diferencia obtenida es significativa o no. Mientras más pequeña sea la
diferencia, mayor será la probabilidad de que nuestro valor hipotético para la media
sea correcto. Mientras mayor sea la diferencia, más pequeña será la probabilidad.
(LEVIN, 2010)
T DE STUDENT
En probabilidad y estadística, la distribución T - Student es una distribución de
probabilidad que surge del problema de estimar la media de una población
normalmente distribuida cuando el tamaño de la muestra es pequeño.
Una variable aleatoria se distribuye según el modelo de T - Student con n grados de
libertad.
Propiedades:
1. La gráfica de la función de densidad es en forma de campana.
2. Los datos están más dispersos que la curva normal estándar.
3. A medida que n aumenta, la gráfica se aproxima a la normal N (0,1).
4. La gráfica es muy parecida a la de la normal estándar diferenciándose en que
las colas de t están por encima de la normal, y el centro se encuentra por
debajo del de la normal.
5. Cuando los grados de libertad son altos, los valores de t coinciden con los de
la normal.
CHI- CUADRADO
Es un estadístico que sirve de base para una prueba no paramétrica denominada
prueba de chi cuadrado que se utiliza especialmente para variables cualitativas,
esto es, variables que carecen de unidad y por lo tanto sus valores no pueden
expresarse numéricamente. Los valores de estas variables son categorías que solo
sirven para clasificar los elementos del universo del estudio. También puede
utilizarse para variables cuantitativas, transformándolas, previamente, en variables
cualitativas ordinales.
El estadístico Chi- Cuadrado se define por:
En donde:
n=número de elementos de la muestra
n-1= números de grados de libertad.
=varianza de la muestra
= varianza de la población
VARIANZA
Cuando es necesario hacer comparaciones entre tres o más medias muéstrales para
determinar si provienen de poblaciones iguales utilizamos la técnica de análisis de
varianza. Esta técnica se realiza utilizando la distribución de probabilidad F vista
anteriormente. Para el uso de esta técnica es necesario seguir los siguientes
supuestos:
1) Las poblaciones siguen una Distribución de Probabilidad Normal
2) Las poblaciones tienen desviaciones estándar (σ) iguales
3) Las muestras se seleccionan de modo independiente
La técnica del análisis de varianza descompone la variación total en dos
componentes de variación llamados variación debida a los tratamientos y variación
aleatoria.
SPSS stadistic
Es un programa estadístico informático muy usado en las ciencias sociales y las
empresas de investigación de mercado. Originalmente SPSS fue creado como el
acrónimo de Statistical Package for the Social Sciences aunque también se ha
referido como "Statistical Product and Service Solutions" (Pardo, A., & Ruiz, M.A.,
2002, p. 3). Sin embargo, en la actualidad la parte SPSS del nombre completo del
software (IBM SPSS) no es acrónimo de nada.
Como programa estadístico es muy popular su uso debido a la capacidad de trabajar
con bases de datos de gran tamaño. En la versión 12 es de 2 millones de registros y
250.000 variables. Además, de permitir la recodificación de las variables y registros
según las necesidades del usuario.
Actualmente, compite no sólo con softwares licenciados como lo son SAS, MATLAB,
Statistica, Stata, sino también con software de código abierto y libre, de los cuales el
más destacado es el Lenguaje R. Recientemente ha sido desarrollado un paquete
libre llamado PSPP, con una interfaz llamada PSPPire que ha sido compilada para
diversos sistemas operativos como Linux, además de versiones para Windows y OS
X. Este último paquete pretende ser un clon de código abierto que emule todas las
posibilidades del SPSS.
INSTALACIÓN DEL SPSS
PASOS PARA DESCARGAR EINSTALAR EL SPSS
1. Prender el computador
2. Descargar el programa spss
3. Entrar en la página 4 shared
4. Clic en archivos y poner el nombre del programa y buscar
5. Clic en descargar spss 17
6. Clic en descargar archivo esperar algunos segundo
7. Clic en descargar archivo
8. Asegurarse de no estar conectado a internet: durante la instalación el
programa
Para desconectar el acceso a la red hacer clic en Inicio
9. Panel de control
10. Doble clic en el icono para proceder a instalar esperar algunos segundo
11. Conexiones de red.
12. Luego hacer clic con el botón secundario del mouse en el ícono de la placa de
red y hacer clic en "Desactivar".
13. ) Ir a la carpeta donde se ubica el archivo "SPSS 17 Setup.exe" y hacer doble
clic en el mismo.
14. Se abrirá una ventana que muestra el progreso de la instalación.
15. Se abre otra ventana. Seleccionar "Licencia de usuario individual" y hacer clic
en "Siguiente >". En la siguiente ventana hacer clic en "Acepto los términos
del contrato de licencia" y hacer clic en "Siguiente >". En la ventana de
"Información de última hora" hacer clic en "Siguiente >".
16. Se abre una nueva ventana
a) Completar los campos "Nombre de usuario" y "Organización" con los datos
que se desee.
b) Ir a la carpeta donde se ubica el archivo "keygen.exe" y hacer doble clic en el
mismo.
c) Atención: antes de continuar, tener en cuenta que los códigos mostrados aquí
pueden diferir de los que muestra el programa en su computadora (se
recomienda utilizar solamente los códigos mostrados en el programa que se
utiliza al instalar y no los mostrados aquí
17. Se abre una ventana para ingresar licencia y registro de SPSS. Hacer clic en
"Aceptar".
18. Se abre una nueva ventana.
a) Seleccionar "Conseguir una licencia para mi producto ahora".
19. Clic en siguiente
20. Introducir el código de autorización que está debajo del botón "Generate" del
keygen mencionado en 5b. Hacer clic en "Siguiente >". Aparece una ventana
que indica un error en la conexión a internet. Hacer clic en "Siguiente >".
21. Clic en siguiente para que se instale el programa
22. Luego clic en inicio programas SPSS aparece una ventana que indica las
licencias de las que se dispone. Hacer clic en "Siguiente >".
23. Se abre una nueva ventana.
a) Seleccionar "Conseguir una licencia para mi producto ahora".
24. Luego se introduce la licencia del producto
25. Clic en siguiente
26. Para pasar el idioma del programa a español
27. Abrir un archivo .sav o alguno de la carpeta Samples. En el menú "Edit" hacer
clic en el botón "Options..."
En la pestaña "General", en el área "Output", en la sección "Language" hacer clic la
lista desplegable (el triángulo que apunta hacia abajo) y hacer clic en "Spanish".
Repetir el paso 19 en la sección "User Interface" y hacer clic en "OK".
28. Para reconectar el acceso a la red hacer clic en Inicio / Panel de control /
Conexiones de red. Luego hacer clic con el botón secundario del mouse en el
ícono de la placa de red y hacer clic en "Activar".
UTILIZACIÓN DEL SPSS
1.- Abrir el programa SPSS
2.- Menú inicio y clic en el icono que aparece del programa con el nombre de SPSS.
3.- A continuación se desplegara la ventana SPSS, con un cuadro de dialogo, hacer
clic en la opción introducir datos y luego clic en aceptar.
4. Ponemos la opción vista de variables y nos despliega la pantalla en donde
ponemos los nombres de las variables de la siguiente manera.
Tomando en cuenta que los decimales debe ir 0 para obtener datos exactos.
5. Ahora hacemos clic en la opción Vista de datos para ingresar los datos de la
información obtenida.
Podemos manifestar que si en casos de ingresar los datos de manera desordenada,
podemos en la opción Datos, después ordenar casos, donde se nos despliega la
siguiente pantalla.
6. Aquí presionamos la flecha para que los datos se pasen y después Aceptar y se
nos ordenara los datos, mostrándonos la siguiente pantalla y ponemos cerrar.
Y verificaremos que se encuentran ordenados.
7. Procedemos a tomar la opción de transformar, hacemos clic en Recodificar
distintas variables
En donde nos despliega la pantalla de igual manera pasamos los datos al lado
derecho haciendo clic en la flecha
8. Aquí llenamos lo datos como Nombre y Etiqueta
Y presionamos la opción Valores antiguos y nuevos
Aquí presionamos Rango y ponemos los intervalos desde ….. Hasta …. Para que se
pueda llenar con normalidad debemos poner el ancho de 20 siempre que
escojamos esta opción añadir y así con todos los intervalos y aceptar.
Y nos despliega la siguiente pantalla
Una vez obtenido estos intervalos pasamos a la opción Analizar en donde hacemos
clic en Datos Descriptivos, después en Frecuencias
De igual manera nos sale la pantalla para pasar los datos al lado derecho
Presionamos en la opción Estadísticos para determinar lo que son los cuartiles,
deciles, percentiles. Tomar en cuenta que en los deciles debemos de poner del 10 al
100 cualquier número en este caso el 70 y añadir.
También nos permite escoger las Medidas de Tendencia Central como: Media,
Mediana, Moda, de igual manera Medidas de dispersión, ahí presionamos lo que es
desviación típica, varianza, y rango.
Después presionamos Continuar
Enseguida presionamos la opción Gráficos para determinar en qué gráficos
deseamos analizar la información
Aquí presionamos en Histogramas y continuar
Una vez esto presionamos Aceptar y nos despliega la información que deseamos.
Aquí podemos cambiar o modificar lo que deseamos en la letra y colores que
deseemos. Minimizamos o de tal forma guardamos el archivo. Aquí terminaríamos
con el proceso de determinación de lo que es la Estadifica Descriptiva.
Ahora la realizaríamos de forma manual para comparar si los resultados son los
mismos.
ESTADÍSTICA INFERENCIAL
FRECUENCIA
Es el número de veces que se repite un dato.
}
FRECUENCIAS ABSOLUTAS
Simple (ni) Acumulada (Ni)
n 1 n 1
n 2 n 1 + n 2
n 3 n 1 + n 2 + n 3
N ∑
FRECUENCIA RELATIVA
Simple Acumulada
h 1 h1
h 2 h 1 + h 2
h 3 h 1 + h 2 + h 3
h n ∑
HISTOGRAMA
Es uno de los medios con mayor frecuencia, es una representación grafica de la
distribución de frecuencias.
El eje vertical se ubica las frecuencias y en el eje (X) se representa los intervalos de
clase.
EJEMPLO:
Sean las siguientes cifras de notas de matemáticas en una escala de (0-100)
evaluados en (n=56) personas.
73 81 44 69 30 38
75 66 76 84 72 82
58 89 73 59 87 63
43 59 64 74 63 63
48 52 77 68 47 53
63 72 52 55 75 43
67 61 87 39 62
75 69 53 79 95
50 38 70 84 82
95 59 75 36 65
1.- Ordena en forma creciente o decreciente
30 50 61 68 75 84
36 52 62 69 75 87
38 52 63 69 75 87
38 53 63 69 76 89
39 53 63 70 77 95
43 55 63 72 79 95
43 58 64 73 81
44 59 65 73 82
47 59 66 74 82
48 59 67 75 84
2.- Determina el intervalo o clase con la fórmula sturges.
3.- Calculamos el recorrido (I)
4.- Se clasifican 7 intervalos de las 56 notas, calculamos el ancho o amplitud
con la letra (C)
Obtener el I1 de los valores aproximados.
Existe un exceso de 4.
70-66=4.
5.-
2 3-> máximo (+)
≤ 𝑘 ≤ 𝑜𝑝𝑐𝑖𝑜𝑛𝑎𝑙
Cuando # <100
4 5
2 2-> mínimo (-)
Restamos -2 el valor mínimo y +2 el valor máximo.
a) 30-2=28
95+2=97
6.- Se forma la tabla
INTERVALO O
CLASE
MARCA DE
CLASE
CONTEO FRECUENCIA
28-38 33 II 2
38-48 43 IIIIIII 7
48-58 53 IIIIIII 7
58-68 63 IIIIIIIIIIIIII 14
68-78 73 IIIIIIIIIIIIIII 15
78-88 83 IIIIIIII 8
88-98 93 III 3
N=56
MEDIDAS DE TENDENCIA CENTRAL
Son las que se hallen en el centro de distribución de frecuencias. Permiten calcular
los valores promedio.
a) Medida aritmética
b) Mediana Md
c) Moda Mo
d) Media geométrica Mg
e) Media armónica Ma
1.- Media Aritmética
Cuando los datos no están agrupados.
∑
Ejemplo:
17-23-25-30-34-38-43-54
(∑
)
A= Marca de clase es el origen de trabajo.
n= Suma de frecuencia.
∑ = Es la multiplicación de la frecuencia por la desviación unitaria.
C= Amplitud o intervalo.
INTERVALO MARCA DE
CLASE Xi
U FRECUENCIA
ABSOLUTA f
fu (u.f) Fi. Xi
40->50 45 -2 5 -10 225
50->60 55 -1 12 -12 660
60->70 65 0 36 0 2340
70->80 75 1 22 22 1650
Cuando los datos están agrupados
80->90 85 2 4 8 340
N=79 ∑
5215
(
)
∑
2.- Mediana
Es el punto que divide la distribución de los datos en dos partes iguales, sean estos
por la derecha o por la izquierda.
a) No Agrupados (Impar)
3, 8, 56, 14, 24, 31, 2, 7, 52 hay 9
Se los ordena en forma creciente o decreciente.
2, 3, 7, 8, 14, 24, 31, 52, 56
b)5, 9, 54, 22, 31, 2, 7, 51, 60.
Se los ordena en forma creciente o decreciente.
2, 5, 7, 9, 22, 31, 51, 54, 60.
Mediana es el numero 22 Me=22.
b) El parse escoge los 2 valores centrales y se los divide para 2.
16, 23, 34, 40, 44, 57, 88, 91.
36, 56, 87, 22, 15 90, 43, 33.
Ordenar; 15, 22, 33, 39, 43, 56, 87, 90
Md= (39+43)/2=41.
Cuando los datos son agrupados generalmente hay que elaborar una tabla de
frecuencias con los intervalos.
Ejemplo:
Nº INTERVALOS Fi Fi (Acu)
i=1 28 – 38 2 2
i=2 78 – 48 7 9
i=3 48 – 58 7 16
i=4 58 – 68 14 30
i=5 68 – 78 15 45
i=6 78 – 88 8 53
i=7 88 – 98 3 56
n=56
(
)
1.- Las frecuencias acumuladas presentan un ordenamiento de los 56
elementos de los que se distribuyen así:
1º Intervalo 1º-2º
2º Intervalo 3º-4º-5º-6º-7º-8º-9º
3º Intervalo 10º-11º-12º-13º-14º-15º-16º
4º Intervalo 17º-18º-19º-20º-21º-………..-30º
5º Intervalo 31º-32º-33º-34º-35º-………..-45º
6º Intervalo 45º-47º-48º-49º-50º-………..-53º
7º Intervalo 54º-55º-56º
2.- La determina la clase donde se encuentra la mediana, se hace la división.
La mediana ocupa el 28º lugar, se busca en la tabla se encuentra en:
3.- Se aplica la fórmula.
Moda
Es un conjunto de datos, es el valor más repetido.
Datos no agrupados
1º Caso
Determinar la moda de los siguientes datos.
1, 1, 3, 4, 5, 5, 6, 8, 8, 8, 9, 9, 12
El valor que más se repite es el 8 en 3 veces Mo=8.
2º Caso
Un conjunto de datos que no tiene Mo.
14, 15, 18, 19, 20, 45, 59, 64.
Ningún dato se repite no tiene Moda.
3ºCaso
7, 8, 8, 8, 16, 16, 16, 20, 24, 24, 33, 56, 56, 78, 78.
Mo= 8; Mo=16 Caso Bimodal.
Datos Agrupados
(
)
1= Es el exceso de frecuencia de la clase modal con respecto a la clase contigua
anterior a ella.
2= Posterior a ella.
2= Amplitud del intervalo.
INTERVALO Fi
28-38 2
38-48 7
48-58 7
58-68 14
68-78 15
78-88 8
88-98 3
(
)
CÁLCULO DE CORRELACIÓN EN EL SPSS
Se calculara la relación que existe entre las exportaciones en toneladas con las
exportaciones en valor FOB.
1.- Hacer clic en análisis
2.- Elige la opción correlación en el menú que se despliega y luego escoge la opción
bivariadas.
3.- Mira el cuadro de dialogo con las dos variables propuestas.
4.- Luego se procede a traspasar cada variable.
5.- Luego has click en aceptar y se desplegaran los datos y tablas optenidas a traves
de programa.
CÁLCULO DE REGRESIÓN EN EL SPSS
Se podrá calcula la ecuación para correlación donde la ecuación nos servirá para
hacer proyecciones al futuro.
1.- Clic en análisis, en el menú que se despliega elige la opción regresión y después
la opción lineal,
2.- En el cuadro que aparece se determinará la variable dependiente e
independiente, y colocarlas en el espacio que aparece en el cuadro de dialogo.
3.- Despliega el cuadro de dialogo en la opción “estadísticos”
4.- Elige las opciones de “estimaciones” y “intervalo de confianza”.
5.- Clic en continuar.
6.- Elige la opción “gráficos”
7.- Selecciona “histogramas” y “gráfico de prob. normal”, para obtener el cálculo de
la gráfica de los datos.
8.- Has clic en aceptar si ya realizaste los pasos anteriores para obtener el resultado
de la Regresión.
9.- En la hoja siguiente observa el cálculo siguiente:
10.- Gráfica de dispersión.
CÁLCULO DE PRUEBA DE HIPÓTESIS EN EL SPSS
Calcularemos la relación existente entre las exportaciones en valor FOB y las
exportaciones en toneladas en donde determinamos la aprobación o rechazo de la
hipótesis nula o hipótesis alternativa
Pasos de una prueba de hipótesis
En la prueba de hipótesis que goza de aceptación general figuran siete pasos:
Formular la hipótesis nula HO,
De manera que pueda determinarse exactamente α, la probabilidad de cometer un
error tipo 1. (Esto equivale a determinar el parámetro de población que interesa
y proponer la validez de un valor para él) (Signo =)
Ho = las exportaciones en valor FOB son iguales a las exportaciones en toneladas
Formular la hipótesis alternativa Ha
De manera que el rechazo de la hipótesis nula signifique aceptar la hipótesis
alternativa. (Signo > o <)
Al formular estas dos hipótesis, se determinan el parámetro y el valor propuesto;
Ha = las exportaciones en valor FOB son diferentes a las exportaciones en
toneladas
2.- Determinar si la prueba es unilateral o bilateral
3.- Asumir el nivel de significación
4.- Determinar la distribución muestral que se usara en la prueba
5.- Elaborar el esquema de la prueba
6.- Calcular el estadístico de la prueba
7.- Tomar la decisión, para esto, se comparan el esquema de la parte 5, con el
estadístico del paso 6
Cálculo en SPSS
1.- Has clic en la opción análisis.
2.- Selecciona la opción “compara medias” y “prueba T para muestras relacionadas”.
3.- En el cuadro siguiente, aparecen las dos variables con las cuales se está
trabajando.
4.- Presiona el botón con la flecha para traspasar las variables al cuadro vacío.
5.- luego de haber insertado las variables, haz clic en opciones.
6.- Haz clic en el cuadro de dialogo en las opciones excluir casos según análisis.
7.- en el intervalo de confianza pon el porcentaje con el que vas a trabajar.
8.- Haz clic en aceptar para que se desplieguen los cálculos de regresión.
9.- Observa los cálculos de regresión en la siguiente hoja del programa SPSS.
CÁLCULO DE CHI CUADRADO EN EL SPSS
Se ha realizado una encuesta a 17 persona vinculadas con el comercio exterior
acerca de acuerdo al nivel que tienen de ceptaciooon con la restriccion que puso el
gobierno a la importaciómn de celulares.
Ho= la dependencia que existe entre las empresas vinculadas con el comercio
exterior y el nivel de acuerdo sobre el porcentaje a la importacion de celulares
Ha = no exite dependencia entre las empresas vinculadas con el comercio exterior y
el nivel de acuerdo sobre el porcentaje a la importacion de celulares.
CALCULO EN EL SPSS DEL CHI CUADRADO
1. Ingresamos los datos al SPSS en este caso deben ser tablas de contingencia
para poder analizar.
2. Nos ubicamos en la barra de herramientas y damos clic en analizar,
estadísticos descriptivos y tablas de contingencia.
3. Se nos desplegara un cuadro de dialogo en el cual aparecerán nuestras
variables.
4. Determinaremos que variable ira en las filas y que variable ira en las
columnas y las pasaremos con las flechas que tiene el cuadro de dialogo.
5. Damos clic en exacta para determinar el nivel de confianza.
6. Clic en continuar
7. Clic en estadísticos para colocar el estadístico chi cuadrado
8. Clic en continuar
9. A continuación damos clic en casillas donde nos aparece otro cuadro de
dialogo y hacemos clic en observadas, esperadas y en porcentajes.
10. Clic en continuar y aceptar.
A continuación nos aparecerá otra hoja del SPSS donde nos mostrara los resultados
obtenidos y podremos observar si aceptamos la hipótesis nula o si la rechazamos y
aceptamos la hipótesis alternativa.
CÁLCULO DE LA VARIANZA EN EL SPSS
Podremos calcular el grado de dispersión que tienen los datos
1.- Se selecciona la opción analizar y escoge la opción frecuencias.
2.- En el cuadro de dialogo que aparece traslada las variable dependiente a la
derecha.
3.- Haz clic en la opción “estadísticos”.
4.- En esta ventana haz clic en varianza y luego clic en continuar
5.- Observa los resultados en la hoja de cálculo del SPSS
CÁLCULO DE LA T STUDENT EN EL SPSS
Podemos calcular la aceptación o rechazo de una hipótesis siempre y cuando la
cantidad de datos no supere los 30 donde las exportaciones en valor FOB y
entoneladas de un año son las variables.
Ho = las exportaciones en valor FOB son iguales a las exportaciones en toneladas
Ha = las exportaciones en valor FOB son diferentes a las exportaciones en
toneladas
1.- Elige la opción analizar, donde se despliega otra ventana y selecciona prueba T
para una muestra.
2.- En el cuadro de dialogo Traslada la variable hacia la ventana derecha.
3.- Haz clic en continuar.
4.- Observa los resultados en la hoja de cálculo del SPSS.
EJERCICIOS DE MANERA MANUAL SIN LA APLICACIÓN DEL SPSS
ESTADÍSTICA INFERENCIAL
FRECUENCIA
Es el número de veces que se repite un dato.
}
FRECUENCIAS ABSOLUTAS
Simple (ni) Acumulada (Ni)
n 1 n 1
n 2 n 1 + n 2
n 3 n 1 + n 2 + n 3
N ∑
FRECUENCIA RELATIVA
Simple Acumulada
h 1 h1
h 2 h 1 + h 2
h 3 h 1 + h 2 + h 3
h n ∑
EJEMPLO:
Sean las siguientes cifras de notas de matemáticas en una escala de (0-100)
evaluados en (n=56) personas.
73 81 44 69 30 38
75 66 76 84 72 82
58 89 73 59 87 63
43 59 64 74 63 63
48 52 77 68 47 53
63 72 52 55 75 43
67 61 87 39 62
75 69 53 79 95
50 38 70 84 82
95 59 75 36 65
1.- Ordena en forma creciente o decreciente
30 50 61 68 75 84
36 52 62 69 75 87
38 52 63 69 75 87
38 53 63 69 76 89
39 53 63 70 77 95
43 55 63 72 79 95
43 58 64 73 81
44 59 65 73 82
47 59 66 74 82
48 59 67 75 84
2.- Determina el intervalo o clase con la fórmula sturges.
3.- Calculamos el recorrido (I)
4.- Se clasifican 7 intervalos de las 56 notas, calculamos el ancho o amplitud
con la letra (C)
Obtener el I1 de los valores aproximados.
Existe un exceso de 4.
70-66=4.
5.-
2 3-> máximo (+)
4 5
≤ 𝑘 ≤ 𝑜𝑝𝑐𝑖𝑜𝑛𝑎𝑙
Cuando # <100
2 2-> mínimo (-)
Restamos -2 el valor mínimo y +2 el valor máximo.
b) 30-2=28
95+2=97
6.- Se forma la tabla
INTERVALO O
CLASE
MARCA DE
CLASE
CONTEO FRECUENCIA
28-38 33 II 2
38-48 43 IIIIIII 7
48-58 53 IIIIIII 7
58-68 63 IIIIIIIIIIIIII 14
68-78 73 IIIIIIIIIIIIIII 15
78-88 83 IIIIIIII 8
88-98 93 III 3
N=56
Media Aritmética
Cuando los datos no están agrupados.
∑
Ejemplo:
17-23-25-30-34-38-43-54
(∑
)
A= Marca de clase es el origen de trabajo.
n= Suma de frecuencia.
∑ = Es la multiplicación de la frecuencia por la desviación unitaria.
C= Amplitud o intervalo.
INTERVALO MARCA DE
CLASE Xi
U FRECUENCIA
ABSOLUTA f
fu (u.f) Fi. Xi
40->50 45 -2 5 -10 225
50->60 55 -1 12 -12 660
60->70 65 0 36 0 2340
70->80 75 1 22 22 1650
80->90 85 2 4 8 340
N=79 ∑
5215
(
)
∑
Cuando los datos están agrupados
Mediana
Ejemplo:
Nº INTERVALOS Fi Fi (Acu)
i=1 28 – 38 2 2
i=2 78 – 48 7 9
i=3 48 – 58 7 16
i=4 58 – 68 14 30
i=5 68 – 78 15 45
i=6 78 – 88 8 53
i=7 88 – 98 3 56
n=56
(
)
Las frecuencias acumuladas presentan un ordenamiento de los 56 elementos
de los que se distribuyen así:
1º Intervalo 1º-2º
2º Intervalo 3º-4º-5º-6º-7º-8º-9º
3º Intervalo 10º-11º-12º-13º-14º-15º-16º
4º Intervalo 17º-18º-19º-20º-21º-………..-30º
5º Intervalo 31º-32º-33º-34º-35º-………..-45º
6º Intervalo 45º-47º-48º-49º-50º-………..-53º
7º Intervalo 54º-55º-56º
2.- La determina la clase donde se encuentra la mediana, se hace la división.
La mediana ocupa el 28º lugar, se busca en la tabla se encuentra en:
3.- Se aplica la fórmula.
Moda
DATOS NO AGRUPADOS
1º CASO
Determinar la moda de los siguientes datos.
1, 1, 3, 4, 5, 5, 6, 8, 8, 8, 9, 9, 12
El valor que más se repite es el 8 en 3 veces Mo=8.
2º Caso
Un conjunto de datos que no tiene Mo.
14, 15, 18, 19, 20, 45, 59, 64.
Ningún dato se repite no tiene Moda.
3ºCaso
7, 8, 8, 8, 16, 16, 16, 20, 24, 24, 33, 56, 56, 78, 78.
Mo= 8; Mo=16 Caso Bimodal.
DATOS AGRUPADOS
(
)
1= Es el exceso de frecuencia de la clase modal con respecto a la clase contigua
anterior a ella.
2= Posterior a ella.
2= Amplitud del intervalo.
INTERVALO Fi
28-38 2
38-48 7
48-58 7
58-68 14
68-78 15
78-88 8
88-98 3
(
)
CONCLUSIONES:
Como vemos la estadística encierra muchos problemas de la vida diaria, en donde
menos lo esperamos se pone en práctica. Hoy en día nos encontramos con un
mundo cada vez más globalizado y actualizado es por ende que nosotros como
futuros profesionales debemos de capacitarnos y relacionarnos con nuevas
tecnologías y nuevos métodos de estudio para así tener una mejor experiencia y
conocimiento en los sistemas informáticos. Todo lo que hemos detallado en el
presente manual a cerca del SPSS nos permiten determinar las relaciones de las
variables poblacionales, sean estas cualitativas o cuantitativa, para las cualitativas
tenemos el chi- cuadrado que permite determinar variables que carecen de unidad.
También nos permiten determinar la situación de las variables en las cuales existen
problemas o desconocimiento de la realidad del entorno en estudio, principalmente
muestral, a medida que aplicamos los estadísticos correctamente, los datos que nos
arroja permitirá aclarar dudas o lo que se desconoce de ciertos aspectos en el
campo empresarial, económico, financiero, social, educacional, en fin de cualquier
área que se desee investigar el comportamiento de las variables ya sean cualitativas
o cuantitativas y la posterior toma de decisiones.
Los diferentes programas para la resolución e interpretación de variables
estadísticas principalmente el SPSS, nos permiten descubrir el comportamiento de
cada una de las variables, con las cuales nos ayudara a la rápida resolución
estadística para una posterior toma de decisiones.
Es de gran importancia saber que en nuestras manos existen programas que nos
permiten analizar resultados de manera más eficaz y eficiente, de nosotros depende
aprender y capacitarnos más con la tecnología actual.
RECOMENDACIONES:
De la manera como apliquemos los datos de cada ejercicio o dato estadístico,
dependerá el éxito del problema o la investigación que pretendemos descubrir
o resolver, es por eso que debemos dar a cada variable su correspondiente
estadístico y de seguro tomaremos la decisión más acertada al interpretar
para una buena toma de decisiones.
Emplear apropiadamente el software SPSS en la interpretación de variables
muestrales estadísticas mediante un histograma, para la correcta toma de
decisiones, y de seguro éxito en nuestro proyecto o investigación que
estamos dando resolución.
Es recomendable que todos y cada uno de los datos estén clasificados entre
las variables a determinar, ya sea por género, país, actividad, etc. Esto
ayudara al programa a desarrollarse con más facilidad y a obtener los
resultados más exactos de nuestra investigación.
ANEXOS
Frecuencias
Estadísticos
EXPORTACION
ES
TONELADA
S
EXPORTACION
ES FOB
N Válidos 41 41
Perdidos 2 2
Varianza 2.519E10 1.318E11
Tabla de frecuencia
EXPORTACIONES TONELADAS
Frecuencia Porcentaje Porcentaje
válido
Porcentaje
acumulad
o
Válidos 1944753 1 2.3 2.4 2.4
2029567 1 2.3 2.4 4.9
2062106 1 2.3 2.4 7.3
2082129 1 2.3 2.4 9.8
2087716 1 2.3 2.4 12.2
2094673 1 2.3 2.4 14.6
2109277 1 2.3 2.4 17.1
2111688 1 2.3 2.4 19.5
2126750 1 2.3 2.4 22.0
2129090 1 2.3 2.4 24.4
2131598 1 2.3 2.4 26.8
2135589 1 2.3 2.4 29.3
2159617 1 2.3 2.4 31.7
2200673 1 2.3 2.4 34.1
2207587 1 2.3 2.4 36.6
2213808 1 2.3 2.4 39.0
2263398 1 2.3 2.4 41.5
2266774 1 2.3 2.4 43.9
2268435 1 2.3 2.4 46.3
2275843 1 2.3 2.4 48.8
2276219 1 2.3 2.4 51.2
2276238 1 2.3 2.4 53.7
2291789 1 2.3 2.4 56.1
2309041 1 2.3 2.4 58.5
2325590 1 2.3 2.4 61.0
2329229 1 2.3 2.4 63.4
2345900 1 2.3 2.4 65.9
2352703 1 2.3 2.4 68.3
2356567 1 2.3 2.4 70.7
2371979 1 2.3 2.4 73.2
2374973 1 2.3 2.4 75.6
2386512 1 2.3 2.4 78.0
2391048 1 2.3 2.4 80.5
2395715 1 2.3 2.4 82.9
2427325 1 2.3 2.4 85.4
2440271 1 2.3 2.4 87.8
2471923 1 2.3 2.4 90.2
2502616 1 2.3 2.4 92.7
2516369 1 2.3 2.4 95.1
2555781 1 2.3 2.4 97.6
2675699 1 2.3 2.4 100.0
Total 41 95.3 100.0
Perdidos Sistema 2 4.7
Total 43 100.0
EXPORTACIONES FOB
Frecuencia Porcentaje Porcentaje
válido
Porcentaje
acumulad
o
Válidos 800798 1 2.3 2.4 2.4
873693 1 2.3 2.4 4.9
993825 1 2.3 2.4 7.3
1018148 1 2.3 2.4 9.8
1113441 1 2.3 2.4 12.2
1167336 1 2.3 2.4 14.6
1212690 1 2.3 2.4 17.1
1237432 1 2.3 2.4 19.5
1249447 1 2.3 2.4 22.0
1286133 1 2.3 2.4 24.4
1328430 1 2.3 2.4 26.8
1334448 1 2.3 2.4 29.3
1359233 1 2.3 2.4 31.7
1360062 1 2.3 2.4 34.1
1369489 1 2.3 2.4 36.6
1392258 1 2.3 2.4 39.0
1397918 1 2.3 2.4 41.5
1467517 1 2.3 2.4 43.9
1469969 1 2.3 2.4 46.3
1489381 1 2.3 2.4 48.8
1514772 1 2.3 2.4 51.2
1576829 1 2.3 2.4 53.7
1613436 1 2.3 2.4 56.1
1621543 1 2.3 2.4 58.5
1690476 1 2.3 2.4 61.0
1726282 1 2.3 2.4 63.4
1772258 1 2.3 2.4 65.9
1827860 1 2.3 2.4 68.3
1831303 1 2.3 2.4 70.7
1856081 1 2.3 2.4 73.2
1863189 1 2.3 2.4 75.6
1868972 1 2.3 2.4 78.0
1974010 1 2.3 2.4 80.5
1975163 1 2.3 2.4 82.9
2009483 1 2.3 2.4 85.4
2021540 1 2.3 2.4 87.8
2032005 1 2.3 2.4 90.2
2053808 1 2.3 2.4 92.7
2060096 1 2.3 2.4 95.1
2064843 1 2.3 2.4 97.6
2120319 1 2.3 2.4 100.0
Total 41 95.3 100.0
Perdidos Sistema 2 4.7
Total 43 100.0
Correlación Lineal
Correlaciones de exportaciones
EXPORTACIO
NES FOB
EXPORTACIO
NES
TONELA
DAS
EXPORTACIONES FOB Correlación de Pearson 1 .317*
Sig. (bilateral) .043
N 41 41
EXPORTACIONES
TONELADAS
Correlación de Pearson .317* 1
Sig. (bilateral) .043
N 41 41
*. La correlación es significante al nivel 0,05 (bilateral).
Regresión Lineal
Variables
Modelo Variables
introducidas
Variables
eliminadas
Método
1 EXPORTACIONES
FOBa
. Introducir
a. Todas las variables solicitadas introducidas.
b. Variable dependiente: EXPORTACIONES TONELADAS
Resumen exportacionesb
Model
o
R R cuadrado R cuadrado
corregida
Error tipo de la
estimació
n
1 .317a .101 .078 152421.164
a. Variables predictoras: (Constante), EXPORTACIONES FOB
b. Variable dependiente: EXPORTACIONES TONELADAS
ANOVAb
Modelo Suma de
cuadrado
s
gl Media
cuadrátic
a
F Sig.
1 Regresión 1.014E11 1 1.014E11 4.366 .043a
Residual 9.061E11 39 2.323E10
Total 1.007E12 40
a. Variables predictoras: (Constante), EXPORTACIONES FOB
b. Variable dependiente: EXPORTACIONES TONELADAS
Coeficientesa
Modelo Coeficientes no estandarizados Coeficientes
tipificados
B Error típ. Beta t Sig.
1 (Constante) 2058480.667 106316.321 19.362 .000
EXPORTACIONES FOB .139 .066 .317 2.090 .043
a. Variable dependiente: EXPORTACIONES TONELADAS
Coeficientes exportacionesa
Modelo Intervalo de confianza de 99,0%
para B
Límite inferior Límite superior
1 (Constante) 1770585.299 2346376.035
EXPORTACIONES FOB -.041 .318
a. Variable dependiente: EXPORTACIONES TONELADAS
Estadísticos sobre los desechosa
Mínimo Máximo Media Desviación
típica
N
Valor pronosticado 2169559.00 2352589.25 2274989.22 50356.849 41
Residual -292126.719 323109.656 .000 150503.841 41
Valor pronosticado tip. -2.094 1.541 .000 1.000 41
Residuo típ. -1.917 2.120 .000 .987 41
a. Variable dependiente: EXPORTACIONES TONELADAS
Gráficos
Prueba T
Estadísticos de muestras relacionadas
Media N Desviación típ. Error típ. de la
media
Par 1 EXPORTACIONES
TONELADAS
2274989.22 41 158704.815 24785.528
EXPORTACIONES FOB 1560876.00 41 363037.841 56696.985
Correlaciones de muestras relacionadas
N Correlación Sig.
Par 1 EXPORTACIONES
TONELADAS y
EXPORTACIONES
FOB
41 .317 .043
Prueba de muestras relacionadas
Diferencias relacionadas
Media Desviación típ. Error típ. de la
media
Par 1 EXPORTACIONES
TONELADAS -
EXPORTACIONES
FOB
714113.220 347017.015 54194.953
Prueba de muestras relacionadas
Diferencias relacionadas
99% Intervalo de confianza para
la diferencia
Inferior Superior
Par 1 EXPORTACIONES
TONELADAS -
EXPORTACIONES
FOB
567545.177 860681.262
Prueba de muestras relacionadas
t gl Sig. (bilateral)
Par 1 EXPORTACIONES
TONELADAS -
EXPORTACIONES
FOB
13.177 40 .000
Tablas de contingencia
Resumen del procesamiento de exportaciones
Casos
Válidos Perdidos Total
N Porcentaje N Porcentaje N Porcentaje
EXPORTACIONES
TONELADAS *
EXPORTACIONES
FOB
41 95.3% 2 4.7% 43 100.0%
Pruebas de chi-cuadrado
Valor gl Sig. asintótica
(bilateral)
Chi-cuadrado de Pearson 1640.000a 1600 .238
Razón de verosimilitudes 304.513 1600 1.000
Asociación lineal por lineal 4.027 1 .045
N de casos válidos 41
a. 1681 casillas (100,0%) tienen una frecuencia esperada inferior a 5. La
frecuencia mínima esperada es ,02.
Prueba para una muestra
Valor de prueba = 0
t gl Sig. (bilateral) Diferencia de
medias
EXPORTACIONES
TONELADAS
45.908 11 .000 2279029.333
EXPORTACIONES FOB 19.664 11 .000 1155254.083
Prueba para una muestra
Valor de prueba = 0
99% Intervalo de confianza para
la diferencia
Inferior Superior
EXPORTACIONES
TONELADAS
2124847.90 2433210.77
EXPORTACIONES FOB 972788.40 1337719.77
EJERCICIOS PROPUESTOS SOBRE DISTRIBUCIONES DE FRECUENCIAS
EJERCICIO No. 1
Se pesaron 53 personas obteniéndose los siguientes pesos en kilogramos:
45 50 50 62 60 52
80 63 65 64 47 67
72 70 73 49 54 60
64 61 79 52 62
40 64 61 65 81
69 60 60 70 43
87 43 59 46 57
54 77 60 53 68
58 80 54 64 61
60 90 51 75 59
Ejercicio No. 2
En el siguiente cuadro se presentan las alturas en cm, de 40 alumnos de un colegio
de educación secundaria. Construir una tabla de distribución de frecuencias.
138 164 150 132
144 125 149 157
146 158 140 147
136 148 152 144
168 126 138 176
163 119 154 165
146 173 142 147
135 153 140 135
161 145 135 142
150 156 145 128
Ejercicio No. 3
En un colegio, 50 estudiantes han sido examinados por una prueba de lenguaje. La
escala es de o a 100. Las calificaciones individuales se presentan en el siguiente
cuadro.
60 85 65 84 57
71 35 35 74 68
80 61 55 59 45
41 55 69 67 76
94 98 73 65 89
33 52 77 65 74
81 50 64 47 54
41 91 73 53 77
MEDIDAS DE DISPERSIÓN
Ejemplo: 6, 10, 16, 22, 36, 48, 56.
Desviación media o variación media:
∑| |
6, 10, 15, 22, 36, 35
| | | | | | | | | | | |
Desviación estándar o desviación típica:
√∑
Es la más confiable de las medidas de dispersión.
Ejemplo:
3, 5, 7, 10, 13, 15
S √
Para datos no agrupados existe otro método.
√
∑
∑
√
√
DATOS AGRUPADOS
Cuando los datos se encuentran agrupados formando distribuciones de frecuencias
se utiliza las siguientes fórmulas:
1) √∑
2) √∑
(
∑
)
INTERVALOS
40-50 45 3 -17.5 306.25 918.75 -2 -6 12
50-60 55 5 -7.5 56.25 281.25 -1 -5 5
60-70 65 7 2.5 6.25 47.75 0 0 0
70-80 75 4 12.5 156.25 625 1 4 4
80-90 85 1 22.5 506.25 506.25 2 2 4
=20 =2375 =-5 =25
∑
√
√
(
)
Varianza:
Se la define como el cuadrado de la desviación estándar.
EJEMPLOS DE LA CAMPANA DE GAUSS
Calcular la probabilidad del evento.
P (0 Z 1.27)
P= 0.3980= 39.80%
Ejercicios propuestos
a) P (0 Z 3.45)
b) P (0 Z 0.8)
c) P (0 Z 0.06)
Calcular la probabilidad del evento
P (-2.8 Z 0)
P= 0.4974= 49.74%
Ejercicios propuestos
a) P (-3.6 Z 0)
b) P (-2.02 Z 0)
c) P (-1.4 Z 0)
Calcular la probabilidad del evento
P (1.02 Z 2.97)
1.02 y 2.96= A (0^2.97)- A (0^1.02)
= 0.4985 – 0.3461
= 0.1524
=15.24%
Ejercicios propuestos
a) P (0.5 Z 1.09)
b) P (2.04 Z 3.16)
c) P (1.84 Z 1.96)
Calcular la probabilidad del evento
P (-2.4 Z -0.85)
A (-2.4 ^ - 0.85)= A (-2.4^0) - A (-0.85^0)
= 0.4918-0.3023
= 0.1895= 18.95%
EJERCICIOS PROPUESTOS
Elabore la grafica de dispersión y encuentre la ecuación lineal y determine qué
tipo relación es:
ESTUDIANTES
PRUEBA DE
HONORABILIDA
D MENTAL
EXAMEN DE
AUDICIÓN
María
Olga
Susana
Aldo
Juan
18
15
12
9
3
82
68
60
32
18
María
Olga
Susana
Aldo
Juan
18
15
12
9
3
18
32
60
68
82
María
Olga
Susana
Aldo
Juan
18
15
12
9
3
18
82
68
60
32
COSTO Y PESO EN LIBRAS DE MANGOS
Bolsas Peso un libro x Costo en $ (Y)
A
B
C
D
E
F
2,25
3
3,75
4,50
5,25
6
0,75
1
1,25
1,50
1,75
2
EJERCICIO PROPUESTO
Calcular el r de Pearson.
ESTUDIANTE COEFICIENTE
INTELECTUAL PUNTAJE
1
2
3
4
5
6
7
8
9
10
11
110
112
118
119
122
125
127
130
132
134
136
1
1.6
1.2
2.1
1.8
2.6
2
3.2
2.6
3
3.6
12 138
19 100-140 (1-4)
COEFICIENTE DE CORRELACIÓN DE RANGOS DE SPERMAN
Cuando una o más variables son solo de escala ordinal su fórmula matemática
es:
N= números de parejas de rango
Sujeto
Orden dado el
psicólogo
A(Raí)
Orden dado
por el
psicólogo
B(Río)
DI
R( xi) - (yi) Di ²
1
2
3
4
5
6
7
8
9
10
12
6
5
7
10
2.5
2.5
9
1
11
4
8
12
5
3
4
8
1
6
10
2
9
7
11
12
1
2
3
2
1.5
3.5
1
1
2
3
3
0
1
4
9
02.25
12.25
1
4
4
9
9
0
EJERCICIO PROPUESTO
Nro. Actividades Atracción
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
0.30
0.44
0.67
0.00
0.50
0.15
0.58
0.32
0.72
1.00
0.87
0.09
0.89
0.64
0.24
8.9
9.3
9.6
6.2
8.8
8.1
9.5
7.1
11
11.7
11.5
7.3
10
10
7.5
EJEMPLO DEL COEFICIENTE r DE PEARSON
Habilidad mental
Vs.
Examen de admisión
x Y x2 y² XY
María
Olga
Susana
Aldo
Juan
18
15
12
9
3
Ʃx = 57
82
68
60
32
18
Ʃy= 260
324
225
144
81
9
Ʃx² =
783
6724
4624
3600
1024
324
Ʃy² =
162
96
1476
1020
7200
288
54
Ʃxy =
355
8
√
√
EJERCICIOS PROPUESTOS
X Y
18
15
12
9
3
18
15
12
9
3
18
82
68
60
32
18
32
60
68
82
alumnos Y X
María
Olga
Susana
Aldo
Juan
Lourdes
Cesar
Jon
49
46
45
42
39
37
20
15
55
50
53
35
48
46
27
32
EJEMPLOS
Alumnos X Y x² y² Xy
Di Di²
María
Olga
Susana
Aldo
Juan
Lourdes
Cesar
Jon
49
46
45
42
39
37
20
15
Σx=293
55
50
53
35
48
46
24
32
Σy=343
2401
2116
2025
1764
1521
1369
400
225
Σx²=11821
3025
2500
2809
1225
2304
2116
576
1024
Σy²=15579
2695
2300
2385
1470
1872
1702
480
480
Σxy=1338
0
-1
1
-2
1
1
-1
1
0
1
1
4
1
1
1
1
ΣDi²=10
√
√
Los profesores son clasificados por los alumnos del V y VI curso y obtuvimos
los siguientes resultados.
Profesor V Ciclo
X
VI ciclo
Y
J
K
L
R
F
Z
49
47
42
39
37
32
48
45
22
22
40
40
Profesor V Ciclo
X
Vi ciclo
Y Rango y D D2
J
K
L
R
F
Z
1
2
3
4
5
6
1
2
5
6
3
4
1
2
5.5
3.5
3.5
0
0
-2.5
-1.5
1.5
2.5
0
0
6.25
2.25
2.25
6.25
D2=17
Su magnitud no es muy fuerte ni débil
Altura del padre Altura del hijo
1
2
3
4
5
6
7
8
3
5
2
1
5
5
4
2
3+4.3
5.5
1
4.3
4.3
4
5.5
178
154
180
184
166
166
166
175
3
8
2
1
5
6
7
4
3
8
2
1
6
6
6
4
REGRESIÓN LINEAL
Ejemplo DE aprovechamiento
Estudiante
numero X
Promedio de Y
calificaciones XY X2
1
2
3
4
5
6
7
110
112
118
119
122
125
127
1
1.6
1.2
2.1
2.6
1.8
2.6
110
179.2
141.6
249.9
317.2
225
330.2
12100
12544
13424
14161
14384
15625
16129
8
9
10
11
12
130
132
134
136
138
2
3.2
2.6
3
3.6
260
422.4
384.4
408
496.8
16900
17421
17456
18496
19044
∑
∑ ∑
∑ ∑
x
y
110 120 130 140
4
3
2
1
Una psicóloga del desarrollo está interesada si es posible utiliza alturas de los
jóvenes para producir en un posible estatura en la edad adulta y ella reúne las
siguientes datos de la tabla.
a) Trace la grafica
b) Obtener la línea de regresión por mínimo cuadrados
c) En base a estos datos aquí esta estatura podría producir para una
persona de 20 años si a los 3 años de edad tiene una altura de 42
pulgadas.
Individuo
Altura la
edad de 3
años
pulgadas
Altura a la
edad de 20
años y
pulgada
Xy
X2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
30
30
32
33
34
35
36
38
40
41
41
43
45
45
47
48
59
63
62
67
65
61
69
66
68
65
73
68
71
74
71
75
1770
1890
1984
2211
2210
2135
2484
2508
2720
2665
2993
2924
3195
2924
3195
3330
900
900
1024
1059
1156
1225
1296
1444
1600
1681
1681
1849
2025
2025
2209
2304
3337
3600
618 1077 41956 24408
∑
∑ ∑
∑ ∑
x
y
5 10 15 20 25 30 35 40 45 50 55 60
40
30
20
10
50
EJEMPLO
Para evaluar el nivel mental de los ingresantes de la Universidad se
estandarizo la habilidad mental encontrándose un C.I. (coeficiente intelectual)
promedio de 101,2 con una desviación estándar de 13,8. Aplicada de la prueba
a una muestra de 60 ingresantes de esta universidad se calculó que el C.I.
promedio es de 106,4 con una desviación estándar de 16,4. ¿El nivel mental de
los ingresantes es superior al término medio?
Variable de estudio: La habilidad mental de los X estudiantes.
µ = rendimiento mental promedio de los ingresantes.
X = rendimiento promedio de la muestra.
Solución:
1) Ho: µ= 101,2
Ha: µ > 101,2
2) Prueba unilateral de acuerdo a Ha.
3) Realizar la prueba de los niveles de significación de 5% y 1%.
4) Se admite que la variable aleatoria de la prueba es la media de los
coeficientes de inteligencia Xi.
5) Como n > 30 podemos usar una distribución normal de probabilidades
para calcular los valores críticos y elaborar el esquema grafico de la
prueba 99%.
6) Calculo estadístico de la prueba.
√
√
7) Toma de decisiones:
A los niveles de significancia de 0,05 ^ 0,01 observamos que el estadístico Z=
2,92 se ubica en la zona de rechazo, esta significancia que la prueba es muy
significativa luego rechazamos la Ho: µ= 101,2 y no rechazamos que el nivel
mental de los ingresantes es superior al término medio.
PRUEBA DE Ji- CUADRADO O
EJEMPLO
De la siguiente Tabla de valores determinar la X2
LA CANTIDAD DE TARJETAS VENDIDAS
JUGADOR TARGETAS VENDIDAS ESPERADO
1 13 20
2 33 20
3 14 20
4 7 20
5 36 20
6 17 20
120 120
1) Ho : No existe diferencia entre la experiencia local y nacional.
Ha: Si existe diferencia entre la experiencia local y nacional.
2) Es una campana Unilateral.
3) Nivel de significancia x= 0.05 nivel de confianza 95%
4) Como n= 400 se puede utilizar la X2 para cualquier valor de datos.
5) GRÁFICO
Z.R
Z.A
x2 = 11,070
6) Calculo de la X2
∑
X2 =
X2 = 34.40
gl= K-1
gl= 6-1
gl= 5
7) Como X2 en la zona de rechazo se acepta ha y se rechaza la Ho
TABLAS DE CONTINGENCIA
EJEMPLO
Se desea hacer una investigación de la liberación de una persona de la cárcel
para mejorar la vida civil, si regresa a su ciudad natal y si va a vivir a otra parte
¿si existe relación entre el ajuste a la vida civil y el lugar de residencia después
de la liberación?
Sitio de
residencia
Excelente Bueno Regular Insatisfactorio Total
Cuidad de
origen
27 35 33 25 120
Otra ciudad 13 15 27 25 80
40 50 60 50 200/200
1. Ho.- No existe una relación entre el ajuste a la vida civil y el lugar de
residencia después de la liberación.
Ha.-Si existe una relación entre el ajuste a la vida civil y el lugar de
residencia.
2. Se trata de una campana unilateral
3. x=0,001 (Nivel de significancia)
Nivel de confianza 99%
4.-n = 200 se puede utilizar la CHI2
5.-GRÁFICO
gl =(F-19 ) (C-1)
gl =(2-1) (4-1)
x²=11,345
6.-CALCULO DEL X²
=
EXCELENTE BUENO REGULAR SATISFACTORIO
TOTAL
fo - fe fo - fe fo - fe fo - fe fo - fe
CIUDAD DE
ORIGEN 27 - 24 35 - 30 33 - 36 25 - 30 120 - 120
OTRA
CUIDAD 13 - 16 15 - 20 27 - 24 25 - 20 80 - 80
40 40 50 50 60 60 50
50 200 200
SON IGUALES
X²= (27-24)2 / 24 + (36-30)2 / 30 + (33-36)2 /36 + (25-30) 2 / 30 + (13 -16) 2 /16
+ (15 -20)2 /20+ (27-24)2 /24 + (25-20)2 /20
X² = 5,729
7.-El valor calculado de ji cuadrado se encuentra a la izquierda de 11,345 es
aceptada la Ho en 0,01 no existe una relación a la vida civil donde resida el
prisionero después de haber alcanzado la libertad.
EJEMPLO
1. Ho.- El suero no tiene efecto, y la recuperación es independiente del
uso del suero.
Ha.- que el suero es el que permite la recuperación del paciente.
2. Es cola unilateral
3. 0,05 (N. significancia.)
Nivel de confianza 95%
4. n =200 personas se puede utilizar la ji cuadrado para cualquier valor de
datos-
5. GRÁFICO
gl =(F-1 ) (C-1)
gl =(2-1) (2-1)
x²=3,84
6. Calculo de x²
X2= (75 - 70)2 / 70 + (65 - 70)2 / 70 + (25-30)2 /30 + (35-30) 2 / 30 = 2,38
FRECUENCIAS OBSERVADAS
CURADOS NO CURADOS TOTAL
GRUPO A USANDO
SUERO
75 25 100
GRUPO B SIN SUERO
65 35 100
TOTAL
140 60 200
FRECUENCIAS ESPERADAS (DE Ho)
CURADOS NO CURADOS TOTAL
GRUPO A USANDO
SUERO
70 30 100
GRUPO B SIN SUERO
70 30 100
TOTAL
140 60 200
7. Ho aceptamos, concluyendo que el suero no tiene efecto, que la
recuperación es independiente
Fe =(80 – 40) / 200 = 16
Fe= FRECUENCIA ESPERADA = (total del renglón) (total columna) / gran total
Fe =(100 – 140) / 200 = 7
Fe =(100 – 60) / 200 = 30
Bibliografía (Levin Richard & Rubin David, 1996:p.140). (s.f.).
http://www.AulaFacil.com. (s.f.).
http://www.monografia.com/estadistica. (s.f.).
http://www.monografias.com/trabajos30/conceptos-de-estadistica/conceptos-de-
estadistica.shtml. (s.f.).
http://www.Wikipedia: Estadísticas. (s.f.). Obtenido de google: http://www.Wikipedia:
Estadísticas.
http://www.Wikipedia: Estadísticas. (s.f.).
JOHNSON, R. (1990). Análisis descriptívo y presentación de datos bivariados. En ESTADÍSTICA
ELEMENTAL (pág. 82 ~ 112). Belmont: Wadsworth Publishing Company Inc.
LEVIN, R. &. (2010). ESTADISTICA PARA ADMINISTRACIÓN Y ECONOMÍA. Carolina del Norte:
Prentice Hall.
SPIEGEL, M. (1992). Teoría de la correlación. En ESTADÍSTICA (págs. 322 - 356). MÉxico D.F.: Mc
GRAW-HILL.
VARGAS, A. (1995). ESTADISTICA DESCRIPTIVA E INFERENCIAL. La Mancha: Coleccion Ciencia y
Técnica.