Date post: | 06-Jul-2018 |
Category: |
Documents |
Upload: | mietherhofer |
View: | 236 times |
Download: | 0 times |
of 63
8/18/2019 Apostila Estatistica-Prof. Fabio
1/63
Estatística
Cursos: Engenharia Civil
UMC – Villa Lobos
Prof. Fábio Conte Correia
São Paulo2011
8/18/2019 Apostila Estatistica-Prof. Fabio
2/63
Sumário
1 O que é estatística ................................................................................................... 3
1.1 Definições: .......................................................................................................... 3
1.2 Métodos Científicos ............................................................................................ 4
1.3 População e Amostra ......................................................................................... 5
1.4 Amostragem ....................................................................................................... 5
1.4.1 Variáveis ..................................................................................................... 6
2 Tabelas .................................................................................................................... 7
2.1 Séries estatísticas ............................................................................................... 8
2.1.1 Séries históricas, cronológicas, temporais ou marchas .............................. 8
2.1.2 Séries geográficas, espaciais, territoriais ou de localização ....................... 8 2.1.3 Séries específicas ou categóricas ............................................................... 9
2.1.4 Séries conjugadas – Tabela de dupla entrada ............................................ 9
2.1.5 Distribuição de freqüência ......................................................................... 10
3 Distribuição de freqüência ..................................................................................... 11
3.1 Tabela primitiva ou dados brutos ...................................................................... 11
3.2 ROL .................................................................................................................. 11
3.3 Distribuição de freqüência sem intervalo de classes ........................................ 11 3.4 Distribuição de freqüência com intervalo de classes ........................................ 12
3.4.1 Elementos de uma distribuição de frequências com intervalos de classe . 13
3.4.1.1 Etapas: Distribuição de Freqüências c/ classe .................................... 14
3.5 Gráficos ............................................................................................................ 15
3.5.1 Histogramas .............................................................................................. 15
3.5.2 Polígonos de freqüências .......................................................................... 16
3.5.3 Polígonos de freqüência acumulada ou ogivas ......................................... 17 4 Medidas posição .................................................................................................... 18
4.1 Medidas de tendência central para dados não agrupados ............................... 18
4.1.1 Média Aritmética Simples .......................................................................... 18
4.1.2 Moda ......................................................................................................... 19
4.1.3 Mediana .................................................................................................... 19
4.2 Medidas de tendência central para dados agrupados ...................................... 20
4.2.1 Média Aritmética Ponderada ..................................................................... 20
4.2.1.1 Sem intervalo de classes ..................................................................... 20
8/18/2019 Apostila Estatistica-Prof. Fabio
3/63
1
4.2.1.2 Com intervalo de classes ..................................................................... 20
4.2.2 Moda ......................................................................................................... 22
4.2.2.1 Sem intervalo de classes ..................................................................... 22
4.2.2.2 Com intervalo de classes ..................................................................... 22
4.2.3 Mediana .................................................................................................... 23
4.2.3.1 Sem intervalo de classes ..................................................................... 23
4.2.3.2 Com intervalo de classes ..................................................................... 23
4.3 Relação entre a média, a mediana e a moda ................................................... 25
4.4 Exercícios. ........................................................................................................ 26
4.5 Separatrizes...................................................................................................... 29
4.5.1 Quartis, Decis e Percentis ......................................................................... 29
4.5.1.1 Calculo para dados não agrupados ..................................................... 29
4.5.1.2 Cálculo para dados agrupados ............................................................ 30
5 Mediadas de dispersão ou de variabilidade ........................................................... 32
5.1 Amplitude Total ................................................................................................. 32
5.2 Variância e desvio padrão ................................................................................ 33
5.2.1 Dados não agrupados ............................................................................... 34
5.2.2 Dados agrupados sem intervalo de classes .............................................. 35
5.2.3 Dados agrupados com intervalo de classes .............................................. 35
5.3 Coeficiente de variação .................................................................................... 36
6 Correlação e Regressão ........................................................................................ 39
6.1 Correlação linear entre duas variáveis ............................................................. 39
6.1.1 Coeficiente de correlação linear ................................................................ 41
6.2 Regressão Linear ............................................................................................. 44
7 Analise combinatória ............................................................................................. 47
7.1 Fatorial .............................................................................................................. 47
7.2 Princípio fundamental da contagem – PFC ...................................................... 48
7.3 Arranjos simples ............................................................................................... 49
7.3.1 Cálculo do número de arranjos ................................................................. 49
7.4 Permutações simples ....................................................................................... 50
7.4.1 Permutações com elementos repetidos .................................................... 51
7.5 Combinações simples ....................................................................................... 51
7.6 Números Binomiais ........................................................................................... 53
8/18/2019 Apostila Estatistica-Prof. Fabio
4/63
2
8 Probabilidade ......................................................................................................... 54
8.1 Experimentos ou fenômenos aleatórios ............................................................ 54
8.2 Espaço amostral ............................................................................................... 54
8.3 Eventos ............................................................................................................. 55
8.4 Função Probabilidade ....................................................................................... 55
8.5 Eventos complementares ................................................................................. 56
8.6 Eventos independentes .................................................................................... 56
8.7 Eventos mutuamente exclusivos ...................................................................... 57
8.8 Exercícios ......................................................................................................... 57
9 Distribuição Binomial ............................................................................................. 60
8/18/2019 Apostila Estatistica-Prof. Fabio
5/63
3
1 O que é estatística
1. É a ciência da tomada de decisão perante incertezas;
2. Coleta, análise e interpretação de dados;3. É um “kit” de ferramentas que ajuda a resolver problemas;
4. Base para a maior parte das decisões tomadas quanto ao controle de qualidade,
assim como em quase todas as outras áreas da atividade humana moderna.
Vista dessa forma, a Estatística não deve ser confundida como uma disciplina
isolada, e sim, compreendida como uma ferramenta ou conjunto de ferramentas,
disponível para a solução de problemas em diversas áreas do conhecimento.
1.1 Definições:
Processo: é qualquer combinação específica de máquinas, ferramentas,
métodos, materiais e/ou pessoas empregadas para atingir qualidades
específicas num produto ou serviço. Estas qualidades são chamadas de
“características de qualidade”.
Controle: é o ciclo de feedback (realimentação) através da qual medimos odesempenho real, comparando-o com o padrão, e agimos sobre a diferença.
Controle Estatístico do processo (CEP): aplicação de técnicas estatísticas para
medir e analisar a variação nos processos.
Controle Estatístico da Qualidade (CEQ): aplicação de técnicas estatísticas para
medir e aprimorar a qualidade dos processos. CEQ inclui CEP, ferramentas de
diagnósticos, planos de amostragem e outras técnicas estatísticas.
Est atíst ica Desc rit i va: sua função é observar fenômenos de mesma natureza, coletar
dados numéricos referente a esses fenômenos, organizar e classificar esses dados
observados, além da sua apresentação por meio de tabelas, diagramas e gráficos.
Etapas básicas:
Definição do problema;
Planejamento;
Coleta de dados; Apuração dos dados;
8/18/2019 Apostila Estatistica-Prof. Fabio
6/63
4
Apresentação dos dados;
Análise e interpretação dos dados.
Est atíst ica Indut iva:é um processo de generalização a partir de resultados obtidos
particulares, isto é, a inferência de propriedades para o todo com base na parte do
particular. O processo de generalização que é característico do método indutivo está
associado a uma margem de erro e para minimizar este grau de incerteza a teoria de
probabilidades será fundamental para o desenvolvimento da estatística aplicada.
Estatística nas empresas
Neste mundo globalizado, a empresa é uma das vigas mestras da Economia dos
povos e a Estatística tem colaborado com os gerentes porque permitem a construção
de ferramentas que dão oportunidades a tomada de decisões e estimativas, e ainda,
facilitam o tríplice trabalho do Administrador de organizar, dirigir e controlar a empresa.
Aplicação na Engenharia e na Administração
Uma firma que está se preparando para lançar um novo produto precisa
conhecer as preferências do consumidor no mercado de interesse. Deve-se fazer
pesquisa de mercado entrevistando um número de residências escolhidas
aleatoriamente. Assim, os resultados podem ser usados para estimar as preferências
da população.
É possível que em uma comunidade, o consumo de sorvete dependa do:
- preço do produto;
- renda média local;
- número de crianças na comunidade;
- temperatura média; Através da análise de regressão podem-se determinar quais fatores têm efeitos
mais importantes.
1.2 Métodos Científicos
Método é um conjunto de meios dispostos convenientemente para se chegar aum fim que se deseja.
8/18/2019 Apostila Estatistica-Prof. Fabio
7/63
5
• Método Experimental: consiste em manter constantes todas as causas (fatores),
menos uma, e variar esta causa de modo que o pesquisador possa descobrir
seus efeitos, caso existam.
• Método Estatístico: Admite todas essas causas presentes variando-as,
registrando essas variações e procurando determinar, no resultado final, que
influências cabem a cada uma delas.
1.3 População e Amostra
Ao conjunto de entes portadores de, pelo menos, uma característica comum
denominamos população estatística, universo estatístico ou simplesmentePOPULAÇÃO.
Como em qualquer estudo estatístico, temos em mente pesquisar uma ou mais
características dos elementos de alguma população, esta característica deve estar
perfeitamente definida. Isso possibilita que afirmemos, sem ambiguidade, se um
elemento pertence ou não à população.
Na maioria das vezes, por impossibilidade ou inviabilidade econômica ou
temporal, limitamos as observações referentes a uma determinada pesquisa a apenasuma parte da população. A essa parte proveniente da população em estudo
denominamos amostra.
Uma amostra é um subconjunto finito de uma população.
Para as inferências serem corretas, é necessário garantir que a amostra seja
representativa da população, isto é, a amostra deve possuir as mesmas características
básicas da população, no que diz respeito ao fenômeno que desejamos pesquisar.
1.4 Amostragem
A amostragem é uma técnica especial, que garante, tanto quanto possível o
acaso da escolha da amostra.
Dessa forma, cada elemento da população passa a ter a mesma chance de ser
escolhido, o que garante à amostra caráter de representatividade.
Amostragem casual ou aleatória simples
8/18/2019 Apostila Estatistica-Prof. Fabio
8/63
6
Esse tipo de amostragem é equivalente a um sorteio lotérico.
Na prática, a amostragem casual ou aleatória simples pode ser realizada
enumerando-se a população de 1 a n e sorteando-se por meio de um dispositivo
aleatório qualquer, k números dessa seqüência, os quais corresponderão aoselementos pertencentes à amostra.
Amostragem proporcional estratificada
Muitas vezes a população se divide em subpopulações -- estratos.
Como é possível que a variável em estudo apresente, de estrato em estrato, um
comportamento heterogêneo e, dentro de cada estrato, um comportamento
homogêneo, convém que o sorteio dos elementos da amostra leve em consideração
tais estratos.
Amostragem sistemática
Quando os elementos da população já se acham ordenados, não há
necessidade de construir o sistema de referência. São exemplos os prontuários
médicos de um hospital, os prédios de uma rua, etc...
Nesses casos, a seleção dos elementos que constituirão a amostra pode ser
feita por um sistema imposto pelo pesquisador. A esse tipo de amostragem
denominamos sistemática.
1.4.1 Variáveis
Variável é convencionalmente, o conjunto de resultados possíveis de umfenômeno e cada fenômeno corresponde um número de resultados possíveis.
Alguns exemplos:
Para o fenômeno “sexo”, são dois o resultados possíveis: sexo masculino e sexo
feminino;
Para o fenômeno “número de filhos” há um número de resultados possíveis
expresso através dos números naturais: 0, 1, 2, 3, ..., n.
8/18/2019 Apostila Estatistica-Prof. Fabio
9/63
7
Uma variável pode ser:
Qualitativa são as características que não possuem valores quantitativos, mas,
ao contrário, são definidas por várias categorias, ou seja, representam uma
classificação dos indivíduos.
Nominal quando seus valores são expressos por atributos: sexo, cor
da pele, etc.
Ordinal existe uma ordenação entre as categorias. Ex: escolaridade
(1º, 2º, 3º graus), estágio da obra (inicial, intermediário, terminal), mês de
observação (janeiro, fevereiro...).
Quantitativas – são as características que podem ser medidas em uma escala
quantitativa, ou seja, apresentam valores numéricos.
Contínua características mensuráveis que assumem valores em uma
escala contínua (na reta real), para as quais valores fracionais.
Usualmente devem ser medidas através de algum instrumento.
Exemplos: peso (balança), altura (régua), tempo (relógio), pressãoarterial, idade
Discreta características mensuráveis que podem assumir apenas um
número finito ou infinito contável de valores e, assim, somente valores
inteiros. Geralmente é o resultado de contagens. Exemplos: número de
filhos, número de pilares, vigas, número de cigarros fumados por dia.
De modo geral, as medições dão origem a variáveis contínuas e as contagens
ou enumerações dão origem a variáveis discretas.
2 Tabelas
Um dos objetivos da Estatística é sintetizar os valores que uma ou mais
variáveis podem assumir, para que tenhamos uma visão global da variação dessa ou
dessas variáveis.
Tabela é um quadro que resume um conjunto de observações.
8/18/2019 Apostila Estatistica-Prof. Fabio
10/63
8
2.1 Séries estatísticas
Denominamos série estatística toda tabela que apresenta a distribuição de um
conjunto de dados estatísticos em função da época, do local ou da espécie.
Daí, podemos inferir que numa série estatística observamos a existência de três
elementos ou fatores: o tempo, o espaço e a espécie.
2.1.1 Séries históricas, cronológicas, temporais ou marchas
Descrevem os valores da variável, em determinado local, discriminados segundointervalos de tempo variáveis. Exemplo:
2.1.2 Séries geográficas, espaciais, territoriais ou de localização
Descrevem os valores da variável, em determinado instante, discriminados
segundo regiões. Exemplo:
8/18/2019 Apostila Estatistica-Prof. Fabio
11/63
9
2.1.3 Séries específicas ou categóricas
Descrevem os valores da variável, em determinado tempo e local, discriminados
segundo especificações ou categorias. Exemplo:
2.1.4 Séries conjugadas – Tabela de dupla entrada
Muitas vezes temos necessidade de apresentar em uma única tabela, a variação
de valores de mais de uma variável, isto é, fazer uma conjugação de duas ou mais
séries.
8/18/2019 Apostila Estatistica-Prof. Fabio
12/63
10
Conjugando duas séries em uma única tabela, obtemos uma tabela de dupla
entrada. Em uma tabela desse tipo ficam criadas duas ordens de classificação: uma
horizontal (linha) e uma vertical (coluna). Exemplo:
2.1.5 Distribuição de freqüência
Por se tratar de um conceito estatístico de suma importância, merecerá um
tratamento especial. Exemplo:
8/18/2019 Apostila Estatistica-Prof. Fabio
13/63
11
3 Distribuição de freqüência
Quando da análise de dados, é comum procurar conferir certa ordem aos
números tornando-os visualmente mais amigáveis. O procedimento mais comum é o dedivisão por classes ou categorias, verificando-se o número de indivíduos pertencentes
a cada classe. É um tipo de tabela que condensa uma coleção de dados conforme as
freqüências (repetições de seus valores).
3.1 Tabela primitiva ou dados brutos
É uma tabela ou relação de elementos que não foram numericamenteorganizados. É difícil formarmos uma idéia exata do comportamento do grupo como umtodo, a partir de dados não ordenados.
Ex : 45, 41, 42, 41, 42 43, 44, 41 ,50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60, 51
3.2 ROL
É a tabela obtida após a ordenação dos dados (crescente ou decrescente).
Ex : 41, 41, 41, 42, 42 43, 44, 45 ,46, 46, 50, 50, 51, 52, 54, 57, 58, 58, 60, 60
3.3 Distribuição de freqüência sem intervalo de classes
É a simples condensação dos dados conforme as repetições de seus valores.Para um ROL de tamanho razoável esta distribuição de freqüência é inconveniente, jáque exige muito espaço. Veja exemplo abaixo:
Ex1. Um dado foi lançado 15 vezes, obtendo-se os seguintes pontos: 2, 5, 6, 6,1, 4, 2, 6, 5, 1, 3, 3, 2, 4, 6. Construa uma tabela de distribuição de freqüências
absolutas, acumuladas e relativas.
Dados(xi)
Frequênciaabsoluta
(f i)
Freq. absolutaacumulada
(f ac)
Freq. Relativa(f r )%
Freq. Relativaacumulada
(f r ac)%1 2 2 13,33% 13,33% 2 3 5 20,00% 33,33% 3 2 7 13,33% 46,66% 4 2 9 13,33% 59,99% 5 2 11 13,33% 73,32% 6 4 15 26,68% 100%
Total 15 100%
8/18/2019 Apostila Estatistica-Prof. Fabio
14/63
12
Frequência absoluta Número de vezes que a variável xi se repete
Frequência absoluta acumulada É a frequência atual somada às frequências
anteriores
Frequência Relativa É a relação entre a frequência absoluta e o numero de
elementos da população estatística. f r = Ex2. Um condomínio possui 25 apartamentos, sendo que esses apartamentos
possuem áreas (m2) diferentes. Seguem os valores das áreas dos apartamentos: 50,
65, 59, 62, 68, 72, 53, 60, 59, 65, 70, 75, 50, 53, 60, 70, 50, 50, 59, 53, 65, 68, 50, 53,75. Construa uma tabela de distribuição de freqüências absolutas, acumuladas erelativas.
xi f i f ac f r f r % f r ac f r ac%50 5 5 0,20 20% 0,20 20% 53 4 9 0,16 16% 0,36 36% 59 3 12 0,12 12% 0,48 48% 60 2 14 0,08 8% 0,56 56%
62 1 15 0,04 4% 0,60 60% 65 3 18 0,12 12% 0,72 72% 68 2 20 0,08 8% 0,80 80% 70 2 22 0,08 8% 0,88 88% 72 1 23 0,04 4% 0,92 92% 75 2 25 0,08 8% 1,00 100%
Total 25 1,00 100%
3.4 Distribuição de freqüência com intervalo de classes
Quando o tamanho da amostra é elevado, é mais racional efetuar oagrupamento dos valores em vários intervalos de classe.
Ex3. O tempo de cura em minutos de um determinado cimento foi de 45, 41, 42,41, 42 43, 44, 41, 50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60, 51, construa a tabela dedistribuição de frequências.
8/18/2019 Apostila Estatistica-Prof. Fabio
15/63
8/18/2019 Apostila Estatistica-Prof. Fabio
16/63
14
Amplitude do intervalo de classe: é obtida através da diferença entre o limitesuperior e inferior da classe e é simbolizada por hi = Li - li. Ex: na tabelaanterior hi = 53 - 49 = 4. Obs: Na distribuição de freqüências c/ classe o hipoderá ser igual em todas as classes.
Amplitude total da distribuição: é a diferença entre o limite superior da últimaclasse e o limite inferior da primeira classe. AT = L(max) - l(min). Ex: na tabelaanterior AT = 61 - 41= 20.
Amplitude total da amostra (rol): é a diferença entre o valor máximo e o valormínimo da amostra (ROL). Onde AA = Xmax - Xmin. Em nosso exemplo AA =
60 - 41 = 19.
Obs: AT sempre será maior que AA.
Ponto médio de classe ( i ): é o ponto que divide o intervalo de classe emduas partes iguais.
Ex: em 49 |------- 53 o ponto médio x3 = (53+49)/2 = 51, ou seja x3=( l3 + L3 )/2.
3.4.1.1 Etap as : Dis tr ib uição de Freq üências c/ cl ass e
1º - Organize os dados brutos em um ROL.
2º - Calcule a amplitude amostral AA No nosso exemplo: AA = 60 - 41 = 19
3º - Calcule o número de classes através da "Regra de Sturges" K 1 +3,3*log n. Onde K é o número de classes e n o número total de dados, ou pelo Critério
da Raiz K = √ n Obs: Qualquer regra para determinação do nº de classes da tabela não noslevam a uma decisão final; esta vai depender, na realidade, de um julgamento pessoal,que deve estar ligado à natureza dos dados.
No nosso exemplo: n = 20 dados, então a regra sugere a adoção de 5 classes.
4º - Decidido o nº de classes, calcule então a amplitude do intervalo declasse h > AA / k. No nosso exemplo: AA/k = 19/5 = 3,8 . Obs: Como h > AA/k um valorligeiramente superior para haver folga na última classe. Utilizaremos então h = 4
8/18/2019 Apostila Estatistica-Prof. Fabio
17/63
15
5º - Temos então o menor nº da amostra, o nº de classes e a amplitude dointervalo. Podemos montar a tabela, com o cuidado para não aparecer classes comfreqüência = 0 (zero).
No nosso exemplo: o menor nº da amostra = 41 + h = 45, logo a primeira classe
será representada por
41 |------- 45. As classes seguintes respeitarão o mesmo procedimento.
A classe seguinte sempre terá como primeiro elemento o limite superior daclasse anterior.
Ex4. Utilizando os dados do exercício 3 (45, 41, 42, 41, 42 43, 44, 41, 50, 46, 50,46, 60, 54, 52, 58, 57, 58, 60, 51) Construa a tabela de distribuição de frequências comintervalo de classes.
Tempo de cura do cimento X
Classes xi fi fac fr fr% frac frac%
41ǀ---45 43 7 7 0,35 35 0,35 35
45ǀ---49 47 3 10 0,15 15 0,5 50
49ǀ---53 51 4 14 0,2 20 0,7 70
53ǀ---57 55 1 15 0,05 5 0,75 75
57ǀ---61 59 5 20 0,25 25 1 100
3.5 Gráficos
Os principais gráficos utilizados na representação de distribuição de freqüências
são:
histograma e polígono de freqüência;
ogiva ou polígono de freqüência acumulada.
3.5.1 Histogramas
É um conjunto de retângulos com bases sobre um eixo dividido de acordo com
os tamanhos de classe, centro nos pontos médio das classes e áreas proporcionais às
freqüências.
Utilizando os dados do obtidos no EX4 montamos o histograma abaixo.
8/18/2019 Apostila Estatistica-Prof. Fabio
18/63
8/18/2019 Apostila Estatistica-Prof. Fabio
19/63
17
3.5.3 Polígonos de freqüência acumulada ou ogivas
É o gráfico representativo de uma distribuição acumulada de freqüências. É umapoligonal ascendente. No eixo horizontal colocam-se as extremidades de classe e no
eixo vertical as freqüências acumuladas.
Note que a freqüência acumulada relacionada com o limite inferior da primeiraclasse é sempre zero.
Ao contrário do polígono de freqüência, a ogiva de freqüências acumuladasutiliza os pontos extremos
Utilizando os dados do obtidos no EX4 montamos o polígono de freqüência
acumulada.
0
5
10
15
20
25
39 41 43 45 47 49 51 53 55 57 59 61 63
Frequência
Tempo de cura (min)
Tempo de cura do cimento X
8/18/2019 Apostila Estatistica-Prof. Fabio
20/63
18
4 Medidas posição
São as estatísticas que representam uma série de dados orientando-nos quanto
à posição da distribuição em relação ao eixo horizontal do gráfico da curva defreqüência. As medidas de posição mais importantes são:
Medidas de tendência central
Verifica-se uma tendência dos dados observados a se agruparem em torno dos
valores centrais.
As medidas de tendência central mais utilizadas são: média aritmética, moda e
mediana. Outros menos usados são as médias: geométrica, harmônica, quadrática,
cúbica e biquadrática.
Separatrizes
Que englobam: a própria mediana, os decis, os quartis e os percentis.
4.1 Medidas de tendência central para dados não agrupados
4.1.1 Média Aritmética Simples
A média aritmética simples ( x ) dos valores x1, x2, x3,....xn é o quociente entre a
soma desses valores e o seu número total (N):
x = N
xn
i
i1 ou seja: x =
N x x x n...21
Ex5: Uma loja de materiais de construção vendeu as seguintes quantidades de
caixas de pisos durante certa semana. Calcule a média dessas vendas
2ª. feira 3ª. feira 4ª. feira 5ª. feira 6ª. feira sábado22 23 22 27 25 13
x =6
132527222322 x =
6
132 x = 22
8/18/2019 Apostila Estatistica-Prof. Fabio
21/63
19
4.1.2 Moda
Moda de um conjunto de valores é o valor que aparece o maior número de
vezes, ou seja a característica com maior freqüência absoluta.
Na seqüência anterior 28, 37, 37, 37, 40,41, 41,43, 44, 45 a moda será o número
37.
4.1.3 Mediana
É o valor que ocupa a posição central de um conjunto de valores, colocados em
ordem crescente ou decrescente de grandeza. Devemos, portanto, considerar duassituações: o número de valores é par ou, o número de valores é impar.
O número de dados é impar
Md = xp onde p n 1
2 (p = posição) ou
EX7. As nove classes de 1º Ano de engenharia têm respectivamente: 37, 28,
40,41,45,37,37, 41 e 44 alunos. Calcule a mediana.
p n 1
2 p
2
19 = 5
Portanto a mediana ocupará a 5ª posição = 40.
28, 37, 37, 37, 40, 41, 41, 44, 45
O número de dados é par
Mx x
d
p p 1
2 onde p
n
2.
Neste caso a mediana é a Média Aritmética dos dois termos centrais.
8/18/2019 Apostila Estatistica-Prof. Fabio
22/63
20
Ex8. As dez classes de 1º. Ano de engenharia têm respectivamente: 37, 28,
40,41,45,37,37, 41, 43 e 44 alunos. Calcule a mediana.
Ordenando aos dados temos: 28, 37, 37, 37, 40, 41, 41,43, 44, 45
p n
2 = 10/2 = 5
Md= 2
)( 155 x x
2
4140Md
Md= 40,5
4.2 Medidas de tendência central para dados agrupados
4.2.1 Média Aritmética Ponderada
4.2.1.1 Sem intervalo de classes
A média aritmética Ponderada difere da Média Aritmética Simples, pois algunsdos valores x1, x2, x3,..., xn se repetem como podemos ver no exemplo abaixo.
EX6. A Tabela abaixo representa o número de falhas em um determinado
processo em uma indústria química.
xi f i0 2
1 6
2 10
3 12
4 4
∑ 34
3,23478.
iii
f f x x
4.2.1.2 Com intervalo de classes
Neste caso, convencionamos que todos os valores incluídos em um determinado
intervalo de classe coincidem com o seu ponto médio ( i x ), e determinamos a médiaaritmética ponderada por meio da fórmula:
8/18/2019 Apostila Estatistica-Prof. Fabio
23/63
21
i
ii
f
f x .
ou seja
n
nn
f f f
f x f x f x x
...
....
21
221.1
Ex7. O quadro de distribuição de freqüências representa os salários mensais de
40 empregados de uma firma. Calcule o salário médio mensal desses empregados.
Classe em ReaisX10
Ponto Médio da classe( i x )
Freq.(f i)
[180,200[ 190 4[200,220[ 210 18[220,240[ 230 10
[240,260[ 250 5[260,280[ 270 3
40
810175023003780760 x
40
8900 x x = 222,50 x = 222,50 x 10 = R$2.225,00
Ex8. Calcular a altura média de uma série de pilares de uma obra, conforme atabela abaixo.
Altura (cm) - xi Freqüência - f i Ponto médio i xi . f i
50 |------------ 54 4 52 20854 |------------ 58 9 56 50458 |------------ 62 11 60 66062 |------------ 66 8 64 51266 |------------ 70 5 68 34070 |------------ 74 3 72 216
Total 40 2.440
Aplicando a fórmula acima temos: 2.440 / 40.= 61, logo... = 61 cm
3510184
270.3250.5230.10210.18190.4
x
8/18/2019 Apostila Estatistica-Prof. Fabio
24/63
22
4.2.2 Moda
4.2.2.1 Sem intervalo de classes
Neste caso basto fixar o valor da variável de maior frequência
Temperaturas °C xi f i0 3
1 9
2 12
3 6
4 5
∑ 34
2° C é temperatura modal, pois é a de maior frequência.
4.2.2.2 Com intervalo de classes
Neste caso o modo mais simples é achar a classe modal e calcular o pontomédio dessa classe.
Classe f i54 |------------ 58 958 |------------ 62 11
62 |------------ 66 866 |------------ 70 5
Total 33
A classe Modal é 58 |------------ 62, pois é a classe de maior frequência, e o ponto
médio dessa classe é (58+62)/2 60Há também um método mais elaborado no qual utiliza a seguinte formula:
= + 2 ∗ + ∗ ℎ = 58 + 1 1 92 ∗ 1 1 9 + 8 ∗ 4 = 5 9 , 6
8/18/2019 Apostila Estatistica-Prof. Fabio
25/63
23
4.2.3 Mediana
4.2.3.1 Sem intervalo de classes
Impar
Temperaturas °C xi f i f ac0 2 2
1 6 8
2 9 17
3 13 30
4 5 35
∑ 35
2
1
n pimpar n
=(35+1)/2 18° termo equivale a 3°
Par
Temperaturas °C xi f i f ac0 2 2
1 6 8
2 9 17
3 13 30
4 4 34∑ 34
2
1 p p
d
x x M
p
n
2 Md=
2
)( 11717 x x
Nesse caso então serão a média entre os valores da posição 17° e 18°, 2 e 3
respectivamente 5,22
32
4.2.3.2 Com intervalo de classes
Nesse caso devemos seguir os seguintes passos:
1º) Determinamos as freqüências acumuladas;
2º) Calculamos ∑f i/2 ;
3º) Marcamos a classe correspondente à freqüência acumulada imediatamente
superior à ∑f i/2 . Tal classe será a classe mediana;
4º) Calculamos a Mediana pela seguinte fórmula:
8/18/2019 Apostila Estatistica-Prof. Fabio
26/63
24
M d = li + [∑ f i2 Fant] ∗ hf i
onde: li é o limite inferior da classe mediana.
F(ant) é a freqüência acumulada da classe anterior a classe mediana
h é a amplitude do intervalo da classe mediana
f i é a freqüência do intervalo da classe mediana
classes freqüência = fi Freqüência acumulada 50 |------------ 54 4 4 54 |------------ 58 9 13 58 |------------ 62 11 24
62 |------------ 66 8 32 66 |------------ 70 5 37 70 |------------ 74 3 40 total 40
∑ = = 20, logo.a classe mediana será 58 |------ 62.li = 58 ; F(ant) =13 ; f i = 11 e h = 4 , Substituindo esses valores na fórmula, obtemos:
M d = 5 8 + 20 13 ∗ 411 =60,54 No caso de
∑ = f i acontecer, a mediana será o limite superior da classe correspondente EX9. Calcule a mediana
8
18
29
45
58
63
64
8/18/2019 Apostila Estatistica-Prof. Fabio
27/63
25
∑ = = 32, logo.a classe mediana será 750 |------ 850.li = 750 ; F(ant) =29 ; f i = 16 e h = 100 , Substituindo esses valores na fórmula, obtemos:
M d = 7 5 0 + 32 29 ∗10016 =768,75 No caso de
∑ = f i acontecer, a mediana será o limite superior da classe correspondente
4.3 Relação entre a média, a mediana e a moda
Para os dados agrupados representados por uma curva de freqüência, as
diferenças entre os valores da média, da mediana e da moda são indicadores da forma
da curva em termos de assimetria. Para uma distribuição unimodal simétrica, a média,
a mediana e a moda são, todas, coincidentes em valor Para uma distribuição
positivamente assimétrica, a média apresenta o valor mais elevado, enquanto a
mediana é maior do que a moda, mas menor do que a média. Para uma distribuição
negativamente assimétrica, a média apresenta o menor valor e a mediana se encontraabaixo da moda, mas acima da média.
Moda Média
Mediana
(a) Simétrica (b) Positivamenteassimétrica (c) Negativamente
assimétrica
8/18/2019 Apostila Estatistica-Prof. Fabio
28/63
26
4.4 Exercícios.
1) Calcular a média a moda e a mediana dos seguintes valores:27,27,30,30,30,30,30,32,32,32.
x = 30
Md=2
)( 155 x x 2
)( 155 x x =2
3030 = 30
Mo= 30
2) Calcular a média a moda e a mediana dos seguintes valores: 13,5; 13,5; 17,23;35,003; 45,72; 63,601; 37,13; 13,5; 52,13
x = 32,368
Md - Organizar os dados em ordem crescente
Md= xp onde p n 1
2 (p = posição) p=5 Md= 35,003; Mo= 13,500
Posição
(p)
Valores
(xi)
1 13,500
2 13,500
3 13,500
4 17,230
5 35,003
6 37,130
7 45,720
8 52,130
9 63,601
3) A tabela nos dá uma distribuição de freqüências. Calcule a média dessadistribuição. Resp. 22,9
xi f i xi* f i10 8 8020 11 22030 7 21040 5 200
Total 31 710
8/18/2019 Apostila Estatistica-Prof. Fabio
29/63
8/18/2019 Apostila Estatistica-Prof. Fabio
30/63
28
1° Calcular a amplitude total AA = 75-50= 25
2° Calcular o numero de classes K= 1+3,3*log25 = 5,6 5
3° Calcular a Amplitude do intervalo Ai = AA/k = 5
Obs confirmar se pode li+( Ai * K) ≥ Ls 50+25 ≥ 75 75 ≥ 75 OK.
4° Calcular os intervalos:
Classes x f i f ac f r f rac50 ǀ--- 55 52,50 9 9 0,36 0,36
55 ǀ--- 60 57,50 3 12 0,12 0,4860 ǀ--- 65 62,50 3 15 0,12 0,6065 ǀ--- 70 67,50 5 20 0,20 0,8070 ǀ--- 75 72,50 5 25 0,20 1,00
Total 25 1
5° Calculo da média = 1532,5/25 = 61,3
Classes x f i f ac x * f i
50 ǀ--- 55 52,50 9 9 472,5 55 ǀ--- 60 57,50 3 12 172,5
60 ǀ--- 65 62,50 3 15 187,5
65 ǀ--- 70 67,50 5 20 337,5
70 ǀ--- 75 72,50 5 25 362,5
Total 25 1532,5
6° Calculo da mediana
∑f i/2 20/2 = 10
Classe onde a f ac é imediatamente superior a ∑f i/2 essa será a classe damediana : 55 ǀ--- 60
Usando a formula : Md = li* + [( ∑f i /2 - Fant ) . h*] / f i*
Md= 55 + [( 10 – 9 ) * 5] / 3 = 56,66
8/18/2019 Apostila Estatistica-Prof. Fabio
31/63
8/18/2019 Apostila Estatistica-Prof. Fabio
32/63
30
4.5.1.2 Cálcu lo para dados agru pado s
O processo a ser empregado é o mesmo que para o cálculo da mediana,
bastando apenas no cálculo das posições (P) considerarem os denominadores, 4, 10 e
100, respectivamente, para os quartis, decis e percentis.
Q = li + [k ∗∑ f i4 Fant] ∗ hf i
D = li + [k ∗∑ f i10 Fant] ∗ h
f i
P = li + [k ∗ ∑ f i100 Fant]∗hf i Sendo k o número de ordem do quartil, do decil ou do percentil
EX12. Calcular os quartis na seguinte série estatística
8/18/2019 Apostila Estatistica-Prof. Fabio
33/63
31
EX13. Calcular os quartis na seguinte série estatística
EX13. Calcular o oitavo percentil na seguinte série estatística abaixo.
P = li + [k ∗∑ f i100 Fant]∗hf i
K=8
8 ∗
=3,2, logo a classe do percentil será 1°.
li=150; F(ant) = 0; h=4; f i=4
P = 1 5 0 + 3,20 ∗ 44 =150+3,4=153,2
8/18/2019 Apostila Estatistica-Prof. Fabio
34/63
32
5 Mediadas de dispersão ou de variabilidade
Visam descrever os dados no sentido de informar o grau de dispersão ou
afastamento dos valores observados em torno de um valor central (média). Informa seum conjunto de dados é homogêneo (pouca variabilidade) ou heterogêneo (muita
variabilidade).
Medidas de dispersão então medem o afastamento dos valores observados em
relação a uma medida de tendência central (normalmente em relação a média
aritmética).
Ex 14. Desejamos compara o desempenho de dois grupos, com base em um testeem uma prova do MEC:
Grupo A { 70; 71; 69; 70; 70 }
Grupo B { 55; 80; 70; 62; 83 }
Calculando a média para cada um dos grupos vamos obter a=70 e b=70Baseado nestes resultados, diríamos que ambos os grupos apresentam a mesma
performance. Mas, observando mais detalhadamente os dados, notamos que as notas
do grupo A variam apenas de 69 a 71, ao passo que as de B variam de 55 a 83, o que
revela que o desempenho de A é bem mais uniforme que o de B.
Para avalia quantitativamente o grau de variabilidade ou dispersão de um grupo de
valores utilizamos então as medidas de dispersão, onde as principais medidas são: a
amplitude total, a variância, o desvio padrão e o coeficiente de variação de Pearson.
5.1 Amplitude Total
É a diferença entre o maior e o menor valor observado
Sem Intervalo Com intervalo de classes
AT = Xmax – Xmin AT = L(Máx) – l(Mín)
Quanto maior for à amplitude, maior será dispersão ou variabilidade dos valores
da variável
8/18/2019 Apostila Estatistica-Prof. Fabio
35/63
33
5.2 Variância e desvio padrão
A variância e o desvio padrão são medidas que levam em consideração a
totalidade dos valores da variável em estudo, o que faz delas índices de variabilidade
bastante estáveis e, por isso mesmo, os mais geralmente utilizados.
A variância baseia-se nos desvios em torno da média aritmética, porém
determinado a média aritmética dos quadrados dos desvios, representamos a variância
por s2.
O desvio padrão é o valor positivo da raiz quadrada da variância absoluta. É
uma medida estatística que representa, em média, os afastamentos, em valores
absolutos, dos elementos observados em relação a respectiva média aritmética. É uma
medida estatística que é dada na unidade da medida utilizada:
= ∑ ̅
Em geral a média aritmética (x) é um numero fracionário o que torna pouco
prático o calculo das quantidades de ̅ .Podemos simplificar os cálculos fazendo a seguinte igualdade:
̅ =
Substituindo na formula do desvio padrão temos:
= ∑ ∑
= ∑ ̅ ∑ = ∑ ̅
8/18/2019 Apostila Estatistica-Prof. Fabio
36/63
34
5.2.1 Dados não agrupados
EX 15.
EX16.
EX17. Com os seguintes valores 8; 10; 11; 15; 16; 18, calcule o desvio padrão:
(Xi) (Xi)2
8 64
10 100
11 121
15 225
16 256
18 324
∑= 78 ∑=1090
= ∑ ∑ → = ∑ 10906 (786 )
= 12,66 → =3,56
8/18/2019 Apostila Estatistica-Prof. Fabio
37/63
35
5.2.2 Dados agrupados sem intervalo de classes
= ∑ ∗
∑ ∑ ∗ ∑
= ∑ ̅
∑
EX18.
xi f i xi*f i (xi – ) f i(xi – )20 2 0 0 – 2,1 = – 2,1 2*4,41= 8,82
1 6 6 1 – 2,1 = – 1,1 6*1,21= 7,262 12 24 2 – 2,1 = – 0,1 12*0,01= 0,123 7 21 3 – 2,1= 0,9 7*0,81=5,674 3 12 4 – 2,1 = 1,9 3*3,61=10,83
∑= 30 ∑= 63 ∑= 32,70
5.2.3 Dados agrupados com intervalo de classes
EX19.
Altura (cm) - xi f i ̅ xi*f i (xi – ̅) f i(xi – ̅)2 150 |------ 154 4 152 608 152-161 = - 9 4*81154 |------ 158 9 156 1404 -5 9*25158 |------ 162 11 160 1760 -1 11*1162 |------ 166 8 164 1312 3 8*9166 |------ 170 5 168 840 7 5*49170 |------ 174 3 172 516 11 3*121
Total 40 6.440 1240
= 16530 (
6330)
= 1,09 =1,044
= ∑ ̅
∑
= 32,7030 =1,044
= ∑ ̅ ̅ ∑ = 124040 = 5 , 5 7 cm
8/18/2019 Apostila Estatistica-Prof. Fabio
38/63
36
5.3 Coeficiente de variação
O desvio padrão por si só não nos diz muita coisa. Assim, um desvio padrão de
duas unidades pode ser considerado pequeno para uma série de valores cujo valormédio é 200; no entanto, se a média for igual a 20, o mesmo não pode ser dito. Além
disso, o fato de o desvio padrão ser expresso na mesma unidade dos dados limita o
seu emprego quando desejamos comparar duas ou mais séries de valores,
relativamente à sua dispersão ou variabilidade, quando expressas em unidades
diferentes. Para contornar essas dificuldades e limitações, podemos caracterizar a
dispersão ou variabilidade dos dados em termos relativos a seu valor médio, medida
essa denominada coeficiente de variação (CV):
= ̅ EX.20 Tomemos os resultados das medidas das estaturas e dos pesos de um mesmo
grupo de indivíduos:
Temos:
= 5175 ∗100=2,85% = 268 ∗100=2,94%
Logo, nesse grupo de indivíduos, os pesos apresentam maior grau de dispersão
que as estaturas.
Ex.21 Para os dados abaixo calcule a variância e o desvio padrão
a) 1,3,5,9
b) 17,9; 22,5; 13,3; 16,8; 15,4; 14,2
c) 26, 14, 15, 19, 21, 22, 20
d) -10, -6, 2, 3, 7, 9, 10
R: a) 2,96; b) 3,016; c) 2,81; d) 7,04
8/18/2019 Apostila Estatistica-Prof. Fabio
39/63
37
Ex.22 Calcule o desvio padrão das distribuições abaixo:
(R: a) 1,51; b) 0,159)
EX.23 Dada a distribuição relativa a 100 lançamentos de 5 moedas simultaneamente
calcule o desvio padrão:
(R:
1,13)
EX.24 Calcule o desvio padrão da distribuição:
(R: 4,5)
EX.25 Calcule o desvio padrão das distribuições de freqüência abaixo:
(R: a) 2,43; b) 8,8 cm; c) R$ 229; d) 9,93 kg).
8/18/2019 Apostila Estatistica-Prof. Fabio
40/63
38
EX26. Sabendo que um conjunto de dados apresenta para média aritmética e para
desvio padrão, respectivamente, 18,3 e 1,47, calcule o coeficiente de variação.
(R:8,02%).
EX27. Em uma obra A, foram inspecionadas 150 barras de ferro e média foi 7,8 cm e o
desvio padrão, 0,80 cm. Em outra obra B, entretanto, a média foi de 7,3 cm e o desvio
padrão, 0,76. Em qual obra houve uma maior a dispersão?
(R: Obra B)
EX28. Medidas as estaturas de 1.017 indivíduos, obtivemos x = 162,2 cm e s = 8,01
cm. O peso médio desses mesmos indivíduos é 52 kg, com um desvio padrão de 2,3
kg. Esses indivíduos apresentam maior variabilidade em estatura ou em peso?
(R:estatura)
8/18/2019 Apostila Estatistica-Prof. Fabio
41/63
39
6 Correlação e Regressão
Nos métodos estatísticos precedentes consideramos sempre a existência de uma
única variável de interesse, porém vários problemas no trabalho estatístico, todavia,envolvem muitas variáveis. Veremos agora dois métodos estatísticos para lidar com
este tipo de problema. Faremos nosso estudo com o caso mais simples em que temos
apenas duas variáveis de interesse.
6.1 Correlação linear entre duas variáveis
Avaliar se existe associação entre duas características quantitativas é objetivo de
muitos estudos em diversas áreas. Um ecologista pode estar interessado em saber, por
exemplo, se há associação entre a quantidade de chumbo medida na água e o volume
de dejetos despejados em determinado rio; um médico pode querer avaliar se a
pressão arterial está relacionada à idade das pessoas. Quando se pode demonstrar
que existe associação entre duas variáveis quantitativas, isto é, quando se constata
que elas variam juntas, diz-se que as variáveis estão correlacionadas.
Ex29. Consideremos uma amostra aleatória, formada por dez dos 98 alunos de
uma classe da faculdade A e pelas notas obtidas por eles em Matemática e Estatística:
Representando, em um sistema coordenado cartesiano ortogonal, os pares
ordenados (x, y), obtemos uma nuvem de pontos que denominamos diagrama de
8/18/2019 Apostila Estatistica-Prof. Fabio
42/63
40
dispersão. Esse diagrama nos fornece uma idéia grosseira, porém útil, da correlação
existente:
Os pontos obtidos, vistos em conjunto, formam uma elipse em diagonal. Podemos
imaginar que, quanto mais fina for a elipse, mais ela se aproximará de uma reta.
Dizemos, então, que a correlação de forma elíptica tem como "imagem" uma reta,
sendo, por isso, denominada correlação linear. É possível verificar que a cada
correlação está associada como "imagem" uma relação funcional. Por esse motivo, as
relações funcionais são chamadas relações perfeitas.
Como a correlação em estudo tem como "imagem" uma reta ascendente, ela é
chamada correlação linear positiva.
Assim, uma correlação é:
a. linear positiva se os pontos do diagrama têm como "imagem" uma reta
ascendente;b. linear negativa se os pontos têm como "imagem" uma reta descendente;
8/18/2019 Apostila Estatistica-Prof. Fabio
43/63
41
c. não-linear se os pontos têm como "imagem" uma curva .
Se os pontos apresentam-se dispersos, não oferecendo uma "imagem" definida,
concluímos que não há relação alguma entre as variáveis em estudo .
Temos, então:
6.1.1 Coeficiente de correlação linear
O instrumento empregado para a medida da correlação linear é o coeficiente de
correlação. Esse coeficiente deve indicar o grau de intensidade da correlação entre
duas variáveis e, ainda, o sentido dessa correlação (positivo ou negativo).
Faremos uso do coeficiente de correlação de Pearson, que é dado por:
= ∗ ∑ ∑ ∗ ∑ ∗ ∑ ∑ ∗ ∗ ∑ ∑
Onde n é o número de observações. Os valores limites de r são -1 e + 1, isto é, o
valor de r pertence ao intervalo [-1, +1].
Assim:
se r = + 1, há uma correlação perfeita e positiva entre as variáveis;
se r = -1, há uma correlação perfeita e negativa entre as variáveis;
se r = 0, ou não há correlação entre as variáveis, ou a relação que porventura
exista não é linear.
8/18/2019 Apostila Estatistica-Prof. Fabio
44/63
42
Para podermos tirar algumas conclusões significativas sobre o comportamento
simultâneo das variáveis analisadas, é necessário que:
0,6 ≤ I r I ≤ 1
Se 0,3 ≤ I r I ≤ 0,6, há uma correlação relativamente fraca entre as variáveis.
Se 0 < I r I < 0,3, a correlação é muito fraca e, praticamente, nada podemos
concluir sobre a relação entre as variáveis em estudo.
EX29. Vamos, então, calcular o coeficiente de correlação relativo à tabela dada.O
modo mais prático para obtermos r é abrir, na tabela, colunas correspondentes aos
valores de x.y., x2 e y2. Assim:
Resultado que indica uma correlação linear positiva altamente significativa entre as
duas variáveis.
8/18/2019 Apostila Estatistica-Prof. Fabio
45/63
43
Ex 30. Calcule o coeficiente de correlação para os valores das variáveis X i e Yi
abaixo:
A correlação linear entre as variáveis X e Y é positiva, porém fraca.
EX31. Um grupo de pesquisadores fez uma avaliação do peso aparente de alguns
objetos. Com o peso real e a média dos pesos aparentes, dados pelo grupo, obteve-se
a tabela:
Com os dados apresentados calcule o índice de correlação:
Xi Yi Xi*Yi Xi2 Yi2
18 10 180 324 100
30 23 690 900 529
42 33 1386 1764 1089
62 60 3720 3844 3600
73 91 6643 5329 8281
97 98 9506 9409 9604120 159 19080 14400 25281
442 474 41205 35970 48484
Xi Yi Xi*Yi Xi2 Yi2
4 12 48 16 144
6 10 60 36 100
8 8 64 64 64
10 12 120 100 144
12 14 168 144 196
40 56 460 360 648
= ∗ ∑ ∑ ∗ ∑ ∗ ∑ ∑ ∗ ∗ ∑ ∑
= 5 ∗ 4 6 0 4 0 ∗ 5 6 5 ∗ 3 6 0 40 ∗ 5 ∗ 6 4 8 56 =0,416
= 7∗41205442∗474 7∗35970 442 ∗ 7∗48484 474 =0,981
8/18/2019 Apostila Estatistica-Prof. Fabio
46/63
44
6.2 Regressão Linear
Sempre que desejamos estudar determinada variável em função de outra,
fazemos uma análise de regressão.
Podemos dizer que a análise de regressão tem por objetivo descrever, através de
um modelo matemático, a relação entre duas variáveis, partindo de n observações das
mesmas.
A variável sobre a qual desejamos fazer uma estimativa recebe o nome de
variável dependente e a outra recebe o nome de variável independente.
Assim, supondo X a variável independente e Y a dependente, vamos procurar
determinar o ajustamento de uma reta à relação entre essas variáveis, ou seja, vamos
obter uma função definida por:
Y = aX + b
Onde os parametros a e b podem ser obtidos pelas formula:
= ∑ ∑ ∑ ∑ ∑
= ̅ → = ∑ ∑ Exemplo: Dada a tabela abaixo:
= 1 0 ∗ 4 7 3 6 5 ∗ 6 510∗ 481 65 =0,8632 = 650,8632∗6510 =0,8893 =0,86+0,89
8/18/2019 Apostila Estatistica-Prof. Fabio
47/63
8/18/2019 Apostila Estatistica-Prof. Fabio
48/63
46
Xi Yi Xi*Yi Xi2 Yi2
0 34 0 0 11561 36 36 1 12962 36 72 4 1296
3 38 114 9 14444 41 164 16 16815 42 210 25 17646 43 258 36 1849
7 44 308 49 19368 46 368 64 2116
36 360 1530 204 14538
c) = 1 , 5 + 3 4 = 1 , 5 ∗ 9 + 3 4 = 4 7 , 5 =1,5∗1989+2936=47,5
a)
= 9 ∗ 1 5 3 0 3 6 ∗ 3 6 0 9 ∗ 2 0 4 36 ∗ 9∗14538 360
=0,989 b) = 9∗ 1530 36∗ 3609 ∗ 2 0 4 36 =1,5 = 3601,5∗369 = 34 = + → = 1 , 5 + 3 4
8/18/2019 Apostila Estatistica-Prof. Fabio
49/63
47
7 Analise combinatória
7.1 Fatorial
Seja n um número natural, tal que n2. Denomina-se fatorial de n e representado
por n! o produto de todos os números naturais de n a 1, ou seja:
Para n N e n 2,
12)...2)(1(! nnnn
Para n=1 e n=0 define-se n!=1, isto é
1!=1 e 0!=1
Na utilização da calculadora podemos observar a existência de uma tecla n!,
para a realização do cálculo fatorial. Vamos analisar alguns exemplos:
a) 12012345!5
b)40320!567812345678!8
c) 8006283!8910!10
Em probabilidade, muitas vezes devemos calcular expressões como !!, e paracalculá-la devemos recorrer a seguinte simplificação:
336678!5
!5678
!5
!8
De um modo geral, podemos escrever:
...)!2)(1()!1(! nnnnnn
8/18/2019 Apostila Estatistica-Prof. Fabio
50/63
48
7.2 Princípio fundamental da contagem – PFC
Suponhamos que uma ação seja constituída de duas etapas sucessivas. A
primeira etapa pode ser realizada de p maneiras distintas. Para cada uma dessas
possibilidades, a 2ª etapa pode ser realizada de q maneiras distintas. Então, o número
de possibilidades de se efetuar a ação completa é dado por p x q.
EX1. No Brasil as placas dos veículos são confeccionadas usando-se 3 letras do
alfabeto e 4 algarismos. Qual o número máximo de veículos que poderá ser licenciado?
Imaginemos a seguinte situação: Placa ACD – 2172.
Como o alfabeto possui 26 letras e nosso sistema numérico possui 10 algarismos
(de 0 a 9), podemos concluir que: para a 1ª posição, temos 26 alternativas, e como
pode haver repetição, para a 2ª, e 3ª também teremos 26 alternativas. Com relação
aos algarismos, concluímos facilmente que temos 10 alternativas para cada um dos 4
lugares, portanto:
26 . 26 . 26 . 10 . 10 . 10 . 10 = 175.760.000.
EX2. No sistema antigo utilizavam se 2 letras do alfabeto e 4 algarismos. Qual o
número máximo de veículos que podia ser licenciado neste sistema?
26 . 26 . 10 . 10 . 10 . 10 = 6.760.000.
Concluímos que a inclusão de apenas uma letra faz com que sejam licenciados,
aproximadamente, mais 170.000.000 de veículos.
EX3. Com os algarismos 1, 2, 3, 4, 5 e 6, quantos números de três algarismos
distintos podemos formar?1ª escolha do algarismo das centenas: são seis possibilidades.
2ª escolha do algarismo das dezenas: como não pode haver repetição de
algarismo, devemos ter um algarismo diferente do algarismo escolhido para a centena.
Assim, há cinco possibilidades.
3ª escolha do algarismo das unidades: devemos ter um algarismo diferente dos
dois algarismos escolhidos para a centena e para a dezena. Assim, há quatro
possibilidades.Pelo PFC, o resultado é: 6 x 5 x 4 = 120 números
8/18/2019 Apostila Estatistica-Prof. Fabio
51/63
49
EX4. Quantos números de três algarismos podemos formar com os algarismos 0,
1, 2, 3, 4, 5, 6 e 7 ?
Algarismo das centenas: com exceção do zero, qualquer um dos algarismos
dados pode ser escolhido, havendo, portanto, sete possibilidades.
Algarismo das dezenas e unidades não há restrição alguma
Logo, pelo PFC: 7 x 8 x 8 = 448.
7.3 Arranjos simples
Dado um conjunto com n elementos distintos, chama-se arranjo dos n elementos,
tomados k a k, a qualquer seqüência ordenada de k elementos distintos escolhidosentre os n existentes.
Ex5. Dado o conjunto A = (1, 2, 3, 4), vamos escrever todos os arranjos desses
quatro elementos tomados dois a dois. A4,2
(1, 2); (1, 3); (1, 4); (2, 1); (2, 3); (2, 4); (3, 1); (3, 2); (3, 4); (4, 1); (4, 2); (4, 3).
Notamos que (2, 3) ≠ (3, 2), isto é, a troca na ordem dos elementos de um
possível agrupamento gera um agrupamento diferente.
EX6. Um cofre possui um disco marcado com os dígitos 0,1,2,...,9. O segredo do
cofre é marcado por uma seqüência de 3 dígitos distintos. Se uma pessoa tentar abrir o
cofre, quantas tentativas deverá fazer (no máximo) para conseguir abri-lo?
As seqüências serão do tipo xyz. Para a primeira posição teremos 10 alternativas,
para a segunda, 9 e para a terceira, 8. Aplicando a fórmula de arranjos pelo PFC,
chegaremos ao mesmo resultado: 10.9.8 = 720. Observe que 720 = A10,3
7.3.1 Cálculo do número de arranjos
Seja um conjunto de n elementos distintos. Vamos encontrar uma expressão para
o número de arranjos dos n elementos tomados k a k (An,k).
, = ! !
8/18/2019 Apostila Estatistica-Prof. Fabio
52/63
50
EX7. O quadrangular de um torneio de futebol é disputado por quatro seleções. De
quantas maneiras distintas podemos ter os três primeiros colocados?
, = 4!4 3! = 24 EX8. Usando-se as 26 letras do alfabeto (A,B,C,D,...,Z), quantos arranjos distintos com
3 letras podem ser montados?
, = 26!2 6 3! =15600
EX9. A senha de um cartão de banco é formada por duas letras distintas seguidas por
uma seqüência de três algarismos distintos. Quantas senhas poderiam ser
confeccionadas?
1° As letras A26,2 = 650
2° Os Números A10,3 = 720
Pelo PFC A26,2 x A10,3 = 650 x 720 = 468.000.
7.4 Permutações simples
De outro modo, podemos entender permutação simples como um caso especial de
arranjo, onde n = k.
= ! EX10. Escrever todos os anagramas da palavra SOL. Um anagrama da palavra SOL é
qualquer permutação das letras S, O, L de modo que se forme uma palavra com ou
sem sentido: SOL, SLO, OSL, OLS, LOS, LSO.
8/18/2019 Apostila Estatistica-Prof. Fabio
53/63
51
7.4.1 Permutações com elementos repetidos
Se entre os n elementos de um conjunto, existem a elementos repetidos, b
elementos repetidos, c elementos repetidos e assim sucessivamente, o número total de
permutações que podemos formar é dado por:
,, ! ! ∗ ! ∗ ! EX11. Determine o número de anagramas da palavra MATEMÁTICA Temos 10
elementos, com repetições. A letra M está repetida duas vezes, a letra A três, a letra T,
duas vezes. Na fórmula anterior, teremos:
,, 10!2 ! ∗ 3 ! ∗ 2 ! =151200
7.5 Combinações simples
Dado um conjunto A com n elementos distintos, chama-se combinação dos n
elementos de A, tomados k a k, a qualquer subconjunto formado por k elementos, isto
é, temos uma combinação quando os agrupamentos conseguidos permanecem iguais
ao se inverter a posição dos seus elementos.
Perceba que se houver cinco pessoas entre as quais desejamos formar grupos de
três, o grupo formado por João, Pedro e Luís é o mesmo grupo formado por Luís,
Pedro e João. Temos, então, uma COMBINAÇÃO de cinco elementos em grupos de
três.
, !! !
8/18/2019 Apostila Estatistica-Prof. Fabio
54/63
52
EX12. Uma turma é formada por 10 alunos. Deseja-se formar uma comissão de
três alunos para representação discente na universidade. De quantas maneiras
podemos fazer tal escolha?
Neste caso tanto faz a posição dos três alunos no conjunto ( A, B, C); (B, A, C) ....
desde que os três sejam os escolhidos
Se fosse importante a ordem deles nos subconjunto usaríamos o Arranjo simples
, = 10!1 0 3! =720 Mas não nos importa a ordem então utilizaremos a combinação simples.
, 10!3! 1 0 3! =120 Ex13. Uma loja de materiais de construção oferece 15 tipos de pisos diferentes
a) De quantas maneiras se pode escolher três tipos desses pisos?
b) Suponha que certo comprador sempre opte por um piso tipo A. Como poderão
ser escolhidos os outros dois pisos?
a) Escolher os pisos {A, B, C} é o mesmo que escolher os Pisos {C, B, A}. Assim,
cada possível escolha é uma combinação dos 15 pisos tomados três a três
, 15!3! 1 5 3! =455 b) Como um dos pisos já foi definido, os outros dois serão escolhidos entre os 14
restantes.
, 14!3! 1 4 3! =364
8/18/2019 Apostila Estatistica-Prof. Fabio
55/63
53
7.6 Números Binomiais
Sejam n e p dois números naturais quaisquer e tais que n p. Denomina-se
número binomial, e indica-se por , o número assim definido: = !! !
Onde n,p N e n p, e devemos lembrar que n é o numerador e p é a classe do
número binomial
, e lê-se: binomial n classe p.
Vamos calcular o seguinte exemplo, aplicando-se a expressão dada acima:
73 = 7!3! 7 3! = 7!3! ∗ 4! = 7 ∗ 6 ∗ 5 ∗ 4 !3 ∗ 2 ∗ 1 ∗ 4 ! = 35 Existem também os binomiais complementares, que recebem esta
denominação, quando dois números binomiais apresentam o mesmo numerador, e asoma de suas classes é igual a esse numerador, isto é, se n, p, q N, então:
São complementares se p+q=n.Vamos analisar os seguintes exemplos:
156 159 Observamos que a soma: 6+9=15Dois números binominais complementares são iguais, se n, p, q N, isto é:
p + q=n = Devemos observar como conseqüência dessa propriedade dos números
binominais complementares, a seguinte relação:
Para n, p N e np
n p xou p x p
n
x
n
8/18/2019 Apostila Estatistica-Prof. Fabio
56/63
54
8 Probabilidade
A Probabilidade pode ser definida como a possibilidade ou chance de que um
evento venha a ocorrer. O estudo das probabilidades se justifica pelo fato de a maioriados fenômenos de que trata a Estatística serem de natureza aleatória ou probabilística.
Fenômenos onde o resultado final depende do acaso são chamados fenômenos
aleatórios ou experimentos aleatórios.
8.1 Experimentos ou fenômenos aleatórios
São aqueles que, mesmo repetidos várias vezes sob condições semelhantes,apresentam resultados imprevisíveis.
Assim, da afirmação "é provável que o meu time ganhe a partida de hoje" pode
resultar:
a. que, apesar do favoritismo, ele perca;
b. que, como pensamos, ele ganhe;
c. que empate.
8.2 Espaço amostral
A cada experimento correspondem, em geral, vários resultados possíveis. Assim,
ao lançarmos uma moeda, há dois resultados possíveis: ocorrer cara ou ocorrer coroa.
Já ao lançarmos um dado há seis resultados possíveis: 1, 2, 3, 4, 5 ou 6.
Ao conjunto desses resultados possíveis damos o nome de espaço amostral ou
conjunto universo, representado por S.
Os dois experimentos citados anteriormente têm os seguintes espaços amostrais:
lançamento de uma moeda: S = {Ca, Co};
lançamento de um dado: S = {1, 2, 3, 4, 5, 6}.
Se lançarmos duas vezes a moeda teremos:
S = {(Ca, Ca), (Ca, Co), (Co, Ca), (Co, Co)}.
Cada elemento de S que corresponde a um resultado recebe o nome de ponto
amostral.
8/18/2019 Apostila Estatistica-Prof. Fabio
57/63
55
8.3 Eventos
Chamamos de evento qualquer subconjunto de espaço amostral S de um
experimento aleatório.
Assim, qualquer que seja E, se E C S (E está contido em S), então E é um evento
de S.
Se E = S, E é chamado evento certo;
Se E C S e E é um conjunto unitário, E é chamado evento elementar. Se
E=conjunto vazio, então é chamado evento impossível.
Ex1.
No lançamento de um dado, onde S = {1,2,3,4,5,6}, temos:
A = {2,4,6} C S; logo, A é um evento de S;
B = {1,2,3,4,5,6} C S; logo, B é um evento certo de S;
C = {4} C S; logo, C é um evento elementar de S;
D = C S; logo, D é um evento impossível de S.
8.4 Função Probabilidade
Dado um experimento aleatório, sendo S o seu espaço amostral, vamos admitir
que todos os elementos de S tenham a mesma chance de acontecer, ou seja, que S é
um conjunto equiprovável.
Chamamos de probabilidade de um evento A (A C S) o número real P(A), tal que:
n(A) é o número de elementos de A;
n(S) é o número de elementos de S.
Ex2:
a) Considerando o lançamento de uma moeda e o evento A "obter cara", temos:
S = {Ca, Co} n(S) = 2
A = {Ca) n(A ) = 1
S n An
A P
2
1 A P
8/18/2019 Apostila Estatistica-Prof. Fabio
58/63
56
O resultado acima nos permite afirmar que, ao lançarmos uma moeda
equilibrada, temos 50% de chance de que apareça cara na face superior.
b) Considerando o lançamento de um dado, vamos calcular:
1° Probabilidade do evento A "obter um número par na face superior".
Temos:
S = {1, 2, 3, 4, 5, 6} n(S) = 6
A = {2, 4, 6} n(A) = 3
2° Probabilidade do evento B "obter um número menor ou igual a 6 na face superior" .
Temos:
S = {1, 2, 3, 4, 5, 6} n(S) = 6
B = {1, 2,3, 4, 5, 6} n(B) = 6
8.5 Eventos complementares
Sabemos que um evento pode ocorrer ou não. Sendo “p” a probabilidade de queele ocorra (sucesso) e “q” a probabilidade de que ele não ocorra (fracasso), para ummesmo evento existe sempre a relação:
p + q = 1 q = 1 – p
Assim, se a probabilidade de se realizar o evento é5
1 p , a probabilidade de que
ele não ocorra é5
4q .
8.6 Eventos independentes
Dizemos que dois eventos são independentes quando a realização ou a não-
realização de um dos eventos não afeta a probabilidade de realização do outro e vice-
versa.
Por exemplo, quando lançamos dois dados, o resultado obtido em um deles
independe do resultado obtido no outro.
2
1
6
3 A P
16
6 A P
8/18/2019 Apostila Estatistica-Prof. Fabio
59/63
8/18/2019 Apostila Estatistica-Prof. Fabio
60/63
58
2) De dois baralhos de 52 cartas retiram-se, simultaneamente, uma carta do primeiro
baralho e uma carta do segundo. Qual a probabilidade de a carta do primeiro baralho
ser um rei e a do segundo ser o 5 de paus?
= 452 ∗ 152 = 42704 = 1676
3)
4)
8/18/2019 Apostila Estatistica-Prof. Fabio
61/63
59
5)
6)
a) 14/16 = 7/8
b) 10/16 = 5/8
c)10/16 + 2/16 = 3/4
a) 10/16 * 9/15 = 90/ 240 = 3/8
b) = 7/8
c) 14/16 * 13/15 = 91/120
d) 6/16 * 5/15 = 1/8
8/18/2019 Apostila Estatistica-Prof. Fabio
62/63
60
9 Distribuição Binomial
Uma distribuição de probabilidade binomial resulta de um experimento que
satisfaz os seguintes requisitos:
O experimento deve ser repetido, nas mesmas condições, um número finito de
vezes (n);
As tentativas devem ser independentes, ou seja, o resultado de uma não afeta
os resultados das sucessivas;
Cada tentativa deve ter todos os resultados classificados em duas categorias
(sucesso e insucesso);
No decorrer do experimento, a probabilidade p do sucesso e a probabilidade q
(q = 1 – p) do insucesso devem permanecer constantes.
Se um experimento satisfaz esses quatro requisitos, a distribuição da variável
aleatória x é chamada de distribuição de probabilidade binomial ou (distribuição
binomial).
Em uma distribuição binomial, as probabilidades podem ser calculadas atravésda fórmula da probabilidade binomial.
= !! ! ∗ ∗ −
Onde: n = número de tentativas
k = número de sucessos em n tentativas
p = probabilidade de sucesso em qualquer tentativa
q = probabilidade de fracasso em qualquer tentativa (q = 1 – p)
8/18/2019 Apostila Estatistica-Prof. Fabio
63/63
Ex1. Uma moeda é lançada 5 vezes seguidas e independentes. Calcule a
probabilidade de obter 3 caras, nessas 5 provas. Para o exemplo dado temos que:
n= 5
k=3
p = ( probabilidade de obter cara – sucesso)q = (probabilidade de obter coroa – insucesso)Daí:
3 =5!
3! ∗ 5 3! ∗ (12)
∗ (12)
−
=5!
3! ∗ 2! ∗18 ∗
14 =
516
Ex2. Dois times de futebol, A e B, jogam entre si 6 vezes. Encontre a probabilidade de
o time A ganhar 4 jogos.
n = 6
k = 4
p = 1/3 (Pode ganhar empatar ou perder)
q = 1 – 1/3 = 2/3
4 = 6!4! ∗ 6 4! ∗ (13) ∗ (23)
− = 6!4! ∗ 2! ∗ 181 ∗ 29 = 20243