30 Pages • 1,937 Words • PDF • 8.3 MB
Uploaded at 2021-09-24 05:42
This document was submitted by our user and they confirm that they have the consent to share it. Assuming that you are writer or own the copyright of this document, report to us by using this DMCA report button.
ESTATÍSTICA
Prof Wanderlan
Medidas de Dispersão Visam tornar a avaliação do conjunto de dados por meio de estatísticas-resumo mais próximas da realidade.
Vamos considerar as seguintes sequências de valores: A={1, 3, 6, 7, 10} B={4, 5, 5, 6, 7} Podemos observar, com um rápido cálculo, que ambas possuem a mesma média, 5,4 . Porém, é fácil observar que os valores apresentados no conjunto B estão bem mais próximos da média, enquanto que, no conjunto A, os valores estão mais distanciados.
Dessa forma, dizemos que o conjunto B possui os valores mais concentrados, enquanto que os valores no conjunto A estão mais dispersos. Quanto maior a dispersão dos dados podemos observar que a informação contida na medida de posição central (média) fica menor. O grau ao qual os dados numéricos tendem a dispersarse em relação a um valor médio chama-se variação ou dispersão dos dados. Essa dispersão pode ser calculada por meio das seguintes medidas: - Amplitude total - Desvio Médio - Desvio Padrão - Variância - Coeficiente de Variação
Podemos observar nas medidas de dispersão que quanto maior forem os valores encontrados nos indica que maior é o afastamento dos seus dados. Isso nos remete portanto que menor a informação contida nas medidas de posição central calculada, tais como a média e a mediana.
1) AMPLITUDE TOTAL (AT) Como já foi visto anteriormente, é a diferença entre o maior e o menor valor da sequência numérica. Nas sequências utilizadas como exemplo acima, teremos: Ex1.: A amplitude total da sequência A={1,3, 6, 7, 10} será: AT1 = 10 - 1 = 9 Ex2.: A amplitude total da sequência B={4, 5, 5, 6, 7} será: AT2 = 7 - 4 = 3 Observe que, por esta medida, a dispersão do conjunto A é bem maior que a dispersão do conjunto B.
Na Amplitude Total com dados agrupados sem intervalos ou com intervalos de classe, o cálculo será o mesmo. É importante para o cálculo dos dados brutos colocarmos em ordem crescente, ou seja, fazer o ROL. A desvantagem da amplitude total é que ela leva em conta somente os dois valores extremos da série de dados, não levando em consideração o conjunto de valores intermediários.
2) VARIÂNCIA (S²) Medida de dispersão que indica a divergência entre
o valor da média aritmética e os dados, ou seja, baseando nesses desvios. A unidade da variância é o quadrado da unidade
medida, o que impossibilita uma comparação direta com os valores obtidos Exemplo: se a medida é dada em metros(m), a
variância é dada em metros quadrados(m²)
Propriedades Somando-se ou subtraindo-se a cada elemento de
um conjunto de valores uma constante arbitrária, a variância não se altera Multiplicando-se ou dividindo-se cada elemento de
um conjunto de valores por um valor constante, a variância fica multiplicada ou dividida pelo quadrado da constante
Variância (S²) - Resumo População (²)
Dados brutos Dados sem intervalos (variáveis discretas) Dados com intervalos de classe (variáveis contínuas)
Amostra (S²)
Exemplo: Calcule a variância da amostra 2, 4, 6, 8, 10. A média desse conjunto é 6. xi 2 4 6 8 10
somas
x 6 6 6 6 6
x i- x -4 -2 0 +2 +4 0
(x i - x ) 2 16 4 0 4 16 40
2 (x x ) i 40 = 10 S2 = = n-1 5-1
Variância - Exemplo
Da distribuição, encontre a variância da idade das crianças.
Em um clube de corrida, o treinador anotou o tempo gasto durante 5 dias de treinamento para analisar o desempenho dos corredores. Como a equipe é formada de três corredores Jonas, Salomão e Davi. Os tempos em minutos foram anotados na tabela a seguir: Atletas
Dia 1
Dia 2
Dia Dia 3 4
Dia 5
Jonas
63
60
59
55
62
Salomão
54
59
60
57
61
Davi
60
63
58
62
55
O treinador está preocupado se esses tempos podem leválos à vitória na competição que se aproxima. Ele precisa fazer cálculos de variância de cada atleta para analisar o desempenho e a possibilidade de vitória na competição. Os dados que ele precisa levar em consideração para obter as análises são a média de tempo de cada atleta e a variância desses tempos.
Calcule a variância para as temperaturas da cidade X, Y e Z. X: 25;25;25;25;25 Y: 26;24;25;23;27 Z: 8; 13;27;40;37. R= 0; 2; 161,2
3) Desvio Padrão (s) É a medida de dispersão mais importante e uma das
mais utilizadas Equivalente á raiz quadrada positiva da variância Tem a mesma unidade da série e admite interpretação direta com os dados Como o desvio padrão é a raiz quadrada da variância, basta calcular o valor da variância primeiro e depois calcular a raiz quadrada positiva.
Quanto maior é o desvio padrão maior é a dispersão dos dados em torno da média.
7 6 5 4 3 2 1 0
s=0
emtodos os casos temos 7 medidas com média X 4 s = 0,8
1 2 3 4 5 6 7
1 2 3 4 5 6 7
s = 1,0
1 2 3 4 5 6 7
s=3
1 2 3 4 5 6 7
O desvio-padrão cresce quando a dispersão dos dados aumenta
Desvio Padrão (s) - Resumo Equações para o cálculo direto do desvio padrão
População
Dados brutos
Dados sem intervalos (variáveis discretas) Dados com intervalos de classe (variáveis contínuas)
Amostra
Desvio-padrão - Exemplos Exemplo: Calcular o desvio-padrão da amostra representada por: 1, 2, 4, 5, 7.
i 1 2 3 4 5 X
Xi 1 2 4 5 7 = 3,8
(Xi - X ) (1 – 3,8) = -2,8 (2 – 3,8) = -1,8 (4 – 3,8) = 0,2 (5 – 3,8) = 1,2 (7 – 3,8) = 3,2
2
(Xi - X ) (-2,8)2 = 7,84 (-1,8)2 = 3,24 (0,2)2 = 0,04 (1,2)2 = 1,44 (3,2)2 = 10,24
X X 22,8 5
2
i
1
Continuação - Exemplos
X
Xi 1 2 4 5 7 = 3,8
(Xi - X ) (1 – 3,8) = -2,8 (2 – 3,8) = -1,8 (4 – 3,8) = 0,2 (5 – 3,8) = 1,2 (7 – 3,8) = 3,2
(Xi - X )2 (-2,8)2 = 7,84 (-1,8)2 = 3,24 (0,2)2 = 0,04 (1,2)2 = 1,44 (3,2)2 = 10,24
X X 5
2
i
22,8
1
n Logo : S
Xi X
i
n -1
2
22,8 5 1
22,8 2,39 4
1) Calcule a variância e o desvio padrão da sequência: X: 4, 5, 8, 5. R: 3 e 1,73 unidades
2) Calcule a variância da série abaixo, representativa de uma amostra. S² = 0,9763; S= 0,988
3) Calcule a variância e o desvio padrão para a série representativa de uma amostra: S² = 11,38; S= 3,373
Desvio-padrão - Exercícios Exercício 1: Vamos supor que eu quero comprar uma lâmpada para a minha casa e quero que ela dure pelo menos 700 h. Eu solicito a dois fabricantes o tempo de vida útil de suas lâmpadas e eles me fornecem os seguintes dados: Fabricante A (h) 730 710 705 720 765 750
Fabricante B (h) 1000 687 700 850 587 710
Supondo que as duas lâmpadas custam o mesmo valor, qual delas eu deveria comprar?
Médias e Desvio-padrão - Exercícios Para chegarmos à uma conclusão é necessário calcularmos o tempo de vida útil médio para cada fabricante e saber qual é variabilidade dos dados. Fabricante A (h) 730 710 705 720 765 750
Fabricante B (h) 1000 687 700 850 587 710
X B 755,67 h SB = 146,25 h Critério de escolha: tempo de vida útil =
X A 730 h SA = 23,45 h
média desvio-padrão
Médias e Desvio-padrão - Exercícios Fabricante A : 730 ± 23,45 h
X A S A 730 23,45 h
X A 730 h
X A S A 730 23,45 h
Conclusão : Escolheria o fabricante A. Fabricante B : 755,67 ± 146,25 h
Fabricante A:[706,55 – 753,45= -46,9]
X B S B 755,67 146,25 h
X B 755,67 h
Fabricante B : [609,42 – 901,92= -292,5]
X B S B 755,67 146,25 h
5) COEFICIENTE DE VARIAÇÃO O coeficiente de variação, também denominado de dispersão relativa, é uma medida muito útil para a comparação de distribuições de valores. É definida pelo quociente entre o desvio padrão e a média em porcentagem: amostra
CV (%) =
S
x
população
. 100
ou
CV(%) =
σ . 100 µ
Obs: Convencionamos dizer que uma população (ou amostra) possui uma distribuição homogênea, ou simplesmente que possui um comportamento homogêneo, quando o coeficiente de variação estiver limitado entre 0% e 30%. Uma população (ou amostra) terá um comportamento heterogêneo quando o Coeficiente de Variação for maior que 30%.
Nos dá a idéia do tamanho do desvio padrão em relação à média. Uma pequena dispersão absoluta pode ser na verdade considerável quando comparada com os valores da variável
Conjunto de dado com s = 15 e média 100 CV = 15%
Conjunto de dado com s = 20 e média 1000 CV = 2%
Obs: para comparar a dispersão dos dados de duas séries de médias diferentes, usa-se o Coeficiente de Variação.
Ex.: Vamos supor que duas turmas de estatística tenham obtido as seguintes médias de notas, com os respectivos valores de desvio padrão populacional. Turma A: Média = 5,6 e DP A = 0,98 Turma B: Média = 5,6 e DP B = 1,21
Com os dados acima poderemos calcular o Coeficiente de Variação de cada turma. Assim, teremos:
Assim, podemos afirmar que a turma A possui uma distribuição das notas mais homogênea que a distribuição apresentada pela turma B, pois o Coeficiente de Variação da turma A é menor que o da turma B.
Exercícios – 1) Uma empresa faz, mensalmente, o controle do volume de vendas em duas de suas filiais. A seguir estão as medidas obtidas nesse mês.
Filial 1 Média= 145 mil reais Desvio padrão = 9,8 mil reais Filial 2 Média= 95 mil reais Desvio padrão = 7,5 mil reais
a) Compare a dispersão das duas séries b) Calcule o coeficiente de variação
2) Responda as questões abaixo: a) Medidas as estaturas de 1.017 indivíduos, obtivemos uma média de 162,2 cm e um desvio padrão de 8,01 cm. O peso médio desses mesmos indivíduos é 52kg, com um desvio padrão de 2,3 kg. A maior variabilidade apresentada esta na altura nos pesos desses indivíduos? b) Um grupo de 85 moças tem estatura média de 160,6 cm, com um desvio padrão igual a 5,97cm. Outro grupo de 125 moças tem uma estatura média de 161,9 cm, sendo o desvio padrão igual a 6,01 cm. Qual o coeficiente de variação de cada um dos grupos? Qual o grupo mais homogêneo? c) Um grupo de cem estudantes tem uma estatura média de 163,8cm, com um coeficiente de variação de 3,3%. Qual o desvio padrão desse grupo?
d) Uma distribuição apresente as seguintes estatísticas: s= 1,5 e CV= 2,9%. Determine a média da distribuição.
3) Calcule o coeficiente de variação dos dados abaixo:
Respostas Exercício 01 a) O desvio-padrão da Filial 1 é 9,8 e o da Filial 2 é 7,5, portanto, a filial que apresenta maior dispersão absoluta no volume de vendas é a Filial 1. b) CV Filial 1 = 9,8/145 = 0,0676 ou 6,76% CV Filial 2 = 7,5/95 = 0,0789 ou 7,89% Exercício 02 – a) Estatura b) 3,72% e 3,71%; segundo grupo c) s= 5,42 d) Média= 51,72