Aula 06_Medidas de Dispersão

30 Pages • 1,937 Words • PDF • 8.3 MB
Uploaded at 2021-09-24 05:42

This document was submitted by our user and they confirm that they have the consent to share it. Assuming that you are writer or own the copyright of this document, report to us by using this DMCA report button.


ESTATÍSTICA

Prof Wanderlan

Medidas de Dispersão Visam tornar a avaliação do conjunto de dados por meio de estatísticas-resumo mais próximas da realidade.

Vamos considerar as seguintes sequências de valores: A={1, 3, 6, 7, 10} B={4, 5, 5, 6, 7} Podemos observar, com um rápido cálculo, que ambas possuem a mesma média, 5,4 . Porém, é fácil observar que os valores apresentados no conjunto B estão bem mais próximos da média, enquanto que, no conjunto A, os valores estão mais distanciados.

Dessa forma, dizemos que o conjunto B possui os valores mais concentrados, enquanto que os valores no conjunto A estão mais dispersos. Quanto maior a dispersão dos dados podemos observar que a informação contida na medida de posição central (média) fica menor. O grau ao qual os dados numéricos tendem a dispersarse em relação a um valor médio chama-se variação ou dispersão dos dados. Essa dispersão pode ser calculada por meio das seguintes medidas: - Amplitude total - Desvio Médio - Desvio Padrão - Variância - Coeficiente de Variação

Podemos observar nas medidas de dispersão que quanto maior forem os valores encontrados nos indica que maior é o afastamento dos seus dados. Isso nos remete portanto que menor a informação contida nas medidas de posição central calculada, tais como a média e a mediana.

1) AMPLITUDE TOTAL (AT) Como já foi visto anteriormente, é a diferença entre o maior e o menor valor da sequência numérica. Nas sequências utilizadas como exemplo acima, teremos: Ex1.: A amplitude total da sequência A={1,3, 6, 7, 10} será: AT1 = 10 - 1 = 9 Ex2.: A amplitude total da sequência B={4, 5, 5, 6, 7} será: AT2 = 7 - 4 = 3 Observe que, por esta medida, a dispersão do conjunto A é bem maior que a dispersão do conjunto B.

Na Amplitude Total com dados agrupados sem intervalos ou com intervalos de classe, o cálculo será o mesmo. É importante para o cálculo dos dados brutos colocarmos em ordem crescente, ou seja, fazer o ROL. A desvantagem da amplitude total é que ela leva em conta somente os dois valores extremos da série de dados, não levando em consideração o conjunto de valores intermediários.

2) VARIÂNCIA (S²)  Medida de dispersão que indica a divergência entre

o valor da média aritmética e os dados, ou seja, baseando nesses desvios.  A unidade da variância é o quadrado da unidade

medida, o que impossibilita uma comparação direta com os valores obtidos  Exemplo: se a medida é dada em metros(m), a

variância é dada em metros quadrados(m²)

Propriedades  Somando-se ou subtraindo-se a cada elemento de

um conjunto de valores uma constante arbitrária, a variância não se altera  Multiplicando-se ou dividindo-se cada elemento de

um conjunto de valores por um valor constante, a variância fica multiplicada ou dividida pelo quadrado da constante

Variância (S²) - Resumo População (²)

Dados brutos Dados sem intervalos (variáveis discretas) Dados com intervalos de classe (variáveis contínuas)

Amostra (S²)

Exemplo: Calcule a variância da amostra 2, 4, 6, 8, 10. A média desse conjunto é 6. xi 2 4 6 8 10

somas

x 6 6 6 6 6

x i- x -4 -2 0 +2 +4 0

(x i - x ) 2 16 4 0 4 16 40

2 (x x )  i 40 = 10 S2 = = n-1 5-1

Variância - Exemplo

Da distribuição, encontre a variância da idade das crianças.

Em um clube de corrida, o treinador anotou o tempo gasto durante 5 dias de treinamento para analisar o desempenho dos corredores. Como a equipe é formada de três corredores Jonas, Salomão e Davi. Os tempos em minutos foram anotados na tabela a seguir: Atletas

Dia 1

Dia 2

Dia Dia 3 4

Dia 5

Jonas

63

60

59

55

62

Salomão

54

59

60

57

61

Davi

60

63

58

62

55

O treinador está preocupado se esses tempos podem leválos à vitória na competição que se aproxima. Ele precisa fazer cálculos de variância de cada atleta para analisar o desempenho e a possibilidade de vitória na competição. Os dados que ele precisa levar em consideração para obter as análises são a média de tempo de cada atleta e a variância desses tempos.

Calcule a variância para as temperaturas da cidade X, Y e Z. X: 25;25;25;25;25 Y: 26;24;25;23;27 Z: 8; 13;27;40;37. R= 0; 2; 161,2

3) Desvio Padrão (s)  É a medida de dispersão mais importante e uma das

mais utilizadas  Equivalente á raiz quadrada positiva da variância  Tem a mesma unidade da série e admite interpretação direta com os dados  Como o desvio padrão é a raiz quadrada da variância, basta calcular o valor da variância primeiro e depois calcular a raiz quadrada positiva.

Quanto maior é o desvio padrão maior é a dispersão dos dados em torno da média.

7 6 5 4 3 2 1 0

s=0

emtodos os casos temos 7 medidas com média X  4 s = 0,8

1 2 3 4 5 6 7

1 2 3 4 5 6 7

s = 1,0

1 2 3 4 5 6 7

s=3

1 2 3 4 5 6 7

O desvio-padrão cresce quando a dispersão dos dados aumenta

Desvio Padrão (s) - Resumo Equações para o cálculo direto do desvio padrão

População

Dados brutos

Dados sem intervalos (variáveis discretas) Dados com intervalos de classe (variáveis contínuas)

Amostra

Desvio-padrão - Exemplos Exemplo: Calcular o desvio-padrão da amostra representada por: 1, 2, 4, 5, 7.

i 1 2 3 4 5 X

Xi 1 2 4 5 7 = 3,8

(Xi - X ) (1 – 3,8) = -2,8 (2 – 3,8) = -1,8 (4 – 3,8) = 0,2 (5 – 3,8) = 1,2 (7 – 3,8) = 3,2

2

(Xi - X ) (-2,8)2 = 7,84 (-1,8)2 = 3,24 (0,2)2 = 0,04 (1,2)2 = 1,44 (3,2)2 = 10,24

 X  X   22,8 5

2

i

1

Continuação - Exemplos

X

Xi 1 2 4 5 7 = 3,8

(Xi - X ) (1 – 3,8) = -2,8 (2 – 3,8) = -1,8 (4 – 3,8) = 0,2 (5 – 3,8) = 1,2 (7 – 3,8) = 3,2

(Xi - X )2 (-2,8)2 = 7,84 (-1,8)2 = 3,24 (0,2)2 = 0,04 (1,2)2 = 1,44 (3,2)2 = 10,24

 X  X  5

2

i

 22,8

1

n Logo : S 



 Xi X

i

n -1

2





22,8  5 1

22,8  2,39 4

1) Calcule a variância e o desvio padrão da sequência: X: 4, 5, 8, 5. R: 3 e 1,73 unidades

2) Calcule a variância da série abaixo, representativa de uma amostra. S² = 0,9763; S= 0,988

3) Calcule a variância e o desvio padrão para a série representativa de uma amostra: S² = 11,38; S= 3,373

Desvio-padrão - Exercícios Exercício 1: Vamos supor que eu quero comprar uma lâmpada para a minha casa e quero que ela dure pelo menos 700 h. Eu solicito a dois fabricantes o tempo de vida útil de suas lâmpadas e eles me fornecem os seguintes dados: Fabricante A (h) 730 710 705 720 765 750

Fabricante B (h) 1000 687 700 850 587 710

Supondo que as duas lâmpadas custam o mesmo valor, qual delas eu deveria comprar?

Médias e Desvio-padrão - Exercícios Para chegarmos à uma conclusão é necessário calcularmos o tempo de vida útil médio para cada fabricante e saber qual é variabilidade dos dados. Fabricante A (h) 730 710 705 720 765 750

Fabricante B (h) 1000 687 700 850 587 710

X B  755,67 h SB = 146,25 h Critério de escolha: tempo de vida útil =

X A  730 h SA = 23,45 h

média  desvio-padrão

Médias e Desvio-padrão - Exercícios Fabricante A : 730 ± 23,45 h

X A  S A  730  23,45 h

X A  730 h

X A  S A  730  23,45 h

Conclusão : Escolheria o fabricante A. Fabricante B : 755,67 ± 146,25 h

Fabricante A:[706,55 – 753,45= -46,9]

X B  S B  755,67 146,25 h

X B  755,67 h

Fabricante B : [609,42 – 901,92= -292,5]

X B  S B  755,67 146,25 h

5) COEFICIENTE DE VARIAÇÃO O coeficiente de variação, também denominado de dispersão relativa, é uma medida muito útil para a comparação de distribuições de valores. É definida pelo quociente entre o desvio padrão e a média em porcentagem: amostra

CV (%) =

S

x

população

. 100

ou

CV(%) =

σ . 100 µ

Obs: Convencionamos dizer que uma população (ou amostra) possui uma distribuição homogênea, ou simplesmente que possui um comportamento homogêneo, quando o coeficiente de variação estiver limitado entre 0% e 30%. Uma população (ou amostra) terá um comportamento heterogêneo quando o Coeficiente de Variação for maior que 30%.

Nos dá a idéia do tamanho do desvio padrão em relação à média. Uma pequena dispersão absoluta pode ser na verdade considerável quando comparada com os valores da variável

Conjunto de dado com s = 15 e média 100 CV = 15%

Conjunto de dado com s = 20 e média 1000 CV = 2%

Obs: para comparar a dispersão dos dados de duas séries de médias diferentes, usa-se o Coeficiente de Variação.

Ex.: Vamos supor que duas turmas de estatística tenham obtido as seguintes médias de notas, com os respectivos valores de desvio padrão populacional. Turma A: Média = 5,6 e DP A = 0,98 Turma B: Média = 5,6 e DP B = 1,21

Com os dados acima poderemos calcular o Coeficiente de Variação de cada turma. Assim, teremos:

Assim, podemos afirmar que a turma A possui uma distribuição das notas mais homogênea que a distribuição apresentada pela turma B, pois o Coeficiente de Variação da turma A é menor que o da turma B.

Exercícios – 1) Uma empresa faz, mensalmente, o controle do volume de vendas em duas de suas filiais. A seguir estão as medidas obtidas nesse mês.

Filial 1 Média= 145 mil reais Desvio padrão = 9,8 mil reais Filial 2 Média= 95 mil reais Desvio padrão = 7,5 mil reais

a) Compare a dispersão das duas séries b) Calcule o coeficiente de variação

2) Responda as questões abaixo: a) Medidas as estaturas de 1.017 indivíduos, obtivemos uma média de 162,2 cm e um desvio padrão de 8,01 cm. O peso médio desses mesmos indivíduos é 52kg, com um desvio padrão de 2,3 kg. A maior variabilidade apresentada esta na altura nos pesos desses indivíduos? b) Um grupo de 85 moças tem estatura média de 160,6 cm, com um desvio padrão igual a 5,97cm. Outro grupo de 125 moças tem uma estatura média de 161,9 cm, sendo o desvio padrão igual a 6,01 cm. Qual o coeficiente de variação de cada um dos grupos? Qual o grupo mais homogêneo? c) Um grupo de cem estudantes tem uma estatura média de 163,8cm, com um coeficiente de variação de 3,3%. Qual o desvio padrão desse grupo?

d) Uma distribuição apresente as seguintes estatísticas: s= 1,5 e CV= 2,9%. Determine a média da distribuição.

3) Calcule o coeficiente de variação dos dados abaixo:

Respostas Exercício 01 a) O desvio-padrão da Filial 1 é 9,8 e o da Filial 2 é 7,5, portanto, a filial que apresenta maior dispersão absoluta no volume de vendas é a Filial 1. b) CV Filial 1 = 9,8/145 = 0,0676 ou 6,76% CV Filial 2 = 7,5/95 = 0,0789 ou 7,89% Exercício 02 – a) Estatura b) 3,72% e 3,71%; segundo grupo c) s= 5,42 d) Média= 51,72
Aula 06_Medidas de Dispersão

Related documents

30 Pages • 1,937 Words • PDF • 8.3 MB

29 Pages • 737 Words • PDF • 2.1 MB

5 Pages • 899 Words • PDF • 107 KB

17 Pages • 1,293 Words • PDF • 411.3 KB

2 Pages • 263 Words • PDF • 415.5 KB

2 Pages • 1,130 Words • PDF • 186.2 KB

39 Pages • 962 Words • PDF • 1.7 MB

7 Pages • 1,702 Words • PDF • 353.9 KB

4 Pages • 1,931 Words • PDF • 647.3 KB

10 Pages • 4,592 Words • PDF • 620.6 KB

1 Pages • 189 Words • PDF • 208.1 KB

2 Pages • 6 Words • PDF • 752.5 KB