Existem casos em que se faz necessário o estudo mais detalhado do fenômeno estudado.
Para tal, utiliza-se as medidas de dispersão, que tem como objetivo indicar o quanto os elementos de uma amostra estão afastados da média.
Calculando uma dessas medidas, em cada uma de duas amostras de mesma média, será considerada a amostra menos dispersa aquela que apresentar a menor dispersão.
Para melhor entender os conceitos que serão apresentados, considere o seguinte exemplo:
A tabela a seguir representa o número de gols da última rodada de um campeonato de futebol.
Jogo | Nº de gols |
---|---|
A | 5 |
B | 0 |
C | 11 |
D | 3 |
E | 4 |
F | 1 |
A média de gols da última rodada é:
\( \bar{x} = \dfrac{5 + 0 + 11 + 3 + 4 + 1}{6} = \dfrac{24}{6} \) = 4 gols
Repare que os jogos B (0 gol) e C (11 gols) tiveram número de gols bem mais distantes da média do que os demais jogos.
Em Estatística é possível verificar como esses dados se distribuem em torno da média, ou seja, se estão muito ou pouco dispersos. Para tal, basta calcular as medidas de dispersão: desvio médio, variância e desvio padrão.
Amplitude total é a diferença entre o maior valor e o menor valor observado.
AT = \( x_{MAX} – x_{MIN} \)
No exemplo, tem-se que 0 e 11 são o menor e o maior valor, respectivamente. Então, a amplitudade é:
AT = \( x_{MAX} – x_{MIN} \) = 11 - 0 = 11
O desvio absoluto médio (Dam) mede o afastamento médio dos elementos da amostra em relação à média aritmética.
Para determinar o quanto cada elemento está afastado da média aritmética, basta efetuar a diferença entre o elemento e a média, nessa ordem. Essa diferença é chamada de desvio.
Para calcular o desvio de cada elemento do exemplo, pode-se utilizar a tabela que foi apresentada. Observe:
Jogo | Nº de gols | Desvios (\(x_1 - \bar{x}\)) |
---|---|---|
A | 5 | 5 - 4 = 1 |
B | 0 | 0 - 4 = -4 |
C | 11 | 11 - 4 = 7 |
D | 3 | 3 - 4 = -1 |
E | 4 | 4 - 4 = 0 |
F | 1 | 1 - 4 = -3 |
O módulo de cada diferença é chamado de desvio absoluto.
Jogo | Nº de gols | Desvios (\(x_1 - \bar{x}\)) | Desvio absoluto (|\(x_1 - \bar{x}\)|) |
---|---|---|---|
A | 5 | 5 - 4 = 1 | 1 |
B | 0 | 0 - 4 = -4 | 4 |
C | 11 | 11 - 4 = 7 | 7 |
D | 3 | 3 - 4 = -1 | 1 |
E | 4 | 4 - 4 = 0 | 0 |
F | 1 | 1 - 4 = -3 | 3 |
A média aritmética entre os desvios absolutos é chamada de desvio absoluto médio, que se indica por Dam.
Em outras palavras:
Sendo \( \bar{x} \) a média aritmética de uma amostra de números \(x_1\), \(x_2\), \(x_3\), ..., \(x_n\), chama-se desvio absoluto médio o número:
Dam = \( \dfrac{|x_1 - \bar{x}| + |x_2 - \bar{x}| + |x_3 - \bar{x}| + \cdots + |x_n - \bar{x}|}{n} \)
Observação: O desvio absoluto médio pode ser chamado, também, de desvio médio.
Agora que sabemos que o desvio médio é a média aritmética dos valores absolutos dos desvios, vamos calcular o Dam do exemplo:
Dam = \( \dfrac{|x_1 - \bar{x}| + |x_2 - \bar{x}| + |x_3 - \bar{x}| + |x_4 - \bar{x}| + |x_5 - \bar{x}| + |x_6 - \bar{x}|}{n} \) =
= \( \dfrac{|5 - 4| + |0 - 4| + |11 - 4| + |3 - 4| + |4 - 4| + |1 - 4|}{6} \) =
= \( \dfrac{|1| + |-4| + |7| + |-1| + |0| + |-3|}{6} \) =
= \( \dfrac{1 + 4 + 7 + 1 + 0 + 3}{6} = \dfrac{16}{6} \) ≅ 2,6
2,6 representa o afastamento (dispersão) médio dos elementos em relação à média aritmética.
Variância (\( \sigma^2 \)) é uma outra medida que indica o afastamento dos elementos de uma amostra em relação à média aritmética.
Define-se essa medida como a média aritmética entre os quadrados dos desvios dos elementos da amostra:
\( \sigma^2 = \dfrac{(x_1 - \bar{x})^2 + (x_2 - \bar{x})^2 + (x_3 - \bar{x})^2 + \cdots + (x_n - \bar{x})^2}{n} \)
Do exemplo, tem-se:
\( \sigma^2 = \dfrac{(5 - 4)^2 + (0 - 4)^2 + (11 - 4)^2 + (3 - 4)^2 + (4 - 4)^2 + (1 - 4)^2}{6} \)
\( \sigma^2 = \dfrac{(1)^2 + (-4)^2 + (7)^2 + (-1)^2 + (0)^2 + (-3)^2}{6} = \dfrac{1 + 16 + 49 + 1 + 0 + 9}{6} = \dfrac{76}{6} \) ≅ 12,6
Na interpretação da variância podem surgir algumas dificuldades em relação à unidade de medida dos elementos da amostra. Por exemplo, se os elementos da amostra representam capacidades em litros (\(l\)), a variância representará um resultado em \(l^2\). Como essa unidade não tem significado físico, não é conveniente utilizar a variância nesse caso.
Utilizamos, então, o desvio padrão (\( \sigma \)), definido como a raiz quadrada da variância:
\( \sigma = \sqrt{\dfrac{(x_1 - \bar{x})^2 + (x_2 - \bar{x})^2 + (x_3 - \bar{x})^2 + \cdots + (x_n - \bar{x})^2}{n}} \)
Do exemplo, tem-se:
\( \sigma = \sqrt{\sigma^2} = \sqrt{12,6} \) ≅ 3,5
Mas como obter o desvio padrão quando os dados estão agrupados e quando não estão agrupados.
Para dados não agrupados:
Para evitar o acúmulo de erros por arredondamento, utilizaremos a seguinte fórmula:
\( \sigma = \sqrt{\dfrac{\sum (x_i)^2}{n} - \left( \dfrac{\sum x_i}{n} \right)^2} \)
Para dados agrupados:
Neste caso temos que considerar a distribuição de frequência sem e com intervalos de classe.
Sem intervalos de classe
Deve-se levar em conta as frequências:
\( \sigma = \sqrt{\dfrac{\sum (f_i \cdot x_i)^2}{n} - \left( \dfrac{\sum (f_i \cdot x_i)}{n} \right)^2} \)
Com intervalos de classe
Também deve-se levar em conta as frequências, e \(x_i\) é o ponto médio do intervalo de classe:
\( \sigma = \sqrt{\dfrac{\sum (f_i \cdot x_i)^2}{n} - \left( \dfrac{\sum (f_i \cdot x_i)}{n} \right)^2} \)
Não é medida de dispersão:
Uma escola observou a quantidade de pais presentes das últimas 6 reuniões de pais do Ensino Médio, conforme apresenta a tabela.
Reunião | Quantidade de pais |
---|---|
A | 62 |
B | 90 |
C | 88 |
D | 92 |
E | 110 |
F | 86 |
Obter:
Solução
a) \( \bar{x} = \dfrac{62 + 90 + 88 + 92 + 110 + 86}{6} = \dfrac{528}{6} \) = 88
b) Dam = \( \dfrac{|62 - 88| + |90 - 88| + |88 - 88| + |92 - 88| + |110 - 88| + |86 - 88|}{6} \) =
= \( \dfrac{|-26| + |2| + |0| + |4| + |22| + |-2|}{6} \) =
= \( \dfrac{26 + 2 + 0 + 4 + 22 + 2}{6} = \dfrac{56}{6} \) ≅ 9,33
c) \( \sigma^2 = \dfrac{(62 - 88)^2 + (90 - 88)^2 + (88 - 88)^2 + (92 - 88)^2 + (110 - 88)^2 + (86 - 88)^2}{6} \)
\( \sigma^2 = \dfrac{(-26)^2 + (2)^2 + (0)^2 + (4)^2 + (22)^2 + (-2)^2}{6} \) =
= \( \dfrac{676 + 4 + 0 + 16 + 484 + 4}{6} = \dfrac{1.184}{6} \) ≅ 197,33
d) \( \sigma = \sqrt{\sigma^2} = \sqrt{197,33} \) ≅ 14,05
Após um ano de funcionamento, uma maternidade registrou o nascimento de 720 crianças, em parto normal. Os dados referentes à altura dessas crianças foram apresentados na seguinte tabela:
Altura (cm) | Quantidade de crianças |
---|---|
45 \(\vdash\) 47 | 80 |
47 \(\vdash\) 49 | 260 |
49 \(\vdash\) 51 | 200 |
51 \(\vdash\) 53 | 160 |
53 \(\vdash\) 55 | 20 |
Total | 720 |
Obter:
Solução
Como os dados estão agrupados, deve-se obter os pontos médios de cada classe:
Altura (cm) | Quantidade de crianças | Ponto médio |
---|---|---|
45 \(\vdash\) 47 | 80 | 46 |
47 \(\vdash\) 49 | 260 | 48 |
49 \(\vdash\) 51 | 200 | 50 |
51 \(\vdash\) 53 | 160 | 52 |
53 \(\vdash\) 55 | 20 | 54 |
Total | 720 |
a) A altura média é determinada considerando-se a frequência de cada classe com o ponto médio da mesma.
\( \bar{x} = \dfrac{80 \cdot 46 + 260 \cdot 48 + 200 \cdot 50 + 160 \cdot 52 + 20 \cdot 54}{720} \) ≅ 49
b) Dam = \( \dfrac{80 \cdot |46 - 49| + 260 \cdot |48 - 49| + 200 \cdot |50 - 49| + 160 \cdot |52 - 49| + 20 \cdot |54 - 49|}{720} \) ≅ 1,8
c) \( \sigma^2 = \dfrac{80 \cdot (46 - 49)^2 + 260 \cdot (48 - 49)^2 + 200 \cdot (50 - 49)^2 + 160 \cdot (52 - 49)^2 + 20 \cdot (54 - 49)^2}{720} \) ≅ 4,3
d) \( \sigma = \sqrt{\sigma^2} = \sqrt{4,3} \) ≅ 2
Esta foi uma demonstração gratuita.
Logue para ter acesso a todo conteúdo interativo.
Hum, ainda não criou conta!?
Crie sua conta e ative-a para ter acesso a todo conteúdo interativo.