No último post, você aprendeu que a medida de tendência central é um valor que expressa uma medida central dentro de um conjunto de dados (Para saber mais, clique aqui). Em todos os trabalhos quantitativos, é recomendável que você adote uma medida de tendência central para apresentar o seu resultado. Mas atenção: uma medida de tendência central nunca deve ser apresentada sozinha! Afinal, ela nada revela sobre a variabilidade dos dados. Por isso, é recomendável que a medida de tendência central esteja sempre acompanhada de uma medida de dispersão.
Mas, afinal, o que são medidas de dispersão?
Medidas de dispersão são medidas usadas para determinar o grau de variabilidade dos dados de um conjunto de valores.
Vamos a um exemplo prático: o quadro abaixo apresenta a idade de 10 pessoas. A média de idade desse grupo é 28 anos. No entanto, podemos notar que nem todas as pessoas desse grupo apresentam 28 anos, na verdade, somente a pessoa 4 tem essa idade. A pessoa 1 tem 25 anos, medida que se aproxima da média, por outro lado, a pessoa 5 tem 44 anos, valor que se afasta consideravelmente da média. A medida de dispersão serve justamente para mostrar o quanto as medidas de um conjunto de dados se afastam da média.
Por que apresentar uma medida de dispersão juntamente a medida de tendência central?
A utilização da medida de dispersão torna a análise descritiva dos dados de uma amostra mais confiável, já que as medidas de tendência central (média, mediana, moda) muitas vezes escondem a homogeneidade (ou mesmo a heterogeneidade) dos dados.
Quais são as medidas de dispersão mais utilizadas?
AMPLITUDE
Essa medida de dispersão é definida como a diferença entre o maior e o menor valor do conjunto de dados.
O maior valor observado no conjunto de dados ilustrado na figura 1 é 44, enquanto o menor valor é 15. Portanto, a amplitude é:
A = 44 – 15
A = 29
A amplitude apresenta a limitação de considerar somente os dois valores mais extremos do conjunto de dados e desconsiderar os demais.
VARIÂNCIA
A variância é determinada a partir da média dos quadrados das diferenças entre cada uma das observações e a média aritmética da amostra. Calma, não se assuste com o conceito! A fórmula utilizada para calcular a variância é:
Sendo,
S: variância
xi: valor observado
X: média aritmética da amostra
n: número de dados observados
Portanto, o cálculo da variância do conjunto de dados 1 é:
Mas fique tranquilo! Você não precisará fazer esses cálculos à mão. Atualmente os softwares estatísticos e (também as planilhas eletrônicas) calculam a variância de forma automática pra gente!
DESVIO PADRÃO
O desvio padrão é, indiscutivelmente, a medida de dispersão mais utilizada. Então, atenção a ele! Para calcularmos o desvio padrão de um conjunto de dados, devemos apenas extrair a raiz quadrada da variância (aquela que você acabou de aprender).
Dessa forma, para calcular o desvio padrão do conjunto de dados 1, devemos extrair a raiz quadrada de 26,2.
Agora você conhece as principais medidas de dispersão e sabe como determiná-las. Aqui vale a mesma dica que demos em medidas de tendência central: é fácil de calcular as medidas quando trabalhamos com um bancos de dados pequenos. No entanto, quando desejamos trabalhar com um banco de dados maior, precisaremos utilizar softwares específicos para isso.
Se você ficou com alguma dúvida sobre as medidas de dispersão, manda pra gente!