Imagine que você coletou dados sobre a altura de todos os alunos da sua turma. Você quer resumir essas informações de forma que qualquer pessoa possa entender rapidamente as características gerais da altura dos alunos. É aí que entram a média, a moda, a mediana e as medidas de dispersão.
Medidas de tendência central: encontrando o “centro” dos dados
As medidas de tendência central nos ajudam a encontrar um valor típico ou representativo em um conjunto de dados. Providenciei as fórmulas para usar em planilhas do Excel ou Google Sheets.
- Média: É a soma de todos os valores dividida pelo número total de valores. É o “valor médio” que você provavelmente já conhece.
- Conceito: O ponto de equilíbrio dos dados.
- Excel/Google Sheets:
=MÉDIA(intervalo_de_dados)
- Moda: É o valor que aparece com mais frequência no conjunto de dados.
- Conceito: O valor mais comum. Um conjunto de dados pode ter uma moda (unimodal), várias modas (multimodal) ou nenhuma moda.
- Excel:
=MODO.ÚNICO(intervalo_de_dados)(para uma única moda) ou=MODO.MULT(intervalo_de_dados)(para múltiplas modas) - Google Sheets:
=MODE(intervalo_de_dados)(funciona para uma ou mais modas, mas pode retornar apenas a primeira)
- Mediana: É o valor do meio em um conjunto de dados ordenado. Se houver um número par de valores, a mediana é a média dos dois valores do meio.
- Conceito: O valor que divide o conjunto de dados em duas metades iguais.
- Excel/Google Sheets:
=MEDIANA(intervalo_de_dados)
Medidas de Dispersão: quão espalhados estão os dados?
As medidas de dispersão nos dizem quão espalhados ou variados estão os dados em torno da tendência central.
- Amplitude: É a diferença entre o maior e o menor valor do conjunto de dados.
- Conceito: A faixa total dos dados.
- Excel/Google Sheets:
=MÁXIMO(intervalo_de_dados) - MÍNIMO(intervalo_de_dados)
- Variância: Mede a média dos quadrados das diferenças entre cada valor e a média.
- Conceito: Quão longe os dados geralmente se desviam da média. Uma variância alta indica que os dados estão mais espalhados.
- Variância Amostral (usada quando os dados são uma amostra da população):
- Excel/Google Sheets:
=VAR.S(intervalo_de_dados)
- Excel/Google Sheets:
- Variância Populacional (usada quando os dados representam toda a população):
- Excel/Google Sheets:
=VAR.P(intervalo_de_dados)
- Excel/Google Sheets:
- Desvio Padrão: É a raiz quadrada da variância.
- Conceito: A medida de dispersão mais comummente usada. Fornece uma medida da distância típica dos dados em relação à média, na mesma unidade dos dados originais.
- Desvio Padrão Amostral:
- Excel/Google Sheets:
=DESVPAD.A(intervalo_de_dados)ou=STDEV.S(intervalo_de_dados)
- Excel/Google Sheets:
- Desvio Padrão Populacional:
- Excel/Google Sheets:
=DESVPAD.P(intervalo_de_dados)ou=STDEV.P(intervalo_de_dados)
- Excel/Google Sheets:
- Coeficiente de Variação: É o desvio padrão dividido pela média, expresso como uma porcentagem.
- Conceito: Mede a dispersão relativa, permitindo comparar a variabilidade entre conjuntos de dados com diferentes médias.
- Excel/Google Sheets:
=(DESVPAD.A(intervalo_de_dados) / MÉDIA(intervalo_de_dados)) * 100
Por que essas medidas são importantes?
- Elas nos permitem resumir grandes conjuntos de dados de forma concisa.
- Comparação: Facilitam a comparação entre diferentes conjuntos de dados.
- Identificação de Padrões: Ajudam a identificar padrões, outliers (valores atípicos) e características importantes dos dados.
- Tomada de Decisão: Fornecem informações valiosas para a tomada de decisões em diversas áreas (por exemplo, negócios, saúde, educação).
Exemplo:
Se a média da altura dos alunos for 1,70 m e o desvio padrão for 0,10 m, isso significa que a altura da maioria dos alunos está tipicamente a 0,10 m de distância da média (ou seja, entre 1,60 m e 1,80 m).
Conclusão
A média, a moda, a mediana e as medidas de dispersão são ferramentas essenciais para descrever e entender os dados. Dominar esses conceitos é fundamental para qualquer estudante de estatística e para qualquer pessoa que precise trabalhar com informações quantitativas.
