Qual das seguintes medidas de dispersão é adequada para conjuntos de dados com valores muito diferentes (outliers)?
(A) -
Amplitude
(B) -
Variância
(C) -
Desvio padrão
(D) -
Mediana
(E) -
Moda
Dica
- Verifique se há valores que são significativamente diferentes do restante dos dados.
- Use gráficos, como boxplots ou gráficos de dispersão, para visualizar os dados e identificar possíveis outliers.
- Calcule a amplitude para avaliar a variabilidade dos dados, incluindo os outliers.
Explicação
A amplitude é a medida de dispersão mais adequada para conjuntos de dados com outliers, pois ela não é afetada por valores extremos. A amplitude simplesmente mede a diferença entre o maior e o menor valor no conjunto de dados, tornando-a uma medida robusta contra outliers.
Análise das alternativas
As outras alternativas não são adequadas para conjuntos de dados com outliers:
- (B): A variância e o desvio padrão são medidas de dispersão que são afetadas por outliers, pois elas levam em consideração a distância de cada valor em relação à média.
- (C): Como a variância, o desvio padrão também é afetado por outliers.
- (D): A mediana é uma medida de tendência central e não uma medida de dispersão.
- (E): A moda é uma medida de tendência central e não uma medida de dispersão.
Conclusão
A amplitude é a medida de dispersão mais apropriada para conjuntos de dados com outliers, pois ela não é afetada por valores extremos. Quando houver outliers em um conjunto de dados, é importante escolher uma medida de dispersão robusta, como a amplitude.