Qual das seguintes medidas de tendência central é mais adequada para dados que podem conter valores discrepantes (outliers)?
(A) -
média
(B) -
mediana
(C) -
moda
(D) -
mediana e moda
(E) -
média e moda
Dica
- observe os gráficos dos dados (por exemplo, boxplots ou histogramas) para identificar valores que estão muito distantes da maioria dos dados.
- calcule o desvio padrão e identifique valores que estão a mais de 3 desvios padrão da média.
- use o "teste do olhar" para identificar valores que parecem fora do padrão.
Explicação
A mediana é a medida de tendência central mais adequada para dados que podem conter valores discrepantes, pois ela não é afetada por valores extremos.
Análise das alternativas
- (a): a média é sensível a valores discrepantes e pode ser distorcida por eles.
- (b): a mediana não é afetada por valores discrepantes, tornando-a uma escolha adequada.
- (c): a moda representa o valor que aparece com maior frequência e pode ser influenciada por valores discrepantes.
- (d): a combinação de mediana e moda também pode ser adequada, mas a mediana é mais robusta em relação a valores discrepantes.
- (e): a combinação de média e moda não é adequada, pois a média pode ser distorcida por valores discrepantes.
Conclusão
A escolha da medida de tendência central mais adequada depende da natureza dos dados. para dados com valores discrepantes, a mediana é a medida mais robusta e confiável.