Qual das seguintes medidas de tendência central é mais adequada para dados que podem conter valores discrepantes (outliers)?

(A) - 
 média
(B) - 
 mediana
(C) - 
 moda
(D) - 
 mediana e moda
(E) - 
 média e moda

Dica

  • observe os gráficos dos dados (por exemplo, boxplots ou histogramas) para identificar valores que estão muito distantes da maioria dos dados.
  • calcule o desvio padrão e identifique valores que estão a mais de 3 desvios padrão da média.
  • use o "teste do olhar" para identificar valores que parecem fora do padrão.

Explicação

A mediana é a medida de tendência central mais adequada para dados que podem conter valores discrepantes, pois ela não é afetada por valores extremos.

Análise das alternativas

  • (a): a média é sensível a valores discrepantes e pode ser distorcida por eles.
  • (b): a mediana não é afetada por valores discrepantes, tornando-a uma escolha adequada.
  • (c): a moda representa o valor que aparece com maior frequência e pode ser influenciada por valores discrepantes.
  • (d): a combinação de mediana e moda também pode ser adequada, mas a mediana é mais robusta em relação a valores discrepantes.
  • (e): a combinação de média e moda não é adequada, pois a média pode ser distorcida por valores discrepantes.

Conclusão

A escolha da medida de tendência central mais adequada depende da natureza dos dados. para dados com valores discrepantes, a mediana é a medida mais robusta e confiável.