Qual das seguintes medidas de tendência central é mais adequada para representar um conjunto de dados que contém outliers?

(A) - 
 média
(B) - 
 mediana
(C) - 
 moda
(D) - 
 variância
(E) - 
 desvio padrão

Explicação

Outliers são valores extremos que podem distorcer as medidas de tendência central. a mediana é a medida menos afetada por outliers, pois é calculada como o valor do meio do conjunto de dados quando ordenado.

Análise das alternativas

  • (a) média: é facilmente influenciada por outliers, pois é calculada somando todos os valores e dividindo pelo número total de valores.
  • (b) mediana: é a medida menos afetada por outliers.
  • (c) moda: é o valor que ocorre com mais frequência, mas pode não ser um bom representante do conjunto de dados se houver vários valores diferentes que ocorrem com a mesma frequência.
  • (d) variância e (e) desvio padrão: são medidas de dispersão, não medidas de tendência central.

Conclusão

Ao analisar um conjunto de dados que contém outliers, a mediana é a medida de tendência central mais apropriada, pois fornece uma representação mais precisa do "valor típico" do conjunto de dados do que outras medidas, como média ou moda.