Qual das seguintes medidas de tendência central é mais adequada para representar um conjunto de dados que contém outliers?
(A) -
média
(B) -
mediana
(C) -
moda
(D) -
variância
(E) -
desvio padrão
Explicação
Outliers são valores extremos que podem distorcer as medidas de tendência central. a mediana é a medida menos afetada por outliers, pois é calculada como o valor do meio do conjunto de dados quando ordenado.
Análise das alternativas
- (a) média: é facilmente influenciada por outliers, pois é calculada somando todos os valores e dividindo pelo número total de valores.
- (b) mediana: é a medida menos afetada por outliers.
- (c) moda: é o valor que ocorre com mais frequência, mas pode não ser um bom representante do conjunto de dados se houver vários valores diferentes que ocorrem com a mesma frequência.
- (d) variância e (e) desvio padrão: são medidas de dispersão, não medidas de tendência central.
Conclusão
Ao analisar um conjunto de dados que contém outliers, a mediana é a medida de tendência central mais apropriada, pois fornece uma representação mais precisa do "valor típico" do conjunto de dados do que outras medidas, como média ou moda.