Qual técnica ou ferramenta é mais adequada para explorar e analisar conjuntos de dados relativos ao comportamento de duas variáveis numéricas?

(A) - 
 regressão logística
(B) - 
 gráfico de dispersão
(C) - 
 teste de hipóteses
(D) - 
 análise de variância
(E) - 
 árvore de decisão

Explicação

Um gráfico de dispersão é um tipo de representação gráfica que mostra a relação entre duas variáveis numéricas. ele permite que os analistas visualizem os dados, identifiquem padrões e tendências, e façam inferências sobre a correlação entre as variáveis.

Análise das alternativas

As outras alternativas não são tão adequadas quanto um gráfico de dispersão para o propósito de exploração e análise de dados de duas variáveis numéricas:

  • (a): a regressão logística é usada para modelar relacionamentos entre uma variável dependente categórica e uma ou mais variáveis independentes.
  • (c): o teste de hipóteses é usado para testar a significância estatística das diferenças entre dois ou mais grupos.
  • (d): a análise de variância é usada para comparar as médias de três ou mais grupos.
  • (e): as árvores de decisão são usadas para classificação e predição, não para exploração e análise de dados.

Conclusão

Os gráficos de dispersão são uma ferramenta essencial para explorar e analisar conjuntos de dados relativos ao comportamento de duas variáveis numéricas. eles permitem que os analistas entendam a natureza da relação entre as variáveis e façam inferências sobre possíveis causalidades ou correlações.