Qual das seguintes situações descreve melhor um conjunto de dados que pode ser modelado usando uma reta de regressão?

(A) - 
 uma lista de notas de alunos em matemática e português, onde não há relação aparente entre as notas nas duas disciplinas.
(B) - 
 um conjunto de dados que mostra o crescimento da temperatura ao longo do dia, onde a temperatura aumenta gradualmente com o passar das horas.
(C) - 
 uma lista de nomes de países e suas populações, onde não há padrão óbvio na variação das populações.
(D) - 
 um conjunto de dados que registra o número de gols marcados por um time de futebol em cada partida, onde o número de gols varia aleatoriamente.
(E) - 
 uma lista de dados sobre a altura e peso de diferentes pessoas, onde não há relação entre as duas variáveis.

Dica

  • procure por conjuntos de dados em que uma variável aumenta ou diminui constantemente em relação à outra variável.
  • observe se há uma tendência clara nos dados quando plotados em um gráfico de dispersão.
  • verifique se a correlação entre as variáveis é significativa.

Explicação

Uma reta de regressão é uma linha que descreve a relação linear entre duas variáveis numéricas. no conjunto de dados da alternativa (b), a temperatura aumenta gradualmente com o passar das horas, indicando uma relação linear entre as duas variáveis.

Análise das alternativas

As demais alternativas não apresentam uma relação linear entre as variáveis:

  • (a): não há relação aparente entre as notas de matemática e português.
  • (c): não há padrão óbvio na variação das populações dos países.
  • (d): o número de gols marcados varia aleatoriamente.
  • (e): não há relação entre a altura e o peso das pessoas.
  • (e): não há relação entre a altura e o peso das pessoas.

Conclusão

A modelagem linear é uma ferramenta útil para analisar dados quando há uma relação linear entre as variáveis. essa técnica nos permite descrever a relação e fazer previsões com base nos dados disponíveis.