Qual das seguintes situações descreve melhor um conjunto de dados que pode ser modelado usando uma reta de regressão?
(A) -
uma lista de notas de alunos em matemática e português, onde não há relação aparente entre as notas nas duas disciplinas.
(B) -
um conjunto de dados que mostra o crescimento da temperatura ao longo do dia, onde a temperatura aumenta gradualmente com o passar das horas.
(C) -
uma lista de nomes de países e suas populações, onde não há padrão óbvio na variação das populações.
(D) -
um conjunto de dados que registra o número de gols marcados por um time de futebol em cada partida, onde o número de gols varia aleatoriamente.
(E) -
uma lista de dados sobre a altura e peso de diferentes pessoas, onde não há relação entre as duas variáveis.
Dica
- procure por conjuntos de dados em que uma variável aumenta ou diminui constantemente em relação à outra variável.
- observe se há uma tendência clara nos dados quando plotados em um gráfico de dispersão.
- verifique se a correlação entre as variáveis é significativa.
Explicação
Uma reta de regressão é uma linha que descreve a relação linear entre duas variáveis numéricas. no conjunto de dados da alternativa (b), a temperatura aumenta gradualmente com o passar das horas, indicando uma relação linear entre as duas variáveis.
Análise das alternativas
As demais alternativas não apresentam uma relação linear entre as variáveis:
- (a): não há relação aparente entre as notas de matemática e português.
- (c): não há padrão óbvio na variação das populações dos países.
- (d): o número de gols marcados varia aleatoriamente.
- (e): não há relação entre a altura e o peso das pessoas.
- (e): não há relação entre a altura e o peso das pessoas.
Conclusão
A modelagem linear é uma ferramenta útil para analisar dados quando há uma relação linear entre as variáveis. essa técnica nos permite descrever a relação e fazer previsões com base nos dados disponíveis.