Skip to main content

4.1.1 - Regressão Linear Simples

Manual da ferramenta Action sobre Regressão Linear Simples 

Para mais detalhes sobre o conteúdo estatístico  Regressão Linear Simples, clique aqui   

Se estamos interessados na relação linear de apenas uma variável de entrada com a variável resposta, então temos o caso de Regressão Linear Simples.

 

Exemplo: Em problemas de tratamento térmico deseja-se estabelecer uma relação entre a temperatura da estufa e uma característica da qualidade (dureza) de uma peça.

Observação Dureza Temperatura
1 137 220
2 137 220
3 137 220
4 136 220
5 135 220
6 135 225
7 133 225
8 132 225
9 133 225
10 133 225
11 128 230
12 124 230
13 126 230
14 129 230
15 126 230
16 122 235
17 122 235
18 122 235
19 119 235
20 122 235

 

clique aqui para efetuar o download dos dados utilizados nesse exemplo

 

Você pode consultar o vídeo demonstrativo para esse exemplo.

Para ajustarmos um  Modelo Linear Simples, vamos realizar os seguintes passos:


1. Primeiramente vamos acessar o menu como descrito a seguir:

Action $ \blacktriangleright $ Modelos $ \blacktriangleright $  Modelo Linear.

 

2. Após clicarmos em Modelo Linear, será exibida a seguinte tela:


 

3. Com o cursor no campo Conjunto de Dados, selecionamos na planilha de dados as duas colunas contendo os valores das variáveis incluíndo os nomes das variáveis. Para fazermos esta seleção, utilizamos o mouse, como mostrado na figura abaixo. Caso desejamos ler os dados sem os nomes das variáveis, é preciso desabilitar a opção Colunas com Nome, que fica abaixo do campo Conjunto de Dados


 

4. Após selecionarmos o conjunto de dados, clicamos no botão Ler. Consequentemente, os nomes das variáveis lidas aparecerão no campo Montar Fórmula como visto na figura abaixo.



5. Devemos indicar para o programa qual é a variável resposta. Para isso, no campo Variável Resposta, selecionamos dentre as variáveis lidas qual é a variável resposta. No nosso exemplo específico selecionaremos Dureza.



6. A variável explicativa pode ser numérica ou categórica.

  • Se a variável explicativa for categórica, o programa reconhece automaticamente essa informação e o nome da variável categórica é inserido automaticamente no campo Variáveis Categóricas.
  • Se a variável explicativa for numérica mas quisermos utilizá-la como variável categórica, devemos informar. Para isso, no campo Variáveis Categóricas, digitamos o nome da variável explicativa como visto na figura abaixo.
  • Se a variável explicativa for numérica e quisermos utilizá-la como variável numérica, não precisamos fazer nada, deixando o campo Variáveis Categóricas em branco.


CUIDADO: É preciso digitar o nome da variável da mesma maneira que está escrito na planilha de dados, incluindo letras maiúscula e minúscula pois o programa não reconhece a variável caso o nome esteja escrito errado. Na figura abaixo o nome Temperatura é escrito da maneira correta, respeitando letras maiúscula e minúscula, como na planilha de dados.



Se digitarmos o nome da variável categórica de maneira errada, a seguinte mensagem de erro aparecerá quando efetuarmos os demais passos e clicarmos no botão OK.



7. Indicado a variável resposta, devemos informar a fórmula do modelo. Como o modelo linear simples possui apenas uma variável explicativa, podemos montar a fórmula de duas maneiras. No campo Montar Fórmula

i) dar um clique na opção Todas ou

ii) dar um duplo clique em Temperatura, que é o nome da variável explicativa.

Assim, no campo Fórmula, aparecerá a variável explicativa Temperatura, como mostrado na figura abaixo, indicando que o modelo linear simples Dureza01Temperatura é considerado. 


Neste caso, o intercepto é considerado no modelo. Entretanto podemos considerar o modelo linear simples sem o intercepto. Para isto, basta habilitarmos a opção Sem Intercepto no campo Opções, como mostrado na figura abaixo.

 

8. Opcionais.

Além das funções básicas, podemos solicitar outras funções que complementam e auxiliam na interpretação dos resultados.

Análise Gráfica. 

Diagnosticar Erros.

 

9. Podemos calcular os valores de predição (opcional) e consequentemente os intervalos de confiança e os desvios padrão desses valores preditos. Para isto, basta habilitarmos no campo Opções a opção Valores de Predição como mostrado na figura abaixo.

 

10. No cálculo do intervalo de confiança é necessário indicarmos qual o nível de confiança adotado. Automaticamente o valor preenchido é 0,95 indicando que estamos considerando um nível de confiança de 95%. Para alterarmos esse nível, basta digitarmos o valor desejado no campo Nível de Confiança como na figura abaixo.

 

11. Para calcularmos o Valor de Previsão de uma nova observação, devemos inicialmente habilitar a opção Valores de Previsão (Novos Dados) como visto na tela abaixo.

 

12. Depois de habilitado, é necessário ler o(s) valor(es) da covariável (Temperatura) para o qual queremos prever a Dureza. Para isso, clicamos com o mouse na janela abaixo de Valores de Previsão (Novos Dados), como pode ser visto na figura abaixo. 

 

13. Com o mouse, selecionamos o(s) valor(es) da covariável incluindo o nome da covariável, como mostrado a seguir.

O Nível de Confiança será o mesmo adotado para os cálculos dos Valores de Predição.


14. Após indicarmos os passos a serem executado pelo programa, devemos escolher o local onde os resultados serão mostrados. No campo Mostrar Resultados, escolhemos uma das opções. Sugerimos a opção Nova Planilha, como visto na figura abaixo pois o Action não possui o comando desfazer. Ao escolher a opção Célula Atual, os resultados serão impressos a partir da célula em que se encontra o cursor na janela do Excel. Neste caso, o usuário deve posicionar previamente (antes do passo 1) o cursor em uma posição apropriada.

 

 

15. Para finalizar e então ver os resultados, devemos clicar em Ok.

 

Resultados e Interpretação


Após efetuada a análise, serão exibidos os seguintes resultados:


  • Adotando um nível de significância $ \alpha $=5%, temos na primeira tabela (Tabela da Anova) que o P-valor$ \textless $0,05 indicando que $ \beta_{1}\neq0 $. Portanto, concluímos com um nível de confiança de 95% que a variável explicativa tem relação linear com a variável resposta.     
  • A segunda tabela apresenta uma análise descritiva dos resíduos do modelo, contendo os valores dos quartis, máximos e mínimos, média e mediana. 
  • Na terceira tabela (Coeficientes) temos as estimativas do intercepto e do coeficiente relacionado à variável de entrada. Como o coeficiente da variável de entrada é negativo, concluímos que no intervalo da análise, um aumento na temperatura provoca diminuição na dureza do material. A tabela apresenta também os p-valores para cada coeficiente, em que a hipótese nula é que o coeficiente é não significativo. Como os valores são muito pequenos (aproximadamente 0), rejeitamos a hipótese nula para os coeficientes, indicando que eles são importantes (significativo) para o modelo.
  • A quarta tabela apresenta o $ R^2 $ Ajustado em que podemos ter uma idéia da qualidade do ajuste. Quanto mais próximo do valor 1, melhor. No exemplo, como $ R^2 $ Ajustado é próximo de 1, temos indícios de que o modelo linear simples se ajustou bem ao conjunto de dados analisado.

 

  • Na primeira tabela são apresentados os valores preditos (valores ajustados) e os respectivos intervalos de confiança e desvios padrão para cada observação.
  • Na segunda tabela temos o valor previsto, o intervalo de confiança e o desvio padrão para o nível 220 da variável explicativa Temperatura.