Modelo de Regressão Linear Simples sobre tratamento térmico

Você está aqui

Manual da ferramenta Action sobre Regressão Linear 

Para mais detalhes sobre o conteúdo estatístico Regressão Linear Simples, clique aqui

 

Se estamos interessados na relação linear de apenas uma variável de entrada com a variável resposta, então temos o caso de Regressão Linear Simples.

Exemplo:

Em problemas de tratamento térmico deseja-se estabelecer uma relação entre a temperatura da estufa e uma característica da qualidade (dureza) de uma peça.

Observação Dureza Temperatura
1 137 220
2 137 220
3 137 220
4 136 220
5 135 220
6 135 225
7 133 225
8 132 225
9 133 225
10 133 225
11 128 230
12 124 230
13 126 230
14 129 230
15 126 230
16 122 235
17 122 235
18 122 235
19 119 235
20 122 235

clique aqui para efetuar o download dos dados utilizados nesse exemplo

Para ajustarmos um  Modelo Linear Simples, vamos realizar os seguintes passos:

1. Primeiramente vamos acessar o menu como descrito a seguir:

Action Stat $ \blacktriangleright $ Modelo Linear $ \blacktriangleright $  Modelo Linear Simples.

2. Após clicarmos em Modelo Linear Simples, será exibida a seguinte tela:

 

3. Com o cursor no campo Conjunto de Dados, selecionamos na planilha de dados as duas colunas contendo os valores das variáveis incluindo os nomes das variáveis. Para fazermos esta seleção, utilizamos o mouse, como mostrado na figura abaixo. Caso desejamos ler os dados sem os nomes das variáveis, é preciso desabilitar a opção Colunas com Nome, que fica abaixo do campo Conjunto de Dados

4. Após selecionarmos o conjunto de dados, clicamos no botão ​Ler. Devemos indicar para o programa qual é a variável resposta. Para isso, no campo Variável Resposta, selecionamos dentre as variáveis lidas qual é a variável resposta. No nosso exemplo específico selecionaremos Dureza.

5. Devemos indicar o tipo de Modelo de Regressão, para o exemplo em questão, selecionamos Linear.

6. Podemos também incluir Pesos, através da função conforme vemos na figura abaixo, porém para o exemplo em questão não serão inclusos pesos​.

7. Em ​Diagnósticar Erros, podemos selecionar o tipo de análise a ser feita, com intuito de verificar indícios de falta de ajuste ou valores que possam influenciar a adequabilidade do modelo. Podemos selecionar a opção ​Selecionar todos​, e realizar todo diagnóstico de uma vez.

​8. Neste caso, o modelo Dureza01Temperatura ​é considerado. Entretanto podemos considerar o modelo linear simples sem o intercepto. Para isto, basta habilitarmos a opção Sem Intercepto no campo Opções, como mostrado na figura abaixo.

9. Podemos calcular os valores de predição (opcional) e consequentemente os intervalos de confiança e os desvios padrão desses valores preditos. Para isto, basta habilitarmos no campo Opções a opção Valores de Predição como mostrado na figura abaixo.

10. Para calcularmos o Valor de Previsão de uma nova observação, devemos inicialmente habilitar a opção Valores de Previsão (Novos Dados) como visto na tela abaixo.

11. Depois de habilitado, é necessário ler o(s) valor(es) da covariável (Temperatura) para o qual queremos prever a Dureza. Para isso, clicamos com o mouse na janela abaixo de Valores de Previsão (Novos Dados), como pode ser visto na figura abaixo. 

12. Com o mouse, selecionamos o(s) valor(es) da covariável incluindo o nome da covariável, como mostrado a seguir.

13. Podemos fazer um Gráfico do Diagrama de Dispersão para os dados, basta habilitar a opção Diagrama de Dispersão como visto abaixo.

14. No cálculo do intervalo de confiança é necessário indicarmos qual o nível de confiança adotado. Automaticamente o valor preenchido é 0,95 indicando que estamos considerando um nível de confiança de 95%. Para alterarmos esse nível, basta digitarmos o valor desejado no campo Nível de Confiança como na figura abaixo.

O Nível de Confiança será o mesmo adotado para os cálculos dos Valores de Predição.

15. Após indicarmos os passos a serem executado pelo programa, devemos escolher o local onde os resultados serão mostrados. No campo Mostrar Resultados, escolhemos uma das opções. Sugerimos a opção Nova Planilha, como visto na figura abaixo pois o Action não possui o comando desfazer. Ao escolher a opção Célula Atual, os resultados serão impressos a partir da célula em que se encontra o cursor na janela do Excel. Neste caso, o usuário deve posicionar previamente (antes do passo 1) o cursor em uma posição apropriada.

16. Para finalizar e então ver os resultados, devemos clicar em Ok.

Resultados e Interpretação

Após efetuada a análise, serão exibidos os seguintes resultados:

Adotando um nível de significância $ \alpha $=5%, temos na Tabela da Anova que o P-valor$ \textless $0,05 indicando que $ \beta_{1}\neq0 $. Portanto, concluímos com um nível de confiança de 95% que a variável explicativa tem relação linear com a variável resposta.   

A segunda tabela apresenta uma análise descritiva dos resíduos do modelo, contendo os valores dos quartis, máximos e mínimos, média e mediana. 

Na terceira tabela (Coeficientes) temos as estimativas do intercepto e do coeficiente relacionado à variável de entrada. Como o coeficiente da variável de entrada é negativo, concluímos que no intervalo da análise, um aumento na temperatura provoca diminuição na dureza do material. A tabela apresenta também os p-valores para cada coeficiente, em que a hipótese nula é que o coeficiente é não significativo. Como os valores são muito pequenos (aproximadamente 0), rejeitamos a hipótese nula para os coeficientes, indicando que eles são importantes (significativo) para o modelo.

A quarta tabela apresenta o $ R^2 $ Ajustado em que podemos ter uma ideia da qualidade do ajuste. Quanto mais próximo do valor 1, melhor. No exemplo, como $ R^2 $ Ajustado é próximo de 1, temos indícios de que o modelo linear simples se ajustou bem ao conjunto de dados analisado.

Na Tabela Intervalo de Confiança para os Parâmetros, são apresentados os intervalos de confiança para cada parâmetro.

Na tabela de predição são apresentados os valores preditos (valores ajustados) e os respectivos intervalos de confiança e desvios padrão para cada observação.

Na tabela intervalo de previsão temos o valor previsto, o intervalo de confiança e o desvio padrão para o nível 220 da variável explicativa Temperatura.

 

Para a a Análise de Gráfica, temos o ​Diagrama de Dispersão​ em que vemos os valores ajustados da variável resposta Dureza pela temperatura de 220.

 

Na Tabela Análise de Diagnóstico, temos a análise de alguns tipos de resíduos além dos Pontos de Influência, DFfits, DFbetas e Distância de Cook.

 

A Tabela Critério nos mostra os valores adotados para determinar os pontos de alavanca, pontos influentes e valores extremos na resposta.

 

No gráfico 1 um gráfico de Resíduos Padronizados versus Valores Ajustados.

No gráfico 2 um gráfico de Resíduos versus Quantis da Normal.

No gráfico 3 um gráfico de Resíduos versus Valores Ajustados.

No gráfico 4 um gráfico de Resíduos versus Ordem de Coleta.

 

Na Tabela Teste de Normalidade, temos os testes de Anderson-DarlingShapiro-WilkKolmogorov-SmirnovRyan-Joiner para verificar se os resíduos tem distribuição normal, como os p-valores são todos maiores que 0,05, não rejeitamos a hipótese de normalidade dos dados.

No QQ plot podemos verificar se os resíduos seguem uma distribuição normal. O teste de Ryan Joiner é utilizado para testar se os dados provém de uma população com distribuição normal, utilizando um nível de significância de 5%,  como o p-valor é 0,42, não rejeitamos a hipótese de que os dados provém de uma população normal.

Nas tabelas acima temos os testes de homocedasticidade de Cochran, Brown Forsythe, Breusch Pagan e Goldfeld Quandt, assumindo um nível de confiança de 0,05, todos os testes apresentam p-valores maiores que o nível de significância, assim não rejeitamos a hipótese de homocedasticidade dos resíduos.

Adotando um nível de significância de 5% temos que pelo teste de Durbin Watson os resíduos são independentes.

Também, analisando o gráfico dos resíduos versus a ordem da coleta vemos que os pontos não parecem ter uma tendência e por isso temos indícios de independência dos erros.

 

Na Tabela Teste de Falta de Ajuste, temos o Teste F para a verificação da adequabilidade do modelo.

 

Temos nenhum resíduo padronizado $ r_i $ e resíduo studentizado $ t_i $ fora do intervalo $ -3\leq r_i \leq 3 $. Por isso, temos que nenhuma observação é considerada outlier em Y. 

 

Observamos  que nenhum $ h_{ii} $ é maior do que 2(p+1)/n=2(2)/20= 0,2. Por isso, temos que nenhuma observação é considerada outlier em X. 

 

 

Pelos resultados dos gráficos temos que nenhum DFFITS, D-COOK e DFBETAS é, em módulo, maior que 1. Assim, temos que nenhuma observação do exemplo é um ponto influente.

 

Podemos ver a Análise Gráfica dos Resíduos por meio dos gráficos acima.

Manual - Modelos

Sobre o Portal Action

O Portal Action é mantido pela Estatcamp - Consultoria Estatística e Qualidade, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.

Facebook

CONTATO

  •  Maestro Joao Seppe, 900, São Carlos - SP | CEP 13561-180
  • Telefone: (16) 3376-2047
  • E-Mail: [email protected]