5.1.1 - Ajuste do Modelo Completo

Você está aqui

Considerando o modelo de regressão linear múltipla com todas as variáveis explicativas dadas no conjunto de dados, verificamos inicialmente se há problemas de colinearidade e de multicolinearidade entre as variáveis envolvidas.

Usando o Software Action obtemos os seguintes resultados:

Tabela 5.1.1: Matriz de correlação para as covariáveis do modelo.

 

Tabela 5.1.2: VIF das variáveis - diagnóstico de multicolinearidade.

Para entender como executar essa função do Software Action, você pode consultar o manual do usuário.

Analisando a Tabela 5.1.1 observamos que os valores encontrados são todos inferiores a 0,9. Desta forma, não eliminamos nenhuma covariável do modelo. Já na Tabela 5.1.2 verificamos que o valor do VIF da covariável Cr é o maior valor entre os VIFs calculados. Além disso, o valor encontrado é maior do que 10. Desta forma, temos indícios de que a covariável Cr tem problema de multicolinearidade. Logo, consideramos o modelo de regressão linear múltipla sem a covariável Cr e então recalculamos os valores do VIF das covariáveis, como mostrado na Tabela 5.1.3.

Tabela 5.1.3: VIF das variáveis considerando o modelo sem a covariável Cr - diagnóstico de multicolinearidade.

Observamos na Tabela 5.1.3 que o valor do VIF da covariável P é o maior entre os VIFs calculados. Como o valor encontrado é maior do que 10, retiramos a covariável P do modelo e recalculamos os valores do VIF das covariáveis restantes, que pode ser observado na Tabela 5.1.4.

Tabela 5.1.4: VIF das variáveis considerando o modelo sem as covariáveis Cr e P - diagnóstico de multicolinearidade.

Analisando a Tabela 5.1.4 percebemos que nenhum dos valores de VIF calculados é superior a 10. Assim, não temos indícios de multicolinearidade entre as covariáveis do modelo em questão. Logo, consideramos o modelo sem as covariáveis explicativas Cr e P nas análises subsequentes.

Após avaliarmos a colinearidade e a multicolinearidade entre as covariáveis envolvidas, realizamos um diagnóstico de outlier a fim de detectar se alguma observação é outlier e ponto influente.

 

Para uma observação ser outlier em X, o hii precisa ser maior que 0,52 (2(p+1)/n). Verificamos , através da Figura 5.1.1, que uma observação apresenta valor maior que 0,52 e por isso é outlier em X. Pela Figura 5.1.2 observamos que a terceira observação é um outlier em Y pois os valores dos resíduos studentizados e padronizados são maiores que 3.

A fim de confirmar a análise gráfica, pelo teste de Bonferroni da Tabela 5.1.4 rejeitamos a hipótese de que a observação 3 não é um outlier.

Pela Figura 5.1.3 percebemos que além de outliers, a observação 3 é um ponto influente pois os seus valores de DFBetas para as variáveis "Hardness" e "UTS" são maiores que 1.

Figura 5.1.1: Boxplot do hii

Figura 5.1.2: Resíduos padronizados e studentizados versus valores ajustados

Tabela 5.1.4: Teste de Bonferroni para outliers

Figura 5.1.3: Gráficos das medidas de influência das observações

Como vimos que a observação 3 é um outlier e um ponto influente no ajuste, vamos realizar a seleção de variáveis sem considerar essa observação para que ela não influencie na significância ou não na seleção das variáveis importantes para o modelo. Na Tabela 5.1.5 temos o ajuste do modelo com a estimativa e significância dos parâmetros sem considerar a observação 3.

Tabela 5.1.5: Modelo sem a observação 3

 

Para entender como executar essa função do Software Action, você pode consultar:

 

 Para entender como executar essa função do Software Action, você pode consultar o  manual do usuário.

Análise de Regressão

Sobre o Portal Action

O Portal Action é mantido pela Estatcamp - Consultoria Estatística e Qualidade, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.

Facebook

CONTATO

  •  Maestro Joao Seppe, 900, São Carlos - SP | CEP 13561-180
  • Telefone: (16) 3376-2047
  • E-Mail: [email protected]