- (16) 3376-2047
- [email protected]
- Portfólio de Serviços
- AT
Considerando o modelo de regressão linear múltipla com todas as variáveis explicativas dadas no conjunto de dados, verificamos inicialmente se há problemas de colinearidade e de multicolinearidade entre as variáveis envolvidas.
Usando o Software Action obtemos os seguintes resultados:
Tabela 5.1.1: Matriz de correlação para as covariáveis do modelo.
Tabela 5.1.2: VIF das variáveis - diagnóstico de multicolinearidade.
![]() |
Para entender como executar essa função do Software Action, você pode consultar o manual do usuário. |
Analisando a Tabela 5.1.1 observamos que os valores encontrados são todos inferiores a 0,9. Desta forma, não eliminamos nenhuma covariável do modelo. Já na Tabela 5.1.2 verificamos que o valor do VIF da covariável Cr é o maior valor entre os VIFs calculados. Além disso, o valor encontrado é maior do que 10. Desta forma, temos indícios de que a covariável Cr tem problema de multicolinearidade. Logo, consideramos o modelo de regressão linear múltipla sem a covariável Cr e então recalculamos os valores do VIF das covariáveis, como mostrado na Tabela 5.1.3.
Tabela 5.1.3: VIF das variáveis considerando o modelo sem a covariável Cr - diagnóstico de multicolinearidade.
Observamos na Tabela 5.1.3 que o valor do VIF da covariável P é o maior entre os VIFs calculados. Como o valor encontrado é maior do que 10, retiramos a covariável P do modelo e recalculamos os valores do VIF das covariáveis restantes, que pode ser observado na Tabela 5.1.4.
Tabela 5.1.4: VIF das variáveis considerando o modelo sem as covariáveis Cr e P - diagnóstico de multicolinearidade.
Analisando a Tabela 5.1.4 percebemos que nenhum dos valores de VIF calculados é superior a 10. Assim, não temos indícios de multicolinearidade entre as covariáveis do modelo em questão. Logo, consideramos o modelo sem as covariáveis explicativas Cr e P nas análises subsequentes.
Após avaliarmos a colinearidade e a multicolinearidade entre as covariáveis envolvidas, realizamos um diagnóstico de outlier a fim de detectar se alguma observação é outlier e ponto influente.
Para uma observação ser outlier em X, o hii precisa ser maior que 0,52 (2(p+1)/n). Verificamos , através da Figura 5.1.1, que uma observação apresenta valor maior que 0,52 e por isso é outlier em X. Pela Figura 5.1.2 observamos que a terceira observação é um outlier em Y pois os valores dos resíduos studentizados e padronizados são maiores que 3.
A fim de confirmar a análise gráfica, pelo teste de Bonferroni da Tabela 5.1.4 rejeitamos a hipótese de que a observação 3 não é um outlier.
Pela Figura 5.1.3 percebemos que além de outliers, a observação 3 é um ponto influente pois os seus valores de DFBetas para as variáveis "Hardness" e "UTS" são maiores que 1.
Figura 5.1.1: Boxplot do hii
Figura 5.1.2: Resíduos padronizados e studentizados versus valores ajustados
Tabela 5.1.4: Teste de Bonferroni para outliers
Figura 5.1.3: Gráficos das medidas de influência das observações
Como vimos que a observação 3 é um outlier e um ponto influente no ajuste, vamos realizar a seleção de variáveis sem considerar essa observação para que ela não influencie na significância ou não na seleção das variáveis importantes para o modelo. Na Tabela 5.1.5 temos o ajuste do modelo com a estimativa e significância dos parâmetros sem considerar a observação 3.
Tabela 5.1.5: Modelo sem a observação 3
Para entender como executar essa função do Software Action, você pode consultar:
![]() |
Para entender como executar essa função do Software Action, você pode consultar o manual do usuário. |
O Portal Action é mantido pela Estatcamp - Consultoria Estatística e Qualidade, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.