7.1.3 - Modelo Final

Você está aqui

Conforme analisado na seção ajuste do modelo completo observamos que as variáveis APS D50 e APS D90 tem correlação superior a 0,9. Desta forma, vamos eliminar a covariável do APS D50 do modelo. Após avaliarmos a colinearidade entre as covariáveis envolvidas, a observação 66 é um ponto influente pois os seus valores de $D_i$ (Distância de Cook) é maior que 1. Assim, vamos retirar esta observação do modelo.

Portanto, o modelo final é dado por:

$$Y=\beta_0+\beta_1 x_{1}+\beta_2 x_{2}+\beta_3 x_{3}+\beta_3 x_{3}+\beta_4 x_{4}+\beta_6 x_{1}:x_{2}+\dots+\beta_{32} x_{1}:x_{2}:x_{3}:x_{4}~~~(7.1.3.1)$$

em que

  • Y: é a peneira de 45 μm;
  • β0: é o intercepto;
  • x1 : é a variável damper;
  • x2 : é a variável drenagem;
  • x3 : é a variável corrente;
  • x4 : é a variável APS D90;
  • βi : são os coeficientes do modelo para as variáveis x1, x2, x3 , x4 e as interações dois a dois, três a três etc entre estas variáveis, para i=1,...,32.

  

A seguir, vamos apresentar os resultados obtidos pelo software Action.

Tabela 7.1.3.1: Tabela da ANOVA.

No ajuste do modelo com as variáveis Damper, Drenagem, Corrente, APS D90 e todas as interações como variáveis explicativas da variável Peneira 45 μm, observamos que o modelo é significativo ao nível de significância de 5%. Fato visto também na tabela 7.1.3.2 na tabela com teste individual dos parâmetros.

Tabela 7.1.3.2: Tabela com a estimativa dos parâmetros do modelo.

 O $R^2$ é uma medida descritiva da qualidade do ajuste obtido. Em geral referimo-nos ao $R^2$ como a quantidade de variabilidade nos dados que é explicada pelo modelo de regressão ajustado.  Neste caso obtemos $R^2$=0,97.  

Tabela 7.1.3.3: Tabela com o desvio padrão dos resíduos, graus de liberdade e medidas de associação $R^2$ e $R^2$ ajustado.

Um valor grande de $R^2$ não significa uma reta mais inclinada, além do mais, ele não leva em consideração a falta de ajuste do modelo. O $R^2$ poderá ser grande, mesmo que y e x estejam não linearmente relacionados. Dessa forma, temos que $R^2$ não deve ser observado sozinho, mas sempre aliado a outros diagnósticos do modelo. Logo, para reforçar o ajuste do modelo, vamos analisar a falta de ajuste do modelo 7.1.3.1.

Agora, vamos testar a seguinte hipótese:

$$\left\{\begin{array}{llll}H_0:E(Y_i) = \beta_0+\beta_i~x_i~~\mbox{modelo linear adequado}\\H_1 : E(Y_i) \neq \beta_0+\beta_i~x_i ~~\mbox{modelo linear inadequado}\\\quad \quad i=1,\dots,32.\end{array}\right.$$

Temos inicialmente

$$ (y_{ij}-\hat{y}_i)=(y_{ij}-\bar{y}_{i.})-(\bar{y}_{i.}-\hat{y}_{i}).$$

Disto, calculamos a soma de quadrados separadamente para o Falta de Ajuste.

$$SQE=\sum_{i=1}^m\sum_{j=1}^{n_i}(y_{ij}-\overline{y}_{i.})^2 +\sum_{i=1}^m \sum_{j=1}^{n_i}(\hat{y}_{ij}-\overline{y}_{i})^2$$

$$=0,00135+0,01448771=0,01583771.$$

$$QM_{LOF}=\frac{SQ_{LOF}}{m-p-1}=\frac{0,01448771}{48}= 0,000301827.$$

$$QM_{PE}=\frac{SQ_{PE}}{n-m}=\frac{0,00135}{10} =0,000135.$$

Podemos então, calcular a estatística F, com base nos quadrados médios, sabendo que neste exemplo os valores de m=122 e n=132.

$$F_0=\frac{QM_{LOF}}{QM_{PE}} = \frac{0,000301827}{0,000135}= 2,2357.$$

Se $H_0$ é verdadeiro, obtemos que $F_0 \sim F_{(48;10)}.$

Com isso, rejeitamos $H_0$ se $F_0\textgreater F_{(48; 10)}$. Como $F_{(48;10)}=2,64,$ então temos $F_0\textless F_{(48;10)}.$ Assim, não temos evidências de rejeitar $H_0.$ A seguir, vamos calcular o p-valor.

$$\text{P-valor}=P[F_{(48; 10)}\textgreater F_0]= 0,08512.$$

Temos a seguir a Tabela ANOVA com o Falta de Ajuste dos dados com réplicas.

Tabela 7.1.3.4: Tabela do teste de falta de ajuste (Lack of Fit).

Portanto, não rejeitamos a hipótese de que o modelo linear é adequado, isto é, o modelo linear é adequado.

 Para entender como executar essa função do Software Action, você pode consultar o manual do usuário.

A seguir apresentamos alguns diagnósticos do modelo final como o diagnóstico de outliers e pontos influentes.

Figura 5.3.3.1: Gráfico do diagnóstico de outliers.

Figura 7.1.3.2: Gráfico do diagnóstico de pontos influentes.

 Agora, vamos avaliar a homocedasticidade (variância constante dos erros εi) do modelo. A partir da tabela 5.3.3.5, obtemos que a variável APS D90  é a responsável pela heteroscedasticidade do modelo (p-valor desprezível). Assim, não podemos mais dizer que os Estimadores de Mínimos Quadrados são os melhores estimadores de variância mínima variância para $\beta,$ embora ainda possam ser não viciados.


Tabela 7.1.3.5: Tabela do diagnóstico de homocedasticidade.

A seguir, como não obtemos estimadores de mínimos quadrados com variância mínima, vamos na próxima seção fazer a previsão do modelo ajustado e alguns gráficos de otimização do modelo final.

 

Sobre o Portal Action

O Portal Action é mantido pela Estatcamp - Consultoria Estatística e Qualidade, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.

Facebook

CONTATO

  •  Maestro Joao Seppe, 900, São Carlos - SP | CEP 13561-180
  • Telefone: (16) 3376-2047
  • E-Mail: [email protected]