Skip to main content

Esse procedimento parte da suposição de que não há variável no modelo, apenas o intercepto. A ideia do método é adicionar uma variável de cada vez. A primeira variável selecionada é aquela com maior correlação com a resposta.

Procedimento:

  • Ajustamos o modelo com a variável com maior correlação amostral com a variável resposta.

Supondo que essa variável seja $ x_1 $, calculamos a estatística F para testar se ela realmente é significativa para o modelo. A variável entra no modelo se a estatística F for maior do que o ponto crítico, chamado de $ F_{in} $ ou F para entrada. Notemos que $ F_{in} $ é calculado para um dado $ \alpha $ crítico.

  • Considerando que $ x_1 $ foi selecionado para o modelo, o próximo passo é encontrar uma variável com maior correlação com a resposta considerando a presença da primeira variável no modelo. Esta é chamada de correlação parcial e é a correlação dos resíduos do modelo $ \hat{y}=\hat{\beta}_0+\hat{\beta}_1x_1 $ com os resíduos do modelo $ \hat{x}_j=\hat{\alpha}_{0j}+\hat{\alpha}_{1j}x_1 $, j=2,3,...,p.

Vamos supor que a maior correlação parcial com y seja $ x_2 $. Isso implica que a maior estatística F parcial é:

$$F=\frac{SQR(x_2|x_1)}{QME(x_1,x_2)}.$$

Se o valor da estatística é maior do que $ F_{in} $, $ x_2 $ é selecionado para o modelo.

  • O processo é repetido, ou seja, variável com maior correlação parcial com y é adicionada no modelo se sua estatística F parcial for maior que $ F_{in} $, até que não seja incluída mais nenhuma variável explicativa no modelo.
 Para entender como executar essa função do Software Action, você pode consultar o manual do usuário.