Exemplo
Em uma empresa são fabricadas peças de ferro que são moldadas em moldes de areia. Entre as peças produzidas as que apresentam uma grande quantidade de areia incrustada são consideradas Refugo. A Volatilidade da Areia e o coeficiente RFV (Resistência ao Fluido Verde) influenciam na quantidade de areia incrustada. A partir dos dados da Tabela 1 avaliar a significância das variáveis e interação entre elas, considerando o modelo binomial para superfície de resposta.
| Observação | Quantidade Produzida | Refugo | Volatilidade | RFV |
| 1 | 832 | 270 | 1,906 | 5,642 |
| 2 | 996 | 152 | 1,766 | 7,63 |
| 3 | 1224 | 289 | 1,673 | 5,253 |
| 4 | 712 | 2 | 1,982 | 5,223 |
| 5 | 2072 | 11 | 2 | 5,064 |
| 6 | 544 | 14 | 2,12 | 5,395 |
| 7 | 700 | 5 | 2,085 | 6,138 |
| 8 | 3840 | 47 | 1,97 | 5,82 |
| 9 | 1940 | 101 | 2,15 | 4,498 |
| 10 | 1005 | 17 | 2,37 | 6,478 |
| 11 | 1260 | 26 | 2,37 | 5,826 |
| 12 | 1815 | 308 | 2,597 | 6,052 |
| 13 | 1340 | 79 | 2,44 | 5,839 |
| 14 | 1485 | 134 | 2,473 | 5,08 |
| 15 | 1585 | 127 | 2,493 | 5,313 |
| 16 | 1095 | 83 | 2,43 | 5,21 |
| 17 | 1370 | 81 | 3,42 | 5,04 |
| 18 | 1405 | 58 | 3,607 | 5,2222 |
clique aqui para efetuar o download dos dados utilizados nesse exemplo
| Você pode consultar o vídeo demonstrativo para esse exemplo. | |||
Para realizarmos a Seleção de Modelos Binomial, vamos realizar os seguintes passos:
1. Primeiramente vamos acessar o menu como descrito a seguir:
Action
Modelos
Modelo Binomial

2. A seguinte tela será exibida:

3. Com o cursor no campo Conjunto de Dados, selecionamos na planilha de dados as duas colunas contendo os valores das variáveis incluíndo os nomes das variáveis. Para fazermos esta seleção, utilizamos o mouse, como mostrado na figura abaixo. Caso desejamos ler os dados sem os nomes das variáveis, é preciso desabilitar a opção Colunas com Nome, que fica abaixo do campo Conjunto de Dados.

4. Após selecionarmos o conjunto de dados, clicamos no botão Ler. Consequentemente, os nomes das variáveis lidas aparecerão no campo Montar Fórmula como visto na figura abaixo.

5. Em Amostras em, selecionemos a opção correspondente a seus dados: se estão completos (Dados Completos) ou resumidos (Dados Resumidos). No nosso exemplo selecionaremos Dados Resumidos;

6. No campo Variável Resposta escolheremos a variável correspondente. No nosso exemplo selecionaremos Refugo;

7. No campo Função de Ligação, selecionemos dentre as opções Logit (Logístico), Probit (Probito) e cloglog (Complemento Log Log). No nosso exemplo selecionaremos logit;

8. No campo Número de ensaios, selecionemos a variável correspondente. No nosso exemplo selecionaremos Quantidade Produzida;

9. A variável explicativa pode ser numérica ou categórica.
- Se a variável explicativa for categórica, o programa reconhece automaticamente essa informação e o nome da variável categórica é inserido automaticamente no campo Variáveis Categóricas.
- Se a variável explicativa for numérica mas quisermos utilizá-la como variável categórica, devemos informar. Para isso, no campo Variáveis Categóricas, digitamos o nome da variável explicativa como visto na figura abaixo.
- Se a variável explicativa for numérica e quisermos utilizá-la como variável numérica, não precisamos fazer nada, deixando o campo Variáveis Categóricas em branco.
CUIDADO: É preciso digitar o nome da variável da mesma maneira que está escrito na planilha de dados, incluindo letras maiúscula e minúscula pois o programa não reconhece a variável caso o nome esteja escrito de forma errada. Na figura abaixo vemos que não temos variáveis categóricas.

Se digitarmos o nome da variável categórica de maneira errada, a seguinte mensagem de erro aparecerá quando efetuarmos os demais passos e clicarmos no botão OK.

7. Indicado a variável resposta, devemos informar a fórmula do modelo. No campo Montar Fórmula, podemos selecionar as variáveis do modelo da seguinte maneira:
i) dar um clique na opção Todas ou
ii) dar um duplo clique em cada variável explicativa.
Obs: Ao clicar no botão Todas o software Action seleciona todas as variáveis, porém sem considerar as interações ou termos de ordem superior.
Assim, no campo Fórmula, aparecerá a variável explicativa Volatilidade+RFV, como mostrado na figura abaixo, assim o modelo ficará da seguinte forma log(Refugo)=β0 +β1Volatilidade+β2*RFV.
8. No quadro Opções, selecione as opções desejadas. No nosso exemplo selecionaremos Odds Ratio, Probabilidades Ajustadas e Valores de Previsão (Novos Dados), no mesmo quadro digitaremos o nível de confiança, no nosso exemplo 0,95 (95%);

Obs: O quadro Predição será habilitada apenas na opção Dados Completos, explicaremos essas opções no exemplo usando esse tipo de conjunto de dados.
9. Ao clicarmos no botão TRV (Teste de Razão de Verossimilhança), abrirá uma janela no qual poderemos testar as hipóteses. Ao aparecer a janela poderemos selecionar as variáveis testadas, no nosso exemplo selecionaremos todas, então clicaremos no botão >>.
Obs: Caso queira selecionar uma variável de cada vez, devemos clicar na variável de interesse e em seguida no botão >.

10. O botão Gráficos explicaremos separadamente. Para saber mais clique aqui (Gráficos).
11. Ao clicarmos no botão Resíduos, abrirá uma janela como na figura a seguir. No nosso exemplo escolheremos as opções Resíduo de Pearson, hii e Gráfico de Resíduo.

12. Ao clicarmos no botão Adequabilidade, abrirá uma janela como na figura a seguir. No nosso exemplo escolheremos as opções Teste de Pearson e Teste Deviance.

11. Em Mostrar Resultados, caso desejarmos que o resultado seja exibido na mesma planilha do conjunto de dados, vamos clicar em (Célula Atual), senão poderemos imprimir os resultados em nova planilha , nesse caso clicaremos em (Nova Planilha).
OBS: Ao escolher a opção Célula Atual, os resultados serão impressos a partir da célula em que se encontra o cursor na janela do Excel. Neste caso, o usuário deve posicionar previamente (antes do passo 1) o cursor em uma posição apropriada.
12. Finalmente, vamos clicar em Ok para concluirmos a análise e obtermos os resultados.

Resultados e Interpretação
Após finalizado esse processo, serão exibidos os seguintes resultados:



A primeira tabela fornece os p-valores do teste, indicando que o intercepto, a volatilidade e o RFV são significativos para o modelo a 5% de significância (Veja que os p-valores são iguais a zero e, portanto, menores que
). São fornecidos ainda as odds ratios referentes às duas variáveis e seus respectivos intervalos de confiança. A odds referente à volatilidade, de 0,7653 indica que o aumento da volatilidade em uma unidade diminui a chance de refugo em 23,47% (1-0,7653=0,2347). Da mesma forma, a odds referente ao RFV, de 1,22, indica que o aumento do RFV em uma unidade aumenta em 22% a chance de refugo. Pelos intervalos de confiança, vemos que estas chances podem variar de 0,145 a 0,315 [de (1-0,855=0,145) a (1-0,685=0,315)] para o caso da volatilidade e de 0,142 a 0,316 para o caso do RFV.
A segunda tabela fornece o número de interações Fisher-Scoring realizadas para estimar os parâmetros do modelo, e as deviances, estatísticas utilizadas para determinar a qualidade do ajuste na regressão logística.




