Modelo Binomial Simples sobre tempo de experiência em programação computacional

Você está aqui

Manual da ferramenta Action sobre Modelo Binomial Simples

Exemplo

Um analista está estudando o efeito do tempo de experiência em programação computacional sobre a habilidade para completar, dentro de um determinado tempo, uma tarefa difícil. Vinte e cinco programadores foram selecionados para o estudo. A variável preditora, X, corresponde ao meses de experiência.

OBS: Tarefa $ (Y)=1 $ se a tarefa foi completada com sucesso no tempo permitido, e Tarefa $ (Y)=0 $ se a tarefa não foi completada com sucesso.

Meses de Experiência Tarefa
14 0
29 0
6 0
25 1
18 1
4 0
18 0
12 0
22 1
6 0
30 1
11 0
30 1
5 0
20 1
13 0
9 0
32 1
24 0
13 1
19 0
4 0
28 1
22 1
8 1

clique aqui para efetuar o download dos dados utilizados nesse exemplo

Para realizarmos a Seleção de Modelos Binomial, vamos realizar os seguintes passos:

1. Primeiramente vamos acessar o menu como descrito a seguir:

Action Stat $ \blacktriangleright $ Modelo Linear $ \blacktriangleright $  Modelo Binomial

2. A seguinte tela será exibida:

3. No campo Conjunto de Dados selecionaremos a opção Dados Completos;

4.Com o cursor no campo Conjunto de Dados, selecionamos na planilha de dados as duas colunas contendo os valores das variáveis incluindo os nomes das variáveis. Para fazermos esta seleção, utilizamos o mouse, como mostrado na figura abaixo;

5.Caso desejamos ler os dados sem os nomes das variáveis, é preciso desabilitar a opção Colunas com Nome, que fica abaixo do campo Conjunto de Dados, neste caso, deixaremos habilitado;

6. Após selecionarmos o conjunto de dados, clicamos no botão Ler. Consequentemente, os nomes das variáveis lidas aparecerão no campo Montar Fórmula como visto na figura abaixo;

7. No campo Variável Resposta escolheremos a variável correspondente. No nosso exemplo selecionaremos a variável Tarefa;

8. Em Função de Ligação, temos as opções Logito, Probito e Complemento Log-Log, neste exemplo utilizaremos a opção Logito;

9. No campo Montar Fórmula clicaremos na variável Meses de Experiência;

10. No campo Fórmula aparecerá a formula do modelo;

11. No campo Opções selecionaremos as opções Odds Ratios, Probabilidades Ajustadas e Valores de Previsão (Novos Dados);

12. No campo Valores de Previsão (Novos Dados) selecionaremos os dados de Meses de Experiência;

13. No campo Predição selecionaremos as opções Curva ROC e Medidas de Desempenho;

14. Ainda no campo Predição em Ponto de Corte digitaremos o valor do ponto de corte, neste caso 0,7;

15. Clicaremos no botão TRV (Teste de Razão de Verossimilhança), abrirá uma janela como mostra a figura abaixo;

16. No campo Variáveis Disponíveis clicaremos duas vezes em Meses de Experiência, essa aparecerá em Variáveis Testadas;

17. Clicaremos no botão Resíduos, abrirá uma janela como mostra a figura abaixo;

18. Na caixa Resíduos selecionaremos a opção Selecionar todos;

19. Clicaremos no botão Adequabilidade, abrirá uma janela como mostra a figura abaixo;

20. Na caixa Adequabilidade selecionaremos a opção Teste Hosmer e Lemeshow;

21. Em Mostrar Resultados, caso desejarmos que o resultado seja exibido na mesma planilha do conjunto de dados, vamos clicar em (Célula Atual), senão poderemos imprimir os resultados em nova planilha , nesse caso clicaremos em (Nova Planilha).

OBS: Ao escolher a opção Célula Atual, os resultados serão impressos a partir da célula em que se encontra o cursor na janela do Excel. Neste caso, o usuário deve posicionar previamente (antes do passo 1) o cursor em uma posição apropriada.

22. Finalmente, vamos clicar em Ok para concluirmos a análise e obtermos os resultados.

Resultados e interpretação

Após finalizado esse processo, serão exibidos os seguintes resultados:

A primeira tabela nos fornece as estimativas dos parâmetros do modelo ajustado, o resultado do teste de Wald, utilizado para avaliar se o parâmetro é estatisticamente significativo. Adotando um nível de significância de 5%, como o p-valor 0,0129 é menor que o nível de significância concluímos que meses de experiência é significativo para o modelo.

Acima temos a matriz de covariância.

Na tabela Informações Gearis temos a Deviance residual, que se estiver próxima dos seus graus de liberdade (o que realmente ocorre), conclui-se que a variação residual está explicada satisfatoriamente. Além disso, essa tabela apresenta também o número de iterações necessárias (quatro no total) para que houvesse a convergência dos parâmetros (Fisher Scoring Interaction).

Acima temos o Resumo (Performance), temos que a proporção de verdadeiros positivos no modelo é de 45,45%, a proporção dos verdadeiros negativos é de 92,86%, a proporção de verdadeiro positivos em relação a todas as predições positivas é de 83,33% e a proporção de verdadeiros negativos em relação a todas predições negativas é de 68,42%.

A tabela mostra a razão de chances (odds ratio). As razões de chances (odds ratio) dos meses de experiência é igual a 1,175 nos indica que a chance de um programador completar uma tarefa difícil aumenta em 17,5% para cada mês adicional de experiência.

Acima temos o intervalo de previsão para cada meses de experiência.

 

Tabela de intervalo de predição para cada observação.

 

Na tabela Teste da razão de Verossimilhança, adotando um nível de significância de 5%, temos que o p-valor 0,0029 é menor que 0,05, com isso rejeitamos a hipótese nula, então a variável meses de experiência é significativa para o modelo.

Temos a curva ROC com o ponto de corte, que é baseado na combinação ótima tanto da sensibilidade quanto da especificidade. Pela análise da curva ROC, escolhemos o ponto de corte referente a combinação da sensibilidade e 1-especificidade que mais se aproxima do canto superior esquerdo do gráfico. 

 

 

Manual - Modelos

Sobre o Portal Action

O Portal Action é mantido pela Estatcamp - Consultoria Estatística e Qualidade, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.

Facebook

CONTATO

  •  Maestro Joao Seppe, 900, São Carlos - SP | CEP 13561-180
  • Telefone: (16) 3376-2047
  • E-Mail: [email protected]