O modelo de regressão logístico é semelhante ao modelo de regressão linear. No entanto, no modelo logístico a variável resposta
é binária. Uma variável binária assume dois valores, como por exemplo,
e
denominados "fracasso" e "sucesso", respectivamente. Neste caso, "sucesso" é o evento de interesse.
No modelo linear temos
![]() |
Assumindo que
, obtemos que
![]() |
A variável resposta
tem distribuição Bernoulli
, com probabilidade de sucesso
e de fracasso
Desta forma
![]() |
Igualando (4.2) e (4.1), temos
![]() |
Essa igualdade viola as suposições do modelo linear. De fato,
i) Os erros não são normais, pois:
Assim não faz sentido assumirmos a normalidade dos erros.
ii) Não homogeneidade da variância.
Temos que
então a variância de
depende de
, e consequentemente, não é constante.
iii) Restrição para a resposta média
Como a resposta média é obtida em probabilidades temos que
. Entretanto, esta restrição é inapropiada para resposta em um modelo linear, que assume valores no intervalo
Uma forma de resolver esse problema é utilizar o modelo logístico.
Muitas funções foram propostas para a análise de variáveis com respostas dicotômicas. Dentre elas a mais simples é a que dá origem ao modelo logístico. Do ponto de vista estatístico este modelo é bastante flexível e de fácil interpretação.






