4. Regressão Logística

Você está aqui

O modelo de regressão logística é semelhante ao modelo de regressão linear. No entanto, no modelo logístico a variável resposta $ Y_i $ é binária. Uma variável binária assume dois valores, como por exemplo, $ Y_i=0 $ e $ Y_i=1, $ denominados "fracasso" e "sucesso", respectivamente. Neste caso, "sucesso" é o evento de interesse.

No modelo linear temos


$$Y_i=\beta_0+\beta_1x_i+\varepsilon_i.$$

Assumindo que $ E(\varepsilon_i)=0 $, obtemos que


$$E(Y_i)=\beta_0+\beta_1x_i.~~~~(4.1)$$

A variável resposta $ Y $ tem distribuição Bernoulli $ (1, \pi) $, com probabilidade de sucesso $ P(Y_i=1)=\pi_i $ e de fracasso $ P(Y_i=0)=1 - \pi_i. $ Desta forma


$$E(Y_i) = \pi_i.~~~~(4.2)$$

Igualando (4.2) e (4.1), temos


$$E(Y_i) = \pi_i = \beta_0+\beta_1x_i.$$

Essa igualdade viola as suposições do modelo linear. De fato,

i) Os erros não são normais, pois:

  • $ y_i=1 ~~\Rightarrow~~\varepsilon_i=1-\beta_0-\beta_1x_1 $
  • $ y_i=0 ~~\Rightarrow~~\varepsilon_i=0-\beta_0-\beta_1x_1 $

Assim não faz sentido assumirmos a normalidade dos erros.

ii) Não homogeneidade da variância.

Temos que $ \text{Var}(Y_1)=\pi_i(1-\pi_i)=(\beta_0+\beta_1x_1)(1-\beta_0-\beta_1 x_1) $ então a variância de $ Y_i $ depende de $ x_i $, e consequentemente, não é constante.

iii) Restrição para a resposta média $ E(Y_i). $ Como a resposta média é obtida em probabilidades temos que $ 0 \leq \beta_0+\beta_1x_1\leq 1 $. Entretanto, esta restrição é inapropriada para resposta em um modelo linear, que assume valores no intervalo $ (-\infty, \infty). $ Uma forma de resolver esse problema é utilizar o modelo logístico.

Muitas funções foram propostas para a análise de variáveis com respostas dicotômicas. Dentre elas a mais simples é a que dá origem ao modelo logístico. Do ponto de vista estatístico este modelo é bastante flexível e de fácil interpretação.

 

Análise de Regressão

Sobre o Portal Action

O Portal Action é mantido pela Estatcamp - Consultoria Estatística e Qualidade, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.

Facebook

CONTATO

  •  Maestro Joao Seppe, 900, São Carlos - SP | CEP 13561-180
  • Telefone: (16) 3376-2047
  • E-Mail: [email protected]