4.1.1 Modelo Estatístico

Você está aqui

Um modelo de regressão logística simples é usado para o caso de regressão com uma variável explicativa.

Suponha uma amostra de $ n $ observações independentes da terna $ (x_i,m_i,y_i), $$ i=1,2,\ldots,n $, sendo que:

  • $ x_i $ é o valor da variável explicativa;
  • $ m_i $ é a quantidade de itens verificados na amostra (número de ensaios);
  • $ y_i $ número de ocorrência de um evento (exemplo: quantidade de peças não conforme) em $ m_i $ ensaios; e
  • $ n $ é o tamanho da amostra.

Com isso, assumimos que a variável resposta tem distribuição de probabilidade binomial $ ( Y_i \sim B(m_i,\pi_i)) $, tal que


$$P[Y_i=y_i]=\binom{m_i}{y_i}\pi_i^{y_i}(1-\pi_i)^{m_i-y_i}.$$

Para adequarmos a resposta média ao modelo linear usamos a função de ligação


$$\pi(x_i)=\frac{e^{\beta_0+\beta_1x_i}}{1+e^{\beta_0+\beta_1x_i}},\, i=1, \ldots, n,$$

que pode ser escrita como


$$\ln\left(\frac {\pi_i} {1 - \pi_i}\right)= \beta_0+\beta_1x_i.$$

As figuras a seguir ilustram a forma do modelo logístico para $ \beta_1 $ positivo e negativo.

Figura 4.1.1.1: Modelo logístico com $ \beta_1 $ positivo.

Figura 4.1.1.2: Modelo logístico com $ \beta_1 $ negativo.

Neste caso, utilizamos o método da máxima verossimilhança para estimarmos os parâmetros $ (\beta_0 ,\beta_1) $. De forma genérica, o método de máxima verossimilhança nos fornece valores para os parâmetros desconhecidos que maximizam a probabilidade de se obter determinado conjunto de dados.

Assumindo que $ (x_0, m_0 , y_0), \ldots, (x_n, m_n, y_n) $ são independentes, a função de verossimilhança é da seguinte forma


$$P [Y=y_1,\ldots,y_n|\beta_0,\beta_1]~=~\prod_{i=1}^n \binom{m_i} {y_i} \pi_i^{y_i}(1-\pi_i)^{m_i-y_i}$$


$$=\prod_{i=1}^n \binom{m_i} {y_i} \pi_i^{y_i}(1-\pi_i)^{m_i}(1-\pi_i)^{-y_i}$$


$$=\prod_{i=1}^n \binom{m_i} {y_i} \frac{\pi_i^{y_i}(1-\pi_i)^{m_i}}{(1-\pi_i)^{y_i}}$$


$$=\prod_{i=1}^n \binom{m_i} {y_i} \left(\frac{\pi_i}{1-\pi_i}\right)^{y_i}{(1-\pi_i)^{m_i}}$$

Ignorando o termo constante $ \displaystyle\binom{m_i} {y_i}, $ que não depende de $ x_i, $ e tomando o logaritmo $ (\ln) $ em ambos os lados da expressão anterior, temos


$$\L~(\beta_0,\beta_1|(x_i;m_i;y_i))~=~\ln \,\left(\frac{\pi_i}{1-\pi_i}\right)^{y_i}+\ln \, {(1-\pi_i)^{m_i}}$$


$$\L~(\beta_0,\beta_1|(x_i;m_i;y_i))~=~{y_i} \, \ln \left(\frac{\pi_i}{1-\pi_i}\right)+ {m_i}\,\ln(1-\pi_i)~~~~(4.1.1.1)$$

Detalhando $ \ln \, \left(\displaystyle\frac{\pi_i}{1-\pi_i}\right), $ e considerando que,


$$\pi_i~=~\frac{e^{\beta_0+\beta_1 x_i}}{1+e^{\beta_0+\beta_1 x_i}},\, \mbox{temos}$$


$$\ln \, \left(\displaystyle\frac{\pi_i}{1-\pi_i}\right)~=~\ln \,\left(\displaystyle\frac{\displaystyle\frac{e^{\beta_0+\beta_1x_i}}{1+e^{\beta_0+\beta_1x_i}}}{1-\displaystyle\frac{e^{\beta_0+\beta_1 x_i}}{1+e^{\beta_0+\beta_1 x_i}}}\right)$$


$$=\ln \,\left(\frac{\displaystyle\frac{e^{\beta_0+\beta_1 x_i}}{1+e^{\beta_0+\beta_1 x_i}}}{\displaystyle\frac{1}{1+e^{\beta_0+\beta_1 x_i}}}\right)$$

Assim a expressão (4.1.1.1), pode ser reescrita como:


$$\L~(\beta_0,\beta_1|(x_i;m_i;y_i))~=~\sum^n_{i=1}\left[ y_i ~\ln \left(\frac{\pi_i}{1-\pi_i} \right)+m_i \,\ln\, (1-\pi_i)\right]$$


$$=\sum^n_{i=1}\left[ y_i ~\left(\beta_0 + \beta_1 x_i \right)+ m_i \,\ln \, \left(1 - \frac{e^{\beta_0+\beta_1 x_i}}{1+e^{\beta_0+\beta_1x_i}}\right)\right]$$


$$=\sum^n_{i=1}\left[y_i~(\beta_0+\beta_1 x_i)+m_i \, \ln \left(\frac{1}{1+e^{\beta_0+\beta_1x_i}}\right)\right]$$


$$=\sum^n_{i=1}\left[y_i~(\beta_0+\beta_1 x_i) + m_i \, (\ln 1 - \ln (1+e^{\beta_0+\beta_1 x_i}))\right]$$


$$=\sum^n_{i=1}y_i~(\beta_0+\beta_1 x_i) - \sum^n_{i=1} m_i \, \ln (1+e^{\beta_0+\beta_1 x_i})$$

Portanto,

$$\L~(\beta_0,\beta_1|(x_i;m_i;y_i))=\sum^n_{i=1}y_i~(\beta_0+\beta_1x_i) - \sum^n_{i=1}m_i \, \ln (1+e^{\beta_0+\beta_1 x_i})~~~~(4.1.1.2)$$

Para simplificar a notação faremos $ \L~(\beta_0,\beta_1|(x_i;m_i;y_i))= \L~(\beta_0,\beta_1). $

 

 

Análise de Regressão

Sobre o Portal Action

O Portal Action é mantido pela Estatcamp - Consultoria Estatística e Qualidade, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.

Facebook

CONTATO

  •  Maestro Joao Seppe, 900, São Carlos - SP | CEP 13561-180
  • Telefone: (16) 3376-2047
  • E-Mail: [email protected]