Skip to main content

4.4 Diagnóstico do Modelo

4.4.1 Leverage

Assim como no modelo linear, uma métrica para diagnosticar outliers é a leverage (diagonal da matriz chapéu). No modelo linear, a matriz chapéu é definida por:

$$H=X(X'X)^{-1}X'.$$

Os elementos da diagonal principal da matriz H são denominados $ h_{ii}. $

No modelo de regressão logística, J é o número de diferentes combinações de níveis das covariáveis.

$ X_{(j)(p+1)} $: matriz de todos os valores de todas combinações de níveis para todas as covariáveis.

$$H=V^{1/2}X(X'VX)^{-1}X'V^{1/2}.$$

$ v_{j}=m_{j}\hat{\pi}(x_j)(1-\hat{\pi}(x_j)),~~~~~~~~~~j=1,2,...,J. $

$ h_i=m_j\hat{\pi}_j(1-\hat{\pi}_j)x^{'}_{j}(X'VX)^{-1}x^{'}_j, $ 

em que $ b_j=x^{'}_{j}(X'VX)^{-1}x^{'}_j. $

Assim, $ h_j=v_jb_j $. 

No caso da regressão linear, se $ h_j\textgreater 2(p+1)/n $ então a observação j é considerada um outlier. A diferença é que neste caso a matriz chapéu depende apenas de valores das covariáveis enquanto que na regressão logística, essa matriz também depende das probabilidades estimadas (através de $ v_j $). 

A consequência disso é que uma observação pode estar fora do comum nas covariáveis, mas não possui um grande valor de $ h_j $, se a probabilidade ajustada estiver próxima de 0 ou 1.  

4.4.2 Resíduo de Pearson 

O resíduo de Pearson é dado por:

$$r_{Pi}=\frac{Y_i-\hat{\pi}_i}{\sqrt{\hat{\pi}_i(1-\hat{\pi}_i)}}$$

4.4.3 Resíduo de Pearson Studentizado

O resíduo de Pearson Studentizado tem a seguinte forma:

$$r_{SPi}=\frac{r_{Pi}}{\sqrt{1-h_i}},$$

em que $ h_i $ é a diagonal da matriz chapéu.

4.4.4 Resíduo Deviance

O resíduo deviance é:

$$d_i=\pm\sqrt{-2[Y_ilog_e(\hat{\pi}_i)+(1-Y_i)log_e(1-\hat{\pi}_i)}.$$

4.4.5 Diagnóstico de Influência

Além de detectar outliers, é importante também detectarmos pontos influentes, ou seja, pontos que afetam de forma significativa o ajuste do modelo.

Assim como no modelo linear, podemos utilizar a distância de Cook para avaliar a influência geral da observação i nas estimativas dos coeficientes da regressão. A métrica da distância de Cook para a observação i é:

$$D_i=\frac{r^{2}_{Pi}h_i}{p{(1-h_i)}^2}.$$