4.3.1 Resíduos de Pearson

 Na regressão linear, medidas da qualidade do ajuste são funções dos resíduos definido como a diferença entre o observado e valores ajustados $ (y-\hat{y}) $. Na regressão logística existem diferentes formas de calcular essa diferença. Para entendermos que os valores ajustados na regressão logística são calculados para cada Covariate Pattern (veja a definição em "Medidas de Qualidade do Ajuste do Modelo")e depende das estimativas de probabilidade para cada Covariate Pattern, vamos denotar os valores ajustados para o jth Covariate Pattern como $ \hat{y}_j $ em que: 

$$\hat{y}_j=m_j\hat{\pi}_j,$$

em que $ m_j $ é o número de observações na Covariate Pattern j e $ \hat{\pi}_j $ é a probabilidade ajustada dos indivíduos em j.

A medida de Pearson para a diferença entre o observado e predito é: 

$$r(y_j,\hat{\pi}_j)=\cfrac{(y_j-m_j\hat{\pi}_j)}{\sqrt{m_j\hat{\pi}_j(1-\hat{\pi}_j)}},$$

em que $ y_j $ o número de indivíduos em j com y=1.

Assim, a estatística qui-quadrado de Pearson é dada por: 

$$\chi^2=\sum_{j=1}^{J}{r(y_j,\hat{\pi}_j)}^2.$$

Podemos dizer que $ \chi^2 $ se aproxima, assintoticamente, $ \chi^2_{J-(p+1)}, $$ p $ o número de covariáveis do modelo ajustado e $ J $ é o número de Covariate Pattern. Porém, em alguns casos essa aproximação é ruim (veja Restrições do teste).

Exemplo 4.3.1.1

Para calcular a estatística qui-quadrado de Pearson para testar se o modelo ajustado é adequado, temos que calcular, para cada grupo, o resíduo de Pearson.

Para o primeiro grupo (como são dados resumidos, a primeira "observação"), temos que: 

$$\hat{y}_1=m_1\hat{\pi}_1=200*0,01806=3,612,~~~y_1=2.$$


$$r(y_1,\hat{\pi}_1)=\cfrac{(y_1-m_1\hat{\pi}_1)}{\sqrt{m_1\hat{\pi}_1(1-\hat{\pi}_1)}}=\cfrac{(2-3,612)}{\sqrt{200*0,01806(0,98194)}}=\frac{-1,612}{1,8833}=-0,8559.$$

De maneira análoga calculamos os resíduos de Pearson para os outros grupos e obtemos os seguintes valores:

Grupos (observações resumidas) Resíduos de Pearson
1 -0,85599
2 -0,85599
3 -0,85599
4 -0,954
5 -0,55487
6 -0,18804
7 0,147992
8 0,147992
9 0,454625
10 0,294173
11 0,98504
12 0,429086
13 0,429086
14 0,429086
15 0,230969
16 0,230969
17 0,584557
18 0,379551
19 0,507824
20 0,079737
21 0,170431
22 -0,05228
23 -0,05228
24 0,24343
25 0,012207
26 0,012207
27 -0,219
28 -0,45045
29 -0,17915
30 -0,89921

Tabela 4.3.1.1.1: Resíduos de Pearson

Com os valores dos resíduos da Tabela 4.3.1.1.1, a estatística qui-quadrado de Pearson é: 

$$\chi^2=\sum_{j=1}^{30}{r(y_j,\hat{\pi}_j)}^2=7,3535.$$

O p-valor $ P(\chi^2_{28} \textgreater 7,3535)=0,99 $ e por isso não rejeitamos a hipótese de que o modelo ajustado é adequado.

Para obtermos a estatística qui-quadrado de Pearson para testar se o modelo ajustado é adequado, temos que calcular, para cada grupo, o resíduo de Pearson.

Assim, para o primeiro grupo (como são dados resumidos, a primeira "observação"), temos que: 

$$\hat{y}_1=m_1\hat{\pi}_1=832*0,0764=63,56,~~~y_1=270.$$


$$r(y_1,\hat{\pi}_1)=\cfrac{(y_1-m_1\hat{\pi}_1)}{\sqrt{m_1\hat{\pi}_1(1-\hat{\pi}_1)}}=\cfrac{(270-63,56)}{\sqrt{832*0,0764(0,9236)}}=\frac{206,44}{7,66214}=26,94.$$

De maneira análoga calculamos os resíduos de Pearson para os outros grupos e obter os seguintes valores:

Grupos (observações resumidas) Resíduos de Pearson
1 26,94226
2 2,325756
3 10,89268
4 -7,29709
5 -12,1222
6 -3,41077
7 -6,6327
8 -14,1813
9 -2,78226
10 -8,84807
11 -5,97549
12 13,87763
13 -0,44592
14 9,839347
15 6,995839
16 5,203155
17 2,974618
18 -5,2033

Tabela 4.3.1.1.2: Resíduos de Pearson

Com os valores dos resíduos da Tabela 4.3.1.1.2, temos que a estatística qui-quadrado de Pearson é: 

$$\chi^2=\sum_{j=1}^{18}{r(y_j,\hat{\pi}_j)}^2=1830,15.$$

O p-valor $ (P(\chi^2_{12} \textgreater 1830,15)) $ é 0 e por isso rejeitamos a hipótese de que o modelo ajustado é adequado. Assim, temos indícios pelo teste qui-quadrado de Pearson que o modelo ajustado não é adequado.

Análise de Regressão

Sobre o Portal Action

O Portal Action é mantido pela Estatcamp - Consultoria Estatística e Qualidade, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.

Facebook

CONTATO

  •  Maestro Joao Seppe, 900, São Carlos - SP | CEP 13561-180
  • Telefone: (16) 3376-2047
  • E-Mail: [email protected]