Skip to main content

Os resíduos brutos são definidos como $ e_i=Y_i-\hat{Y}_i $. Entretanto, para uma melhor detecção em outliers em Y, eles foram melhorados.

3.4.2.1 Resíduos Padronizados

O resíduo padronizado, $ d_i $, corresponde ao resíduo bruto dividido pelo erro padrão estimado dos resíduos, $ \sqrt{QME} $.

$$d_i=\frac{e_i}{\sqrt{QME}}.$$

Se os erros têm distribuição normal, então aproximadamente 95% dos resíduos padronizados $ (d_i) $ devem estar no intervalo de (-2,2). Resíduos fora desse intervalo podem indicar a presença de outliers.

3.4.2.2 Resíduos Studentizados

Existem inúmeras maneiras de se expressar o vetor de resíduos "e" que nos será útil.

$$e=Y-\hat{Y}=Y-X\hat{\beta}=Y - HY=(I-H)Y.$$

A matriz de covariâncias dos resíduos é, 

$$Cov[e]=Cov[(I-H)Y]=(I-H)Var(Y)(I-H)'$$

$$=\sigma^2(I-H)(I-H)'$$

$$=\sigma^2(I-H).$$

Assim, definimos os resíduos studentizados por

$$\begin{equation*}r_{\imath}=\displaystyle\frac{e_i}{\sqrt{QME(I-h_{\imath\imath})}},~~~~~~~~~~i=1,2,\ldots,n,\end{equation*}$$

com $ \hat{\sigma}^2=QME. $

Os resíduos studentizados tem variâncias constantes $ Var(r_i)=1 $ o que consequentemente torna muito prática a procura por outliers, que são observações distantes das demais.

Qualquer observação fora do intervalo $ -2\leq r_i \leq 2 $ deve ser analisada.

 

Exemplo 3.4.2.1

Para os dados na "Motivação 1" vamos calcular os resíduos studentizados e padronizados.

 clique aqui para efetuar o download dos dados utilizados nesse exemplo

Solução:

    * Resíduos Studentizados: $ r_i=\displaystyle\frac{e_i}{\sqrt{QME(I-h_{\imath\imath})}}. $

    * Resíduos Padronizados: $ d_i=\displaystyle\frac{e_i}{\sqrt{QME}}. $

Como vimos em "Estimação dos Parâmetros do Modelo Linear", o QME do exemplo na motivação 1 é calculado no "Exemplo 1.2.2" e é dado por 2,286. Já a diagonal da matriz H foi calculada no "Diagnóstico de Outliers em X". Assim, os resíduos são:

e studentizados padronizados
-0,14 -0,100 -0,09
-0,14 -0,100 -0,093
-0,14 -0,100 -0,093
-1,14 -0,813 -0,754
-2,14 -1,526 -1,415
3,02 2 2
1,02 1 1
0,02 0,014 0,013
1,02 0,696 0,675
1,02 0,696 0,675
1,18 0,805 0,780
-2,82 -1,923 -1,865
-0,82 -1 -1
2,18 1,487 1,442
-0,82 -1 -1
0,34 0,242 0,225
0,34 0,242 0,225
0,34 0,242 0,225
-2,66 -1,897 -1,759
0,34 0,244 0,22

Tabela 3.4.2.1: Resíduos da Motivação 1.

Usando o software Action temos os seguintes resultados:

 Para entender como executar essa função do Software Action, você pode consultar o manual do usuário.

Exemplo 3.4.2.2

Usaremos novamente o exemplo da "Motivação 2" para fazer os resíduos padronizados e studentizados.

clique aqui para efetuar o download dos dados utilizados nesse exemplo

Solução:

    * Resíduos Studentizados: $ r_i=\displaystyle\frac{e_i}{\sqrt{QME(I-h_{\imath\imath})}}. $

    * Resíduos Padronizados: $ d_i=\displaystyle\frac{e_i}{\sqrt{QME}}. $ 

O QME neste caso foi calculado no "Exemplo 2.3.1" e é dado por $ QME=1.220,1 $. Além disso, a matriz H referente ao conjunto de dados é dada por


Desta forma, os resíduos são:

e  studentizados padronizados
30,35 1,092 0,869
15,48 0,553 0,443
-30,36 -1,052 -0,869
-23,23 -0,801 -0,665
5,34 0,16 0,153
-11,87 -0,365 -0,34
63,2 1,96 1,809
-25,01 -0,823 -0,716
-19,88 -0,651 -0,569
-37,09 -1,185 -1,062
-44,58 -1,442 -1,276
24,56 0,73 0,703
37,46 1,225 1,072
15,65 0,466 0,448

Tabela 3.4.2.2: Resíduos da Motivação 2.

Usando o software Action temos os seguintes resultados:

 Para entender como executar essa função do Software Action, você pode consultar o manual do usuário.