Skip to main content

Um ponto é influente se sua exclusão do ajuste da regressão causa uma mudança substancial nos valores ajustados. Por isso, técnicas foram desenvolvidas para identificar essas observações influentes.


3.4.3.1 DFFITS

DFFITS mede a influência que a observação i tem sobre seu próprio valor ajustado. Consideremos a medida

$$DFFITS_{(i)}=\frac{\hat{Y}_i-\hat{Y}_{i(i)}}{\sqrt{QME_{(i)}h_{ii}}},$$

isto é, a diferença dos valores preditos de $ Y_i $ com e sem a observação i (se i está entre parênteses, significa que é sem essa observação), expressa em unidades de desvios padrões dos valores preditos de $ Y_i $.

Assim, essa técnica mede o quanto a inclusão da observação i aumenta ou diminui seu valor predito.

Dizemos que um ponto outlier é influente segundo o DFFITS se

  • $ |DFFITS_{(i)}|~\textgreater~ 1 $, para amostras pequenas ou médias.
  • $ |DFFITS_{(i)}|~\textgreater~ 2\sqrt{p/n} $, para amostras grandes.

 

3.4.3.2 DFBETA

DFBETA mede a influência da observação i sobre o coeficiente de $ X_j $. É definido por

$$DFBETA_{j(i)}=\frac{\hat{\beta}_j-\hat{\beta}_{j(i)}}{\sqrt{QME_{i}c_{jj}}},~~~~~~~~j=0,1,...,p,$$

em que $ c_{jj} $ é o j-ésimo elemento da diagonal de $ (X'X)^{-1} $.

São consideradas observações influentes aquelas que

  • $ |DFBETA|~\textgreater~1 $, para amostras pequenas.
  • $ |DFBETA|~\textgreater~2/\sqrt{n} $, para amostras grandes.

 

3.4.3.3 Distância de Cook

A distância de Cook mede a influência da observação i sobre todos n valores ajustados $ \hat{Y}_i $. É definido por

$$D_i=\frac{e_i^2}{pQME}\frac{h_{ii}}{(1-h_{ii})^2}.$$

Percebemos que $ D_i $ é grande quando ou o resíduo $ e_i $ é grande, a leverage $ h_{ii} $ é grande ou ambos. Destacamos as observações quando $ D_i~\textgreater~1 $.

 

Exemplo 3.4.3.1

Vamos verificar se as observações da "Motivação 1" são pontos influentes. Vale ressaltar que na análise dos resíduos estamos considerando o modelo

$$Dureza=\beta_0+\beta_1Temperatura.$$

clique aqui para efetuar o download dos dados utilizados nesse exemplo

Solução:

Observações DFFIT $ DF\beta_0 $ $ DF\beta_1 $ DCOOK
1 -0,039 -0,032 0,031 8,11E-04
2 -0,039 -0,032 0,031 8,11E-04
3 -0,039 -0,032 0,031 8,11E-04
4 -0,325 -0,265 0,260 5,38E-02
5 -0,641 -0,523 0,514 1,90E-01
6 0,579 0,249 -0,236 1,35E-01
7 0,173 0,075 -0,071 1,54E-02
8 0,003 0,001 -0,001 5,94E-06
9 0,173 0,075 -0,071 1,54E-02
10 0,173 0,075 -0,071 1,54E-02
11 0,201 -0,078 0,082 2,07E-02
12 -0,530 0,204 -0,216 1,18E-01
13 -0,139 0,053 -0,057 9,98E-03
14 0,390 -0,150 0,159 7,06E-02
15 -0,139 0,053 -0,057 9,98E-03
16 0,095 -0,075 0,076 4,78E-03
17 0,095 -0,075 0,076 4,78E-03
18 0,095 -0,075 0,076 4,78E-03
19 -0,831 0,654 -0,667 2,93E-01
20 0,095 -0,075 0,076 4,78E-03

Tabela 3.4.3.1: Medidas de Influência do exemplo na "Motivação 1".

Usando o software Action temos os seguintes resultados:


 

Figura 3.4.3.1: Gráficos com os valores de DFFITS, D-COOK e DFBETAS considerando os dados da Motivação 1.

 Para entender como executar essa função do Software Action, você pode consultar o manual do usuário.

Pelos resultados da Tabela 3.4.3.1 e pela Figura 3.4.3.1 temos que nenhum DFFITS, D-COOK e DFBETAS é, em módulo, maior do que 1. Assim, temos que nenhuma observação do exemplo na "Motivação 1" é um ponto influente.

 

Exemplo 3.4.3.2

Usaremos novamente o exemplo da "Motivação 2" para verificar se as observações são pontos influentes. Vale a pena ressaltar que na análise dos resíduos estamos considerando o seguinte modelo

Ganho=$ \beta_0 $+$ \beta_1 $Dose de íons+$ \beta_2 $Tempo.

clique aqui para efetuar o download dos dados utilizados nesse exemplo

Solução:

Observações DFFITS $ DF\beta_0 $ $ DF\beta_1 $ $ DF\beta_2 $ DCOOK
1 0,841 0,745 -0,492 -0,573 0,231
2 0,399 0,055 -0,236 0,268 0,057
3 -0,720 -0,018 -0,352 0,526 0,171
4 -0,528 0,418 -0,262 -0,382 0,096
5 0,049 0,022 -0,023 -0,001 0,001
6 -0,137 -0,084 0,094 0,002 0,007
7 0,964 -0,535 0,692 -0,010 0,222
8 -0,459 -0,257 0,037 0,384 0,072
9 -0,351 0,130 0,027 -0,291 0,043
10 -0,599 -0,417 0,478 0,008 0,115
11 -0,803 0,518 -0,657 0,007 0,192
12 0,200 0,036 -0,029 -0,004 0,014
13 0,693 -0,456 0,577 -0,005 0,152
14 0,130 0,005 -0,018 0,029 0,006

Tabela 3.4.3.2: Medidas de Influência do exemplo na "Motivação 2".

Usando o software Action temos os seguintes resultados:


 

Figura 3.4.3.2: Gráficos com os valores de DFFITS, D-COOK e DFBETAS considerando os dados da Motivação 2.

 Para entender como executar essa função do Software Action, você pode consultar o manual do usuário.

Pelos resultados da Tabela 3.4.3.2 e pela Figura 3.4.3.2 temos que nenhum DFFITS, D-COOK e DFBETAS é, em módulo, maior que 1. Assim, temos que nenhuma observação do exemplo na "Motivação 2" é um ponto influente.