3.4.3 Pontos Influentes

Você está aqui

Um ponto é influente se sua exclusão do ajuste da regressão causa uma mudança substancial na análise de regressão, po exemplo, nos valores ajustados ou nas estimativas dos coeficientes do modelo. Por isso, técnicas foram desenvolvidas para identificar essas observações influentes.

3.4.3.1 DFFITS

A medida DFFITS mede a influência que a observação $ i $ tem sobre seu próprio valor ajustado. Neste caso, medimos a influência da exclusão da i-ésima observação no seu valor previsto ou ajustado. Consideremos a medida 

$$DFFITS_{(i)}=\frac{\hat{Y}_i-\hat{Y}_{i(i)}}{\sqrt{QME_{(i)}h_{ii}}},$$

isto é, a diferença dos valores preditos de $ Y_i $ com e sem a observação i (se i está entre parênteses, significa que excluímos observação i), expressa em unidades de desvios padrão dos valores preditos de $ Y_i $.  Assim, essa técnica mede o quanto a exclusão da observação i aumenta ou diminui seu valor predito. Dizemos que uma observação é um ponto é influente segundo a medida DFFITS se: 

(1) $ |DFFITS_{(i)}|~\textgreater~ 1 $, para amostras pequenas ou médias.

(2) $ |DFFITS_{(i)}|~\textgreater~ 2\sqrt{(p+1)/n} $, para amostras grandes, no qual $ (p+1) $ é o número de parâmetros.

3.4.3.2 DFBETA

A medida DFBETA mede a influência da observação i sobre o coeficiente de $ X_j $. Esta medida de influência é deinida por 

$$DFBETA_{j(i)}=\frac{\hat{\beta}_j-\hat{\beta}_{j(i)}}{\sqrt{QME_{i}c_{jj}}},~~~~~~~~j=0,1,...,p,$$

em que $ c_{jj} $ é o j-ésimo elemento da diagonal de $ (X^\prime X)^{-1} $. Valor alto para a medida de influência DFBETA nos indica que a observação i influência na estimativa do coeficiente angular da variável explicativa $ X_j $.  São consideradas observações influentes aquelas que

(1) $ |DFBETA|~\textgreater~1 $, para amostras pequenas.

(2) $ |DFBETA|~\textgreater~2/\sqrt{n} $, para amostras grandes.

3.4.3.3 Distância de Cook

A distância de Cook mede a influência da observação i sobre todos n valores ajustados $ \hat{Y}_i $. Esta medida de influência é definida por:

$$D_i=\frac{e_i^2}{(p+1)QME}\frac{h_{ii}}{(1-h_{ii})^2}.$$

Percebemos que $ D_i $ é grande quando ou o resíduo $ e_i $ é grande, a leverage $ h_{ii} $ é grande ou ambos. Destacamos as observações quando $ D_i~\textgreater~1 $.

Exemplo 3.4.3.1

Vamos verificar se as observações da "Motivação 1" são pontos influentes. Vale ressaltar que na análise dos resíduos estamos considerando o modelo 

$$Dureza=\beta_0+\beta_1Temperatura.$$

clique aqui para efetuar o download dos dados utilizados nesse exemplo

Solução:

Observações DFFIT $ DF\beta_0 $ $ DF\beta_1 $ DCOOK
1 -0,039 -0,032 0,031 8,11E-04
2 -0,039 -0,032 0,031 8,11E-04
3 -0,039 -0,032 0,031 8,11E-04
4 -0,325 -0,265 0,260 5,38E-02
5 -0,641 -0,523 0,514 1,90E-01
6 0,579 0,249 -0,236 1,35E-01
7 0,173 0,075 -0,071 1,54E-02
8 0,003 0,001 -0,001 5,94E-06
9 0,173 0,075 -0,071 1,54E-02
10 0,173 0,075 -0,071 1,54E-02
11 0,201 -0,078 0,082 2,07E-02
12 -0,530 0,204 -0,216 1,18E-01
13 -0,139 0,053 -0,057 9,98E-03
14 0,390 -0,150 0,159 7,06E-02
15 -0,139 0,053 -0,057 9,98E-03
16 0,095 -0,075 0,076 4,78E-03
17 0,095 -0,075 0,076 4,78E-03
18 0,095 -0,075 0,076 4,78E-03
19 -0,831 0,654 -0,667 2,93E-01
20 0,095 -0,075 0,076 4,78E-03

Tabela 3.4.3.1: Medidas de Influência do exemplo na "Motivação 1".

Usando o software Action temos os seguintes resultados:

 

Figura 3.4.3.1: Gráficos com os valores de DFFITS, D-COOK e DFBETAS considerando os dados da Motivação 1.

 Para entender como executar essa função do Software Action, você pode consultar o manual do usuário.

Pelos resultados da Tabela 3.4.3.1 e pela Figura 3.4.3.1 temos que nenhum DFFITS, D-COOK e DFBETAS é, em módulo, maior do que 1. Assim, temos que nenhuma observação do exemplo na "Motivação 1" é um ponto influente.

Exemplo 3.4.3.2

Usaremos novamente o exemplo da "Motivação 2" para verificar se as observações são pontos influentes. Vale a pena ressaltar que na análise dos resíduos estamos considerando o seguinte modelo

Ganho=$ \beta_0 $+$ \beta_1 $Dose de íons+$ \beta_2 $Tempo.

clique aqui para efetuar o download dos dados utilizados nesse exemplo

Solução:

Observações DFFITS $ DF\beta_0 $ $ DF\beta_1 $ $ DF\beta_2 $ DCOOK
1 0,841 0,745 -0,492 -0,573 0,231
2 0,399 0,055 -0,236 0,268 0,057
3 -0,720 -0,018 -0,352 0,526 0,171
4 -0,528 0,418 -0,262 -0,382 0,096
5 0,049 0,022 -0,023 -0,001 0,001
6 -0,137 -0,084 0,094 0,002 0,007
7 0,964 -0,535 0,692 -0,010 0,222
8 -0,459 -0,257 0,037 0,384 0,072
9 -0,351 0,130 0,027 -0,291 0,043
10 -0,599 -0,417 0,478 0,008 0,115
11 -0,803 0,518 -0,657 0,007 0,192
12 0,200 0,036 -0,029 -0,004 0,014
13 0,693 -0,456 0,577 -0,005 0,152
14 0,130 0,005 -0,018 0,029 0,006

Tabela 3.4.3.2: Medidas de Influência do exemplo na "Motivação 2".

Usando o software Action temos os seguintes resultados:

 

Figura 3.4.3.2: Gráficos com os valores de DFFITS, D-COOK e DFBETAS considerando os dados da Motivação 2.

 Para entender como executar essa função do Software Action, você pode consultar o manual do usuário.

Pelos resultados da Tabela 3.4.3.2 e pela Figura 3.4.3.2 temos que nenhum DFFITS, D-COOK e DFBETAS é, em módulo, maior que 1. Assim, temos que nenhuma observação do exemplo na "Motivação 2" é um ponto influente.

Análise de Regressão

Sobre o Portal Action

O Portal Action é mantido pela Estatcamp - Consultoria Estatística e Qualidade, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.

Facebook

CONTATO

  •  Maestro Joao Seppe, 900, São Carlos - SP | CEP 13561-180
  • Telefone: (16) 3376-2047
  • E-Mail: [email protected]