- (16) 3376-2047
- [email protected]
- Portfólio de Serviços
- AT
Um ponto é influente se sua exclusão do ajuste da regressão causa uma mudança substancial na análise de regressão, po exemplo, nos valores ajustados ou nas estimativas dos coeficientes do modelo. Por isso, técnicas foram desenvolvidas para identificar essas observações influentes.
A medida DFFITS mede a influência que a observação $i$ tem sobre seu próprio valor ajustado. Neste caso, medimos a influência da exclusão da i-ésima observação no seu valor previsto ou ajustado. Consideremos a medida $$DFFITS_{(i)}=\frac{\hat{Y}_i-\hat{Y}_{i(i)}}{\sqrt{QME_{(i)}h_{ii}}},$$
isto é, a diferença dos valores preditos de $Y_i$ com e sem a observação i (se i está entre parênteses, significa que excluímos observação i), expressa em unidades de desvios padrão dos valores preditos de $Y_i$. Assim, essa técnica mede o quanto a exclusão da observação i aumenta ou diminui seu valor predito. Dizemos que uma observação é um ponto é influente segundo a medida DFFITS se:
(1) $|DFFITS_{(i)}|~\textgreater~ 1$, para amostras pequenas ou médias.
(2) $|DFFITS_{(i)}|~\textgreater~ 2\sqrt{(p+1)/n}$, para amostras grandes, no qual $(p+1)$ é o número de parâmetros.
A medida DFBETA mede a influência da observação i sobre o coeficiente de $X_j$. Esta medida de influência é deinida por $$DFBETA_{j(i)}=\frac{\hat{\beta}_j-\hat{\beta}_{j(i)}}{\sqrt{QME_{i}c_{jj}}},~~~~~~~~j=0,1,...,p,$$
em que $c_{jj}$ é o j-ésimo elemento da diagonal de $(X^\prime X)^{-1}$. Valor alto para a medida de influência DFBETA nos indica que a observação i influência na estimativa do coeficiente angular da variável explicativa $X_j$. São consideradas observações influentes aquelas que
(1) $|DFBETA|~\textgreater~1$, para amostras pequenas.
(2) $|DFBETA|~\textgreater~2/\sqrt{n}$, para amostras grandes.
A distância de Cook mede a influência da observação i sobre todos n valores ajustados $\hat{Y}_i$. Esta medida de influência é definida por: $$D_i=\frac{e_i^2}{(p+1)QME}\frac{h_{ii}}{(1-h_{ii})^2}.$$ Percebemos que $D_i$ é grande quando ou o resíduo $e_i$ é grande, a leverage $h_{ii}$ é grande ou ambos. Destacamos as observações quando $D_i~\textgreater~1$.
Vamos verificar se as observações da "Motivação 1" são pontos influentes. Vale ressaltar que na análise dos resíduos estamos considerando o modelo $$Dureza=\beta_0+\beta_1Temperatura.$$
clique aqui para efetuar o download dos dados utilizados nesse exemplo
Solução:
Observações | DFFIT | $DF\beta_0$ | $DF\beta_1$ | DCOOK |
1 | -0,039 | -0,032 | 0,031 | 8,11E-04 |
2 | -0,039 | -0,032 | 0,031 | 8,11E-04 |
3 | -0,039 | -0,032 | 0,031 | 8,11E-04 |
4 | -0,325 | -0,265 | 0,260 | 5,38E-02 |
5 | -0,641 | -0,523 | 0,514 | 1,90E-01 |
6 | 0,579 | 0,249 | -0,236 | 1,35E-01 |
7 | 0,173 | 0,075 | -0,071 | 1,54E-02 |
8 | 0,003 | 0,001 | -0,001 | 5,94E-06 |
9 | 0,173 | 0,075 | -0,071 | 1,54E-02 |
10 | 0,173 | 0,075 | -0,071 | 1,54E-02 |
11 | 0,201 | -0,078 | 0,082 | 2,07E-02 |
12 | -0,530 | 0,204 | -0,216 | 1,18E-01 |
13 | -0,139 | 0,053 | -0,057 | 9,98E-03 |
14 | 0,390 | -0,150 | 0,159 | 7,06E-02 |
15 | -0,139 | 0,053 | -0,057 | 9,98E-03 |
16 | 0,095 | -0,075 | 0,076 | 4,78E-03 |
17 | 0,095 | -0,075 | 0,076 | 4,78E-03 |
18 | 0,095 | -0,075 | 0,076 | 4,78E-03 |
19 | -0,831 | 0,654 | -0,667 | 2,93E-01 |
20 | 0,095 | -0,075 | 0,076 | 4,78E-03 |
Tabela 3.4.3.1: Medidas de Influência do exemplo na "Motivação 1".
Usando o software Action temos os seguintes resultados:
Figura 3.4.3.1: Gráficos com os valores de DFFITS, D-COOK e DFBETAS considerando os dados da Motivação 1.
![]() |
Para entender como executar essa função do Software Action, você pode consultar o manual do usuário. |
Pelos resultados da Tabela 3.4.3.1 e pela Figura 3.4.3.1 temos que nenhum DFFITS, D-COOK e DFBETAS é, em módulo, maior do que 1. Assim, temos que nenhuma observação do exemplo na "Motivação 1" é um ponto influente.
Usaremos novamente o exemplo da "Motivação 2" para verificar se as observações são pontos influentes. Vale a pena ressaltar que na análise dos resíduos estamos considerando o seguinte modelo
Ganho=$\beta_0$+$\beta_1$Dose de íons+$\beta_2$Tempo.
clique aqui para efetuar o download dos dados utilizados nesse exemplo
Solução:
Observações | DFFITS | $DF\beta_0$ | $DF\beta_1$ | $DF\beta_2$ | DCOOK |
1 | 0,841 | 0,745 | -0,492 | -0,573 | 0,231 |
2 | 0,399 | 0,055 | -0,236 | 0,268 | 0,057 |
3 | -0,720 | -0,018 | -0,352 | 0,526 | 0,171 |
4 | -0,528 | 0,418 | -0,262 | -0,382 | 0,096 |
5 | 0,049 | 0,022 | -0,023 | -0,001 | 0,001 |
6 | -0,137 | -0,084 | 0,094 | 0,002 | 0,007 |
7 | 0,964 | -0,535 | 0,692 | -0,010 | 0,222 |
8 | -0,459 | -0,257 | 0,037 | 0,384 | 0,072 |
9 | -0,351 | 0,130 | 0,027 | -0,291 | 0,043 |
10 | -0,599 | -0,417 | 0,478 | 0,008 | 0,115 |
11 | -0,803 | 0,518 | -0,657 | 0,007 | 0,192 |
12 | 0,200 | 0,036 | -0,029 | -0,004 | 0,014 |
13 | 0,693 | -0,456 | 0,577 | -0,005 | 0,152 |
14 | 0,130 | 0,005 | -0,018 | 0,029 | 0,006 |
Tabela 3.4.3.2: Medidas de Influência do exemplo na "Motivação 2".
Usando o software Action temos os seguintes resultados:
Figura 3.4.3.2: Gráficos com os valores de DFFITS, D-COOK e DFBETAS considerando os dados da Motivação 2.
![]() |
Para entender como executar essa função do Software Action, você pode consultar o manual do usuário. |
Pelos resultados da Tabela 3.4.3.2 e pela Figura 3.4.3.2 temos que nenhum DFFITS, D-COOK e DFBETAS é, em módulo, maior que 1. Assim, temos que nenhuma observação do exemplo na "Motivação 2" é um ponto influente.
O Portal Action é mantido pela Estatcamp - Consultoria Estatística e Qualidade, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.