Após o ajuste, é importante verificar se o modelo linear é adequado. As Figuras 3.5.1 e 3.5.2 mostram os pontos da amostra para situações de um modelo correto e um modelo incorreto.
Na Figura 3.5.1, o valor esperado de
dado
(
) está alinhado e então, a falta de ajuste de um modelo linear praticamente não existe, pois a variação da amostra em torno da reta de regressão é o erro aleatório devido a variação das observações das replicas.

Figura 3.5.1: Reta de regressão perfeitamente ajustada sem Falta de Ajuste
Na Figura 3.5.2 a reta de regressão não se ajusta perfeitamente aos dados e existe uma variância grande em torno do ajuste equivocado, neste caso observamos uma falta de ajuste.

Figura 3.5.2: Reta de regressão com Falta de Ajuste
Uma maneira formal de verificar o ajuste de um modelo linear é por meio do teste de falta de ajuste.
Esse teste requer medidas repetidas para um ou mais níveis de X. A seguir apresentamos o teste tanto para o modelo linear quanto para o múltiplo.
3.5.1 Análise da falta de ajuste nos modelos de Regressão Linear Simples
O modelo linear simples é:
![]() |
em que,
: representa a j-ésima observação para o i-ésimo valor da variável;
: onde a reta intercepta o eixo y;
: a inclinação da reta de regressão;
: o i-ésimo valor da variável explicativa;
: erro aleatório associado à i-ésimo e j-ésima observação;
representa o número de observações para o i-ésimo valor de x.
Supondo que temos
diferentes valores da variável explicativa
e que temos
réplicas da variável resposta para cada valor da variável explicativa, ou seja,
![]() |
Vamos quebrar a soma de quadrados do erro em dois componentes.
Para entendermos a quebra, tomamos,
![]() |
A primeira parte reflete a variabilidade entre as observações da variável resposta para o mesmo
,
enquanto que a segunda parte reflete os desvios das médias das observações (em cada
) para o modelo.
Assim, associamos a primeira parte ao erro puro (PE) e a segunda parte à falta de ajuste do modelo (lof).
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
Assim,
![]() |
O quadrado médio devido ao Falta de Ajuste é dado por
![]() |
Assim o teste para a falta de ajuste é dada por
![]() |
Temos que
![]() |
Se a regressão linear for perfeita obtemos que
e o segundo termos da equação (3.5.2) é zero. Neste caso,
![]() |
Se o modelo linear não for adequado, obtemos que
. Neste caso,
![]() |
Seja,
![]() |
Se
é verdadeiro, obtemos que 
Com isso, rejeitamos
se 
O P-valor é dado por
![]() |
A tabela ANOVA se resume em:
| Fonte | SQ | GL | QM | Estatística |
| Regressão | ![]() |
1 | ![]() |
![]() |
| Resíduo | ![]() |
n-2 | ||
| Falta de Ajuste | ![]() |
m-2 | ![]() |
![]() |
| Erro Puro | ![]() |
n-m | ![]() |
|
| Total | ![]() |
n-1 |
Tabela 3.5.1: ANOVA para o teste de linearidade da regressão.
Exemplo 3.5.1
Vamos fazer a aplicação do Teste da Falta de Ajuste ao exemplo da "Motivação 1". Nesse caso de regressão simples, temos quatro níveis (m=4) da variável explicativa temperatura, com quatro replicações cada um.
Solução:
![]() |
![]() |
![]() |
Temos inicialmente
![]() |
A partir daí podemos chegar na soma de quadrados separada para o Teste da Falta de Ajuste.
![]() |
![]() |
![]() |
![]() |
Podemos então calcular a estatística F com base nos quadrados médios, sabendo que neste exemplo os valores de
e
.
![]() |
Se
é verdadeiro, obtemos que
Com isso, rejeitamos
se 
O p-valor é dado por
![]() |
| Fonte | SQ | GL | QM | Estatística | P-valor |
| Regressão | 665,64 | 1 | 665,64 | 350,3368 | 0 |
| Resíduo | 41,16 | 18 | |||
| Falta de Ajuste | 10,76 | 2 | 5,38 | 2,8316 | 0,089 |
| Erro Puro | 30,4 | 16 | 1,9 | ||
| Total | 706,8 | 19 |
Tabela 3.5.2: Tabela da ANOVA.
Portanto, não rejeitamos a hipótese de que o modelo linear é adequado.
Usando o software Action temos os seguintes resultados:

| Para entender como executar essa função do Software Action, você pode consultar o manual do usuário. | |||
3.5.2 Análise da falta de ajuste nos modelos na Regressão Linear Múltipla
No caso da regressão linear múltipla, nosso modelo é dado por
![]() |
em que,
: representa a j-ésima observação para o i-ésimo valor da variável;
: onde o hiperplano intercepta o eixo y;
: é o coeficiente da i-ésima variável regressora (
);
: o j-ésimo valor da variável explicativa
;
: erro aleatório associado à j-ésima observação;
representa o número de observações para o i-ésimo valor de x.
Como temos
observações para cada combinação i das variáveis explicativas,
, temos
observações.
O procedimento do teste envolve particionar a soma dos quadrados dos resíduos em dois componentes (da mesma forma que no caso linear simples),
![]() |
em que
é a soma dos quadrados devido ao Erro Puro e
é a soma dos quadrados
devido ao Falta de Ajuste.
Para desenvolver esta partição de
, note que o (i j)-ésimo resíduo é,
![]() |
em que
é a média de
observações em
.
Com os dois lados elevados ao quadrado da equação (3.5.4) e somando através de i e j, temos:
![]() |
O lado esquerdo da equação (3.5.5) é a soma dos quadrados dos resíduos tradicional. Os dois componentes do lado direito medem o puro erro e o Falta de Ajuste.
A soma dos quadrados do puro erro,
![]() |
é obtido através da soma dos quadrados corrigidos das observações repetidas em cada nível
e então somamos para todos os m níveis de x.
Como temos
graus de liberdade para a soma dos quadrados do puro erro em cada nível
, o total de graus de liberdade associados com a soma dos quadrados do puro erro é,
A soma dos quadrados do Falta de Ajuste,
![]() |
é uma soma dos desvios quadráticos ponderada entre a resposta média
em cada nível e seu
correspondente valor ajustado.
Se o valor ajustado
está próximo das correspondentes médias respostas
então existe um grande indicativo de que o modelo linear é adequado. Se
desvia muito de
, este por sua vez é um forte indício de que a regressão não é linear.
O valor esperado de
é
, e o valor esperado do
é dado por:
![]() |
em que
é o número de variáveis explicativas da regressão.
O teste estatístico para o Falta de Ajuste é,
![]() |
Se a regressão linear for perfeita obtemos que
e o segundo termos da equação é zero. Neste caso,
![]() |
Se o modelo linear não for adequado, obtemos que
. Neste caso,
![]() |
Seja,
![]() |
Se
é verdadeiro, obtemos que
Com isso, rejeitamos
se
. O P-valor é dado por:
![]() |
A Tabela ANOVA se resume em
| Fonte | SQ | GL | QM | Estatística |
| Regressão | ![]() |
p | ![]() |
![]() |
| Resíduo | ![]() |
n-p-1 | ||
| Falta de Ajuste | ![]() |
m-p-1 | ![]() |
![]() |
| Erro Puro | ![]() |
n-m | ![]() |
|
| Total | |
n-1 |
Tabela 3.5.3: ANOVA para o teste de linearidade da regressão.
Exemplo 3.5.2
Vamos fazer a aplicação do Falta de Ajuste ao problema dado na "Motivação 2". Como necessitamos de réplicas nos níveis, vamos considerar um novo conjunto de dados conforme a Tabela 3.5.4.
| Observação | Tempo | Dose | Ganho | Observação | Tempo | Dose | Ganho |
| 1 | 195 | 4 | 1004 | 16 | 225 | 4,7 | 1160 |
| 2 | 195 | 4 | 1010 | 17 | 225 | 4,3 | 1276 |
| 3 | 195 | 4,6 | 852 | 18 | 225 | 4,3 | 1270 |
| 4 | 195 | 4,6 | 849 | 19 | 225 | 4,72 | 1225 |
| 5 | 195 | 4,3 | 903 | 20 | 225 | 4,72 | 1220 |
| 6 | 195 | 4,3 | 920 | 21 | 230 | 4,3 | 1321 |
| 7 | 225 | 4,2 | 1272 | 22 | 230 | 4,3 | 1330 |
| 8 | 225 | 4,2 | 1285 | 23 | 230 | 4,5 | 1340 |
| 9 | 225 | 4,1 | 1270 | 24 | 230 | 4,5 | 1345 |
| 10 | 225 | 4,1 | 1280 | 25 | 255 | 4 | 1636 |
| 11 | 225 | 4,6 | 1269 | 26 | 255 | 4 | 1640 |
| 12 | 225 | 4,6 | 1200 | 27 | 255 | 4,6 | 1506 |
| 13 | 225 | 4 | 1260 | 28 | 255 | 4,6 | 1510 |
| 14 | 225 | 4 | 1250 | 29 | 255 | 4,3 | 1555 |
| 15 | 225 | 4,7 | 1146 | 30 | 255 | 4,3 | 1550 |
Tabela 3.5.4: Dados da "Motivação 2" com réplicas
Solução:
Temos inicialmente
![]() |
A partir, daí podemos chagar na soma de quadrados separada para o Falta de Ajuste.
![]() |
![]() |
![]() |
![]() |
Podemos então, calcular a estatística F, com base nos quadrados médios, sabendo que neste exemplo os valores de m=15 e n=30.
![]() |
Se
é verdadeiro, obtemos que 
Com isso, rejeitamos
se
.
O p-valor é dado por
![]() |
Temos a seguir a Tabela ANOVA com o Falta de Ajuste dos dados do exemplo da Motivação 2, com réplicas.
| Fonte | SQ | GL | QM | Estatística | P-valor |
| Regressão | 1307620 | 2 | 653810 | 559,89 | 0 |
| Resíduo | 31529 | 27 | 1168 | ||
| Falta de Ajuste | 28587 | 12 | 2382 | 12,15 | 0 |
| Erro Puro | 2942 | 15 | 196 | ||
| Total | 133914 | 29 |
Tabela 3.5.5: Tabela da ANOVA.
Usando o software Action temos os seguintes resultados:
- Sem réplicas:

- Com réplicas:

| Para entender como executar essa função do Software Action, você pode consultar o manual do usuário. | |||













![$$E[QM_{LOF}] =\sigma^2 + \frac{\displaystyle\sum_{i=1}^{m}n_i [E(Y_i) - \beta_0 -\beta_1~x_i]^2}{m-2}.~~~~~(3.5.2)$$](/sites/default/files/tex/d76487dfa7a8129b50493245325edffe1ccf6084.png)
![$$E[QM_{LOF}]=\sigma^2$$](/sites/default/files/tex/c83441fe74bd95f3a34a0ade3dbdd21556b3c392.png)
![$$E[QM_{LOF}]\textgreater \sigma^2$$](/sites/default/files/tex/714cefd2adafef86bfa6d2ac1dc07744eddc7613.png)

![$$P-valor=P[F_{(m - 2; n - m)}\textgreater F_0].$$](/sites/default/files/tex/824bad2af37bede7fbaf58e9ab0c7a566883ba08.png)



















![$$P-valor=P[F_{(2; 16)}\textgreater F_0]= 0,089.$$](/sites/default/files/tex/2254084146c3d762555ceccd7bf5af927c6d8d27.png)






![$$E(QM_{LOF})=\sigma^2+\frac{\sum_{i=1}^m n_i \left[ E(Y_i)-\beta_0-\sum_{j=1}^k \beta_j x_{ij} \right]^2}{m-p-1}.$$](/sites/default/files/tex/305de9b9236d4e57de5150f704cb1105bcb6ed7f.png)

![$$E[QM_{LOF}]=\sigma^2.$$](/sites/default/files/tex/3db151419f2d49442239716f354b69945b5bb77f.png)
![$$E[QM_{LOF}]\textgreater \sigma^2.$$](/sites/default/files/tex/1eb170dccfe20beb594e01e2897fed9928ae295f.png)

![$$P-valor=P[F_{(m - p -1; n - m)}\textgreater F_0].$$](/sites/default/files/tex/f0a88dd4bd2f8ae7c25e48d14b6af74163960425.png)










![$$P-valor=P[F_{(12; 15)}\textgreater F_0]= 0,000.$$](/sites/default/files/tex/75f47df289fd466e857f006e658a2e5a58a5de96.png)