Para avaliarmos a significância do modelo como um todo utilizamos a análise de variância (ANOVA). Para isso, consideremos o "Modelo de Regressão Linear Simples" com a suposição de que os erros tem distribuição Normal.
A análise de variância é baseada na decomposição da soma de quadrados e nos graus de liberdade associados a variável resposta Y. Em palavras, o desvio de uma observação em relação à média pode ser decomposto como o desvio da observação em relação ao valor ajustado pela regressão mais o desvio do valor ajustado em relação à média, isto é, podemos escrever
como
![]() |
1.5.1 Soma de Quadrados
Elevando cada componente de (1.3.1) ao quadrado e somando para todo o conjunto de observações, obtemos
![]() |
em que
![]() |
![]() |
![]() |
Desta forma, escrevemos
![]() |
em que decompomos a Soma de Quadrados Total em Soma de Quadrados da Regressão e Soma de Quadrados dos Erros.
Prova:
![]() |
![]() |
Notemos que
![]() |
Como visto em "Algumas propriedades do ajuste de mínimos quadrados",
![]() |
e
![]() |
Desta forma,
![]() |
![]() |
e portanto,
![]() |
1.5.2 Partição dos Graus de Liberdade
Assim como há uma decomposição da soma de quadrados total, existe uma decomposição dos graus de liberdade associados (abreviados por gl). A decomposição é a seguinte:
- gl da SQT: (n-1);
- gl da SQR: 1;
- gl da SQE: (n-2).
1.5.3 Quadrado Médio
A divisão da soma de quadrados pelos respectivos graus de liberdade é o quadrado médio. A relação da decomposição da variabilidade não existe mais nesse caso.
![]() |
![]() |
Como visto em "Propriedades dos Estimadores",
![]() |
Além disso,
![]() |
Desta forma,
![]() |
e portanto,
![]() |
![]() |
1.5.4 Tabela de Análise de Variância
Resumidamente temos:
| Fonte | GL | Soma de Quadrados | Quadrado Médio |
| Regressão | 1 | ![]() |
![]() |
| Resíduo | ![]() |
![]() |
![]() |
| Total | ![]() |
![]() |
Tabela: ANOVA
1.5.5 Teste F
Considerando o Modelo de Regressão Linear Simples, a análise de regressão estabelece um teste para avaliar o parâmetro
, isto é, testar as hipóteses
![]() |
Seja
![]() |
e consideremos o seguinte teorema:
Teorema de Cochran
Sejam
variáveis aleatórias independentes com distribuição
. Então
![]() |
Se tivermos
![]() |
em que
são somas de quadrados, cada um com
graus de liberdade, tal que
![]() |
então obtemos que
e são independentes para qualquer
.
Sob
. Então, segue pelo teorema de Cochran que
![]() |
![]() |
![]() |
com as distribuições Qui-Quadradas
e
independentes.
Desta forma, propomos a estatística do teste
![]() |
Como
é uma proporção de duas variáveis
, cada uma dividida pelos seus graus de liberdade, segue que
.
Uma motivação, baseada nas esperanças dos quadrados médios sugere que valores grandes de
levem a
e valores de
próximos de 1 levem a
. Logo, rejeitamos
com um nível de significância
se
. Outra maneira é analisar o p_valor. Neste caso, rejeitamos
se
Na tabela a seguir apresentamos a tabela ANOVA com a Estatística do Teste F.
| Fonte | GL | Soma de Quadrados | Quadrado Médio | ![]() |
| Regressão | 1 | |
![]() |
|
| Resíduo | ![]() |
|
![]() |
|
| Total | ![]() |
![]() |
Tabela: Análise de significância usando ANOVA.
Exemplo 1.5.1
Construir a tabela da ANOVA para o exemplo dado na "Motivação 1".
clique aqui para efetuar o download dos dados utilizados nesse exemplo
Solução:
![]() |
![]() |
![]() |
Assim,
![]() |
A tabela da ANOVA é então, dada por
| Fonte | GL | Soma de Quadrados | Quadrado Médio | ![]() |
| Regressão | 1 | 665,64 |
![]() |
|
| Resíduo | 18 | 41,16 |
![]() |
|
| Total | 19 | 706,80 |
Tabela: Análise de significância usando ANOVA.
Para
, obtemos que 
Logo,
![]() |
Além disso,
![]() |
Portanto, rejeitamos
com um nível de confiança de
e concluímos que a variável explicativa tem correlação com a variável resposta.
Interpretação do P-valor
Obtemos um nível de significância (ou P-valor) para o teste F, por exemplo, comparando o valor
com o quantil da distribuição F,
A maioria dos programas computacionais, que ajustam modelos de regressão incluem o cálculo do
na tabela ANOVA. Quando o p-valor é aproximadamente zero significa que, se a hipótese nula
for verdadeira, a chance de F exceder o valor observado
é praticamente nula. Esta é uma evidência muito forte, contra
O p-valor é uma probabilidade condicional de observar um valor da estatística computada, nesse caso
como maior do que o valor observado, sob
Um p-valor pequeno fornece evidências contra
Em algumas áres de pesquisa, é adotado um nível de significância fixo para examinar o p-valor. Por exemplo, se fixarmos um nível de significância (
), então poderemos dizer que uma hipótese nula é rejeitada a este nível, quando o p-valor é menor do que esse nível. A escolha mais comum para
é 0,05, isto significa que quando
é verdadeira encontraremos evidências contra essa hipótese em aproximadamente 5% dos elementos da amostra.
Denominamos significância estatística a observação de um P-valor suficientemente pequeno, porém essa significância necessita de outros métodos para ser determinada, além do P-valor.
Usando o Software Action temos os seguintes resultados:

| Para entender como executar essa função do Software Action, você pode consultar o manual do usuário. | |||













































![$$\mbox{P\_valor}=P[F_{1;18}\textgreater F_0]=0,000\textless 0,05=\alpha.$$](/sites/default/files/tex/496b855525a4c9fd21b7f1f8b79f0eddd271d1b7.png)