1.6.1 Coeficiente de Determinação
Uma das formas de avaliar a qualidade do ajuste do modelo é através do coeficiente de determinação. Basicamente, este coeficiente indica quanto o modelo foi capaz de explicar os dados coletados. O coeficiente de determinação é dado pela expressão
![]() |
ou seja, é a razão entre a soma de quadrados da regressão e a soma de quadrados total. No modelo com intercepto, podemos escrever
![]() |
Notemos que
![]() |
O
é, portanto, uma medida descritiva da qualidade do ajuste obtido. Em geral referimo-nos ao
como a quantidade de variabilidade nos dados que é explicada pelo modelo de regressão ajustado. Entretanto, o valor do coeficiente de determinação depende do número de observações
, tendendo a crescer quando
diminui. Se
, tem-se sempre 
O
deve ser usado com precaução, pois é sempre possível torná-lo maior pela adição de um número suficiente de termos ao modelo. Assim, se, por exemplo, não há dados repetidos (mais do que um valor
para um mesmo
) um polinômio de grau
dará um ajuste perfeito
para
dados. Quando há valores repetidos, o
não será nunca igual a 1, pois o modelo não poderá explicar a variabilidade devido ao erro puro.
Embora
aumente com a adição de termos ao modelo, isto não significa necessariamente que o novo modelo é superior ao anterior. A menos que a soma de quadrados residual do novo modelo seja reduzida por uma quantidade igual ao quadrado médio residual original, o novo modelo terá um quadrado médio residual maior do que o original, devido a perda de 1 grau de liberdade. Na realidade esse novo modelo poderá ser pior do que o anterior.
A magnitude de
, também, depende da amplitude de variação da variável regressora (
). Geralmente,
aumentará com maior amplitude de variação dos
's e diminuirá em caso contrário. Pode-se mostrar que
![]() |
Assim, um valor grande de
poderá ser grande simplesmente porque
variou em uma amplitude muito grande. Por outro lado
poderá ser pequeno porque a amplitude dos
's foi muito pequena para permitir que uma relação com
fosse detectada. Em geral, também,
não mede a magnitude da inclinação da reta. Um valor grande de
não significa uma reta mais inclinada. Além do mais, ele não leva em consideração a falta de ajuste do modelo; ele poderá ser grande, mesmo que
e
estejam não linearmente relacionados. Dessa forma, vê-se que
não deve ser considerado sozinho, mas sempre aliado a outros diagnósticos do modelo.
Exemplo 1.6.1
clique aqui para efetuar o download dos dados utilizados nesse exemplo
Vamos calcular agora o coeficiente de determinação
com os dados do exemplo na "Motivação 1".
Solução:
![]() |
1.6.2 Coeficiente de Determinação Ajustado
Para evitar dificuldades na interpretação de
, alguns estatísticos preferem usar o
(
ajustado), definido para uma equação com p coeficientes como
![]() |
Assim como o Coeficiente de Determinação
, quanto maior
, mais a variável resposta é explicada pela regressora X.
Exemplo 1.6.2
clique aqui para efetuar o download dos dados utilizados nesse exemplo
Vamos calcular agora o coeficiente de determinação
com os dados do exemplo na "Motivação 1".
Solução:
![]() |
Usando o software Action temos os seguintes resultados:
![]()
| Para entender como executar essa função do Software Action, você pode consultar o manual do usuário. | |||




![$$E[R^2]\cong \dfrac{\widehat{\beta}^2_1 \displaystyle\sum\limits_{i=1}^n(x_i-\bar{x})^2}{\widehat{\beta}_1^2\displaystyle\sum\limits_{i=1}^n(x_i-\bar{x})^2+\sigma^2}.$$](/sites/default/files/tex/655d003ca2fb05cb6f5c82f3e227a316aa2111a0.png)


