Supondo que a relação linear entre as variáveis Y e X é satisfatória, podemos estimar a linha de regressão e resolver alguns problemas de inferência. O problema de estimar os parâmetros
e
é o mesmo que ajustar a melhor reta em um gráfico de dispersão, como na Figura 1.2.1. O Método dos Mínimos Quadrados é uma eficiente estratégia de estimação dos parâmetros da regressão e sua aplicação não é limitada apenas às relações lineares.

Figura 1.2.1: Representação da Reta de Regressão.
1.2.1 Método dos Mínimos Quadrados
O primeiro passo na análise de regressão é obter as estimativas
e
dos parâmetros do modelo. Os valores dessas estimativas serão obtidos a partir de uma amostra de n pares de valores (xi,Yi), i=1,...,n que correspondem a n pontos em um gráfico, como na Figura 1.2.1. No método de Mínimos Quadrados, não é necessário conhecer a forma da distribuição dos erros.
Suponha que é traçada uma reta arbitrária
passando por esses pontos. No valor
da variável explicativa, o valor predito por esta reta é
, enquanto o valor observado é
. Os desvios (erros) entre estes dois valores é
, que corresponde a distância vertical do ponto à reta arbitrária.
O objetivo é estimar os parâmetros
e
de modo que os desvios (
) entre os valores observados e estimados sejam mínimos. Isso equivale a minimizar o comprimento do vetor de erros,
.
Uma forma de obter essas estimativas é o Método de Mínimos Quadrados. Este método consiste em minimizar a soma dos quadrados dos desvios L, como na expressão abaixo
![]() |
A potência é necessária, pois a soma dos desvios é nula, isto é, 
Para encontrarmos estimativas para os parâmetros, vamos minimizar (1.2.1.1) em relação aos parâmetros
e
. Para isto, derivamos-a em relação aos parâmetros
e
. Assim,
![]() |
![]() |
Substituindo
e
por
e
, para indicar valores particulares dos parâmetros que minimizam L, e igualando as derivadas parciais a zero, obtemos
![]() |
![]() |
Simplificando, obtemos as equações denominadas Equações Normais de Mínimos Quadrados.
![]() |
Para encontrarmos os valores de
e
que minimizam L, resolvemos o sistema de equações dado em (1.2.1.2). Considerando a primeira equação de (1.2.1.2) obtemos que,
![]() |
ou seja,
![]() |
em que
são as médias de x e da variável Y, respectivamente.
Desta forma, substituindo (1.2.1.3) na segunda equação de (1.2.1.2) temos que,
![]() |
![]() |
![]() |
![]() |
Então,
![]() |
e portanto, concluímos que
![]() |
Podemos também escrever
![]() |
Os valores de
e
assim determinados são chamados Estimadores de Mínimos Quadrados (EMQ).
O modelo de regressão linear simples ajustado é então
![]() |
sendo que
é um estimador pontual da média da variável Y para um valor de
, ou seja,
![]() |
Notação:
Considerando n pares de valores observados (x1,y1),...,(xn,yn),
![]() |
![]() |
![]() |
![]() |
As quantidades
e
são as médias amostrais de x e y. Já as quantidades
e
são as somas dos quadrados dos desvios das médias e
é a soma dos produtos cruzados dos desvios de x e y.
Desta forma, as estimativas de mínimos quadrados de
e
, em termos desta notação são:
![]() |
Voltando à "Motivação 1", em que queríamos determinar os valores de temperatura em
que otimizam a dureza do material, encontramos as estimativas dos parâmetros
e
pelo Método dos Mínimos Quadrados.
clique aqui para efetuar o download dos dados utilizados nesse exemplo
Solução:
As médias amostrais das variáveis temperatura (X) e dureza (Y) são, respectivamente,
![]() |
![]() |
Além disso, na Tabela 1.2.1, apresentamos os valores de x2, y2 e xy para cada observação i, i=1,...,20.
| Observação | Temperatura (x) | Dureza (y) | ![]() |
![]() |
![]() |
| 1 | 220 | 137 | 48.400 | 18.769 | 30.140 |
| 2 | 220 | 137 | 48.400 | 18.769 | 30.140 |
| 3 | 220 | 137 | 48.400 | 18.769 | 30.140 |
| 4 | 220 | 136 | 48.400 | 18.496 | 29.920 |
| 5 | 220 | 135 | 48.400 | 18.225 | 29.700 |
| 6 | 225 | 135 | 50.625 | 18.225 | 30.375 |
| 7 | 225 | 133 | 50.625 | 17.689 | 29.925 |
| 8 | 225 | 132 | 50.625 | 17.424 | 29.700 |
| 9 | 225 | 133 | 50.625 | 17.689 | 29.925 |
| 10 | 225 | 133 | 50.625 | 17.689 | 29.925 |
| 11 | 230 | 128 | 52.900 | 16.384 | 29.440 |
| 12 | 230 | 124 | 52.900 | 15.376 | 28.520 |
| 13 | 230 | 126 | 52.900 | 15.876 | 28.980 |
| 14 | 230 | 129 | 52.900 | 16.641 | 29.670 |
| 15 | 230 | 126 | 52.900 | 15.876 | 28.980 |
| 16 | 235 | 122 | 55.225 | 14.884 | 28.670 |
| 17 | 235 | 122 | 55.225 | 14.884 | 28.670 |
| 18 | 235 | 122 | 55.225 | 14.884 | 28.670 |
| 19 | 235 | 119 | 55.225 | 14.161 | 27.965 |
| 20 | 235 | 122 | 55.225 | 14.884 | 28.670 |
| Soma | 4.550 | 2.588 | 1.035.750 | 335.594 | 588.125 |
| Média | 227,5 | 129,4 |
Tabela 1.2.1: Dados da Motivação 1.
Assim, encontramos as somas de quadrados
![]() |
![]() |
![]() |
Logo, as estimativas dos parâmetros
e
são, respectivamente
![]() |
![]() |
Portanto, o modelo ajustado é dado por
![]() |
Pelos valores das estimativas, temos que a cada aumento da Temperatura, temos um decréscimo de 1,032 na Dureza.
1.2.2 Resíduos
A diferença entre o valor observado
e o correspondente valor ajustado
, dado pela expressão (1.2.1.4), é chamada de resíduo e é denotada por
![]() |
Essa medida é importante já que por meio dela verificamos o ajuste do modelo.
1.2.2.1 Algumas propriedades do ajuste de mínimos quadrados
(i) A soma dos resíduos é sempre nula.
![]() |
(ii) A soma dos valores observados
é igual a soma dos valores ajustados
.
![]() |
(iii) A reta de regressão de mínimos quadrados passa pelo ponto
. De fato,
![]() |
com
. Assim, a reta de regressão ajustada é dada por
![]() |
Logo,
![]() |
e portanto, temos que a reta ajustada passa por
.
(iv) A soma dos resíduos ponderado pelo correspondente valor da variável regressora é sempre nula.
![]() |
(v) A soma dos resíduos ponderado pelo correspondente valor ajustado é sempre zero.
![]() |
1.2.3 Estimador da variância residual
Assim como os parâmetros
e
, a variância
dos termos do erro
precisa ser estimada. Isto é necessário já que inferências a respeito da função de regressão e da predição de Y requerem uma estimativa de
. Consideremos os resíduos
dado em (1.2.2.1). Desta forma, definimos a Soma de Quadrados dos Resíduos (Erros),
![]() |
Não utilizamos a soma dos resíduos uma vez que em (i),
![]() |
Como demonstrado em "Propriedades dos Estimadores", SQE é um estimador viciado de
, isto é,
![]() |
Desta forma, um estimador não viciado para
é dado por
![]() |
em que QME é o Quadrado Médio dos Erros (Resíduos).
Considerando n pares de valores observados (x1,y1),...,(xn,yn), podemos escrever
![]() |
como visto em "Propriedades dos Estimadores", em que
e
são dados respectivamente pelas expressões (1.2.1.6) e (1.2.1.7). Portanto,
![]() |
Daremos mais detalhes para a Soma de Quadrados dos Erros (SQE) e para o Quadrado Médio dos Erros (QME) em "Análise de Variância".
Obter um estimador não viesado para a variância residual do exemplo da "Motivação 1".
clique aqui para efetuar o download dos dados utilizados nesse exemplo
Solução:
Temos que
![]() |
Já vimos que
e
então
![]() |
![]() |
Usando o Software Action obtemos os seguintes resultados:

| Para entender como executar essa função do Software Action, você pode consultar o manual do usuário. | |||

![$$L=\displaystyle\sum^n_{i=1}\varepsilon_i^2=\sum^n_{i=1}[Y_i-\beta_0-\beta_1 x_i]^2.~~~~(1.2.1.1)$$](/sites/default/files/tex/d97249ceb37a88c577a8a08d364c7c1b4f4f6e0b.png)
















































