- Estatcamp: (16) 3376-2047 [email protected]
- [email protected] https://www.actionstat.com.br
Suponha que dispomos de $n$ pares de observações $(x_i, y_i),$ $i=1,\ldots,n.$ O modelo de regressão linear simples, sem intercepto, é definido por
$\begin{equation*}Y_i =\beta_1 x_i + \varepsilon_i, \quad i=1,\ldots, n.\end{equation*}$
Neste caso, a função de mínimos quadrados é
$$L=\sum_{i=1}^n\varepsilon^2_i=\sum_{i=1}^n(Y_i-\beta_1x_i)^2,$$
que derivando em relação a $\beta_1$ resulta em
$$\dfrac{\partial L(\beta_1)}{\partial \beta_1}=2\sum_{i=1}^n(Y_i-\beta_1 x_i)(-x_i).$$
Substituindo $\beta_1$ por $\widehat\beta_1$ e igualando a zero, obtemos
$$\sum_{i=1}^n(Y_i -\widehat{\beta}_1x_i)(x_i)=\sum_{i=1}^n x_iY_i -\widehat{\beta}_1\sum_{i=1}^n x_i^2=0,$$
que resolvendo em relação a $\widehat{\beta}_1$ resulta em
$$\widehat{\beta}_1 = \dfrac{\sum\limits_{i=1}^n x_i Y_i}{\sum\limits_{i=1}^n x_i^2}.$$
Podemos mostrar que
$$E(\widehat{\beta}_1)=\beta_1 \mbox{\ e\ que}$$
$$\mbox{Var}(\widehat{\beta}_1)=\dfrac{\sigma^2}{\sum\limits_{i=1}^n x_i^2}.$$
Sendo $\varepsilon_i \ensuremath{\stackrel{\mbox{\footnotesize iid}}{\sim}} N(0, \sigma^2),$ temos que
i) $\dfrac{\widehat{\beta}_1 - \beta_1}{\sqrt{\dfrac{\sigma^2}{\sum\limits_{i=1}^n x_i^2}}} \sim N(0, 1);$
ii) Um estimador não viciado para $\sigma^2$ é dado por
$$\widehat{\sigma}^2 = \frac{SQE}{n - 1};$$
iii) $\dfrac{(n-1)\widehat{\sigma}^2}{\sigma^2} \sim \chi_{(n-1)}^2;$
iv) $T = \dfrac{\widehat{\beta}_1 - \beta_1}{\sqrt{\dfrac{\widehat{\sigma}^2}{\sum\limits_{i=1}^n x_i^2}}} \sim t_{(n-1)}.$
Um intervalo de $100(1-\alpha)\%$ de confiança para $\beta_1$ é dado por
$$\left[\widehat{\beta}_1 - t_{\left(\dfrac{\alpha}{2}, n - 1\right)} \sqrt{\dfrac{\widehat{\sigma}^2}{\sum\limits_{i=1}^n x_i^2}}~~;~~\widehat{\beta}_1 + t_{\left(\dfrac{\alpha}{2}, n - 1\right)}\sqrt{\dfrac{\widehat{\sigma}^2}{\sum\limits_{i=1}^n x_i^2}}\right].$$
Um intervalo de $100(1-\alpha)\%$ de confiança para a resposta média em $X=x_0$ é dado por
$$\left[\widehat{\mu}_{Y\mid x_0}-t_{\left(\dfrac{\alpha}{2},n-1\right)}\sqrt{\dfrac{\widehat{\sigma}^2 x_0^2}{\sum\limits_{i=1}^n x_i^2}}~~;~~\widehat{\mu}_{Y\mid x_0} + t_{\left(\dfrac{\alpha}{2},n-1\right)} \sqrt{\dfrac{\widehat{\sigma}^2 x_0^2}{\sum\limits_{i=1}^n x_i^2}}\right],$$
em que $\widehat{\mu}_{Y\mid x_0} = \widehat{\beta}_1x_0.$
Um intervalo de $100(1-\alpha)\%$ de confiança para a predição de $Y_h$ dado $X=x_h$ é
$$\left[\widehat{Y}_{h}-t_{\left(\dfrac{\alpha}{2},n-1\right)}\sqrt{\widehat{\sigma}^2+\dfrac{\widehat{\sigma}^2 x_0}{\sum\limits_{i=1}^n x_i^2}}~~;~~\widehat{Y}_{h}+t_{\left(\dfrac{\alpha}{2},n-1\right)}\sqrt{\widehat{\sigma}^2+\dfrac{\widehat{\sigma}^2 x_0}{\sum\limits_{i=1}^n x_i^2}}\right],$$
em que $\widehat{Y}_{h} = \widehat{\beta}_1 x_h.$
Voltando à "Motivação 1", em que queríamos determinar os valores de temperatura em $^{\circ}\mathrm{C}$ que otimizam a dureza do material, calculemos a estimativa de $\beta_1$ considerando o modelo sem intercepto.
clique aqui para efetuar o download dos dados utilizados nesse exemplo
Temos que a estimativa de $\beta_1$ do modelo sem intercepto é
$$\widehat{\beta}_1 = \dfrac{\sum\limits_{i=1}^n x_i Y_i}{\sum\limits_{i=1}^n x_i^2}=\dfrac{588125}{1035750}=0,567.$$
Usando o Software Action temos os seguintes resultados:
![]() |
Para entender como executar essa função do Software Action, você pode consultar o manual do usuário. |
O Portal Action é mantido pela Estatcamp - Consultoria Estatística e Qualidade, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.