2.6 Intervalo de Confiança para Resposta Média e Predição

Você está aqui

2.6.1 Intervalo de confiança para a Predição

Podemos obter o intervalo de confiança para a resposta média em um ponto particular da amostra. Seja o vetor $x_0^\prime =[1, x_{01}, x_{02}, \ldots, x_{0p}]^\prime $ um ponto da amostra.

A resposta média para este ponto é $$E(Y\mid x_0)=\mu_{Y\mid x_0}=\beta_0+\beta_1x_{01}+\beta_2x_{02}+\ldots+\beta_px_{0p}=x^\prime _0\beta.$$

O estimador da média neste ponto é $$\widehat{\mu}_{Y\mid x_0}=\widehat{Y}_0=x^\prime _0\widehat{\beta}.$$

Notemos que o estimador da resposta média é não viciado. De fato, $$E(\widehat{\mu}_{Y\mid x_0})= E(x^\prime _0\widehat{\beta})=x^\prime _0\beta=\mu_{Y\mid x_0}\quad \mbox{(não viciado)}.$$

Além disso, temos que a variância de $\widehat{\mu}_{Y\mid x_0}$ é dada por $$Var(\widehat{\mu}_{Y\mid x_0})=\sigma^2 x^\prime _0(X^\prime X)^{-1}x_0.$$

Assim, temos que  $$\dfrac{\widehat{\mu}_{Y\mid x_0}-\mu_{Y\mid x_0}}{\sqrt{\sigma^2x^\prime _0(X^\prime X)^{-1}x_0}}\sim N(0,1)~~~~\mbox{e~que}$$

$$\dfrac{(n-p-1)\widehat{\sigma}^2}{\sigma^2}\sim\chi^2_{(n-p-1)}~~~~\mbox{independentes~entre~si}.$$

Logo, segue que $$\dfrac{\widehat{\mu}_{Y\mid x_0}-\mu_{Y\mid x_0}}{\sqrt{\widehat{\sigma}^2x^\prime _0(X^\prime X)^{-1}x_0}}\sim t_{(n-p-1)}.$$

Portanto, o intervalo com confiança de $100(1-\alpha)\%$ para a resposta média ($\mu_{Y\mid x_0}$) no ponto $x_{0}$ é dado por $$\left[\widehat{\mu}_{Y\mid x_0}-t_{(\frac{\alpha}{2},n-p-1)}\sqrt{\widehat{\sigma}^2 x^\prime _0(X^\prime X)^{-1}x_0}~~;~~\widehat{\mu}_{Y\mid x_0}+t_{(\frac{\alpha}{2},n-p-1)}\sqrt{\widehat{\sigma}^2 x^\prime _0(X^\prime X)^{-1}x_0}\right].$$

Exemplo 2.6.1

Determinar um intervalo de confiança para a resposta média no ponto $x_{01}=225$ min e $x_{02}=4,36 \times10^{14}$ íons.

Solução:

Em termos das variáveis codificadas, temos que $x_{01}=0$ e $x_{02}=0$, em que $x_{01}$ é a variável tempo e $x_{02}$ é a variável dose. Desta forma, seja o ponto $x^\prime_0=[1,0,0].$ A estimativa da resposta média neste ponto é $$\widehat{\mu}_{y\mid x_0}=x_0^\prime\widehat{\beta}=[1~0~0]\left[\begin{array}{c}1.242,31\\323,43\\-54,77\\\end{array}\right]=1.242,31.$$

Temos também que

Sabemos também que o estimador de $\sigma^2$ é $\widehat{\sigma}^2=QME =1.220,1.$

Portanto, temos que o intervalo de confiança é dado por $$\left[\widehat{\mu}_{y\mid x_0}-t_{\frac{(\alpha}{2},n-p-1)}\sqrt{\sigma^2 x^\prime _0(X^\prime X)^{-1}x_0} \,; \, \widehat{\mu}_{y\mid x_0}+t_{(\frac{\alpha}{2},n-p-1)}\sqrt{\sigma^2 x^\prime _0(X^\prime X)^{-1}x_0}\right]$$
$$\left[1.242,31-2,201\sqrt{1.220,1 \times 0,072}\,;\,1.242,31+2,201 \sqrt{1.220,1\times0,072}\right]$$
$$\left[1.242,31-20,63\,;\,1.242,31+20,63\right]$$ $$\left[1.221,68\,;\,1.262,94\right]$$

Portanto, $1.221,68\leq\mu_{y\mid x_0}\leq 1.262,94.$

2.6.2 Previsões para novas observações

O modelo de regressão pode ser usado para predizer futuras observações na variável resposta $Y$ correspondente a valores particulares das variáveis explicativas $x_{01},x_{02},\dots,x_{0p}$. Aqui assumimos que os valores de $x_{01},x_{02,\dots,x_{0p}}$ são não observados. Se $x^\prime _0=[1,x_{01},x_{02},\ldots,x_{0p}]$, o valor predito para a nova observação é dada por
$$\widehat{y}(x_0)=x^\prime _0\widehat{\beta}$$

Um intervalo de previsão $100(1-\alpha)\%$ para futuras observações ($\mu_{y\mid x_0}$) é

$$\left[\widehat{y}(x_0)-t_{(\frac{\alpha}{2},n-p-1)}\sqrt{\widehat{\sigma}^2(1+x^\prime _0(X^\prime X)^{-1}x_0)}~~;~~\widehat{y}(x_0)+t_{(\frac{\alpha}{2},n-p-1)}\sqrt{\widehat{\sigma}^2(1+x^\prime _0(X^\prime X)^{-1}x_0)}\right].$$

É preciso cuidado para estimar a variável resposta para pontos que estão além da região da amostra. É bem provável que um modelo ajustado dentro da região dos dados possa não estar mais ajustado quando usarmos observações fora dessa região. Em regressão múltipla é fácil extrapolar novos dados mas para tal devemos ter certeza de que os níveis das variáveis definam uma região conjunta que contenha os dados.

Como exemplo considere a Figura 2.6.1 que ilustra a região citada para um modelo de duas variáveis.

Figura 2.6.1: Um exemplo de extrapolação na regressão múltipla.

Exemplo 2.6.2

Encontrar um intervalo de predição com $95\%$ de confiança para o ganho do transistor, no ponto de $x_{01}=225$ min e $x_{02}= 4,36 \times 10^{14}$ íons.

Solução:

Com as variáveis codificadas, estes pontos passam a ser $x_{01}=0$ e $x_{02}=0$, sendo $x_{01}$ a variável tempo e $x_{02}$ a variável dose. Assim, o valor predito para o ganho no ponto $x^\prime _0=[1,0,0]$ é dado por

$$\widehat{y}(x_0)=x_0^\prime \widehat{\beta}=[1, 0, 0] \left[\begin{array}{c}1.242,31\\323,43\\-54,77\\\end{array}\right]=1.242,31.$$

Do "Exemplo 2.6.1" temos que $$x_0^\prime (X^\prime X)^{-1}x_0 = 0,072.$$

Então o intervalo de predição será $$\left[\widehat{y}(x_0)-t_{\frac{(\alpha}{2},n-p-1)}\sqrt{\widehat{\sigma}^2(1+x^\prime _0(X^\prime X)^{-1}x_0)}\,;\,\widehat{y}(x_0)+t_{(\frac{\alpha}{2},n-p-1)}\sqrt{\widehat{\sigma}^2(1+x^\prime _0(X^\prime X)^{-1}x_0)}\right]$$
$$\left[1.242,31-2,201 \sqrt{1.220,1(1 + 0,072)}~~;~~1.242,31+2,201 \sqrt{1.220,1 (1 + 0,072)}\right]$$
$$\left[1.242,31-79,60~~;~~1.242,31+79,60\right]$$
$$\left[1.162,71\,;\,1.321,91\right]$$

Portanto, $1.162,71 \leq \mu_{y\mid x_0} \leq 1.321,91.$

Observemos que se compararmos o intervalo de predição com o intervalo de confiança para a resposta média no mesmo ponto para os dois exemplos, poderemos constatar que o intervalo de predição é bem mais amplo. Isto reflete o fato de que existe dificuldade em predizer um valor individual futuro.

Usando o software Action temos os seguintes resultados:

 Para entender como executar essa função do Software Action, você pode consultar o manual do usuário.

Análise de Regressão

Sobre o Portal Action

O Portal Action é mantido pela Estatcamp - Consultoria Estatística e Qualidade, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.

Facebook

CONTATO

  •  Maestro Joao Seppe, 900, São Carlos - SP | CEP 13561-180
  • Telefone: (16) 3376-2047
  • E-Mail: [email protected]