2.6 Intervalo de Confiança para Resposta Média e Predição

Você está aqui

2.6.1 Intervalo de confiança para a Predição

Podemos obter o intervalo de confiança para a resposta média em um ponto particular da amostra. Seja o vetor $ x_0^\prime =[1, x_{01}, x_{02}, \ldots, x_{0p}]^\prime  $ um ponto da amostra.

A resposta média para este ponto é

$$E(Y\mid x_0)=\mu_{Y\mid x_0}=\beta_0+\beta_1x_{01}+\beta_2x_{02}+\ldots+\beta_px_{0p}=x^\prime _0\beta.$$

O estimador da média neste ponto é

$$\widehat{\mu}_{Y\mid x_0}=\widehat{Y}_0=x^\prime _0\widehat{\beta}.$$

Notemos que o estimador da resposta média é não viciado. De fato,

$$E(\widehat{\mu}_{Y\mid x_0})= E(x^\prime _0\widehat{\beta})=x^\prime _0\beta=\mu_{Y\mid x_0}\quad \mbox{(não viciado)}.$$

Além disso, temos que a variância de $ \widehat{\mu}_{Y\mid x_0} $ é dada por

$$Var(\widehat{\mu}_{Y\mid x_0})=\sigma^2 x^\prime _0(X^\prime X)^{-1}x_0.$$

Assim, temos que  

$$\dfrac{\widehat{\mu}_{Y\mid x_0}-\mu_{Y\mid x_0}}{\sqrt{\sigma^2x^\prime _0(X^\prime X)^{-1}x_0}}\sim N(0,1)~~~~\mbox{e~que}$$

$$\dfrac{(n-p-1)\widehat{\sigma}^2}{\sigma^2}\sim\chi^2_{(n-p-1)}~~~~\mbox{independentes~entre~si}.$$

Logo, segue que

$$\dfrac{\widehat{\mu}_{Y\mid x_0}-\mu_{Y\mid x_0}}{\sqrt{\widehat{\sigma}^2x^\prime _0(X^\prime X)^{-1}x_0}}\sim t_{(n-p-1)}.$$

Portanto, o intervalo com confiança de $ 100(1-\alpha)\% $ para a resposta média ($ \mu_{Y\mid x_0} $) no ponto $ x_{0} $ é dado por

$$\left[\widehat{\mu}_{Y\mid x_0}-t_{(\frac{\alpha}{2},n-p-1)}\sqrt{\widehat{\sigma}^2 x^\prime _0(X^\prime X)^{-1}x_0}~~;~~\widehat{\mu}_{Y\mid x_0}+t_{(\frac{\alpha}{2},n-p-1)}\sqrt{\widehat{\sigma}^2 x^\prime _0(X^\prime X)^{-1}x_0}\right].$$

Exemplo 2.6.1

Determinar um intervalo de confiança para a resposta média no ponto $ x_{01}=225 $ min e $ x_{02}=4,36 \times10^{14} $ íons.

Solução:

Em termos das variáveis codificadas, temos que $ x_{01}=0 $ e $ x_{02}=0 $, em que $ x_{01} $ é a variável tempo e $ x_{02} $ é a variável dose. Desta forma, seja o ponto $ x^\prime_0=[1,0,0]. $ A estimativa da resposta média neste ponto é 

$$\widehat{\mu}_{y\mid x_0}=x_0^\prime\widehat{\beta}=[1~0~0]\left[\begin{array}{c}1.242,31\\323,43\\-54,77\\\end{array}\right]=1.242,31.$$

Temos também que

Sabemos também que o estimador de $ \sigma^2 $ é $ \widehat{\sigma}^2=QME =1.220,1. $

Portanto, temos que o intervalo de confiança é dado por 

$$\left[\widehat{\mu}_{y\mid x_0}-t_{\frac{(\alpha}{2},n-p-1)}\sqrt{\sigma^2 x^\prime _0(X^\prime X)^{-1}x_0} \,; \, \widehat{\mu}_{y\mid x_0}+t_{(\frac{\alpha}{2},n-p-1)}\sqrt{\sigma^2 x^\prime _0(X^\prime X)^{-1}x_0}\right]$$

$$\left[1.242,31-2,201\sqrt{1.220,1 \times 0,072}\,;\,1.242,31+2,201 \sqrt{1.220,1\times0,072}\right]$$

$$\left[1.242,31-20,63\,;\,1.242,31+20,63\right]$$
$$\left[1.221,68\,;\,1.262,94\right]$$

Portanto, $ 1.221,68\leq\mu_{y\mid x_0}\leq 1.262,94. $

2.6.2 Previsões para novas observações

O modelo de regressão pode ser usado para predizer futuras observações na variável resposta $ Y $ correspondente a valores particulares das variáveis explicativas $ x_{01},x_{02},\dots,x_{0p} $. Aqui assumimos que os valores de $ x_{01},x_{02,\dots,x_{0p}} $ são não observados. Se $ x^\prime _0=[1,x_{01},x_{02},\ldots,x_{0p}] $, o valor predito para a nova observação é dada por

$$\widehat{y}(x_0)=x^\prime _0\widehat{\beta}$$

Um intervalo de previsão $ 100(1-\alpha)\% $ para futuras observações ($ \mu_{y\mid x_0} $) é

$$\left[\widehat{y}(x_0)-t_{(\frac{\alpha}{2},n-p-1)}\sqrt{\widehat{\sigma}^2(1+x^\prime _0(X^\prime X)^{-1}x_0)}~~;~~\widehat{y}(x_0)+t_{(\frac{\alpha}{2},n-p-1)}\sqrt{\widehat{\sigma}^2(1+x^\prime _0(X^\prime X)^{-1}x_0)}\right].$$

É preciso cuidado para estimar a variável resposta para pontos que estão além da região da amostra. É bem provável que um modelo ajustado dentro da região dos dados possa não estar mais ajustado quando usarmos observações fora dessa região. Em regressão múltipla é fácil extrapolar novos dados mas para tal devemos ter certeza de que os níveis das variáveis definam uma região conjunta que contenha os dados.

Como exemplo considere a Figura 2.6.1 que ilustra a região citada para um modelo de duas variáveis.

Figura 2.6.1: Um exemplo de extrapolação na regressão múltipla.

Exemplo 2.6.2

Encontrar um intervalo de predição com $ 95\% $ de confiança para o ganho do transistor, no ponto de $ x_{01}=225 $ min e $ x_{02}= 4,36 \times 10^{14} $ íons.

Solução:

Com as variáveis codificadas, estes pontos passam a ser $ x_{01}=0 $ e $ x_{02}=0 $, sendo $ x_{01} $ a variável tempo e $ x_{02} $ a variável dose. Assim, o valor predito para o ganho no ponto $ x^\prime _0=[1,0,0] $ é dado por

$$\widehat{y}(x_0)=x_0^\prime \widehat{\beta}=[1, 0, 0] \left[\begin{array}{c}1.242,31\\323,43\\-54,77\\\end{array}\right]=1.242,31.$$

Do "Exemplo 2.6.1" temos que 

$$x_0^\prime (X^\prime X)^{-1}x_0 = 0,072.$$

Então o intervalo de predição será 

$$\left[\widehat{y}(x_0)-t_{\frac{(\alpha}{2},n-p-1)}\sqrt{\widehat{\sigma}^2(1+x^\prime _0(X^\prime X)^{-1}x_0)}\,;\,\widehat{y}(x_0)+t_{(\frac{\alpha}{2},n-p-1)}\sqrt{\widehat{\sigma}^2(1+x^\prime _0(X^\prime X)^{-1}x_0)}\right]$$

$$\left[1.242,31-2,201 \sqrt{1.220,1(1 + 0,072)}~~;~~1.242,31+2,201 \sqrt{1.220,1 (1 + 0,072)}\right]$$

$$\left[1.242,31-79,60~~;~~1.242,31+79,60\right]$$

$$\left[1.162,71\,;\,1.321,91\right]$$

Portanto, $ 1.162,71 \leq \mu_{y\mid x_0} \leq 1.321,91. $

Observemos que se compararmos o intervalo de predição com o intervalo de confiança para a resposta média no mesmo ponto para os dois exemplos, poderemos constatar que o intervalo de predição é bem mais amplo. Isto reflete o fato de que existe dificuldade em predizer um valor individual futuro.

Usando o software Action temos os seguintes resultados:

 Para entender como executar essa função do Software Action, você pode consultar o manual do usuário.

Análise de Regressão

Sobre o Portal Action

O Portal Action é mantido pela Estatcamp - Consultoria Estatística e Qualidade, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.

Facebook

CONTATO

  •  Maestro Joao Seppe, 900, São Carlos - SP | CEP 13561-180
  • Telefone: (16) 3376-2047
  • E-Mail: [email protected]