1.4 Testes e Intervalos de Confiança para os Parâmetros

Você está aqui

Na regressão linear é importante avaliarmos se existe uma boa "correlação" entre a resposta e a variável explicativa. Por exemplo, se o aumento em cinco graus na temperatura de uma peça na estufa acarretará em uma mudança significativa no valor de dureza da peça. Para respondermos a esta questão, utilizamos testes de hipóteses e intervalos de confiança para os parâmetros. Em todos estes casos, é feita a suposição de que os erros são independentes e identicamente distribuídos $ N(0,\sigma^2) $. Dessa forma, as observações $ Y_i $ têm distribuição $ N(\beta_0+\beta_1x_i,\sigma^2) $.

 

1.4.1 Inferência para $ \bf\beta_0 $

 

Não é com frequência que fazemos inferências sobre $ \beta_{0} $. Isso só ocorre quando a variável x pode assumir o valor x=0.

Suponha que desejamos testar a hipótese de que o intercepto é igual a um determinado valor, denotado por $ \beta_{00} $. Desta forma, sejam as hipóteses


\beta_0 \neq \beta_{00},\\\end{array} \right.$$

no qual $ \beta_{00} $ é uma constante. Em geral, consideramos $ \beta_{00}=0 $.

Como visto em "Propriedades dos Estimadores",


$$\widehat{\beta}_0 \sim N \left(\beta_{0},~ \sigma^2\left[\dfrac{1}{n}+\dfrac{\bar{x}^2}{\displaystyle\sum\limits_{i=1}^n(x_i-\bar{x})^2}\right]\right).$$

Assim, sob $ \mbox{H}_0 $ temos que


$$N_0=\dfrac{\widehat{\beta}_0-\beta_{00}}{\sqrt{Var(\widehat{\beta}_0)}}~~\sim N(0,1).$$

Além disso, seja


$$\chi =\dfrac{(n-2)QME}{\sigma^2}~~\sim \chi_{(n-2)}^2.$$

Como as variáveis aleatórias $ N_0 $ e $ \chi $ são independentes, segue que


$$T=\dfrac{N_0}{\sqrt{\dfrac{\chi}{n-2}}}=\dfrac{\dfrac{\widehat{\beta}_0-\beta_{00}}{\sqrt{\left(\sigma^2\left[\dfrac{1}{n}+\dfrac{\bar{x}^2}{\displaystyle\sum\limits_{i=1}^n(x_i-\bar{x})^2}\right]\right)}}}{\sqrt{\dfrac{\dfrac{(n-2)QME}{\sigma^2}}{n-2}}}=\dfrac{\widehat{\beta}_0-\beta_{00}}{\sqrt{QME\left(\dfrac{1}{n}+\dfrac{\bar{x}^2}{\displaystyle\sum\limits_{i=1}^n(x_i-\bar{x})^2}\right)}}~~~\sim t_{(n-2)},$$

ou seja, T tem distribuição t de Student com n-2 graus de liberdade. Logo, intervalos de confiança e testes a respeito de $ \beta_0 $ podem ser realizados utilizando a distribuição t.

No modelo 1.1.1, queremos testar as hipóteses


\beta_0 \neq 0.\\\end{array} \right.$$

Assim, a estatística do teste é dada por 


$$T_0=\dfrac{\widehat{\beta}_0}{\sqrt{QME\left(\dfrac{1}{n}+\dfrac{\bar{x}^2}{\displaystyle\sum\limits_{i=1}^n(x_i-\bar{x})^2}\right)}}~~~\sim t_{(n-2)}.$$

Logo, rejeitamos  $ \mbox{H}_0 $ com um nível de confiança de $ (1-\alpha)100\% $ se $ \mid T_0\mid\textgreater t_{(1-\alpha/2,n-2)} $. O p-valor associado ao teste é dado por

$$P-valor=2*P\left( t_{(n-2)}\textgreater \mid T_0 \mid \right).$$

Rejeitamos $ \mbox{H}_0 $ se o p-valor for menor do que o nível de significância $ \alpha $ considerado. Geralmente adotamos $ \alpha=0,05 $

Quando não rejeitamos $ \mox{H}_0 $, podemos utilizar o "Modelo de Regressão sem Intercepto". 

O intervalo de confiança para $ \beta_0 $ com $ (1-\alpha)100\% $ é dado por


$$\left[\widehat{\beta}_0 - t_{\left(1-\dfrac{\alpha}{2};n-2\right)}\sqrt{QME\left(\dfrac{1}{n}+\dfrac{\bar{x}^2}{\displaystyle\sum\limits_{i=1}^n(x_i-\bar{x})^2}\right)}~;~\widehat{\beta}_0 +t_{\left(1-\dfrac{\alpha}{2};n-2\right)}\sqrt{QME\left(\dfrac{1}{n}+\dfrac{\bar{x}^2}{\displaystyle\sum\limits_{i=1}^n(x_i-\bar{x})^2}\right)}\right]$$

 

1.4.2 Inferência para $ \bf\beta_1 $

 

Inferência sobre $ \beta_1 $ é mais frequente já que por meio deste parâmetro temos um indicativo da existência ou não de associação linear entre as variáveis envolvidas.

Similarmente ao parâmetro $ \beta_0 $, consideremos as hipóteses


\beta_1 \neq \beta_{10},\\\end{array} \right.$$

no qual $ \beta_{10} $ é uma constante. Em geral, consideramos $ \beta_{10}=0 $.

De "Propriedades dos Estimadores",


$$\widehat{\beta}_1 \sim N\left(\beta_{1},~\dfrac{\sigma^2}{\displaystyle\sum\limits_{i=1}^n(x_i-\bar{x})^2}\right)$$

Assim, sob $ \mbox{H}_0 $ segue que


$$N_1=\dfrac{\widehat{\beta}_1-\beta_{10}}{\sqrt{Var(\widehat{\beta}_1)}}~~\sim N(0;1).$$

Novamente, considerando que


$$\chi =\dfrac{(n-2)QME}{\sigma^2} ~~\sim \chi_{(n-2)}^2$$

e que $ N_1 $ e $ \chi $ são independentes, obtemos


$$T=\dfrac{N_1}{\sqrt{\dfrac{\chi}{n-2}}}=\dfrac{\dfrac{\widehat{\beta}_1-\beta_{10}}{\sqrt{\left(\dfrac{\sigma^2}{\displaystyle\sum\limits_{i=1}^n(x_i-\bar{x})^2}\right)}}}{\sqrt{\dfrac{\dfrac{(n-2)QME}{\sigma^2}}{n-2}}}=\dfrac{\widehat{\beta}_1 -\beta_{10}}{\sqrt{\dfrac{QME}{\displaystyle\sum\limits_{i=1}^n(x_i-\bar{x})^2}}}~~~\sim t_{(n-2)},$$

 

ou seja, T tem distribuição t de Student com n-2 graus de liberdade. Logo, intervalos de confiança e testes a respeito de $ \beta_1 $ podem ser realizados utilizando a distribuição t.

No modelo em questão, queremos testar as seguintes hipóteses


\beta_1 \neq 0 \\\end{array} \right.$$

Neste caso, a estatística do teste é 


$$T_0=\dfrac{\widehat{\beta}_1}{\sqrt{\dfrac{QME}{\displaystyle\sum\limits_{i=1}^n(x_i-\bar{x})^2}}}~~~\sim t_{(n-2)}.$$

Assim, rejeitamos  $ \mbox {H}_0 $ com um nível de confiança $ (1-\alpha)100\% $ se $ \mid T_0\mid\textgreater t_{(1-\alpha/2,n-2)} $. O p-valor associado ao teste é dado por


$$P-valor=2*P\left( t_{(n-2)}\textgreater \mid T_0 \mid \right).$$

Rejeitamos $ \mbox {H}_0 $ se o P-valor for menor do que $ \alpha. $

O intervalo de confiança para $ \beta_1 $ com $ (1-\alpha)100\% $ é dado por


$$\left[\widehat{\beta}_1 - t_{\left(1-\dfrac{\alpha}{2};n-2\right)}\sqrt{\dfrac{QME}{\displaystyle\sum\limits_{i=1}^n(x_i-\bar{x})^2}}~;~\widehat{\beta}_1 +t_{\left(1-\dfrac{\alpha}{2};n-2\right)}\sqrt{\dfrac{QME}{\displaystyle\sum\limits_{i=1}^n(x_i-\bar{x})^2}}\right]$$

 

Exemplo 1.4.1

Aplicar testes de hipóteses e construir intervalos de confiança para os parâmetros ($ \beta_0, \,\beta_1 $), usando os dados do exemplo na "Motivação 1". Como visto no Exemplo 1.2.1, as estimativas dos parâmetros são $ \widehat{\beta}_0=364,18 $ e $ \widehat{\beta}_1= -1,032 $.

 clique aqui para efetuar o download dos dados utilizados nesse exemplo

Solução:

Para $ \beta_0 $, queremos testar as hipóteses

\beta_0 \neq 0\\\end{array}\right.$$

Dos Exemplos 1.2.2 e 1.3.1, temos que


$$QME = 2,2866~~~\mbox{ e }~~~\widehat{Var}(\widehat{\beta}_0) = 189,47.$$

Desta forma, a estatística do teste é dada por


$$T_0=\dfrac{\widehat{\beta}_0}{\sqrt{QME\left(\dfrac{1}{n}+\dfrac{\bar{x}^2}{\displaystyle\sum\limits_{i=1}^n(x_i-\bar{x})^2}\right)}}=\dfrac{364,18}{\sqrt{189,4732}}=26,46.$$

Para $ \alpha = 0,05 $ temos $ t_{(1-0,05/2;18)}=2,101 $.

Como $ T_0=26,46\textgreater 2,101 = t_{(1-0,05/2;18)} $, e

$ P-valor =2*P\left( t_{(n-2)}\textgreater \mid T_0 \mid\right)= 0,000, $ rejeitamos $ \mbox {H}_0. $

O intervalo de confiança, $ IC(95\%) $, para $ \beta_0 $ é dado por

$$\left[\widehat{\beta}_0-t_{\left(1-\dfrac{\alpha}{2},n-2\right)}\sqrt{QME\left(\dfrac{1}{n}+\dfrac{\bar{x}^2}{\displaystyle\sum\limits_{i=1}^n(x_i-\bar{x})^2}\right)}\right.~;~\left.\widehat{\beta}_0 +t_{\left(1-\dfrac{\alpha}{2},n-2\right)}\sqrt{QME\left(\dfrac{1}{n}+\dfrac{\bar{x}^2}{\displaystyle\sum\limits_{i=1}^n(x_i-\bar{x})^2}\right)}\right]$$

$$\left[364,18-2,101 \sqrt{189,4732}\right.;\left. 364,18 + 2,101 \sqrt{189,4732}\right]$$

$$\left[364,18-2,101*13,7649\right.~;~\left. 364,18 + 2,101*13,7649 \right]$$

$$\left[364,18-28,9190\right.~;~\left. 364,18+28,9190\right]$$

$$\left[335,2609\right.~;~\left. 393,0990\right]$$

 

Para $ \beta_1 $, queremos testar as hipóteses

\beta_1 \neq 0 \\\end{array}\right.$$

Novamente, dos Exemplos 1.2.2 e 1.3.1, temos que

$$QME = 2,2866~~~\mbox{ e }~~~\widehat{Var}(\widehat{\beta}_1)=0,003658$$

A estatística do teste, sob $ H_0 $ é dada por

$$T_0 =\dfrac{\widehat{\beta}_1}{\sqrt{\dfrac{QME}{\displaystyle\sum\limits_{i=1}^n(x_i-\bar{x})^2}}}=\dfrac{-1,032}{\sqrt{0,003658}}=\dfrac{-1,032}{0,0605}=-17,06.$$

Para $ \alpha= 0,05, $ obtemos que $ t_{(1-0,05/2;18)}=2,101 $.

Como $ T_0=17,06\textgreater2,101=t_{(1-0,05/2;18)} $ e

$ 2*P\left( t_{(n-2)}\textgreater \mid T_0\mid \right)=0,000, $ rejeitamos $ \mbox {H}_0. $

O intervalo de confiança, $ IC(95\%) $, para $ \beta_1 $ é dado por


$$\left[\widehat{\beta}_1-t_{\left(1-\dfrac{\alpha}{2},n-2\right)}\sqrt{\dfrac{QME}{\displaystyle\sum\limits_{i=1}^n(x_i-\bar{x})^2}} \right.~;~\left.\widehat{\beta}_1+ t_{\left(1-\dfrac{\alpha}{2},n-2\right)}\sqrt{\dfrac{QME}{\displaystyle\sum\limits_{i=1}^n(x_i-\bar{x})^2}}\right]$$

$$\left[-1,032-2,101*\sqrt{0,003658}\right.~;~\left.-1,032+2,101*\sqrt{0,003658}\right]$$

$$\left[-1,032-0,127\right.~;~\left.-1,032+0,127\right]$$

$$\left[-1,159 \right.~;~\left.-0,905\right].$$

 

Usando o Software Action temos os seguintes resultados:

 

 Para entender como executar essa função do Software Action, você pode consultar o manual do usuário.

Análise de Regressão

Sobre o Portal Action

O Portal Action é mantido pela Estatcamp - Consultoria Estatística e Qualidade, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.

Facebook

CONTATO

  •  Maestro Joao Seppe, 900, São Carlos - SP | CEP 13561-180
  • Telefone: (16) 3376-2047
  • E-Mail: [email protected]