1.4 Testes e Intervalos de Confiança para os Parâmetros

Você está aqui

Na regressão linear é importante avaliarmos se existe uma boa "correlação" entre a resposta e a variável explicativa. Por exemplo, se o aumento em cinco graus na temperatura de uma peça na estufa acarretará em uma mudança significativa no valor de dureza da peça. Para respondermos a esta questão, utilizamos testes de hipóteses e intervalos de confiança para os parâmetros. Em todos estes casos, é feita a suposição de que os erros são independentes e identicamente distribuídos $N(0,\sigma^2)$. Dessa forma, as observações $Y_i$ têm distribuição $N(\beta_0+\beta_1x_i,\sigma^2)$.

 

1.4.1 Inferência para $\bf\beta_0$

 

Não é com frequência que fazemos inferências sobre $\beta_{0}$. Isso só ocorre quando a variável x pode assumir o valor x=0.

Suponha que desejamos testar a hipótese de que o intercepto é igual a um determinado valor, denotado por $\beta_{00}$. Desta forma, sejam as hipóteses

$$\left\{\begin{array}{cc}\mbox{H}_{0}:\beta_0=\beta_{00},\\\mbox{H}_{1}:\beta_0 \neq \beta_{00},\\\end{array} \right.$$ no qual $\beta_{00}$ é uma constante. Em geral, consideramos $\beta_{00}=0$.

Como visto em "Propriedades dos Estimadores",

$$\widehat{\beta}_0 \sim N \left(\beta_{0},~ \sigma^2\left[\dfrac{1}{n}+\dfrac{\bar{x}^2}{\displaystyle\sum\limits_{i=1}^n(x_i-\bar{x})^2}\right]\right).$$

Assim, sob $\mbox{H}_0$ temos que

$$N_0=\dfrac{\widehat{\beta}_0-\beta_{00}}{\sqrt{Var(\widehat{\beta}_0)}}~~\sim N(0,1).$$

Além disso, seja

$$\chi =\dfrac{(n-2)QME}{\sigma^2}~~\sim \chi_{(n-2)}^2.$$

Como as variáveis aleatórias $N_0$ e $\chi$ são independentes, segue que

$$T=\dfrac{N_0}{\sqrt{\dfrac{\chi}{n-2}}}=\dfrac{\dfrac{\widehat{\beta}_0-\beta_{00}}{\sqrt{\left(\sigma^2\left[\dfrac{1}{n}+\dfrac{\bar{x}^2}{\displaystyle\sum\limits_{i=1}^n(x_i-\bar{x})^2}\right]\right)}}}{\sqrt{\dfrac{\dfrac{(n-2)QME}{\sigma^2}}{n-2}}}=\dfrac{\widehat{\beta}_0-\beta_{00}}{\sqrt{QME\left(\dfrac{1}{n}+\dfrac{\bar{x}^2}{\displaystyle\sum\limits_{i=1}^n(x_i-\bar{x})^2}\right)}}~~~\sim t_{(n-2)},$$

ou seja, T tem distribuição t de Student com n-2 graus de liberdade. Logo, intervalos de confiança e testes a respeito de $\beta_0$ podem ser realizados utilizando a distribuição t.

No modelo 1.1.1, queremos testar as hipóteses

$$\left\{\begin{array}{cc}\mbox{H}_{0}:\beta_0=0.\\\mbox{H}_{1}:\beta_0 \neq 0.\\\end{array} \right.$$

Assim, a estatística do teste é dada por 

$$T_0=\dfrac{\widehat{\beta}_0}{\sqrt{QME\left(\dfrac{1}{n}+\dfrac{\bar{x}^2}{\displaystyle\sum\limits_{i=1}^n(x_i-\bar{x})^2}\right)}}~~~\sim t_{(n-2)}.$$

Logo, rejeitamos  $\mbox{H}_0$ com um nível de confiança de $(1-\alpha)100\%$ se $\mid T_0\mid\textgreater t_{(1-\alpha/2,n-2)}$. O p-valor associado ao teste é dado por
$$P-valor=2*P\left( t_{(n-2)}\textgreater \mid T_0 \mid \right).$$

Rejeitamos $\mbox{H}_0$ se o p-valor for menor do que o nível de significância $\alpha$ considerado. Geralmente adotamos $\alpha=0,05$. 

Quando não rejeitamos $\mox{H}_0$, podemos utilizar o "Modelo de Regressão sem Intercepto". 

O intervalo de confiança para $\beta_0$ com $(1-\alpha)100\%$ é dado por

$$\left[\widehat{\beta}_0 - t_{\left(1-\dfrac{\alpha}{2};n-2\right)}\sqrt{QME\left(\dfrac{1}{n}+\dfrac{\bar{x}^2}{\displaystyle\sum\limits_{i=1}^n(x_i-\bar{x})^2}\right)}~;~\widehat{\beta}_0 +t_{\left(1-\dfrac{\alpha}{2};n-2\right)}\sqrt{QME\left(\dfrac{1}{n}+\dfrac{\bar{x}^2}{\displaystyle\sum\limits_{i=1}^n(x_i-\bar{x})^2}\right)}\right]$$

 

1.4.2 Inferência para $\bf\beta_1$

 

Inferência sobre $\beta_1$ é mais frequente já que por meio deste parâmetro temos um indicativo da existência ou não de associação linear entre as variáveis envolvidas.

Similarmente ao parâmetro $\beta_0$, consideremos as hipóteses

$$\left\{\begin{array}{cc}\mbox {H}_{0}:\beta_1=\beta_{10}, \\\mbox {H}_{1}:\beta_1 \neq \beta_{10},\\\end{array} \right.$$ no qual $\beta_{10}$ é uma constante. Em geral, consideramos $\beta_{10}=0$.

De "Propriedades dos Estimadores",

$$\widehat{\beta}_1 \sim N\left(\beta_{1},~\dfrac{\sigma^2}{\displaystyle\sum\limits_{i=1}^n(x_i-\bar{x})^2}\right)$$

Assim, sob $\mbox{H}_0$ segue que

$$N_1=\dfrac{\widehat{\beta}_1-\beta_{10}}{\sqrt{Var(\widehat{\beta}_1)}}~~\sim N(0;1).$$

Novamente, considerando que

$$\chi =\dfrac{(n-2)QME}{\sigma^2} ~~\sim \chi_{(n-2)}^2$$

e que $N_1$ e $\chi$ são independentes, obtemos

$$T=\dfrac{N_1}{\sqrt{\dfrac{\chi}{n-2}}}=\dfrac{\dfrac{\widehat{\beta}_1-\beta_{10}}{\sqrt{\left(\dfrac{\sigma^2}{\displaystyle\sum\limits_{i=1}^n(x_i-\bar{x})^2}\right)}}}{\sqrt{\dfrac{\dfrac{(n-2)QME}{\sigma^2}}{n-2}}}=\dfrac{\widehat{\beta}_1 -\beta_{10}}{\sqrt{\dfrac{QME}{\displaystyle\sum\limits_{i=1}^n(x_i-\bar{x})^2}}}~~~\sim t_{(n-2)},$$ 

ou seja, T tem distribuição t de Student com n-2 graus de liberdade. Logo, intervalos de confiança e testes a respeito de $\beta_1$ podem ser realizados utilizando a distribuição t.

No modelo em questão, queremos testar as seguintes hipóteses

$$\left\{\begin{array}{cc}\mbox {H}_{0}:\beta_1=0 \\\mbox {H}_{1}:\beta_1 \neq 0 \\\end{array} \right.$$

Neste caso, a estatística do teste é 

$$T_0=\dfrac{\widehat{\beta}_1}{\sqrt{\dfrac{QME}{\displaystyle\sum\limits_{i=1}^n(x_i-\bar{x})^2}}}~~~\sim t_{(n-2)}.$$

Assim, rejeitamos  $\mbox {H}_0$ com um nível de confiança $(1-\alpha)100\%$ se $\mid T_0\mid\textgreater t_{(1-\alpha/2,n-2)}$. O p-valor associado ao teste é dado por

$$P-valor=2*P\left( t_{(n-2)}\textgreater \mid T_0 \mid \right).$$

Rejeitamos $\mbox {H}_0$ se o P-valor for menor do que $\alpha.$

O intervalo de confiança para $\beta_1$ com $(1-\alpha)100\%$ é dado por

$$\left[\widehat{\beta}_1 - t_{\left(1-\dfrac{\alpha}{2};n-2\right)}\sqrt{\dfrac{QME}{\displaystyle\sum\limits_{i=1}^n(x_i-\bar{x})^2}}~;~\widehat{\beta}_1 +t_{\left(1-\dfrac{\alpha}{2};n-2\right)}\sqrt{\dfrac{QME}{\displaystyle\sum\limits_{i=1}^n(x_i-\bar{x})^2}}\right]$$

 

Exemplo 1.4.1

Aplicar testes de hipóteses e construir intervalos de confiança para os parâmetros ($\beta_0, \,\beta_1$), usando os dados do exemplo na "Motivação 1". Como visto no Exemplo 1.2.1, as estimativas dos parâmetros são $\widehat{\beta}_0=364,18$ e $\widehat{\beta}_1= -1,032$.

 clique aqui para efetuar o download dos dados utilizados nesse exemplo

Solução:

Para $\beta_0$, queremos testar as hipóteses
$$\left\{\begin{array}{ll}\mbox{H}_{0}:\beta_0=0\\\mbox {H}_{1}:\beta_0 \neq 0\\\end{array}\right.$$

Dos Exemplos 1.2.2 e 1.3.1, temos que

$$QME = 2,2866~~~\mbox{ e }~~~\widehat{Var}(\widehat{\beta}_0) = 189,47.$$

Desta forma, a estatística do teste é dada por

$$T_0=\dfrac{\widehat{\beta}_0}{\sqrt{QME\left(\dfrac{1}{n}+\dfrac{\bar{x}^2}{\displaystyle\sum\limits_{i=1}^n(x_i-\bar{x})^2}\right)}}=\dfrac{364,18}{\sqrt{189,4732}}=26,46.$$

Para $\alpha = 0,05$ temos $t_{(1-0,05/2;18)}=2,101$.

Como $T_0=26,46\textgreater 2,101 = t_{(1-0,05/2;18)}$, e

$P-valor =2*P\left( t_{(n-2)}\textgreater \mid T_0 \mid\right)= 0,000,$ rejeitamos $\mbox {H}_0.$

O intervalo de confiança, $IC(95\%)$, para $\beta_0$ é dado por
$$\left[\widehat{\beta}_0-t_{\left(1-\dfrac{\alpha}{2},n-2\right)}\sqrt{QME\left(\dfrac{1}{n}+\dfrac{\bar{x}^2}{\displaystyle\sum\limits_{i=1}^n(x_i-\bar{x})^2}\right)}\right.~;~\left.\widehat{\beta}_0 +t_{\left(1-\dfrac{\alpha}{2},n-2\right)}\sqrt{QME\left(\dfrac{1}{n}+\dfrac{\bar{x}^2}{\displaystyle\sum\limits_{i=1}^n(x_i-\bar{x})^2}\right)}\right]$$
$$\left[364,18-2,101 \sqrt{189,4732}\right.;\left. 364,18 + 2,101 \sqrt{189,4732}\right]$$
$$\left[364,18-2,101*13,7649\right.~;~\left. 364,18 + 2,101*13,7649 \right]$$
$$\left[364,18-28,9190\right.~;~\left. 364,18+28,9190\right]$$
$$\left[335,2609\right.~;~\left. 393,0990\right]$$

 

Para $\beta_1$, queremos testar as hipóteses
$$\left\{\begin{array}{ll}\mbox {H}_{0}:\beta_1=0 \\\mbox {H}_{1}:\beta_1 \neq 0 \\\end{array}\right.$$

Novamente, dos Exemplos 1.2.2 e 1.3.1, temos que
$$QME = 2,2866~~~\mbox{ e }~~~\widehat{Var}(\widehat{\beta}_1)=0,003658$$

A estatística do teste, sob $H_0$ é dada por
$$T_0 =\dfrac{\widehat{\beta}_1}{\sqrt{\dfrac{QME}{\displaystyle\sum\limits_{i=1}^n(x_i-\bar{x})^2}}}=\dfrac{-1,032}{\sqrt{0,003658}}=\dfrac{-1,032}{0,0605}=-17,06.$$

Para $\alpha= 0,05,$ obtemos que $t_{(1-0,05/2;18)}=2,101$.

Como $T_0=17,06\textgreater2,101=t_{(1-0,05/2;18)}$ e

$2*P\left( t_{(n-2)}\textgreater \mid T_0\mid \right)=0,000,$ rejeitamos $\mbox {H}_0.$

O intervalo de confiança, $IC(95\%)$, para $\beta_1$ é dado por

$$\left[\widehat{\beta}_1-t_{\left(1-\dfrac{\alpha}{2},n-2\right)}\sqrt{\dfrac{QME}{\displaystyle\sum\limits_{i=1}^n(x_i-\bar{x})^2}} \right.~;~\left.\widehat{\beta}_1+ t_{\left(1-\dfrac{\alpha}{2},n-2\right)}\sqrt{\dfrac{QME}{\displaystyle\sum\limits_{i=1}^n(x_i-\bar{x})^2}}\right]$$
$$\left[-1,032-2,101*\sqrt{0,003658}\right.~;~\left.-1,032+2,101*\sqrt{0,003658}\right]$$
$$\left[-1,032-0,127\right.~;~\left.-1,032+0,127\right]$$
$$\left[-1,159 \right.~;~\left.-0,905\right].$$

 

Usando o Software Action temos os seguintes resultados:

 

 Para entender como executar essa função do Software Action, você pode consultar o manual do usuário.

Análise de Regressão

Sobre o Portal Action

O Portal Action é mantido pela Estatcamp - Consultoria Estatística e Qualidade, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.

Facebook

CONTATO

  •  Maestro Joao Seppe, 900, São Carlos - SP | CEP 13561-180
  • Telefone: (16) 3376-2047
  • E-Mail: [email protected]