- (16) 3376-2047
- [email protected]
- Portfólio de Serviços
- AT
Na regressão linear é importante avaliarmos se existe uma boa "correlação" entre a resposta e a variável explicativa. Por exemplo, se o aumento em cinco graus na temperatura de uma peça na estufa acarretará em uma mudança significativa no valor de dureza da peça. Para respondermos a esta questão, utilizamos testes de hipóteses e intervalos de confiança para os parâmetros. Em todos estes casos, é feita a suposição de que os erros são independentes e identicamente distribuídos $N(0,\sigma^2)$. Dessa forma, as observações $Y_i$ têm distribuição $N(\beta_0+\beta_1x_i,\sigma^2)$.
Não é com frequência que fazemos inferências sobre $\beta_{0}$. Isso só ocorre quando a variável x pode assumir o valor x=0.
Suponha que desejamos testar a hipótese de que o intercepto é igual a um determinado valor, denotado por $\beta_{00}$. Desta forma, sejam as hipóteses
$$\left\{\begin{array}{cc}\mbox{H}_{0}:\beta_0=\beta_{00},\\\mbox{H}_{1}:\beta_0 \neq \beta_{00},\\\end{array} \right.$$ no qual $\beta_{00}$ é uma constante. Em geral, consideramos $\beta_{00}=0$.
Como visto em "Propriedades dos Estimadores",
$$\widehat{\beta}_0 \sim N \left(\beta_{0},~ \sigma^2\left[\dfrac{1}{n}+\dfrac{\bar{x}^2}{\displaystyle\sum\limits_{i=1}^n(x_i-\bar{x})^2}\right]\right).$$
Assim, sob $\mbox{H}_0$ temos que
$$N_0=\dfrac{\widehat{\beta}_0-\beta_{00}}{\sqrt{Var(\widehat{\beta}_0)}}~~\sim N(0,1).$$
Além disso, seja
$$\chi =\dfrac{(n-2)QME}{\sigma^2}~~\sim \chi_{(n-2)}^2.$$
Como as variáveis aleatórias $N_0$ e $\chi$ são independentes, segue que
$$T=\dfrac{N_0}{\sqrt{\dfrac{\chi}{n-2}}}=\dfrac{\dfrac{\widehat{\beta}_0-\beta_{00}}{\sqrt{\left(\sigma^2\left[\dfrac{1}{n}+\dfrac{\bar{x}^2}{\displaystyle\sum\limits_{i=1}^n(x_i-\bar{x})^2}\right]\right)}}}{\sqrt{\dfrac{\dfrac{(n-2)QME}{\sigma^2}}{n-2}}}=\dfrac{\widehat{\beta}_0-\beta_{00}}{\sqrt{QME\left(\dfrac{1}{n}+\dfrac{\bar{x}^2}{\displaystyle\sum\limits_{i=1}^n(x_i-\bar{x})^2}\right)}}~~~\sim t_{(n-2)},$$
ou seja, T tem distribuição t de Student com n-2 graus de liberdade. Logo, intervalos de confiança e testes a respeito de $\beta_0$ podem ser realizados utilizando a distribuição t.
No modelo 1.1.1, queremos testar as hipóteses
$$\left\{\begin{array}{cc}\mbox{H}_{0}:\beta_0=0.\\\mbox{H}_{1}:\beta_0 \neq 0.\\\end{array} \right.$$
Assim, a estatística do teste é dada por
$$T_0=\dfrac{\widehat{\beta}_0}{\sqrt{QME\left(\dfrac{1}{n}+\dfrac{\bar{x}^2}{\displaystyle\sum\limits_{i=1}^n(x_i-\bar{x})^2}\right)}}~~~\sim t_{(n-2)}.$$
Logo, rejeitamos $\mbox{H}_0$ com um nível de confiança de $(1-\alpha)100\%$ se $\mid T_0\mid\textgreater t_{(1-\alpha/2,n-2)}$. O p-valor associado ao teste é dado por
$$P-valor=2*P\left( t_{(n-2)}\textgreater \mid T_0 \mid \right).$$
Rejeitamos $\mbox{H}_0$ se o p-valor for menor do que o nível de significância $\alpha$ considerado. Geralmente adotamos $\alpha=0,05$.
Quando não rejeitamos $\mox{H}_0$, podemos utilizar o "Modelo de Regressão sem Intercepto".
O intervalo de confiança para $\beta_0$ com $(1-\alpha)100\%$ é dado por
$$\left[\widehat{\beta}_0 - t_{\left(1-\dfrac{\alpha}{2};n-2\right)}\sqrt{QME\left(\dfrac{1}{n}+\dfrac{\bar{x}^2}{\displaystyle\sum\limits_{i=1}^n(x_i-\bar{x})^2}\right)}~;~\widehat{\beta}_0 +t_{\left(1-\dfrac{\alpha}{2};n-2\right)}\sqrt{QME\left(\dfrac{1}{n}+\dfrac{\bar{x}^2}{\displaystyle\sum\limits_{i=1}^n(x_i-\bar{x})^2}\right)}\right]$$
Inferência sobre $\beta_1$ é mais frequente já que por meio deste parâmetro temos um indicativo da existência ou não de associação linear entre as variáveis envolvidas.
Similarmente ao parâmetro $\beta_0$, consideremos as hipóteses
$$\left\{\begin{array}{cc}\mbox {H}_{0}:\beta_1=\beta_{10}, \\\mbox {H}_{1}:\beta_1 \neq \beta_{10},\\\end{array} \right.$$ no qual $\beta_{10}$ é uma constante. Em geral, consideramos $\beta_{10}=0$.
De "Propriedades dos Estimadores",
$$\widehat{\beta}_1 \sim N\left(\beta_{1},~\dfrac{\sigma^2}{\displaystyle\sum\limits_{i=1}^n(x_i-\bar{x})^2}\right)$$
Assim, sob $\mbox{H}_0$ segue que
$$N_1=\dfrac{\widehat{\beta}_1-\beta_{10}}{\sqrt{Var(\widehat{\beta}_1)}}~~\sim N(0;1).$$
Novamente, considerando que
$$\chi =\dfrac{(n-2)QME}{\sigma^2} ~~\sim \chi_{(n-2)}^2$$
e que $N_1$ e $\chi$ são independentes, obtemos
$$T=\dfrac{N_1}{\sqrt{\dfrac{\chi}{n-2}}}=\dfrac{\dfrac{\widehat{\beta}_1-\beta_{10}}{\sqrt{\left(\dfrac{\sigma^2}{\displaystyle\sum\limits_{i=1}^n(x_i-\bar{x})^2}\right)}}}{\sqrt{\dfrac{\dfrac{(n-2)QME}{\sigma^2}}{n-2}}}=\dfrac{\widehat{\beta}_1 -\beta_{10}}{\sqrt{\dfrac{QME}{\displaystyle\sum\limits_{i=1}^n(x_i-\bar{x})^2}}}~~~\sim t_{(n-2)},$$
ou seja, T tem distribuição t de Student com n-2 graus de liberdade. Logo, intervalos de confiança e testes a respeito de $\beta_1$ podem ser realizados utilizando a distribuição t.
No modelo em questão, queremos testar as seguintes hipóteses
$$\left\{\begin{array}{cc}\mbox {H}_{0}:\beta_1=0 \\\mbox {H}_{1}:\beta_1 \neq 0 \\\end{array} \right.$$
Neste caso, a estatística do teste é
$$T_0=\dfrac{\widehat{\beta}_1}{\sqrt{\dfrac{QME}{\displaystyle\sum\limits_{i=1}^n(x_i-\bar{x})^2}}}~~~\sim t_{(n-2)}.$$
Assim, rejeitamos $\mbox {H}_0$ com um nível de confiança $(1-\alpha)100\%$ se $\mid T_0\mid\textgreater t_{(1-\alpha/2,n-2)}$. O p-valor associado ao teste é dado por
$$P-valor=2*P\left( t_{(n-2)}\textgreater \mid T_0 \mid \right).$$
Rejeitamos $\mbox {H}_0$ se o P-valor for menor do que $\alpha.$
O intervalo de confiança para $\beta_1$ com $(1-\alpha)100\%$ é dado por
$$\left[\widehat{\beta}_1 - t_{\left(1-\dfrac{\alpha}{2};n-2\right)}\sqrt{\dfrac{QME}{\displaystyle\sum\limits_{i=1}^n(x_i-\bar{x})^2}}~;~\widehat{\beta}_1 +t_{\left(1-\dfrac{\alpha}{2};n-2\right)}\sqrt{\dfrac{QME}{\displaystyle\sum\limits_{i=1}^n(x_i-\bar{x})^2}}\right]$$
Aplicar testes de hipóteses e construir intervalos de confiança para os parâmetros ($\beta_0, \,\beta_1$), usando os dados do exemplo na "Motivação 1". Como visto no Exemplo 1.2.1, as estimativas dos parâmetros são $\widehat{\beta}_0=364,18$ e $\widehat{\beta}_1= -1,032$.
clique aqui para efetuar o download dos dados utilizados nesse exemplo
Solução:
Para $\beta_0$, queremos testar as hipóteses
$$\left\{\begin{array}{ll}\mbox{H}_{0}:\beta_0=0\\\mbox {H}_{1}:\beta_0 \neq 0\\\end{array}\right.$$
Dos Exemplos 1.2.2 e 1.3.1, temos que
$$QME = 2,2866~~~\mbox{ e }~~~\widehat{Var}(\widehat{\beta}_0) = 189,47.$$
Desta forma, a estatística do teste é dada por
$$T_0=\dfrac{\widehat{\beta}_0}{\sqrt{QME\left(\dfrac{1}{n}+\dfrac{\bar{x}^2}{\displaystyle\sum\limits_{i=1}^n(x_i-\bar{x})^2}\right)}}=\dfrac{364,18}{\sqrt{189,4732}}=26,46.$$
Para $\alpha = 0,05$ temos $t_{(1-0,05/2;18)}=2,101$.
Como $T_0=26,46\textgreater 2,101 = t_{(1-0,05/2;18)}$, e
$P-valor =2*P\left( t_{(n-2)}\textgreater \mid T_0 \mid\right)= 0,000,$ rejeitamos $\mbox {H}_0.$
O intervalo de confiança, $IC(95\%)$, para $\beta_0$ é dado por
$$\left[\widehat{\beta}_0-t_{\left(1-\dfrac{\alpha}{2},n-2\right)}\sqrt{QME\left(\dfrac{1}{n}+\dfrac{\bar{x}^2}{\displaystyle\sum\limits_{i=1}^n(x_i-\bar{x})^2}\right)}\right.~;~\left.\widehat{\beta}_0 +t_{\left(1-\dfrac{\alpha}{2},n-2\right)}\sqrt{QME\left(\dfrac{1}{n}+\dfrac{\bar{x}^2}{\displaystyle\sum\limits_{i=1}^n(x_i-\bar{x})^2}\right)}\right]$$
$$\left[364,18-2,101 \sqrt{189,4732}\right.;\left. 364,18 + 2,101 \sqrt{189,4732}\right]$$
$$\left[364,18-2,101*13,7649\right.~;~\left. 364,18 + 2,101*13,7649 \right]$$
$$\left[364,18-28,9190\right.~;~\left. 364,18+28,9190\right]$$
$$\left[335,2609\right.~;~\left. 393,0990\right]$$
Para $\beta_1$, queremos testar as hipóteses
$$\left\{\begin{array}{ll}\mbox {H}_{0}:\beta_1=0 \\\mbox {H}_{1}:\beta_1 \neq 0 \\\end{array}\right.$$
Novamente, dos Exemplos 1.2.2 e 1.3.1, temos que
$$QME = 2,2866~~~\mbox{ e }~~~\widehat{Var}(\widehat{\beta}_1)=0,003658$$
A estatística do teste, sob $H_0$ é dada por
$$T_0 =\dfrac{\widehat{\beta}_1}{\sqrt{\dfrac{QME}{\displaystyle\sum\limits_{i=1}^n(x_i-\bar{x})^2}}}=\dfrac{-1,032}{\sqrt{0,003658}}=\dfrac{-1,032}{0,0605}=-17,06.$$
Para $\alpha= 0,05,$ obtemos que $t_{(1-0,05/2;18)}=2,101$.
Como $T_0=17,06\textgreater2,101=t_{(1-0,05/2;18)}$ e
$2*P\left( t_{(n-2)}\textgreater \mid T_0\mid \right)=0,000,$ rejeitamos $\mbox {H}_0.$
O intervalo de confiança, $IC(95\%)$, para $\beta_1$ é dado por
$$\left[\widehat{\beta}_1-t_{\left(1-\dfrac{\alpha}{2},n-2\right)}\sqrt{\dfrac{QME}{\displaystyle\sum\limits_{i=1}^n(x_i-\bar{x})^2}} \right.~;~\left.\widehat{\beta}_1+ t_{\left(1-\dfrac{\alpha}{2},n-2\right)}\sqrt{\dfrac{QME}{\displaystyle\sum\limits_{i=1}^n(x_i-\bar{x})^2}}\right]$$
$$\left[-1,032-2,101*\sqrt{0,003658}\right.~;~\left.-1,032+2,101*\sqrt{0,003658}\right]$$
$$\left[-1,032-0,127\right.~;~\left.-1,032+0,127\right]$$
$$\left[-1,159 \right.~;~\left.-0,905\right].$$
Usando o Software Action temos os seguintes resultados:
![]() |
Para entender como executar essa função do Software Action, você pode consultar o manual do usuário. |
O Portal Action é mantido pela Estatcamp - Consultoria Estatística e Qualidade, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.