1.11.4 - Testes e intervalos de confiança para os parâmetros

Você está aqui

Na regressão linear ponderada é importante avaliarmos se existe uma boa “correlação” entre a resposta e a variável explicativa, assim como dito na seção Regressão Linear Simples.  Para respondermos a esta questão, utilizamos testes de hipóteses e intervalos de confiança para os parâmetros.

 

Distribuição amostral dos estimadores:

 

Neste tópico, vamos discutir sobre a distribuição amostral dos estimadores, para isto, observamos que $ \widehat{\beta}_{w0} $ e $ \widehat{\beta}_{w1} $ são combinações lineares de $ Y $, que é uma variável aleatória com distribuição normal. Logo as distribuições dos estimadores são normais exatas, com médias e variâncias iguais as esperanças e variâncias dos estimadores, logo temos que:

$$\widehat{\beta}_{wo} \sim N\left(\beta_{w0}, \dfrac{\sigma^2_w\displaystyle\sum_{i=1}^{n} w_i x^2_i }{\displaystyle \sum_{i=1}^{n} w_i\sum_{i=1}^{n} w_i (X_i - \overline{X}_w )^2}\right)\quad \text{e}\quad \widehat{\beta}_{w1} \sim N \left(\beta_{w1}, \dfrac{\sigma^2_w}{\displaystyle \sum_{i=1}^{n} w_i(X_i - \overline{X}_w)^2} \right).$$

Além disso,

$$Z=\dfrac{\widehat{\beta}_{w0} - \beta_{w0}}{\sqrt{\dfrac{\sigma^2_w\displaystyle\sum_{i=1}^{n} w_i x^2_i }{\displaystyle \sum_{i=1}^{n} w_i\sum_{i=1}^{n} w_i (X_i - \overline{X}_w )^2}}}\sim N(0,1)\quad \text{e}\quad Z=\dfrac{\widehat{\beta}_{w1} - \beta_{w1}}{\sqrt{\dfrac{\sigma^2_w}{\displaystyle \sum_{i=1}^{n} w_i (X_i - \overline{X}_w)^2}}}\sim N(0,1)$$

 

A partir desse resultado podemos construir intervalos de confiança e testar hipóteses a respeito dos estimadores.

 

Inferência para o intercepto

 

Não usual fazermos inferências sobre $ \beta_{w0}, $ isso só ocorre quando a variável x pode assumir o valor x=0. Esta prática não é recomendada, inclusive para o MAPA, que em umas de suas instruções normativas (item 7.1.1.6) diz que “as curvas de calibração não devem ser forçadas a passar pela origem”.

Suponha que desejamos testar a hipótese de que o intercepto é igual a um determinado valor, denotado por $ \beta_{w0*} $. Desta forma, sejam as hipóteses


\beta_{w0} \neq \beta_{w0*}.\\\end{array} \right.$$

Como visto anteriormente,

$$\widehat{\beta}_{w0} \sim N\left(\beta_{w0}, \dfrac{\sigma^2_w\displaystyle\sum_{i=1}^{n} w_i x^2_i }{\displaystyle \sum_{i=1}^{n} w_i\sum_{i=1}^{n} w_i (X_i - \overline{X}_w )^2}\right)\quad \text{e}\quad Z=\dfrac{\widehat{\beta}_{w0} - \beta_{w0}}{\sqrt{\dfrac{\sigma^2_w\displaystyle\sum_{i=1}^{n} w_i x^2_i }{\displaystyle \sum_{i=1}^{n} w_i\sum_{i=1}^{n} w_i (X_i - \overline{X}_w )^2}}}\sim N(0,1)$$

 

A partir desse resultado podemos construir intervalos de confiança e testar hipóteses a respeito dos estimadores. Vale lembrar que 


$$\chi =\dfrac{(n-2)QME_w}{\sigma^2_w}~~\sim \chi_{(n-2)}^2.$$

Como as variáveis aleatórias $ Z $ e $ \chi $ são independentes, segue que


$$T= \dfrac{Z}{\sqrt{\dfrac{\chi}{n-2}}} = \dfrac{\dfrac{\widehat{\beta}_{w0} - \beta_{w0*}}{\sqrt{\dfrac{\sigma^2_w\displaystyle\sum_{i=1}^{n} w_i x^2_i }{\displaystyle \sum_{i=1}^{n} w_i\sum_{i=1}^{n} w_i (X_i - \overline{X}_w )^2}}}}{\sqrt{\dfrac{\dfrac{(n-2)QME_w}{\sigma^2_w}}{(n-2)}}}= \dfrac{\widehat{\beta}_{w0} - \beta_{w0*}}{\sqrt{\dfrac{QME_w\displaystyle\sum_{i=1}^{n} w_i x^2_i }{\displaystyle \sum_{i=1}^{n} w_i\sum_{i=1}^{n} w_i (X_i - \overline{X}_w )^2}}} \quad \sim t_{(n-2)},$$

ou seja, T tem distribuição t de Student com n-2 graus de liberdade. Logo, intervalos de confiança e testes a respeito de $ \beta_{w0} $ podem ser realizados utilizando a distribuição t.

No modelo ponderado, queremos testar as hipóteses


\beta_{w0} \neq 0.\\\end{array} \right.$$

Assim, a estatística do teste é dada por 

$$T_0=\dfrac{\widehat{\beta}_{w0}}{\sqrt{\dfrac{QME_w\displaystyle\sum_{i=1}^{n} w_i x^2_i }{\displaystyle \sum_{i=1}^{n} w_i\sum_{i=1}^{n} w_i (X_i - \overline{X}_w )^2}}} \quad\sim t_{(n-2)}.$$

Logo, rejeitamos  $ H_0 $ com um nível de confiança de (1-$ \alpha $)100% se $ \mid T_0\mid\textgreater t_{(1-\alpha/2,n-2)} $.  O p-valor associado ao teste é dado por


$$\text{P-valor}=2\times\mathbb{P}\left( t_{(n-2)}\textgreater \mid T_0 \mid \right).$$

Rejeitamos $ H_0 $ se o p-valor for menor do que o nível de significância $ \alpha $ considerado. Geralmente adotamos $ \alpha= $0,05. 

Quando não rejeitamos $ H_0 $, podemos utilizar o “Modelo de Regressão ponderado sem Intercepto”. 

O intervalo de confiança para $ \beta_{w0} $ com $ (1-\alpha)100\% $ é dado por

$$\left[\widehat{\beta}_{w0} - t_{\left(1-\alpha/2;n-2\right)} \sqrt{\dfrac{QME_w\displaystyle\sum_{i=1}^{n} w_i x^2_i }{\displaystyle \sum_{i=1}^{n} w_i\sum_{i=1}^{n} w_i (X_i - \overline{X}_w )^2}} ~;~ \widehat{\beta}_{w0} +t_{\left(1-\alpha/2;n-2\right)}\sqrt{\dfrac{QME_w\displaystyle\sum_{i=1}^{n} w_i x^2_i }{\displaystyle \sum_{i=1}^{n} w_i\sum_{i=1}^{n} w_i (X_i - \overline{X}_w )^2}}\right]$$

 

Inferência para coeficiente angular

 

Inferência sobre $ \beta_{w1} $ é mais frequente já que por meio deste parâmetro temos um indicativo da existência ou não de associação linear entre as variáveis envolvidas.

Similarmente ao parâmetro $ \beta_{w0} $, consideremos as hipóteses


\beta_{w1} \neq \beta_{w1*}\\\end{array} \right.$$

Do início desta seção obtemos que

$$\widehat{\beta}_{w1} \sim N \left(\beta_{w1}, \dfrac{\sigma^2_w}{\displaystyle \sum_{i=1}^{n} w_i(X_i - \overline{X}_w)^2} \right).\quad \text{e}\quad Z=\dfrac{\widehat{\beta}_{w1} - \beta_{w1}}{\sqrt{\dfrac{\sigma^2_w}{\displaystyle \sum_{i=1}^{n} w_i (X_i - \overline{X}_w)^2}}}\sim N(0,1)$$

 

Novamente, consideramos que


$$\chi =\dfrac{(n-2)QME_w}{\sigma^2_w} ~~\sim \chi_{(n-2)}^2$$

e que $ N_1 $ e $ \chi $ são independentes, obtemos

$$T=\dfrac{Z}{\sqrt{\dfrac{\chi}{n-2}}}= \dfrac{\dfrac{\widehat{\beta}_{w1} - \beta_{w1}}{\sqrt{\dfrac{\sigma^2_w}{\displaystyle \sum_{i=1}^{n} w_i (X_i - \overline{X}_w)^2}}}}{\sqrt{\dfrac{\dfrac{(n-2)QME_w}{\sigma^2_w}}{(n-2)}}}= \dfrac{\widehat{\beta}_{w1} - \beta_{w1}}{\sqrt{\dfrac{QME_w}{\displaystyle \sum_{i=1}^{n} w_i (X_i - \overline{X}_w)^2}}}\quad \sim t_{(n-2)},$$

ou seja, T tem distribuição t de Student com n-2 graus de liberdade. Logo, intervalos de confiança e testes a respeito de $ \beta_{w1} $ podem ser realizados utilizando a distribuição t.

No modelo em questão, queremos testar as seguintes hipóteses


\beta_{w1} \neq 0 \\\end{array} \right.$$

Neste caso, a estatística do teste é 


$$T_0=\dfrac{\widehat{\beta}_{w1}}{\sqrt{\dfrac{QME_w}{\displaystyle \sum_{i=1}^{n} w_i (X_i - \overline{X}_w)^2}}}\quad\sim t_{(n-2)}.$$

Assim, rejeitamos  $ H_0 $ com um nível de confiança (1-$ \alpha $)100% se $ \mid T_0\mid\textgreater t_{(1-\alpha/2,n-2)} $. O p-valor associado ao teste é dado por


$$\text{P-valor}=2\times\mathbb{P}\left( t_{(n-2)}\textgreater \mid T_0 \mid \right).$$

Rejeitamos $ H_0 $ se o P-valor for menor do que $ \alpha. $

O intervalo de confiança para $ \beta_{w1} $ com (1-$ \alpha $)100% é dado por

$$\left[\widehat{\beta}_{w1} - t_{\left(1-\alpha/2 ;n-2\right)}\sqrt{\dfrac{QME_w}{\displaystyle \sum_{i=1}^{n} w_i (X_i - \overline{X}_w)^2}} ~;~\widehat{\beta}_{w1} +t_{\left(1-\alpha/2;n-2\right)}\sqrt{\dfrac{QME_w}{\displaystyle \sum_{i=1}^{n} w_i (X_i - \overline{X}_w)^2}} \right]$$

 

Exemplo  1.11.3.1

Neste exemplo. vamos aplicar testes de hipóteses e construir intervalos de confiança para os parâmetros $ (\beta_{w0},\beta_{w1}), $ para isto vamos usar os dados do exemplo 1.11.1.1. Como visto no Exemplo 1.11.1.1, as estimativas dos parâmetros são $ \widehat{\beta}_{w0}=0,02039 $ e $ \widehat{\beta}_{w1}=0,720729 $

clique aqui para efetuar o download dos dados utilizados nesse exemplo

Do exemplo 1.11.2.1 obtemos que


$$QME_w=5,203371\quad\text{e} \quad \widehat{\text{Var}}(\widehat{\beta}_{w0})=0,1233$$

Agora, vamos testar as hipóteses


\beta_{w0} \neq 0.\\\end{array} \right.$$

Assim, a estatística do teste é dada por 

$$T_0=\dfrac{\widehat{\beta}_{w0}}{\sqrt{\dfrac{QME_w\displaystyle\sum_{i=1}^{n} w_i x^2_i }{\displaystyle \sum_{i=1}^{n} w_i\sum_{i=1}^{n} w_i (X_i - \overline{X}_w )^2}}}=\dfrac{0,02039}{\sqrt{0,1233}}=0,05807757$$

Para $ \alpha = $ 0,05 temos $ t_{(1-0,05/2;47)}=2,101 $.

Como $ T_0=26,46\textgreater 2,011741 = t_{(1-0,05/2;18)} $, e

$ \text{P-valor} =2\times\mathbb{P}\left( t_{(n-2)}\textgreater \mid T_0 \mid\right)= 0,9539, $ não rejeitamos $ H_0. $

O intervalo de confiança, IC(95%), para $ \beta_{w0} $ é dado por

$$\left[\widehat{\beta}_{w0} - t_{\left(1-\alpha/2;n-2\right)} \sqrt{\dfrac{QME_w\displaystyle\sum_{i=1}^{n} w_i x^2_i }{\displaystyle \sum_{i=1}^{n} w_i\sum_{i=1}^{n} w_i (X_i - \overline{X}_w )^2}} ~;~ \widehat{\beta}_{w0} +t_{\left(1-\alpha/2;n-2\right)}\sqrt{\dfrac{QME_w\displaystyle\sum_{i=1}^{n} w_i x^2_i }{\displaystyle \sum_{i=1}^{n} w_i\sum_{i=1}^{n} w_i (X_i - \overline{X}_w )^2}}\right]$$

$$\left[0,02039-2,011741\times0,35120010 ~;~ 0,02039+2,011741\times0,35120010\right]$$

$$\left[ -0,6861266 ~;~ 0,7269203\right]$$

Similarmente, vamos testar as hipóteses


\beta_{w1} \neq 0 \\\end{array} \right.$$

Vale lembrar que do exemplo 1.11.2.1 obtemos que $ \widehat{\text{Var}}(\widehat{\beta}_{w1})=0,0001108. $ Neste caso, a estatística do teste é 


$$T_0=\dfrac{\widehat{\beta}_{w1}}{\sqrt{\dfrac{QME_w}{\displaystyle \sum_{i=1}^{n} w_i (X_i - \overline{X}_w)^2}}}= \dfrac{0,7207}{0,02117622}= 68,46926310$$

Para $ \alpha = $ 0,05 temos $ t_{(1-0,05/2;47)}=2,0117 $.

Como $ T_0=68,47\textgreater2,0117=t_{(1-0,05/2;47)} $ e

$ 2\times \mathbb{P}\left( t_{(n-2)}\textgreater \mid T_0\mid \right)=9,3769053\times 10^{-49}, $ rejeitamos $ H_0. $

O intervalo de confiança, IC(95%), para $ \beta_{w1} $ é dado por


$$\left[\widehat{\beta}_{w1} - t_{\left(1-\alpha/2 ;n-2\right)}\sqrt{\dfrac{QME_w}{\displaystyle \sum_{i=1}^{n} w_i (X_i - \overline{X}_w)^2}} ~;~\widehat{\beta}_{w1} +t_{\left(1-\alpha/2;n-2\right)}\sqrt{\dfrac{QME_w}{\displaystyle \sum_{i=1}^{n} w_i (X_i - \overline{X}_w)^2}} \right]$$


$$\left[ 0,72072908-2,0117\times 0,01052632~;~ 0,72072908+2,0117\times 0,01052632 \right]$$


$$\left[0,6995529~;~ 0,7419053\right]$$

Por fim, observe os resultados obtidos pelo software Action:

 Para entender como executar essa função do Software Action, você pode consultar o  Manual do Usuário.

Análise de Regressão

Sobre o Portal Action

O Portal Action é mantido pela Estatcamp - Consultoria Estatística e Qualidade, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.

Facebook

CONTATO

  •  Maestro Joao Seppe, 900, São Carlos - SP | CEP 13561-180
  • Telefone: (16) 3376-2047
  • E-Mail: [email protected]