- (16) 3376-2047
- [email protected]
- Portfólio de Serviços
- AT
Na regressão linear ponderada é importante avaliarmos se existe uma boa “correlação” entre a resposta e a variável explicativa, assim como dito na seção Regressão Linear Simples. Para respondermos a esta questão, utilizamos testes de hipóteses e intervalos de confiança para os parâmetros.
Neste tópico, vamos discutir sobre a distribuição amostral dos estimadores, para isto, observamos que $\widehat{\beta}_{w0}$ e $\widehat{\beta}_{w1}$ são combinações lineares de $Y$, que é uma variável aleatória com distribuição normal. Logo as distribuições dos estimadores são normais exatas, com médias e variâncias iguais as esperanças e variâncias dos estimadores, logo temos que:
$$\widehat{\beta}_{wo} \sim N\left(\beta_{w0}, \dfrac{\sigma^2_w\displaystyle\sum_{i=1}^{n} w_i x^2_i }{\displaystyle \sum_{i=1}^{n} w_i\sum_{i=1}^{n} w_i (X_i - \overline{X}_w )^2}\right)\quad \text{e}\quad \widehat{\beta}_{w1} \sim N \left(\beta_{w1}, \dfrac{\sigma^2_w}{\displaystyle \sum_{i=1}^{n} w_i(X_i - \overline{X}_w)^2} \right).$$
Além disso,
$$Z=\dfrac{\widehat{\beta}_{w0} - \beta_{w0}}{\sqrt{\dfrac{\sigma^2_w\displaystyle\sum_{i=1}^{n} w_i x^2_i }{\displaystyle \sum_{i=1}^{n} w_i\sum_{i=1}^{n} w_i (X_i - \overline{X}_w )^2}}}\sim N(0,1)\quad \text{e}\quad Z=\dfrac{\widehat{\beta}_{w1} - \beta_{w1}}{\sqrt{\dfrac{\sigma^2_w}{\displaystyle \sum_{i=1}^{n} w_i (X_i - \overline{X}_w)^2}}}\sim N(0,1)$$
A partir desse resultado podemos construir intervalos de confiança e testar hipóteses a respeito dos estimadores.
Não usual fazermos inferências sobre $\beta_{w0},$ isso só ocorre quando a variável x pode assumir o valor x=0. Esta prática não é recomendada, inclusive para o MAPA, que em umas de suas instruções normativas (item 7.1.1.6) diz que “as curvas de calibração não devem ser forçadas a passar pela origem”.
Suponha que desejamos testar a hipótese de que o intercepto é igual a um determinado valor, denotado por $\beta_{w0*}$. Desta forma, sejam as hipóteses
$$\left\{\begin{array}{ll}\mbox{H}_{0}:\beta_{w0}=\beta_{w0*}.\\\mbox{H}_{1}:\beta_{w0} \neq \beta_{w0*}.\\\end{array} \right.$$
Como visto anteriormente,
$$\widehat{\beta}_{w0} \sim N\left(\beta_{w0}, \dfrac{\sigma^2_w\displaystyle\sum_{i=1}^{n} w_i x^2_i }{\displaystyle \sum_{i=1}^{n} w_i\sum_{i=1}^{n} w_i (X_i - \overline{X}_w )^2}\right)\quad \text{e}\quad Z=\dfrac{\widehat{\beta}_{w0} - \beta_{w0}}{\sqrt{\dfrac{\sigma^2_w\displaystyle\sum_{i=1}^{n} w_i x^2_i }{\displaystyle \sum_{i=1}^{n} w_i\sum_{i=1}^{n} w_i (X_i - \overline{X}_w )^2}}}\sim N(0,1)$$
A partir desse resultado podemos construir intervalos de confiança e testar hipóteses a respeito dos estimadores. Vale lembrar que
$$\chi =\dfrac{(n-2)QME_w}{\sigma^2_w}~~\sim \chi_{(n-2)}^2.$$
Como as variáveis aleatórias $Z$ e $\chi$ são independentes, segue que
$$T= \dfrac{Z}{\sqrt{\dfrac{\chi}{n-2}}} = \dfrac{\dfrac{\widehat{\beta}_{w0} - \beta_{w0*}}{\sqrt{\dfrac{\sigma^2_w\displaystyle\sum_{i=1}^{n} w_i x^2_i }{\displaystyle \sum_{i=1}^{n} w_i\sum_{i=1}^{n} w_i (X_i - \overline{X}_w )^2}}}}{\sqrt{\dfrac{\dfrac{(n-2)QME_w}{\sigma^2_w}}{(n-2)}}}= \dfrac{\widehat{\beta}_{w0} - \beta_{w0*}}{\sqrt{\dfrac{QME_w\displaystyle\sum_{i=1}^{n} w_i x^2_i }{\displaystyle \sum_{i=1}^{n} w_i\sum_{i=1}^{n} w_i (X_i - \overline{X}_w )^2}}} \quad \sim t_{(n-2)},$$
ou seja, T tem distribuição t de Student com n-2 graus de liberdade. Logo, intervalos de confiança e testes a respeito de $\beta_{w0}$ podem ser realizados utilizando a distribuição t.
No modelo ponderado, queremos testar as hipóteses
$$\left\{\begin{array}{ll}\mbox{H}_{0}:\beta_{w0}=0.\\\mbox{H}_{1}:\beta_{w0} \neq 0.\\\end{array} \right.$$
Assim, a estatística do teste é dada por
$$T_0=\dfrac{\widehat{\beta}_{w0}}{\sqrt{\dfrac{QME_w\displaystyle\sum_{i=1}^{n} w_i x^2_i }{\displaystyle \sum_{i=1}^{n} w_i\sum_{i=1}^{n} w_i (X_i - \overline{X}_w )^2}}} \quad\sim t_{(n-2)}.$$
Logo, rejeitamos $H_0$ com um nível de confiança de (1-$\alpha$)100% se $\mid T_0\mid\textgreater t_{(1-\alpha/2,n-2)}$. O p-valor associado ao teste é dado por
$$\text{P-valor}=2\times\mathbb{P}\left( t_{(n-2)}\textgreater \mid T_0 \mid \right).$$
Rejeitamos $H_0$ se o p-valor for menor do que o nível de significância $\alpha$ considerado. Geralmente adotamos $\alpha=$0,05.
Quando não rejeitamos $H_0$, podemos utilizar o “Modelo de Regressão ponderado sem Intercepto”.
O intervalo de confiança para $\beta_{w0}$ com $(1-\alpha)100\%$ é dado por
$$\left[\widehat{\beta}_{w0} - t_{\left(1-\alpha/2;n-2\right)} \sqrt{\dfrac{QME_w\displaystyle\sum_{i=1}^{n} w_i x^2_i }{\displaystyle \sum_{i=1}^{n} w_i\sum_{i=1}^{n} w_i (X_i - \overline{X}_w )^2}} ~;~ \widehat{\beta}_{w0} +t_{\left(1-\alpha/2;n-2\right)}\sqrt{\dfrac{QME_w\displaystyle\sum_{i=1}^{n} w_i x^2_i }{\displaystyle \sum_{i=1}^{n} w_i\sum_{i=1}^{n} w_i (X_i - \overline{X}_w )^2}}\right]$$
Inferência sobre $\beta_{w1}$ é mais frequente já que por meio deste parâmetro temos um indicativo da existência ou não de associação linear entre as variáveis envolvidas.
Similarmente ao parâmetro $\beta_{w0}$, consideremos as hipóteses
$$\left\{\begin{array}{ll}\mbox {H}_{0}:\beta_{w1}=\beta_{w1*} \\\mbox {H}_{1}:\beta_{w1} \neq \beta_{w1*}\\\end{array} \right.$$
Do início desta seção obtemos que
$$\widehat{\beta}_{w1} \sim N \left(\beta_{w1}, \dfrac{\sigma^2_w}{\displaystyle \sum_{i=1}^{n} w_i(X_i - \overline{X}_w)^2} \right).\quad \text{e}\quad Z=\dfrac{\widehat{\beta}_{w1} - \beta_{w1}}{\sqrt{\dfrac{\sigma^2_w}{\displaystyle \sum_{i=1}^{n} w_i (X_i - \overline{X}_w)^2}}}\sim N(0,1)$$
Novamente, consideramos que
$$\chi =\dfrac{(n-2)QME_w}{\sigma^2_w} ~~\sim \chi_{(n-2)}^2$$
e que $N_1$ e $\chi$ são independentes, obtemos
$$T=\dfrac{Z}{\sqrt{\dfrac{\chi}{n-2}}}= \dfrac{\dfrac{\widehat{\beta}_{w1} - \beta_{w1}}{\sqrt{\dfrac{\sigma^2_w}{\displaystyle \sum_{i=1}^{n} w_i (X_i - \overline{X}_w)^2}}}}{\sqrt{\dfrac{\dfrac{(n-2)QME_w}{\sigma^2_w}}{(n-2)}}}= \dfrac{\widehat{\beta}_{w1} - \beta_{w1}}{\sqrt{\dfrac{QME_w}{\displaystyle \sum_{i=1}^{n} w_i (X_i - \overline{X}_w)^2}}}\quad \sim t_{(n-2)},$$
ou seja, T tem distribuição t de Student com n-2 graus de liberdade. Logo, intervalos de confiança e testes a respeito de $\beta_{w1}$ podem ser realizados utilizando a distribuição t.
No modelo em questão, queremos testar as seguintes hipóteses
$$\left\{\begin{array}{ll}\mbox {H}_{0}:\beta_{w1}=0 \\\mbox {H}_{1}:\beta_{w1} \neq 0 \\\end{array} \right.$$
Neste caso, a estatística do teste é
$$T_0=\dfrac{\widehat{\beta}_{w1}}{\sqrt{\dfrac{QME_w}{\displaystyle \sum_{i=1}^{n} w_i (X_i - \overline{X}_w)^2}}}\quad\sim t_{(n-2)}.$$
Assim, rejeitamos $H_0$ com um nível de confiança (1-$\alpha$)100% se $\mid T_0\mid\textgreater t_{(1-\alpha/2,n-2)}$. O p-valor associado ao teste é dado por
$$\text{P-valor}=2\times\mathbb{P}\left( t_{(n-2)}\textgreater \mid T_0 \mid \right).$$
Rejeitamos $H_0$ se o P-valor for menor do que $\alpha.$
O intervalo de confiança para $\beta_{w1}$ com (1-$\alpha$)100% é dado por
$$\left[\widehat{\beta}_{w1} - t_{\left(1-\alpha/2 ;n-2\right)}\sqrt{\dfrac{QME_w}{\displaystyle \sum_{i=1}^{n} w_i (X_i - \overline{X}_w)^2}} ~;~\widehat{\beta}_{w1} +t_{\left(1-\alpha/2;n-2\right)}\sqrt{\dfrac{QME_w}{\displaystyle \sum_{i=1}^{n} w_i (X_i - \overline{X}_w)^2}} \right]$$
Neste exemplo. vamos aplicar testes de hipóteses e construir intervalos de confiança para os parâmetros $(\beta_{w0},\beta_{w1}),$ para isto vamos usar os dados do exemplo 1.11.1.1. Como visto no Exemplo 1.11.1.1, as estimativas dos parâmetros são $\widehat{\beta}_{w0}=0,02039$ e $\widehat{\beta}_{w1}=0,720729$
clique aqui para efetuar o download dos dados utilizados nesse exemplo
Do exemplo 1.11.2.1 obtemos que
$$QME_w=5,203371\quad\text{e} \quad \widehat{\text{Var}}(\widehat{\beta}_{w0})=0,1233$$
Agora, vamos testar as hipóteses
$$\left\{\begin{array}{ll}\mbox{H}_{0}:\beta_{w0}=0.\\\mbox{H}_{1}:\beta_{w0} \neq 0.\\\end{array} \right.$$
Assim, a estatística do teste é dada por
$$T_0=\dfrac{\widehat{\beta}_{w0}}{\sqrt{\dfrac{QME_w\displaystyle\sum_{i=1}^{n} w_i x^2_i }{\displaystyle \sum_{i=1}^{n} w_i\sum_{i=1}^{n} w_i (X_i - \overline{X}_w )^2}}}=\dfrac{0,02039}{\sqrt{0,1233}}=0,05807757$$
Para $\alpha =$ 0,05 temos $t_{(1-0,05/2;47)}=2,101$.
Como $T_0=26,46\textgreater 2,011741 = t_{(1-0,05/2;18)}$, e
$\text{P-valor} =2\times\mathbb{P}\left( t_{(n-2)}\textgreater \mid T_0 \mid\right)= 0,9539,$ não rejeitamos $H_0.$
O intervalo de confiança, IC(95%), para $\beta_{w0}$ é dado por
$$\left[\widehat{\beta}_{w0} - t_{\left(1-\alpha/2;n-2\right)} \sqrt{\dfrac{QME_w\displaystyle\sum_{i=1}^{n} w_i x^2_i }{\displaystyle \sum_{i=1}^{n} w_i\sum_{i=1}^{n} w_i (X_i - \overline{X}_w )^2}} ~;~ \widehat{\beta}_{w0} +t_{\left(1-\alpha/2;n-2\right)}\sqrt{\dfrac{QME_w\displaystyle\sum_{i=1}^{n} w_i x^2_i }{\displaystyle \sum_{i=1}^{n} w_i\sum_{i=1}^{n} w_i (X_i - \overline{X}_w )^2}}\right]$$
$$\left[0,02039-2,011741\times0,35120010 ~;~ 0,02039+2,011741\times0,35120010\right]$$
$$\left[ -0,6861266 ~;~ 0,7269203\right]$$
Similarmente, vamos testar as hipóteses
$$\left\{\begin{array}{ll}\mbox {H}_{0}:\beta_{w1}=0 \\\mbox {H}_{1}:\beta_{w1} \neq 0 \\\end{array} \right.$$
Vale lembrar que do exemplo 1.11.2.1 obtemos que $\widehat{\text{Var}}(\widehat{\beta}_{w1})=0,0001108.$ Neste caso, a estatística do teste é
$$T_0=\dfrac{\widehat{\beta}_{w1}}{\sqrt{\dfrac{QME_w}{\displaystyle \sum_{i=1}^{n} w_i (X_i - \overline{X}_w)^2}}}= \dfrac{0,7207}{0,02117622}= 68,46926310$$
Para $\alpha =$ 0,05 temos $t_{(1-0,05/2;47)}=2,0117$.
Como $T_0=68,47\textgreater2,0117=t_{(1-0,05/2;47)}$ e
$2\times \mathbb{P}\left( t_{(n-2)}\textgreater \mid T_0\mid \right)=9,3769053\times 10^{-49},$ rejeitamos $H_0.$
O intervalo de confiança, IC(95%), para $\beta_{w1}$ é dado por
$$\left[\widehat{\beta}_{w1} - t_{\left(1-\alpha/2 ;n-2\right)}\sqrt{\dfrac{QME_w}{\displaystyle \sum_{i=1}^{n} w_i (X_i - \overline{X}_w)^2}} ~;~\widehat{\beta}_{w1} +t_{\left(1-\alpha/2;n-2\right)}\sqrt{\dfrac{QME_w}{\displaystyle \sum_{i=1}^{n} w_i (X_i - \overline{X}_w)^2}} \right]$$
$$\left[ 0,72072908-2,0117\times 0,01052632~;~ 0,72072908+2,0117\times 0,01052632 \right]$$
$$\left[0,6995529~;~ 0,7419053\right]$$
Por fim, observe os resultados obtidos pelo software Action:
![]() |
Para entender como executar essa função do Software Action, você pode consultar o Manual do Usuário. |
O Portal Action é mantido pela Estatcamp - Consultoria Estatística e Qualidade, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.