- Estatcamp: (16) 3376-2047 [email protected]
- [email protected] https://www.actionstat.com.br
Discutimos intervalos de confiança para os parâmetros, logito, valores ajustados e odds ratio no modelo de regressão logística simples. Os métodos utilizados no caso de apenas uma covariável são os mesmos no caso da regressão múltipla.
O intervalo de confiança para um parâmetro $\beta_j$ é baseado em seu respectivo teste de Wald. O intervalo de confiança de $100(1-\alpha)$% para o parâmetro $\beta_j$ é:
$$IC(\beta_j,1-\alpha)= [\hat{\beta_j}-z_{1-\alpha/2}DP[(\hat{\beta_j})];~~~\hat{\beta_j}+z_{1-\alpha/2}DP[(\hat{\beta_j})]].$$
Em que a obtenção da estimativa do parâmetro $\beta_j$ e de seu desvio padrão é mostrado em 4.2.1.
O modelo proposto é: $$\mbox{Probabilidade de refugo}=\pi_i=\frac{e^{\beta_0 + \beta_1 \, x_1 +\beta_2 \, x_2+\beta_3 \,x^2_1 + \beta_4 \, x^2_2 + \beta_5 \, x_1x_2}}{1+e^{\beta_0 + \beta_1 \, x_1 +\beta_2 \,x_2+\beta_3 \,x^2_1 + \beta_4 \, x^2_2 + \beta_5 \, x_1x_2}},$$
em que $x_1$ é a variável Volatilidade e $x_2$ é a variável RFV.
Assim, vamos construir intervalo de confiança de Wald para os parâmetros considerando as estimativas dos parâmetros e dos seus desvios padrão já calculados nos exemplos 4.2.1.1 e 4.2.1.1.1.
- Para $\beta_0$
$$IC(\beta_0,0,95)= [30,339-1,96*3,67;~~~30,339 + 1,96*3,67],$$
$$IC(\beta_0,0,95)= [30,339-7,1932;~~~30,339+7,1932],$$
$$IC(\beta_0,0,95)= [23,14;~~~37,53].$$
- Para $\beta_1$
$$IC(\beta_1,0,95)= [-14,1496-1,96*1,35514;~~~-14,1496 + 1,96*1,35514],$$
$$IC(\beta_1,0,95)= [-14,1496-2,65607;~~~-14,1496+2,65607],$$
$$IC(\beta_1,0,95)= [-16,8;~~~-11,50].$$
- Para $\beta_2$
$$IC(\beta_2,0,95)= [-6,26927-1,96*0,855191;~~~-6,26927+1,96*0,855191],$$
$$IC(\beta_2,0,95)= [-6,26927-1,67617;~~~-6,26927+1,67617],$$
$$IC(\beta_2,0,95)= [-7,94;~~~-4,59].$$
- Para $\beta_3$
$$IC(\beta_3,0,95)= [1,10101-1,96*0,101994;~~~1,10101 + 1,96*0,101994],$$
$$IC(\beta_3,0,95)= [1,10101- 0,199908;~~~1,10101+0,199908],$$
$$IC(\beta_3,0,95)= [0,90;~~~1,30].$$
- Para $\beta_4$
$$IC(\beta_4,0,95)= [0,2819-1,96*0,046355;~~~0,2819+1,96*0,046355],$$
$$IC(\beta_4,0,95)= [0,2819-0,090855;~~~0,2819+0,090855],$$
$$IC(\beta_4,0,95)= [0,19;~~~0,37].$$
- Para $\beta_5$
$$IC(\beta_5,0,95)= [1,53769 - 1,96*0,18197;~~~1,53769 + 1,96*0,18197],$$
$$IC(\beta_5,0,95)= [1,53769 - 0,35666;~~~1,53769 +0,35666],$$
$$IC(\beta_5,0,95)= [1,18;~~~1,89].$$
A logito é a parte linear do modelo de regressão logística. O estimador para logito é: $$\hat{g}(X)=\hat{\beta}_0+\hat{\beta}_1 X_1+\hat{\beta}_2 X_2 + \ldots +\hat{\beta}_p X_p~~~~~~~~~~~(4.2.2.2.1)$$
O estimador da variância do estimador da logito requer a obtenção da variância da soma. O caso geral é: $$\hat{Var}[\hat{g}(x)]=\sum_{j=0}^{p}x_j^{2}\hat{Var}(\hat{\beta}_j)+\sum_{j=0}^{p}\sum_{k=j+1}^{p}2x_{j}x_{k}\hat{Cov}(\hat{\beta}_j,\hat{\beta}_k).~~~~~~~~~(4.2.2.2.2)$$
O intervalo de confiança para a logito é: $$IC(g(x),1-\alpha)= [\hat{g}(x)-z_{1-\alpha/2}DP[\hat{g}(x)];~~~\hat{g}(x)+z_{1-\alpha/2}DP[\hat{g}(x)]],$$
em que $DP[\hat{g}(x)]$ é a raiz quadrada de 4.2.2.2.2 e $z_{1-\alpha/2}$ é o ponto da normal padrão.
O estimador do logito e seu intervalo de confiança fornece o estimador dos valores ajustados. O intervalo de confiança dos valores ajustados é dado por: $$IC(\pi,1-\alpha)= \left[\frac{e^{\hat{g}(x)-z_{1-\alpha/2}DP[\hat{g}(x)]}}{1+e^{\hat{g}(x)-z_{1-\alpha/2}DP[\hat{g}(x)]}};~~~\frac{e^{\hat{g}(x)+z_{1-\alpha/2}DP[\hat{g}(x)]}}{1+e^{\hat{g}(x)+z_{1-\alpha/2}DP[\hat{g}(x)]}}\right].~~~~~~~~(4.2.2.3.1)$$
Vamos calcular o intervalo de confiança para o valor predito para a primeira observação que tem os seguintes valores das variáveis explicativas: Volatilidade=1,906, RFV=5,64, Volatilidade ao quadrado=3,6328, RFV ao quadrado=31,832, Interação Volatilidade e RFV=10,7536. $$\hat{g}(x)=30,3389-14,1496*1,906-6,2693*5,64+1,1010*3,6328+$$
$$+0,2819*31,832+1,5377 *10,7536=-2,49.$$
$$DP[\hat{g}(x)]=0,003.$$
Assim, para a primeira observação, o intervalo de 95% de confiança dos valores preditos é: $$IC(\pi,0,95)= \left[\frac{e^{-2,49-(1,96*0,003)}}{1+e^{-2,49-(1,96*0,003}};~~~\frac{e^{-2,49+(1,96*0,003)}}{1+e^{-2,49+(1,96*0,003)}}\right].$$
$$IC(\pi,0,95)=[0,07; 0,08].$$
De maneira análoga para as outras observações, o Intervalo de 95% de Confiança para os valores ajustados estão na Tabela 4.2.2.3.
Probabilidade Ajustada | LI | LS |
0,076399885 | 0,070450452 | 0,082349318 |
0,127990657 | 0,107519976 | 0,148461338 |
0,131046731 | 0,115743286 | 0,146350177 |
0,074710904 | 0,070150594 | 0,079271214 |
0,07579158 | 0,070721074 | 0,080862087 |
0,060636055 | 0,056779495 | 0,064492615 |
0,071903929 | 0,066629812 | 0,077178046 |
0,071022609 | 0,065386177 | 0,076659042 |
0,067959741 | 0,05838268 | 0,077536802 |
0,101027497 | 0,089405118 | 0,112649877 |
0,060889841 | 0,05658044 | 0,065199242 |
0,080881681 | 0,072272112 | 0,089491249 |
0,061890438 | 0,057329439 | 0,066451437 |
0,040125901 | 0,035798741 | 0,044453061 |
0,044062237 | 0,040031392 | 0,048093083 |
0,04366689 | 0,039566594 | 0,047767186 |
0,04284874 | 0,036425365 | 0,049272115 |
0,078649613 | 0,06629152 | 0,091007705 |
Tabela 4.2.2.3: Intervalo de Confiança dos Valores Ajustados
Sejam os limites do intervalo de confiança para $\beta_j$:
$\beta_{I}=\hat{\beta_j}-z_{1-\alpha/2}DP[(\hat{\beta_j})]$ e $\beta_{S}=\hat{\beta_j}+z_{1-\alpha/2}DP[(\hat{\beta_j})],$
em que j=1,2,...p.
O intervalo de confiança para a Odds Ratio é: $$IC(Odds~Ratio,1-\alpha)= [e^{\beta_{I}}; ~~~~e^{\beta_{S}}].~~~~~(4.2.2.4.1)$$
Vamos calcular o intervalo de confiança para os dados do exemplo 4.2.1.1.
- Para Volatilidade
$$\left[\exp(-14,1496-1,96*1,35514) \right.~;~~\left.\exp(-14,1496 + 1,96*1,35514)\right]$$
$$\left[\exp(-14,1496- 2,65607)\right.~;~~\left.\exp(-14,1496+ 2,65607)\right]$$
$$\left[5,027942e-08\right.~;~~\left.1,019585e-05\right].$$
- Para RFV
$$\left[\exp(-6,26927-1,96*0,855191)\right.~;~~\left.\exp(-6,26927+1,96*0,855191)\right]$$
$$\left[\exp(-6,26927-1,67617)\right.~;~~\left.\exp(-6,26927+1,67617)\right]$$
$$\left[0,00035427\right.~;~~\left.0,010121\right].$$
- Para o Efeito quadrático da Volatilidade
$$\left[\exp(1,10101-1,96*0,101994)\right.~ ~;~~\left.\exp(1,10101 + 1,96*0,101994) \right]$$
$$\left[\exp(1,10101- 0,199908)\right.~~;~~\left.\exp(1,10101+0,199908)\right]$$
$$\left[2,4623\right.~~;~~\left. 3,6726 \right].$$
- Para o Efeito quadrático do RFV
$$\left[\exp(0,2819-1,96*0,046355)\right.~~;~~\left.\exp(0,2819+1,96*0,046355)\right]$$
$$\left[\exp(0,2819-0,090855)\right.~~;~~\left.\exp(0,2819+0,090855)\right]$$
$$\left[1,2105 \right.~~;~~\left.1,4517\right].$$
- Para a Interação entre a Volatilidade e o RFV
$$\left[\exp(1,53769 - 1,96*0,18197) \right.~~;~~\left.\exp(1,53769 + 1,96*0,18197)\right]$$
$$\left[\exp(1,53769 - 0,35666) \right.~~;~~\left. \exp(1,53769 +0,35666)\right]$$
$$\left[3,2577\right.~~;~~\left.6,64822\right].$$
O Portal Action é mantido pela Estatcamp - Consultoria Estatística e Qualidade, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.