- (16) 3376-2047
- [email protected]
- Portfólio de Serviços
- AT
Consideremos $X$ e $Y$ variáveis aleatórias que representam determinada característica de duas populações com distribuição de Bernoulli com parâmetros $p_1$ e $p_2$ respectivamente.
Retiremos duas amostras aleatórias independentes, $X_1,\ldots,X_{n_1}$ e $Y_1,\ldots,Y_{n_2}$, dessas populações. Cada $X_i$, $i = 1,\ldots,n_1$ e cada $Y_j$, $j = 1,\ldots,n_2$, tem distribuição de Bernoulli com parâmetros $p_1$ e $p_2$ respectivamente, isto é, \[X_1,\ldots,X_{n_1}\sim\hbox{Bernoulli}(p_1) \quad \text{e} \quad Y_1,\ldots,Y_{n_2}\sim\hbox{Bernoulli{(p_2)\]
com médias $p_1$ e $p_2$ e variâncias $\sigma_1^2 = p_1(1-p_1)$ e $\sigma_2^2 = p_2(1-p_2)$, respectivamente.
As variáveis $\hat{p}_1 = \overline{X}$ e $\hat{p}_2=\overline{Y}$ são estimadores de máxima verossimilhança para $p_1$ e $p_2$, respectivamente, e tem distribuição amostral aproximadamente normal: \[\hat{p}_1\sim N\left(p_1,\frac{p_1(1-p_1)}{n_1}\right)\quad\text{e}\quad\hat{p}_2\sim N\left(p_2,\frac{p_2(1-p_2)}{n_2}\right).\]
Assim, temos que \[\hat{p}_1-\hat{p}_2\sim N\left(p_1-p_2,\frac{p_1(1-p_1)}{n_1}+\frac{p_2(1-p_2)}{n_2}\right)\]
ou seja, \[\frac{\hat{p}_1-\hat{p}_2-(p_1-p_2)}{\sqrt{\frac{p_1(1-p_1)}{n_1}+\frac{p_2(1-p_2)}{n_2}}}\sim N(0,1).\]
Para realizarmos o teste para duas proporções com aproximação Normal vamos considerar a hipótese nula $p_1 = p_2$. Assim, sob a hipótese nula, $\hat{p}_1-\hat{p}_2$ tem distribuição Normal com média $\mu = 0$ e desvio padrão \[\sigma=\sqrt{\frac{p_1(1-p_1)}{n_1}+\frac{p_2(1-p_2)}{n_2}}=\sqrt{\frac{p(1-p)}{n_1}+\frac{p(1-p)}{n_2}}\]
onde $p = p_1 = p_2$.
Como não conhecemos o valor $p$, vamos estimá-lo como uma média ponderada de $\hat{p}_1$ e $\hat{p}_2$: \[\hat{p}=\frac{n_1\hat{p}_1+n_2\hat{p}_2}{n_1+n_2}\]
Este é o valor que será utilizado em lugar de $p$ para o cálculo de $\sigma$. Portanto, temos que \[Z=\frac{\hat{p}_1-\hat{p}_2}{\sqrt{\frac{\hat{p}(1-\hat{p})}{n_1}+\frac{\hat{p}(1-\hat{p})}{n_2}}}\sim N(0,1)\]
Tendo essas informações, vejamos os passos padra se construir um teste de hipóteses para duas proporções:
1. Estabelecer alguma das hipóteses \[\left\{\begin{array}{l}H_0:p_1=p_2\\H_1:p_1\neq p_2\end{array}\right. \quad \left\{\begin{array}{l}H_0:p_1=p_2\\H_1:p_1 \ \textgreater \ p_2\end{array}\right. \ \hbox{ou} \ \begin{array}{l}H_0:p_1=p_2\\H_1:p_1 \ \textless \ p_2\end{array}\right.\]
ou seja \[\left\{\begin{array}{l}H_0:p_1-p_2=0\\H_1:p_1-p_2\neq0\end{array}\right. \quad \left\{\begin{array}{l}H_0:p_1-p_2=0\\H_1:p_1-p_2 \ \textgreater \ 0\end{array}\right. \ \hbox{ou} \ \left\{\begin{array}{l}H_0:p_1-p_2=0\\H_1:p_1-p_2 \ \textless \ 0\end{array}\right.\]
2. Fixar o nível de significância $\alpha$.
3. Determinar a região crítica.
4. Calcular o valor de $\hat{p}$.
5. Calcular, sob a hipótese nula, o valor \[Z_{\text{obs}}=\frac{\hat{p}_1-\hat{p}_2}{\sqrt{\frac{\hat{p}(1-\hat{p})}{n_1}+\frac{\hat{p}(1-\hat{p})}{n_2}}}\]
6. Critérios:
7. Para calcular o poder necessário para que o teste de duas proporções detecte a diferença entre as proporções $p_1$ e $p_2$, utilizamos o software Action. O Action recebe como parâmetros o tamanho da primeira amostra ($n_1$), o tamanho da segunda amostra ($n_2$), as propoções ($p_1$) e ($p_2$), o valor do poder ($P$) e o nível de significância ($\alpha$). As fórmula utilizadas são dadas por \[1-\Phi\left(z_{\alpha/2}-(2\arcsin(\sqrt{p_1})-2\arcsin(\sqrt{p_2}))\sqrt{\frac{n_1n_2}{n_1+n_2}}\right)+\]
\[\qquad\qquad+\Phi\left(-z_{\alpha/2}-(2\arcsin(\sqrt{p_1})-2\arcsin(\sqrt{p_2}))\sqrt{\frac{n_1n_2}{n_1+n_2}}\right)\]
para o teste bilateral, \[\Phi\left(-z_{\alpha}-(2\arcsin(\sqrt{p_1})-2\arcsin(\sqrt{p_2}))\sqrt{\frac{n_1n_2}{n_1+n_2}}\right)\]
para o teste unilateral à esquerda e \[1-\Phi\left(z_{\alpha}-(2\arcsin(\sqrt{p_1})-2\arcsin(\sqrt{p_2}))\sqrt{\frac{n_1n_2}{n_1+n_2}}\right)\]
para o teste unilateral à direita.
Já para o cálculo do tamanho das amostras necessárias para que o teste detecte uma diferença entre as proporções $p_1$ e $p_2$, com determinado poder, basta lançarmos os valores das proporções $p_1$ e $p_2$, do poder $P$ e do nível de significância $\alpha$. Com isso, o Action nos fornece o valor dos tamanhos das amostras. As fórmulas utilizadas seguem das acima, isolando $n$ em funções dos demais parâmetros.
Uma empresa que presta serviços de assessoria econômica a outras empresas está interessada em comparar a taxa de reclamações sobre os seus serviços em dois dos seus escritórios em duas cidades diferentes. Suponha que a empresa tenha selecionado aleatoriamente $100$ serviços realizados pelo escritório da cidade $A$ e foi constatado que em $12$ deles houve algum tipo de reclamação. Já do escritório da cidade B foram selecionados $120$ serviços e $18$ receberam algum tipo de reclamação. A empresa deseja saber se estes resultados são suficientes para se concluir que os dois escritórios apresentam diferença significativa entre suas taxas de aprovação.
clique aqui para efetuar o download dos dados utilizados nesse exemplo
Primeiramente, vejamos que as proporções amostrais de aprovação sobre os serviços dos escritórios das cidades $A$ e $B$ são, respectivamente, $\hat{p}_1 = 0,88$ e $\hat{p}_2 = 0,85$.
1. Queremos testar as seguintes hipóteses: \[\left\{\begin{array}{l}H_0:p_1=p_2\\H_1:p_1\neq p_2\end{array}\right.\]
ou seja \[\left\{\begin{array}{l}H_0:p_1-p_2=0\\H_1:p_1-p_2\neq 0\end{array}\right.\]
2. Fixemos o nível de significância $\alpha = 0,05$.
3. Como $\alpha = 0,05$, temos que $-z_{\alpha/2} = -1,96$ e $z_{\alpha/2} = 1,96$.
4. Como $n_1 = 100$, $n_2 = 120$, $\hat{p}_1 = 0,88$ e $\hat{p}_2 = 0,85$, temos que \[\hat{p}=\frac{n_1\hat{p}_1+n_2\hat{p}_2}{n_1+n_2}=\frac{100\times 0,88+120\times 0,85}{220}=\frac{190}{220}=0,864.\]
5. Assim temos, sob a hipótese nula, que \[Z_{\text{obs}}=\frac{\hat{p}_1-\hat{p}_2}{\sqrt{\frac{\hat{p}(1-\hat{p})}{n_1}+\frac{\hat{p}(1-\hat{p})}{n_2}}}=\frac{0,03}{0,0464}=0,645.\]
6. Conclusão: como $-1,96 \ \textless \ Z_{\text{obs}} = 0,645 \ \textless \ 1,96$ não se deve rejeitar a hipótese nula de igualdade entre as proporções com base nos dados amostrais obtidos. Assim, ao nível de significância de $5\%$, há evidências de que as taxas de aprovação sobre os serviços prestados pelos escritórios da empresa nas cidades $A$ e $B$ são iguais.
Veja a seguir os resultados obtidos pelo software Action.
![]() |
Para entender como executar essa função do Software Action, você pode consultar o manual do usuário. |
7. Vamos calcular o poder do teste em detectar a diferença entre as proporções $p_1 = 0,88$ e $p_2 = 0,85$. Para isto, utilizamos o software Action. Lançando os valores $n_1 = 100$, $n_2 = 120$, $p_1 = 0,88$, $p_2 = 0,85$, a um nível de significância $\alpha = 0,05$, nos é fornecido o poder $P = 0,099$.
O Poder é calculado a seguir: \[P=1-\Phi\left(z_{\alpha/2}-(2\arcsin(\sqrt{p_1})-2\arcsin(\sqrt{p_2}))\sqrt{\frac{n_1n_2}{n_1+n_2}}\right)+\]
\[\qquad\qquad+\Phi\left(-z_{\alpha/2}-(2(\arcsin(\sqrt{p_1})-2\arcsin(\sqrt{p_2}))\sqrt{\frac{n_1n_2}{n_1+n_2}}\right)=\]
\[=0,099522497\]
para o teste bilateral,
Os resultados calculados são dados na tabela a seguir.
![]() |
Para entender como executar essa função do Software Action, você pode consultar o manual do usuário. |
O Portal Action é mantido pela Estatcamp - Consultoria Estatística e Qualidade, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.