Skip to main content

5.9 - Teste para comparação de duas proporções

Consideremos X e Y variáveis aleatórias que representam determinada característica de duas populações com distribuição de Bernoulli com parâmetros p1 e p2 respectivamente.

Retiremos duas amostras aleatórias independentes, X1, ..., Xn1 e Y1, ..., Yn2 , dessas populações. Cada Xi, i = 1, ..., n1, e cada Yj , j = 1, ..., n2, tem distribuição de Bernoulli com parâmetros p1 e p2 respectivamente, isto é,

\[X_1,\ldots,X_{n_1}\sim\hbox{Bernoulli}(p_1) \quad \text{e} \quad Y_1,\ldots,Y_{n_2}\sim\hbox{Bernoulli{(p_2)\]

com médias p1 e p2 e variâncias σ12 = p1(1-p1) e σ22 = p2(1-p2), respectivamente.

As variáveis $ \hat{p}_1 = \overline{X} $ e $ \hat{p}_2=\overline{Y} $ são estimadores de máxima verossimilhança para p1 e p2, respectivamente, e tem distribuição amostral aproximadamente normal:

\[\hat{p}_1\sim N\left(p_1,\frac{p_1(1-p_1)}{n_1}\right)\quad\text{e}\quad\hat{p}_2\sim N\left(p_2,\frac{p_2(1-p_2)}{n_2}\right).\]

Assim, temos que

\[\hat{p}_1-\hat{p}_2\sim N\left(p_1-p_2,\frac{p_1(1-p_1)}{n_1}+\frac{p_2(1-p_2)}{n_2}\right)\]

ou seja,

\[\frac{\hat{p}_1-\hat{p}_2-(p_1-p_2)}{\sqrt{\frac{p_1(1-p_1)}{n_1}+\frac{p_2(1-p_2)}{n_2}}}\sim N(0,1).\]

Para realizarmos o teste para duas proporções com aproximação Normal vamos considerar a hipótese nula p1 = p2. Assim, sob a hipótese nula, $ \hat{p}_1-\hat{p}_2 $ tem distribuição Normal com média μ = 0 e desvio padrão

\[\sigma=\sqrt{\frac{p_1(1-p_1)}{n_1}+\frac{p_2(1-p_2)}{n_2}}=\sqrt{\frac{p(1-p)}{n_1}+\frac{p(1-p)}{n_2}}\]

onde p = p1 = p2.

Como não conhecemos o valor p, vamos estimá-lo como uma média ponderada de $ \hat{p}_1 $ e $ \hat{p}_2 $:

\[\hat{p}=\frac{n_1\hat{p}_1+n_2\hat{p}_2}{n_1+n_2}\]

Este é o valor que será utilizado em lugar de p para o cálculo de σ. Portanto, temos que

\[Z=\frac{\hat{p}_1-\hat{p}_2}{\sqrt{\frac{\hat{p}(1-\hat{p})}{n_1}+\frac{\hat{p}(1-\hat{p})}{n_2}}}\sim N(0,1)\]

Tendo essas informações, vejamos os passos padra se construir um teste de hipóteses para duas proporções:

1. Estabelecer alguma das hipóteses

\[\left\{\begin{array}{l}H_0:p_1=p_2\\H_1:p_1\neq p_2\end{array}\right. \quad \left\{\begin{array}{l}H_0:p_1=p_2\\H_1:p_1 \ \textgreater \ p_2\end{array}\right. \ \hbox{ou} \ \begin{array}{l}H_0:p_1=p_2\\H_1:p_1 \ \textless \ p_2\end{array}\right.\]

ou seja

\[\left\{\begin{array}{l}H_0:p_1-p_2=0\\H_1:p_1-p_2\neq0\end{array}\right. \quad \left\{\begin{array}{l}H_0:p_1-p_2=0\\H_1:p_1-p_2 \ \textgreater \ 0\end{array}\right. \ \hbox{ou} \ \left\{\begin{array}{l}H_0:p_1-p_2=0\\H_1:p_1-p_2 \ \textless \ 0\end{array}\right.\]

2. Fixar o nível de significância α.

3. Determinar a região crítica.

  • Se o teste é bilateral, devemos determinar os pontos críticos $ Z_{\alpha/2} $ e $ -Z_{\alpha/2} $ tais que $ P[Z \ \textgreater \ Z_{\alpha/2}]=P[Z \ \textless \ -Z_{\alpha/2}]=\alpha/2 $.

  • Se o teste é unilateral à direita, devemos determinar o ponto crítico $ Z_{\alpha} $ tal que $ P[Z \ \textgreater \ Z_{\alpha}]=\alpha $.

  • Se o teste é unilateral à esquerda, determinamos o ponto crítico $ -Z_{\alpha} $ tal que $ P[Z \ \textless \ -Z_{\alpha}]=\alpha $.

4. Calcular o valor de $ \hat{p} $.

5. Calcular, sob a hipótese nula, o valor

\[Z_{obs}=\frac{\hat{p}_1-\hat{p}_2}{\sqrt{\frac{\hat{p}(1-\hat{p})}{n_1}+\frac{\hat{p}(1-\hat{p})}{n_2}}}\]

6. Critérios:

  • Para o caso bilateral, se $ Z_{obs} \ \textgreater \ z_{\alpha/2} $ ou $ Z_{obs} \ \textless \ -z_{\alpha/2} $, rejeita-se H0. Caso contrário, aceita-se H0.
  • Para o caso unilateral à direita, se $ Z_{obs} \ \textgreater \ z_{\alpha} $, rejeita-se H0. Caso contrário, aceita-se H0.
  • Para o caso unilateral à esquerda, se $ Z_{obs} \ \textless \ -z_{\alpha} $, rejeita-se H0. Caso contrário, aceita-se H0.

7. Para calcular o poder necessário para que o teste de duas proporções detecte a diferença entre as proporções p1 e p2, utilizamos o software Action. O Action recebe como parâmetros o tamanho da primeira amostra (n1), o tamanho da segunda amostra (n2), as propoções (p1) e (p2), o valor do poder (P) e o nível de significância (α). As fórmula utilizadas são dadas por

\[1-\Phi\left(z_{\alpha/2}-(2\arcsin(\sqrt{p_1})-2\arcsin(\sqrt{p_2}))\sqrt{\frac{n_1n_2}{n_1+n_2}}\right)+\]

\[\qquad\qquad+\Phi\left(-z_{\alpha/2}-(2\arcsin(\sqrt{p_1})-2\arcsin(\sqrt{p_2}))\sqrt{\frac{n_1n_2}{n_1+n_2}}\right)\]

para o teste bilateral,

\[\Phi\left(-z_{\alpha}-(2\arcsin(\sqrt{p_1})-2\arcsin(\sqrt{p_2}))\sqrt{\frac{n_1n_2}{n_1+n_2}}\right)\]

para o teste unilateral à esquerda e

\[1-\Phi\left(z_{\alpha}-(2\arcsin(\sqrt{p_1})-2\arcsin(\sqrt{p_2}))\sqrt{\frac{n_1n_2}{n_1+n_2}}\right)\]

para o teste unilateral à direita.

Já para o cálculo do tamanho das amostras necessárias para que o teste detecte uma diferença entre as proporções p1 e p2, com determinado poder, basta lançarmos os valores das proporções p1 e p2, do poder P e do nível de significância α. Com isso, o Action nos fornece o valor dos tamanhos das amostras. As fórmulas utilizadas seguem das acima, isolando n em funções dos demais parâmetros.

Exemplo 5.9.1: Uma empresa que presta serviços de assessoria econômica a outras empresas está interessada em comparar a taxa de reclamações sobre os seus serviços em dois dos seus escritórios em duas cidades diferentes. Suponha que a empresa tenha selecionado aleatoriamente 100 serviços realizados pelo escritório da cidade A e foi constatado que em 12 deles houve algum tipo de reclamação. Já do escritório da cidade B foram selecionados 120 serviços e 18 receberam algum tipo de reclamação. A empresa deseja saber se estes resultados são suficientes para se concluir que os dois escritórios apresentam diferençaa significativa entre suas taxas de reclamações.

clique aqui para efetuar o download dos dados utilizados nesse exemplo

Primeiramente, vejamos que as proporções amostrais de reclamações sobre os seviços dos escritórios das cidades A e B são, respectivamente, $ \hat{p}_1 $ = 0,88 e $ \hat{p}_2 $ = 0,85.

1. Queremos testar as seguintes hipóteses:

\[\left\{\begin{array}{l}H_0:p_1=p_2\\H_1:p_1\neq p_2\end{array}\right.\]

ou seja

\[\left\{\begin{array}{l}H_0:p_1-p_2=0\\H_1:p_1-p_2\neq 0\end{array}\right.\]

2. Fixemos o nível de significância α em 5%.

3. Como α = 0,05, temos que $ -z_{\alpha/2} $ = -1,96 e $ z_{\alpha/2} $ = 1,96.

4. Como n1 = 100, n2 = 120, $ \hat{p}_1 $ = 0,88 e $ \hat{p}_2 $ = 0,85, temos que

\[\hat{p}=\frac{n_1\hat{p}_1+n_2\hat{p}_2}{n_1+n_2}=\frac{100\times 0,88+120\times 0,85}{220}=\frac{190}{220}=0,864.\]

5. Assim temos, sob a hipótese nula, que

\[Z_{obs}=\frac{\hat{p}_1-\hat{p}-2}{\sqrt{\frac{\hat{p}(1-\hat{p})}{n_1}+\frac{\hat{p}(1-\hat{p})}{n_2}}}=\frac{0,03}{0,0464}=0,645.\]

6. Conclusão: como -1,96 < Zobs = 0,645 < 1,96 não se deve rejeitar a hipótese nula de igualdade entre as proporções com base nos dados amostrais obtidos. Assim, ao nível de significância de 5%, há evidências de que as taxas de reclamações sobre os serviços prestados pelos escritórios da empresa nas cidades A e B são iguais.

Veja a seguir os resultados obtidos pelo software Action.


 

Para entender como executar essa função do Software Action, você pode consultar o manual do usuário.

 

7. Vamos calcular o poder do teste em detectar a diferença entre as proporções p1 = 0,88 e p2 = 0,75. Para isto, utilizamos o software Action. Lançando os valores n1 = 100, n2 = 120, p1 0,88, p2 = 0,75, a um nível de significância α = 0,05, nos é fornecido o poder P = 0,7085.

O Poder é calculado a seguir:

$$\beta=1-\Phi\left(z_{\alpha/2}-(2\arcsin(\sqrt{p_1})-2\arcsin(\sqrt{p_2}))\sqrt{\frac{n_1n_2}{n_1+n_2}}\right)+$$

$$\qquad\qquad+\Phi\left(-z_{\alpha/2}-(2(\arcsin(\sqrt{p_1})-2\arcsin(\sqrt{p_2}))\sqrt{\frac{n_1n_2}{n_1+n_2}}\right)=$$

$$=1-0,059752197+0,3512535=0,708498697$$

para o teste bilateral,

Os resultados calculados são dados na tabela a seguir.


 

Para entender como executar essa função do Software Action, você pode consultar o manual do usuário.