Skip to main content

5.9 - Teste para comparação de duas proporções

Consideremos $ X $ e $ Y $ variáveis aleatórias que representam determinada característica de duas populações com distribuição de Bernoulli com parâmetros $ p_1 $ e $ p_2 $ respectivamente.

Retiremos duas amostras aleatórias independentes, $ X_1,\ldots,X_{n_1} $ e $ Y_1,\ldots,Y_{n_2} $, dessas populações. Cada $ X_i $, $ i = 1,\ldots,n_1 $ e cada $ Y_j $, $ j = 1,\ldots,n_2 $, tem distribuição de Bernoulli com parâmetros $ p_1 $ e $ p_2 $ respectivamente, isto é,

\[X_1,\ldots,X_{n_1}\sim\hbox{Bernoulli}(p_1) \quad \text{e} \quad Y_1,\ldots,Y_{n_2}\sim\hbox{Bernoulli{(p_2)\]

com médias $ p_1 $ e $ p_2 $ e variâncias $ \sigma_1^2 = p_1(1-p_1) $ e $ \sigma_2^2 = p_2(1-p_2) $, respectivamente.

As variáveis $ \hat{p}_1 = \overline{X} $ e $ \hat{p}_2=\overline{Y} $ são estimadores de máxima verossimilhança para $ p_1 $ e $ p_2 $, respectivamente, e tem distribuição amostral aproximadamente normal:

\[\hat{p}_1\sim N\left(p_1,\frac{p_1(1-p_1)}{n_1}\right)\quad\text{e}\quad\hat{p}_2\sim N\left(p_2,\frac{p_2(1-p_2)}{n_2}\right).\]

Assim, temos que

\[\hat{p}_1-\hat{p}_2\sim N\left(p_1-p_2,\frac{p_1(1-p_1)}{n_1}+\frac{p_2(1-p_2)}{n_2}\right)\]

ou seja,

\[\frac{\hat{p}_1-\hat{p}_2-(p_1-p_2)}{\sqrt{\frac{p_1(1-p_1)}{n_1}+\frac{p_2(1-p_2)}{n_2}}}\sim N(0,1).\]

Para realizarmos o teste para duas proporções com aproximação Normal vamos considerar a hipótese nula $ p_1 = p_2 $. Assim, sob a hipótese nula, $ \hat{p}_1-\hat{p}_2 $ tem distribuição Normal com média $ \mu = 0 $ e desvio padrão

\[\sigma=\sqrt{\frac{p_1(1-p_1)}{n_1}+\frac{p_2(1-p_2)}{n_2}}=\sqrt{\frac{p(1-p)}{n_1}+\frac{p(1-p)}{n_2}}\]

onde $ p = p_1 = p_2 $.

Como não conhecemos o valor $ p $, vamos estimá-lo como uma média ponderada de $ \hat{p}_1 $ e $ \hat{p}_2 $:

\[\hat{p}=\frac{n_1\hat{p}_1+n_2\hat{p}_2}{n_1+n_2}\]

Este é o valor que será utilizado em lugar de $ p $ para o cálculo de $ \sigma $. Portanto, temos que

\[Z=\frac{\hat{p}_1-\hat{p}_2}{\sqrt{\frac{\hat{p}(1-\hat{p})}{n_1}+\frac{\hat{p}(1-\hat{p})}{n_2}}}\sim N(0,1)\]

Tendo essas informações, vejamos os passos padra se construir um teste de hipóteses para duas proporções:

1. Estabelecer alguma das hipóteses

\[\left\{\begin{array}{l}H_0:p_1=p_2\\H_1:p_1\neq p_2\end{array}\right. \quad \left\{\begin{array}{l}H_0:p_1=p_2\\H_1:p_1 \ \textgreater \ p_2\end{array}\right. \ \hbox{ou} \ \begin{array}{l}H_0:p_1=p_2\\H_1:p_1 \ \textless \ p_2\end{array}\right.\]

ou seja

\[\left\{\begin{array}{l}H_0:p_1-p_2=0\\H_1:p_1-p_2\neq0\end{array}\right. \quad \left\{\begin{array}{l}H_0:p_1-p_2=0\\H_1:p_1-p_2 \ \textgreater \ 0\end{array}\right. \ \hbox{ou} \ \left\{\begin{array}{l}H_0:p_1-p_2=0\\H_1:p_1-p_2 \ \textless \ 0\end{array}\right.\]

2. Fixar o nível de significância $ \alpha $.

3. Determinar a região crítica.

  • Se o teste é bilateral, devemos determinar os pontos críticos $ Z_{\alpha/2} $ e $ -Z_{\alpha/2} $ tais que $ \mathbb{P}[Z \ \textgreater \ Z_{\alpha/2}]=\mathbb{P}[Z \ \textless \ -Z_{\alpha/2}]=\alpha/2 $.

  • Se o teste é unilateral à direita, devemos determinar o ponto crítico $ Z_{\alpha} $ tal que $ \mathbb{P}[Z \ \textgreater \ Z_{\alpha}]=\alpha $.

  • Se o teste é unilateral à esquerda, determinamos o ponto crítico $ -Z_{\alpha} $ tal que $ \mathbb{P}[Z \ \textless \ -Z_{\alpha}]=\alpha $.

4. Calcular o valor de $ \hat{p} $.

5. Calcular, sob a hipótese nula, o valor

\[Z_{\text{obs}}=\frac{\hat{p}_1-\hat{p}_2}{\sqrt{\frac{\hat{p}(1-\hat{p})}{n_1}+\frac{\hat{p}(1-\hat{p})}{n_2}}}\]

6. Critérios:

  • Para o caso bilateral, se $ Z_{\text{obs}} \ \textgreater \ z_{\alpha/2} $ ou $ Z_{\text{obs}} \ \textless \ -z_{\alpha/2} $, rejeitamos $ H_0 $. Caso contrário, não rejeitamos $ H_0 $.
  • Para o caso unilateral à direita, se $ Z_{\text{obs}} \ \textgreater \ z_{\alpha} $, rejeitamos $ H_0 $. Caso contrário, não rejeitamos $ H_0 $.
  • Para o caso unilateral à esquerda, se $ Z_{\text{obs}} \ \textless \ -z_{\alpha} $, rejeitamos $ H_0 $. Caso contrário, não rejeitamos $ H_0 $.

7. Para calcular o poder necessário para que o teste de duas proporções detecte a diferença entre as proporções $ p_1 $ e $ p_2 $, utilizamos o software Action. O Action recebe como parâmetros o tamanho da primeira amostra ($ n_1 $), o tamanho da segunda amostra ($ n_2 $), as propoções ($ p_1 $) e ($ p_2 $), o valor do poder ($ P $) e o nível de significância ($ \alpha $). As fórmula utilizadas são dadas por

\[1-\Phi\left(z_{\alpha/2}-(2\arcsin(\sqrt{p_1})-2\arcsin(\sqrt{p_2}))\sqrt{\frac{n_1n_2}{n_1+n_2}}\right)+\]

\[\qquad\qquad+\Phi\left(-z_{\alpha/2}-(2\arcsin(\sqrt{p_1})-2\arcsin(\sqrt{p_2}))\sqrt{\frac{n_1n_2}{n_1+n_2}}\right)\]

para o teste bilateral,

\[\Phi\left(-z_{\alpha}-(2\arcsin(\sqrt{p_1})-2\arcsin(\sqrt{p_2}))\sqrt{\frac{n_1n_2}{n_1+n_2}}\right)\]

para o teste unilateral à esquerda e

\[1-\Phi\left(z_{\alpha}-(2\arcsin(\sqrt{p_1})-2\arcsin(\sqrt{p_2}))\sqrt{\frac{n_1n_2}{n_1+n_2}}\right)\]

para o teste unilateral à direita.

Já para o cálculo do tamanho das amostras necessárias para que o teste detecte uma diferença entre as proporções $ p_1 $ e $ p_2 $, com determinado poder, basta lançarmos os valores das proporções $ p_1 $ e $ p_2 $, do poder $ P $ e do nível de significância $ \alpha $. Com isso, o Action nos fornece o valor dos tamanhos das amostras. As fórmulas utilizadas seguem das acima, isolando $ n $ em funções dos demais parâmetros.

Exemplo 5.9.1: Uma empresa que presta serviços de assessoria econômica a outras empresas está interessada em comparar a taxa de reclamações sobre os seus serviços em dois dos seus escritórios em duas cidades diferentes. Suponha que a empresa tenha selecionado aleatoriamente $ 100 $ serviços realizados pelo escritório da cidade $ A $ e foi constatado que em $ 12 $ deles houve algum tipo de reclamação. Já do escritório da cidade B foram selecionados $ 120 $ serviços e $ 18 $ receberam algum tipo de reclamação. A empresa deseja saber se estes resultados são suficientes para se concluir que os dois escritórios apresentam diferençaa significativa entre suas taxas de reclamações.

clique aqui para efetuar o download dos dados utilizados nesse exemplo

Primeiramente, vejamos que as proporções amostrais de reclamações sobre os seviços dos escritórios das cidades $ A $ e $ B $ são, respectivamente, $ \hat{p}_1 = 0,88 $ e $ \hat{p}_2 = 0,85 $.

1. Queremos testar as seguintes hipóteses:

\[\left\{\begin{array}{l}H_0:p_1=p_2\\H_1:p_1\neq p_2\end{array}\right.\]

ou seja

\[\left\{\begin{array}{l}H_0:p_1-p_2=0\\H_1:p_1-p_2\neq 0\end{array}\right.\]

2. Fixemos o nível de significância $ \alpha = 0,05 $.

3. Como $ \alpha = 0,05 $, temos que $ -z_{\alpha/2} = -1,96 $ e $ z_{\alpha/2} = 1,96 $.

4. Como $ n_1 = 100 $, $ n_2 = 120 $, $ \hat{p}_1 = 0,88 $ e $ \hat{p}_2 = 0,85 $, temos que

\[\hat{p}=\frac{n_1\hat{p}_1+n_2\hat{p}_2}{n_1+n_2}=\frac{100\times 0,88+120\times 0,85}{220}=\frac{190}{220}=0,864.\]

5. Assim temos, sob a hipótese nula, que

\[Z_{\text{obs}}=\frac{\hat{p}_1-\hat{p}_2}{\sqrt{\frac{\hat{p}(1-\hat{p})}{n_1}+\frac{\hat{p}(1-\hat{p})}{n_2}}}=\frac{0,03}{0,0464}=0,645.\]

6. Conclusão: como $ -1,96 \ \textless \ Z_{\text{obs}} = 0,645 \ \textless \ 1,96 $ não se deve rejeitar a hipótese nula de igualdade entre as proporções com base nos dados amostrais obtidos. Assim, ao nível de significância de $ 5\% $, há evidências de que as taxas de reclamações sobre os serviços prestados pelos escritórios da empresa nas cidades $ A $ e $ B $ são iguais.

Veja a seguir os resultados obtidos pelo software Action.


 

Para entender como executar essa função do Software Action, você pode consultar o manual do usuário.

 

7. Vamos calcular o poder do teste em detectar a diferença entre as proporções $ p_1 = 0,88 $ e $ p_2 = 0,75 $. Para isto, utilizamos o software Action. Lançando os valores $ n_1 = 100 $, $ n_2 = 120 $, $ p_1 = 0,88 $, $ p_2 = 0,75 $, a um nível de significância $ \alpha = 0,05 $, nos é fornecido o poder $ P = 0,7085 $.

O Poder é calculado a seguir:

\[P=1-\Phi\left(z_{\alpha/2}-(2\arcsin(\sqrt{p_1})-2\arcsin(\sqrt{p_2}))\sqrt{\frac{n_1n_2}{n_1+n_2}}\right)+\]

\[\qquad\qquad+\Phi\left(-z_{\alpha/2}-(2(\arcsin(\sqrt{p_1})-2\arcsin(\sqrt{p_2}))\sqrt{\frac{n_1n_2}{n_1+n_2}}\right)=\]

\[=1-0,2915052+0,000004=0,708498697\]

para o teste bilateral,

Os resultados calculados são dados na tabela a seguir.


 

Para entender como executar essa função do Software Action, você pode consultar o manual do usuário.