5.9 - Teste para comparação de duas proporções

Você está aqui

Consideremos $X$ e $Y$ variáveis aleatórias que representam determinada característica de duas populações com distribuição de Bernoulli com parâmetros $p_1$ e $p_2$ respectivamente.

Retiremos duas amostras aleatórias independentes, $X_1,\ldots,X_{n_1}$ e $Y_1,\ldots,Y_{n_2}$, dessas populações. Cada $X_i$, $i = 1,\ldots,n_1$ e cada $Y_j$, $j = 1,\ldots,n_2$, tem distribuição de Bernoulli com parâmetros $p_1$ e $p_2$ respectivamente, isto é, \[X_1,\ldots,X_{n_1}\sim\hbox{Bernoulli}(p_1) \quad \text{e} \quad Y_1,\ldots,Y_{n_2}\sim\hbox{Bernoulli{(p_2)\]

com médias $p_1$ e $p_2$ e variâncias $\sigma_1^2 = p_1(1-p_1)$ e $\sigma_2^2 = p_2(1-p_2)$, respectivamente.

As variáveis $\hat{p}_1 = \overline{X}$ e $\hat{p}_2=\overline{Y}$ são estimadores de máxima verossimilhança para $p_1$ e $p_2$, respectivamente, e tem distribuição amostral aproximadamente normal: \[\hat{p}_1\sim N\left(p_1,\frac{p_1(1-p_1)}{n_1}\right)\quad\text{e}\quad\hat{p}_2\sim N\left(p_2,\frac{p_2(1-p_2)}{n_2}\right).\]

Assim, temos que \[\hat{p}_1-\hat{p}_2\sim N\left(p_1-p_2,\frac{p_1(1-p_1)}{n_1}+\frac{p_2(1-p_2)}{n_2}\right)\]

ou seja, \[\frac{\hat{p}_1-\hat{p}_2-(p_1-p_2)}{\sqrt{\frac{p_1(1-p_1)}{n_1}+\frac{p_2(1-p_2)}{n_2}}}\sim N(0,1).\]

Para realizarmos o teste para duas proporções com aproximação Normal vamos considerar a hipótese nula $p_1 = p_2$. Assim, sob a hipótese nula, $\hat{p}_1-\hat{p}_2$ tem distribuição Normal com média $\mu = 0$ e desvio padrão \[\sigma=\sqrt{\frac{p_1(1-p_1)}{n_1}+\frac{p_2(1-p_2)}{n_2}}=\sqrt{\frac{p(1-p)}{n_1}+\frac{p(1-p)}{n_2}}\]

onde $p = p_1 = p_2$.

Como não conhecemos o valor $p$, vamos estimá-lo como uma média ponderada de $\hat{p}_1$ e $\hat{p}_2$: \[\hat{p}=\frac{n_1\hat{p}_1+n_2\hat{p}_2}{n_1+n_2}\]

Este é o valor que será utilizado em lugar de $p$ para o cálculo de $\sigma$. Portanto, temos que \[Z=\frac{\hat{p}_1-\hat{p}_2}{\sqrt{\frac{\hat{p}(1-\hat{p})}{n_1}+\frac{\hat{p}(1-\hat{p})}{n_2}}}\sim N(0,1)\]

Tendo essas informações, vejamos os passos padra se construir um teste de hipóteses para duas proporções:

1. Estabelecer alguma das hipóteses \[\left\{\begin{array}{l}H_0:p_1=p_2\\H_1:p_1\neq p_2\end{array}\right. \quad \left\{\begin{array}{l}H_0:p_1=p_2\\H_1:p_1 \ \textgreater \ p_2\end{array}\right. \ \hbox{ou} \ \begin{array}{l}H_0:p_1=p_2\\H_1:p_1 \ \textless \ p_2\end{array}\right.\]

ou seja \[\left\{\begin{array}{l}H_0:p_1-p_2=0\\H_1:p_1-p_2\neq0\end{array}\right. \quad \left\{\begin{array}{l}H_0:p_1-p_2=0\\H_1:p_1-p_2 \ \textgreater \ 0\end{array}\right. \ \hbox{ou} \ \left\{\begin{array}{l}H_0:p_1-p_2=0\\H_1:p_1-p_2 \ \textless \ 0\end{array}\right.\]

2. Fixar o nível de significância $\alpha$.

3. Determinar a região crítica.

  • Se o teste é bilateral, devemos determinar os pontos críticos $Z_{\alpha/2}$ e $-Z_{\alpha/2}$ tais que $\mathbb{P}[Z \ \textgreater \ Z_{\alpha/2}]=\mathbb{P}[Z \ \textless \ -Z_{\alpha/2}]=\alpha/2$.

  • Se o teste é unilateral à direita, devemos determinar o ponto crítico $Z_{\alpha}$ tal que $\mathbb{P}[Z \ \textgreater \ Z_{\alpha}]=\alpha$.

  • Se o teste é unilateral à esquerda, determinamos o ponto crítico $-Z_{\alpha}$ tal que $\mathbb{P}[Z \ \textless \ -Z_{\alpha}]=\alpha$.

4. Calcular o valor de $\hat{p}$.

5. Calcular, sob a hipótese nula, o valor \[Z_{\text{obs}}=\frac{\hat{p}_1-\hat{p}_2}{\sqrt{\frac{\hat{p}(1-\hat{p})}{n_1}+\frac{\hat{p}(1-\hat{p})}{n_2}}}\]

6. Critérios:

  • Para o caso bilateral, se $Z_{\text{obs}} \ \textgreater \ z_{\alpha/2}$ ou $Z_{\text{obs}} \ \textless \ -z_{\alpha/2}$, rejeitamos $H_0$. Caso contrário, não rejeitamos $H_0$.
  • Para o caso unilateral à direita, se $Z_{\text{obs}} \ \textgreater \ z_{\alpha}$, rejeitamos $H_0$. Caso contrário, não rejeitamos $H_0$.
  • Para o caso unilateral à esquerda, se $Z_{\text{obs}} \ \textless \ -z_{\alpha}$, rejeitamos $H_0$. Caso contrário, não rejeitamos $H_0$.

7. Para calcular o poder necessário para que o teste de duas proporções detecte a diferença entre as proporções $p_1$ e $p_2$, utilizamos o software Action. O Action recebe como parâmetros o tamanho da primeira amostra ($n_1$), o tamanho da segunda amostra ($n_2$), as propoções ($p_1$) e ($p_2$), o valor do poder ($P$) e o nível de significância ($\alpha$). As fórmula utilizadas são dadas por \[1-\Phi\left(z_{\alpha/2}-(2\arcsin(\sqrt{p_1})-2\arcsin(\sqrt{p_2}))\sqrt{\frac{n_1n_2}{n_1+n_2}}\right)+\]

\[\qquad\qquad+\Phi\left(-z_{\alpha/2}-(2\arcsin(\sqrt{p_1})-2\arcsin(\sqrt{p_2}))\sqrt{\frac{n_1n_2}{n_1+n_2}}\right)\]

para o teste bilateral, \[\Phi\left(-z_{\alpha}-(2\arcsin(\sqrt{p_1})-2\arcsin(\sqrt{p_2}))\sqrt{\frac{n_1n_2}{n_1+n_2}}\right)\]

para o teste unilateral à esquerda e \[1-\Phi\left(z_{\alpha}-(2\arcsin(\sqrt{p_1})-2\arcsin(\sqrt{p_2}))\sqrt{\frac{n_1n_2}{n_1+n_2}}\right)\]

para o teste unilateral à direita.

Já para o cálculo do tamanho das amostras necessárias para que o teste detecte uma diferença entre as proporções $p_1$ e $p_2$, com determinado poder, basta lançarmos os valores das proporções $p_1$ e $p_2$, do poder $P$ e do nível de significância $\alpha$. Com isso, o Action nos fornece o valor dos tamanhos das amostras. As fórmulas utilizadas seguem das acima, isolando $n$ em funções dos demais parâmetros.

Exemplo 5.9.1:

Uma empresa que presta serviços de assessoria econômica a outras empresas está interessada em comparar a taxa de reclamações sobre os seus serviços em dois dos seus escritórios em duas cidades diferentes. Suponha que a empresa tenha selecionado aleatoriamente $100$ serviços realizados pelo escritório da cidade $A$ e foi constatado que em $12$ deles houve algum tipo de reclamação. Já do escritório da cidade B foram selecionados $120$ serviços e $18$ receberam algum tipo de reclamação. A empresa deseja saber se estes resultados são suficientes para se concluir que os dois escritórios apresentam diferença significativa entre suas taxas de aprovação.

clique aqui para efetuar o download dos dados utilizados nesse exemplo

Primeiramente, vejamos que as proporções amostrais de aprovação sobre os serviços dos escritórios das cidades $A$ e $B$ são, respectivamente, $\hat{p}_1 = 0,88$ e $\hat{p}_2 = 0,85$.

1. Queremos testar as seguintes hipóteses: \[\left\{\begin{array}{l}H_0:p_1=p_2\\H_1:p_1\neq p_2\end{array}\right.\]

ou seja \[\left\{\begin{array}{l}H_0:p_1-p_2=0\\H_1:p_1-p_2\neq 0\end{array}\right.\]

2. Fixemos o nível de significância $\alpha = 0,05$.

3. Como $\alpha = 0,05$, temos que $-z_{\alpha/2} = -1,96$ e $z_{\alpha/2} = 1,96$.

4. Como $n_1 = 100$, $n_2 = 120$, $\hat{p}_1 = 0,88$ e $\hat{p}_2 = 0,85$, temos que \[\hat{p}=\frac{n_1\hat{p}_1+n_2\hat{p}_2}{n_1+n_2}=\frac{100\times 0,88+120\times 0,85}{220}=\frac{190}{220}=0,864.\]

5. Assim temos, sob a hipótese nula, que \[Z_{\text{obs}}=\frac{\hat{p}_1-\hat{p}_2}{\sqrt{\frac{\hat{p}(1-\hat{p})}{n_1}+\frac{\hat{p}(1-\hat{p})}{n_2}}}=\frac{0,03}{0,0464}=0,645.\]

6. Conclusão: como $-1,96 \ \textless \ Z_{\text{obs}} = 0,645 \ \textless \ 1,96$ não se deve rejeitar a hipótese nula de igualdade entre as proporções com base nos dados amostrais obtidos. Assim, ao nível de significância de $5\%$, há evidências de que as taxas de aprovação sobre os serviços prestados pelos escritórios da empresa nas cidades $A$ e $B$ são iguais.

Veja a seguir os resultados obtidos pelo software Action.

Para entender como executar essa função do Software Action, você pode consultar o manual do usuário.

7. Vamos calcular o poder do teste em detectar a diferença entre as proporções $p_1 = 0,88$ e $p_2 = 0,85$. Para isto, utilizamos o software Action. Lançando os valores $n_1 = 100$, $n_2 = 120$, $p_1 = 0,88$, $p_2 = 0,85$, a um nível de significância $\alpha = 0,05$, nos é fornecido o poder $P = 0,099$.

O Poder é calculado a seguir\[P=1-\Phi\left(z_{\alpha/2}-(2\arcsin(\sqrt{p_1})-2\arcsin(\sqrt{p_2}))\sqrt{\frac{n_1n_2}{n_1+n_2}}\right)+\]

\[\qquad\qquad+\Phi\left(-z_{\alpha/2}-(2(\arcsin(\sqrt{p_1})-2\arcsin(\sqrt{p_2}))\sqrt{\frac{n_1n_2}{n_1+n_2}}\right)=\]

\[=0,099522497\]

para o teste bilateral,

Os resultados calculados são dados na tabela a seguir.

Para entender como executar essa função do Software Action, você pode consultar o manual do usuário.

Inferência

Sobre o Portal Action

O Portal Action é mantido pela Estatcamp - Consultoria Estatística e Qualidade, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.

Facebook

CONTATO

  •  Maestro Joao Seppe, 900, São Carlos - SP | CEP 13561-180
  • Telefone: (16) 3376-2047
  • E-Mail: [email protected]