5.3.2 - Teste qui-quadrado de Pearson

Você está aqui

Aproximação Normal

Este é outro tipo de teste assintótico para uma proporção. Consideremos, como no caso anterior, uma amostra aleatória simples $X_1,\ldots,X_n$ onde cada $X_i$, com $i = 1,\ldots,n$, tem distribuição de $\text{Bernoulli}(p)$, isto é, \[X_1,\ldots,X_n\sim \hbox{Bernoulli(p)}.\]

Se $n$ é suficientemente grande, a estatística de Pearson, dada por \[Q^2=\sum_{j=1}^2\frac{(O_j-E_j)^2}{E_j}\sim\chi_1^2\]

tem aproximadamente distribuição qui-quadrado com 1 grau de liberdade, no qual $O_1$ é o número de sucessos e $E_1=np$ é a frequência esperada relativa ao número de sucessos, $O_2=n-O_1$ e $E_2 = n(1-p)$, onde $n = O_1+O_2$ é o tamanho da amostra.

Lembramos que uma distribuição qui-quadrado com 1 grau de liberdade é igual a uma distribuição normal padronizada ao quadrado, ou seja, se $Z \sim N(0,1)$, então \[\chi_1^2 = Z^2.\]

Neste caso, se $y$ é tal que $\mathbb{P}[\chi_1^2 \ \textgreater \ y] = \alpha$, então como $\chi_1^2 = Z^2$, temos que \[\mathbb{P}[\chi_1^2 \ \textgreater \ y]=\mathbb{P}[Z^2 \ \textgreater \ y]=\mathbb{P}[Z \ \textless \ -\sqrt{y}] + \mathbb{P}[Z \ \textgreater \ \sqrt{y}],\]

ou seja, \[\mathbb{P}[Z \ \textless \ -\sqrt{y}]+\mathbb{P}[Z \ \textgreater \ \sqrt{y}]=\alpha.\]

Desta forma, podemos realizar o teste utilizando a distribuição normal padrão ao invés da qui-quadrado, o que é mais vantajoso, já que podemos considerar a sua simetria.

Vamos ver os passos para realizar o teste Qui-Quadrado de Pearson.

1. Estabelecer as hipóteses \[\left\{\begin{array}{l}H_0: p = p_0\\H_1: p\neq p_0\end{array}\right\]

se o teste for bilateral, \[\left\{\begin{array}{l}H_0: p = p_0\\H_1: p \ \textgreater \ p_0\end{array}\right\]

se o teste é unilateral à direita ou \[\left\{\begin{array}{l}H_0: p = p_0\\H_1: p \ \textless \ p_0\end{array}\right\]

se o teste é unilateral à esquerda

2. Fixar o nível de significância $\apha$.

3. Determinar a região crítica.

  • Teste bilateral.

Se o teste é bilateral, devemos encontrar um ponto crítico da distribuição $\chi_1^2$, baseado nos pontos críticos da distribuição normal padrão $Z$. Os pontos críticos da distribuição normal padrão são $-Z_{\alpha/2}$ e $Z_{\alpha/2}$.

Como $Z^2 = \chi_1^2$, temos que \[\alpha=\mathbb{P}[Z \ \textless \ -Z_{\alpha/2}]+\mathbb{P}[Z \ \textgreater \ Z_{\alpha/2}]=\mathbb{P}[Z^2 \ \textgreater \ Z_{\alpha/2}^2]=P[\chi_1^2 \ \textgreater \ Z_{\alpha/2}^2].\]

Portanto, o ponto crítico da distribuição qui-quadrado com um grau de liberdade é $Z_{\alpha/2}^2$.

  • Testes unilaterais.

Se o teste é unilateral à direita ou a esquerda, devemos determinar o ponto crítico da distribuição $\chi_1^2$ baseado nos pontos críticos da distribuição normal padrão $Z$. Os pontos críticos para a distribuição normal $Z$ são dados por $-Z_{\alpha}$ para o teste unilateral à esquerda ou $Z_{\alpha}$ para o teste unilateral à direita.

Para o caso unilateral à esquerda, como $Z^2 = \chi_1^2$, temos que \[Z \ \textless \ -Z_{\alpha} \Rightarrow |Z| \ \textgreater \ Z_{\alpha} \Rightarrow Z^2 \ \textgreater \ Z_{\alpha}^2 \ \Rightarrow \chi_1^2 \ \textgreater \ Z_{\alpha}^2\]

e, no caso unilateral á direita, temos que \[Z \ \textgreater \ Z_{\alpha} \ \Rightarrow Z^2 \ \textgreater \ Z_{\alpha}^2 \ \Rightarrow \chi_1^2 \ \textgreater \ Z_{\alpha}^2\]

Portanto, o ponto crítico da distribuição qui-quadrado com um grau de liberdade é $Z_{\alpha}^2$. Podemos observar também que  \[\mathbb{P}[\chi_1^2 \ \textgreater \ Z_{\alpha}^2]=\mathbb{P}(Z \ \textgreater \ Z_{\alpha}]+\mathbb{P}[Z \ \textless \ -Z_{\alpha}] = 2\alpha.\]

4. Calcular, sob a hipótese nula, a estatística de Pearson \[Q^2_{\text{obs}}=\sum_{j=1}^2\frac{(O_j-E_j)^2}{E_j}.\]

5. Critério

  • Se o teste é bilateral e $Q^2_{\text{obs}}\geq Z_{\alpha/2}^2$, rejeitamos $H_0$. Caso contrário, não rejeitamos $H_0$.
  • Se o teste é unilateral à esquerda temos duas possibilidades:
  1. Se $O_1\leq E_1$ e $Q^2_{\text{obs}}\geq Z_{\alpha}^2$ rejeitamos $H_0$, caso contrário, não rejeitamos $H_0$.
  2. Se $O_1 \ \textgreater \ E_1$ não rejeitamos $H_0$ qualquer que seja o valor de $Q^2_{\text{obs}}$.
  •  Se o teste é unilateral à direita também temos duas possibilidades:
  1. Se $O_1 \ \textless \ E_1$ então não rejeitamos $H_0$, qualquer que seja o valor de $Q^2_{\text{obs}}$.
  2. Se $O_1 \geq E_1$ e $Q^2_{\text{obs}}\geq Z_{\alpha}^2$ rejeitamos $H_0$, caso contrário, não rejeitamos $H_0$.

6. O p-valor é determinado por \[\text{p-valor} \ = \mathbb{P}\left[\chi_1^2 \ \textgreater \ Q^2_{\text{obs}}|H_0\right]\]

se o teste é bilateral, \[\text{p-valor} \ = \left\{\begin{array}{l}\dfrac{1-P\left[\chi_1^2 \ \textless Q^2_{\text{obs}}\right]}{2} \ \hbox{se} \ O_1\leq np\\ \dfrac{1+P\left[\chi_1^2 \ \textless Q^2_{\text{obs}}\right]}{2} \ \hbox{se} \ O_1 \ \textgreater \ np\]

se o teste é unilateral à esquerda ou  \[\text{p-valor} \ = \left\{\begin{array}{l}\dfrac{1+P\left[\chi_1^2 \ \textless Q^2_{\text{obs}}\right]}{2} \ \hbox{se} \ O_1\leq np\\ \dfrac{1-P\left[\chi_1^2 \ \textless Q^2_{\text{obs}}\right]}{2} \ \hbox{se} \ O_1 \ \textgreater \ np}\]

se o teste é unilateral à direita.

Podemos calcular o poder do teste ou o tamanho amostral necessário para se obter determinado poder utilizando o Action. Os parâmetros utilizados pelo Action são o tamanho da amostra ($n$), as proporções ($p_0$) da hipótese nula e ($p$) da hipótese alternativa, os graus de liberdade ($df$), o valor do poder ($P$) e o nível de significância ($\alpha$). Para o cálculo do poder, a fórmula utilizada é \[\text{Poder} = \Gamma(\chi_{\alpha})\]

tal que $\Gamma$ é a função densidade acumulada da distribuição qui-quadrado não-central com $df$ graus de liberdade e parâmetro de não centralidade $\varphi$ dado por \[\varphi=n\sum_{i=1}^2\frac{(p_{1i}-p_{0i})^2}{p_{0i}}\]

onde $p_{0i}$ são as probabilidades sob a hipótese nula e $p_{1i}$ as probabilidades sob a hipótese alternativa, satisfazendo \[\sum_{i=1}^2p_{0i}=1 \quad \hbox{e} \quad \sum_{i=1}^2p_{1i}=1.\]

Exemplo 5.3.2.1:

Resolver o Exemplo 5.3.1.1 utilizando o teste qui-quadrado de Pearson.

clique aqui para efetuar o download dos dados utilizados nesse exemplo

1. Estabelecemos as hipóteses \[\left\{\begin{array}{l}H_0: p = 0,9\\H_1: p \ \textless \ 0,9\end{array}\right.\]

2. Fixamos o nível de significância $\alpha = 0,05$.

3. Como $\alpha = 0,05$, $-Z_{\allpha} = -1,6448$. Desta forma, temos que $(-Z_{\alpha})^2 = 2,7055$.

4. Temos que $O_1 = 175$ e, sob a hipótese nula, $p_0 = 0,9$. Logo $E_1 = 0,9 \times 200 = 180$. Além disso, $O_2 = 25$ e $E_2 = 0,1\times 200 = 20$. Assim, \[Q_{\text{obs}}^2=\frac{(175-180)^2}{180}+\frac{(25-20)^2}{20}=1,3889.\]

5. Conclusão: como $O_1 \leq E_1$ e $Q^2_{\text{obs}} = 1,3889 \ \textless 2,7055$ não rejeitamos $H_0$. Portanto, temos evidências de que a afirmação do fabricante é verdadeira.

6. O p-valor é dado por \[\text{p-valor} \ = \dfrac{1-\mathbb{P}[\chi_1^2 \ \textless \ Q_{\text{obs}}^2]}{2}] = \dfrac{1-\mathbb{P}[\chi_1^2 \ \textless \ 1,3889]}{2}= 0,1193.\]

Para entender como executar essa função do Software Action, você pode consultar o manual do usuário.

Aproximação normal com correção de continuidade

Ao aplicar o Teste Qui-Quadrado de Pearson estamos, novamente, aproximando uma distribuição discreta por uma contínua. Assim, sugere-se uma correção de continuidade, neste caso também chamada de correção de Yates.

Os passos para a realização deste teste são análogos aos do caso anterior, com uma única diferença: se o valor $Q^2$ for maior que o valor crítico substituiremos a equação  \[Q^2=\sum_{j=1}^2\frac{(O_j-E_j)^2}{E_j}\]

pela sua correção $Q^2_c$ dada por \[Q^2_c=\sum_{j=1}^2\frac{(|O_j-E_j|-0,5)^2}{E_j}.\]

Observações:

1) Evidentemente, não é preciso usar a correção de Yates se o valor obtido $Q^2$ for menor que ponto crítico, pois o novo valor será menor que o primeiro, continuando a não ser significativo.

2) A ideia aqui também é evitar que a rejeição de $H_0$ seja resultante da aproximação feita, o que poderia ocorrer eventualmente quando $Q^2_{\text{obs}}$ fosse bastante próximo do valor crítico.

Exemplo 5.3.2.2:

Consideremos que de $75$ peças, $12$ são defeituosas. O fabricante garante que $90\%$ dessas peças estão de acordo como as especificações exigidas. Ao nível de $5\%$ de significância, podemos falar que é válida a afirmação do fabricante? (Resolva utilizando a correção de continuidade.)

1. Estabelecemos as hipóteses \[\left\{\begin{array}{l}H_0: p=0,9\\H_1: p \ \textless \ 0,9\end{array}\right.\]

2. Fixemos o nível de significância $\alpha = 0,05$.

3. Como $\alpha = 0,05$, $Z_{\alpha}^2 = 2,7055$.

4. Temos que $O_1 = 63$ e, sob a hipótese nula, $p_0 = 0,9$. Logo, $E_1 = 0,9\times 75 = 67,5$. Além disso, $O_2 = 12$ e $E_2 = 0,1\times 75 = 7,5$. Assim, \[Q^2=\frac{(63-67,5)^2}{67,5}+\frac{(12-7,5)^2}{7,5}=3.\]

Como $Q^2 \ \textgreater \ 2,7055$, calculamos $Q^2_c$. \[Q^2_c=\frac{(|63-67,5|-0,5)^2}{67,5}+\frac{(|13-7,5|-0,5)^2}{7,5}=0,2370+2,1333=2,3703.\]

5. Conclusão: como $Q^2_c = 2,3073 \ \textless \ 2,7055$ não rejeitamos $H_0$. Portanto, temos evidências de que a afirmação do fabricante é verdadeira.

Observações:

1) Conforme vimos na Observação 1 acima, se revolvermos o Exemplo 5.3.2.1 utilizando a correção de continuidade não rejeitamos a hipótese nula.

2) Realizando o Exemplo 5.3.2.2 sem utilizar a correção de continuidade, obtemos \[Q^2=\frac{(63-67,5)^2}{67,5}+\frac{(12-7,5)^2}{7,5}=3\]

e, como $Q^2 = 3 \ \textgreater \ 2,7055$ rejeitamos $H_0$, ao contrário do teste com correção.

Assim, realizando o teste com a correção de continuidade, evitamos a rejeição de $H_0$, que ocorreu no teste sem a correção devido à aproximação assintótica.

Inferência

Sobre o Portal Action

O Portal Action é mantido pela Estatcamp - Consultoria Estatística e Qualidade, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.

Facebook

CONTATO

  •  Maestro Joao Seppe, 900, São Carlos - SP | CEP 13561-180
  • Telefone: (16) 3376-2047
  • E-Mail: [email protected]