5.3.2 - Teste qui-quadrado de Pearson

Você está aqui

Aproximação Normal

Este é outro tipo de teste assintótico para uma proporção. Consideremos, como no caso anterior, uma amostra aleatória simples $ X_1,\ldots,X_n $ onde cada $ X_i $, com $ i = 1,\ldots,n $, tem distribuição de $ \text{Bernoulli}(p) $, isto é, 

\[X_1,\ldots,X_n\sim \hbox{Bernoulli(p)}.\]

Se $ n $ é suficientemente grande, a estatística de Pearson, dada por 

\[Q^2=\sum_{j=1}^2\frac{(O_j-E_j)^2}{E_j}\sim\chi_1^2\]

tem aproximadamente distribuição qui-quadrado com 1 grau de liberdade, no qual $ O_1 $ é o número de sucessos e $ E_1=np $ é a frequência esperada relativa ao número de sucessos, $ O_2=n-O_1 $ e $ E_2 = n(1-p) $, onde $ n = O_1+O_2 $ é o tamanho da amostra.

Lembramos que uma distribuição qui-quadrado com 1 grau de liberdade é igual a uma distribuição normal padronizada ao quadrado, ou seja, se $ Z \sim N(0,1) $, então 

\[\chi_1^2 = Z^2.\]

Neste caso, se $ y $ é tal que $ \mathbb{P}[\chi_1^2 \ \textgreater \ y] = \alpha $, então como $ \chi_1^2 = Z^2 $, temos que 

\[\mathbb{P}[\chi_1^2 \ \textgreater \ y]=\mathbb{P}[Z^2 \ \textgreater \ y]=\mathbb{P}[Z \ \textless \ -\sqrt{y}] + \mathbb{P}[Z \ \textgreater \ \sqrt{y}],\]

ou seja, 

\[\mathbb{P}[Z \ \textless \ -\sqrt{y}]+\mathbb{P}[Z \ \textgreater \ \sqrt{y}]=\alpha.\]

Desta forma, podemos realizar o teste utilizando a distribuição normal padrão ao invés da qui-quadrado, o que é mais vantajoso, já que podemos considerar a sua simetria.

Vamos ver os passos para realizar o teste Qui-Quadrado de Pearson.

1. Estabelecer as hipóteses 

 p\neq p_0\end{array}\right\]

se o teste for bilateral, 

 p \ \textgreater \ p_0\end{array}\right\]

se o teste é unilateral à direita ou 

 p \ \textless \ p_0\end{array}\right\]

se o teste é unilateral à esquerda

2. Fixar o nível de significância $ \apha $.

3. Determinar a região crítica.

  • Teste bilateral.

Se o teste é bilateral, devemos encontrar um ponto crítico da distribuição $ \chi_1^2 $, baseado nos pontos críticos da distribuição normal padrão $ Z $. Os pontos críticos da distribuição normal padrão são $ -Z_{\alpha/2} $ e $ Z_{\alpha/2} $.

Como $ Z^2 = \chi_1^2 $, temos que 

\[\alpha=\mathbb{P}[Z \ \textless \ -Z_{\alpha/2}]+\mathbb{P}[Z \ \textgreater \ Z_{\alpha/2}]=\mathbb{P}[Z^2 \ \textgreater \ Z_{\alpha/2}^2]=P[\chi_1^2 \ \textgreater \ Z_{\alpha/2}^2].\]

Portanto, o ponto crítico da distribuição qui-quadrado com um grau de liberdade é $ Z_{\alpha/2}^2 $.

  • Testes unilaterais.

Se o teste é unilateral à direita ou a esquerda, devemos determinar o ponto crítico da distribuição $ \chi_1^2 $ baseado nos pontos críticos da distribuição normal padrão $ Z $. Os pontos críticos para a distribuição normal $ Z $ são dados por $ -Z_{\alpha} $ para o teste unilateral à esquerda ou $ Z_{\alpha} $ para o teste unilateral à direita.

Para o caso unilateral à esquerda, como $ Z^2 = \chi_1^2 $, temos que 

\[Z \ \textless \ -Z_{\alpha} \Rightarrow |Z| \ \textgreater \ Z_{\alpha} \Rightarrow Z^2 \ \textgreater \ Z_{\alpha}^2 \ \Rightarrow \chi_1^2 \ \textgreater \ Z_{\alpha}^2\]

e, no caso unilateral á direita, temos que 

\[Z \ \textgreater \ Z_{\alpha} \ \Rightarrow Z^2 \ \textgreater \ Z_{\alpha}^2 \ \Rightarrow \chi_1^2 \ \textgreater \ Z_{\alpha}^2\]

Portanto, o ponto crítico da distribuição qui-quadrado com um grau de liberdade é $ Z_{\alpha}^2 $. Podemos observar também que  

\[\mathbb{P}[\chi_1^2 \ \textgreater \ Z_{\alpha}^2]=\mathbb{P}(Z \ \textgreater \ Z_{\alpha}]+\mathbb{P}[Z \ \textless \ -Z_{\alpha}] = 2\alpha.\]

4. Calcular, sob a hipótese nula, a estatística de Pearson 

\[Q^2_{\text{obs}}=\sum_{j=1}^2\frac{(O_j-E_j)^2}{E_j}.\]

5. Critério

  • Se o teste é bilateral e $ Q^2_{\text{obs}}\geq Z_{\alpha/2}^2 $, rejeitamos $ H_0 $. Caso contrário, não rejeitamos $ H_0 $.
  • Se o teste é unilateral à esquerda temos duas possibilidades:
  1. Se $ O_1\leq E_1 $ e $ Q^2_{\text{obs}}\geq Z_{\alpha}^2 $ rejeitamos $ H_0 $, caso contrário, não rejeitamos $ H_0 $.
  2. Se $ O_1 \ \textgreater \ E_1 $ não rejeitamos $ H_0 $ qualquer que seja o valor de $ Q^2_{\text{obs}} $.
  •  Se o teste é unilateral à direita também temos duas possibilidades:
  1. Se $ O_1 \ \textless \ E_1 $ então não rejeitamos $ H_0 $, qualquer que seja o valor de $ Q^2_{\text{obs}} $.
  2. Se $ O_1 \geq E_1 $ e $ Q^2_{\text{obs}}\geq Z_{\alpha}^2 $ rejeitamos $ H_0 $, caso contrário, não rejeitamos $ H_0 $.

6. O p-valor é determinado por 

\[\text{p-valor} \ = \mathbb{P}\left[\chi_1^2 \ \textgreater \ Q^2_{\text{obs}}|H_0\right]\]

se o teste é bilateral, 

\[\text{p-valor} \ = \left\{\begin{array}{l}\dfrac{1-P\left[\chi_1^2 \ \textless Q^2_{\text{obs}}\right]}{2} \ \hbox{se} \ O_1\leq np\\ \dfrac{1+P\left[\chi_1^2 \ \textless Q^2_{\text{obs}}\right]}{2} \ \hbox{se} \ O_1 \ \textgreater \ np\]

se o teste é unilateral à esquerda ou  

\[\text{p-valor} \ = \left\{\begin{array}{l}\dfrac{1+P\left[\chi_1^2 \ \textless Q^2_{\text{obs}}\right]}{2} \ \hbox{se} \ O_1\leq np\\ \dfrac{1-P\left[\chi_1^2 \ \textless Q^2_{\text{obs}}\right]}{2} \ \hbox{se} \ O_1 \ \textgreater \ np}\]

se o teste é unilateral à direita.

Podemos calcular o poder do teste ou o tamanho amostral necessário para se obter determinado poder utilizando o Action. Os parâmetros utilizados pelo Action são o tamanho da amostra ($ n $), as proporções ($ p_0 $) da hipótese nula e ($ p $) da hipótese alternativa, os graus de liberdade ($ df $), o valor do poder ($ P $) e o nível de significância ($ \alpha $). Para o cálculo do poder, a fórmula utilizada é 

\[\text{Poder} = \Gamma(\chi_{\alpha})\]

tal que $ \Gamma $ é a função densidade acumulada da distribuição qui-quadrado não-central com $ df $ graus de liberdade e parâmetro de não centralidade $ \varphi $ dado por 

\[\varphi=n\sum_{i=1}^2\frac{(p_{1i}-p_{0i})^2}{p_{0i}}\]

onde $ p_{0i} $ são as probabilidades sob a hipótese nula e $ p_{1i} $ as probabilidades sob a hipótese alternativa, satisfazendo 

\[\sum_{i=1}^2p_{0i}=1 \quad \hbox{e} \quad \sum_{i=1}^2p_{1i}=1.\]

Exemplo 5.3.2.1:

Resolver o Exemplo 5.3.1.1 utilizando o teste qui-quadrado de Pearson.

clique aqui para efetuar o download dos dados utilizados nesse exemplo

1. Estabelecemos as hipóteses 

 p \ \textless \ 0,9\end{array}\right.\]

2. Fixamos o nível de significância $ \alpha = 0,05 $.

3. Como $ \alpha = 0,05 $, $ -Z_{\allpha} = -1,6448 $. Desta forma, temos que $ (-Z_{\alpha})^2 = 2,7055 $.

4. Temos que $ O_1 = 175 $ e, sob a hipótese nula, $ p_0 = 0,9 $. Logo $ E_1 = 0,9 \times 200 = 180 $. Além disso, $ O_2 = 25 $ e $ E_2 = 0,1\times 200 = 20 $. Assim, 

\[Q_{\text{obs}}^2=\frac{(175-180)^2}{180}+\frac{(25-20)^2}{20}=1,3889.\]

5. Conclusão: como $ O_1 \leq E_1 $ e $ Q^2_{\text{obs}} = 1,3889 \ \textless 2,7055 $ não rejeitamos $ H_0 $. Portanto, temos evidências de que a afirmação do fabricante é verdadeira.

6. O p-valor é dado por 

\[\text{p-valor} \ = \dfrac{1-\mathbb{P}[\chi_1^2 \ \textless \ Q_{\text{obs}}^2]}{2}] = \dfrac{1-\mathbb{P}[\chi_1^2 \ \textless \ 1,3889]}{2}= 0,1193.\]

Para entender como executar essa função do Software Action, você pode consultar o manual do usuário.

Aproximação normal com correção de continuidade

Ao aplicar o Teste Qui-Quadrado de Pearson estamos, novamente, aproximando uma distribuição discreta por uma contínua. Assim, sugere-se uma correção de continuidade, neste caso também chamada de correção de Yates.

Os passos para a realização deste teste são análogos aos do caso anterior, com uma única diferença: se o valor $ Q^2 $ for maior que o valor crítico substituiremos a equação  

\[Q^2=\sum_{j=1}^2\frac{(O_j-E_j)^2}{E_j}\]

pela sua correção $ Q^2_c $ dada por 

\[Q^2_c=\sum_{j=1}^2\frac{(|O_j-E_j|-0,5)^2}{E_j}.\]

Observações:

1) Evidentemente, não é preciso usar a correção de Yates se o valor obtido $ Q^2 $ for menor que ponto crítico, pois o novo valor será menor que o primeiro, continuando a não ser significativo.

2) A ideia aqui também é evitar que a rejeição de $ H_0 $ seja resultante da aproximação feita, o que poderia ocorrer eventualmente quando $ Q^2_{\text{obs}} $ fosse bastante próximo do valor crítico.

Exemplo 5.3.2.2:

Consideremos que de $ 75 $ peças, $ 12 $ são defeituosas. O fabricante garante que $ 90\% $ dessas peças estão de acordo como as especificações exigidas. Ao nível de $ 5\% $ de significância, podemos falar que é válida a afirmação do fabricante? (Resolva utilizando a correção de continuidade.)

1. Estabelecemos as hipóteses 

 p \ \textless \ 0,9\end{array}\right.\]

2. Fixemos o nível de significância $ \alpha = 0,05 $.

3. Como $ \alpha = 0,05 $, $ Z_{\alpha}^2 = 2,7055 $.

4. Temos que $ O_1 = 63 $ e, sob a hipótese nula, $ p_0 = 0,9 $. Logo, $ E_1 = 0,9\times 75 = 67,5 $. Além disso, $ O_2 = 12 $ e $ E_2 = 0,1\times 75 = 7,5 $. Assim, 

\[Q^2=\frac{(63-67,5)^2}{67,5}+\frac{(12-7,5)^2}{7,5}=3.\]

Como $ Q^2 \ \textgreater \ 2,7055 $, calculamos $ Q^2_c $

\[Q^2_c=\frac{(|63-67,5|-0,5)^2}{67,5}+\frac{(|13-7,5|-0,5)^2}{7,5}=0,2370+2,1333=2,3703.\]

5. Conclusão: como $ Q^2_c = 2,3073 \ \textless \ 2,7055 $ não rejeitamos $ H_0 $. Portanto, temos evidências de que a afirmação do fabricante é verdadeira.

Observações:

1) Conforme vimos na Observação 1 acima, se revolvermos o Exemplo 5.3.2.1 utilizando a correção de continuidade não rejeitamos a hipótese nula.

2) Realizando o Exemplo 5.3.2.2 sem utilizar a correção de continuidade, obtemos 

\[Q^2=\frac{(63-67,5)^2}{67,5}+\frac{(12-7,5)^2}{7,5}=3\]

e, como $ Q^2 = 3 \ \textgreater \ 2,7055 $ rejeitamos $ H_0 $, ao contrário do teste com correção.

Assim, realizando o teste com a correção de continuidade, evitamos a rejeição de $ H_0 $, que ocorreu no teste sem a correção devido à aproximação assintótica.

Sobre o Portal Action

O Portal Action é mantido pela Estatcamp - Consultoria Estatística e Qualidade, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.

Facebook

CONTATO

  •  Maestro Joao Seppe, 900, São Carlos - SP | CEP 13561-180
  • Telefone: (16) 3376-2047
  • E-Mail: [email protected]