3.3 Teste Qui-Quadrado para homogeneidade

Você está aqui

O teste Qui-Quadrado de independência (que foi discutido na seção 2.2) é um teste sobre uma amostra a partir de uma única população. Cada indivíduo da população é classificada em duas formas (atividade e doença psiquiátrica). Agora discutiremos um segundo tipo de teste Qui-Quadrado, que pode ser usado para comparar as proporções em diferentes populações.

 

Definição: Em um teste Qui-Quadrado de homogeneidade, podemos testar a afirmação de que diferentes populações têm a mesma proporção de indivíduos com alguma característica.

O estimador de máxima verosimilhança de pj|i é


$$\hat{p}_{j|_i}=\cfrac{O_{ij}}{n_{i.}}~~~~~~j=1,\dots,c$$

Mas, se a hipótese H0 (hipótese de homogeneidade) é válida, sabemos que


$$p_{j|_1} = p_{j|_2} = \dots =p_{j|_r} = p_j~~~~~~j=1,\dots,c$$

pelo que podemos combinar a informação acerca de cada classe j da variável C e os estimadores de máxima verosimilhança de pj|i=pj serão


$$\hat{p}_{j|_i}=\hat{p}_j=\cfrac{\displaystyle\sum^r_{i=1}O_{ij}}{n}=\cfrac{O_{.j}}{n}~~~~~~j=1,\dots,c$$

Os estimadores de máxima verosimilhança das frequências esperadas Fj|i ,sob a hipótese H0 válida é


$$E_{j|_i}=n_{i.}~\hat{p}_{j|_i}=\cfrac{n_{i.}~N_{.j}}{n}~~~~~~j=1,\dots,c$$

Seja a distribuição multinomial do vetor de frequências da amostra i, (Oi1,Oi2,...,Oic) e admitindo que é válida a hipótese de homogeneidade no critério de classificação, a estatística


$$Q^2_{c|i}=\sum^c_{j=1}\cfrac{(O_{ij}-E_{j|i})^2}{E_{j|i}}$$

tem distribuição assintótica com (c-1) graus de liberdade.

Se repetirmos o mesmo raciocínio para as r amostras, vamos na tabela de contingência somar r variáveis com distribuição Qui-Quadrado, ou seja, a estatística de teste


$$Q^2_{obs}=\sum^r_{i=1}Q^2_{c|i}=\sum^r_{i=1}\sum^c_{j=1}\cfrac{(O_{ij}-E_{j|i})^2}{E_{j|i}}$$

tem distribuição assintótica Qui-Quadrado com (r-1)(c-1) graus de liberdade.

Pela expressão da estatística Q2obs podemos entender qual a região crítica do teste de homogeneidade. Quando não ocorre homegeneidade é natural que as frequências observadas Oij sejam substancialmente diferentes das frequências que esperamos observar quando a homogeneidade ocorre (Ej|i). Então devemos rejeitar a hipótese H0 de homogeneidade da distribuição de probabilidade das categorias de classificação da variável C, para todas as amostras, quando a estatística Q2obs é maior que um ponto crítico $ \chi^2_{\alpha} $ usando a Tabela da distribuição Qui-Quadrado - Apêndice ou usando o software Action (ver manual Action módulo Distribuições).

Assim, dado um nível de significância $ \alpha $, o p-valor é determinado por


$$\mbox{p-valor}=P[Q^2_{obs}\textgreater \chi^2_{\alpha;(r-1)(c-1)}|H_0]$$

 

Contagem dos Graus de Liberdade

 

O número total de frequências numa tabela de contingência r x c é rc. Como é conhecida a dimensão de cada amostra (correspondente ao total de cada linha), a distribuição em cada amostra das frequências de classificação pelas c categorias da variável C, é feita com uma restrição. Assim em cada uma das r linhas temos livres apenas (c-1) frequências. Conhecendo os c totais das colunas, por exemplo, na última as frequências ficam imediatamente determinadas. Assim nesta última linha os valores não são livres. Consequentemente, temos como independentes as frequências de (r-1) amostras, cada uma como (c-1) frequências independentes. Então o total de graus de liberdade será de (r-1)(c-1).


Sobre o Portal Action

O Portal Action é mantido pela Estatcamp - Consultoria Estatística e Qualidade, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.

Facebook

CONTATO

  •  Maestro Joao Seppe, 900, São Carlos - SP | CEP 13561-180
  • Telefone: (16) 3376-2047
  • E-Mail: [email protected]