Teste de independência para estudo da quantidade de erro na distribuição de materiais de uma editora

Você está aqui

Uma editora quer realizar um estudo sobre a quantidade de erros que acontecem na distribuição de materiais produzidos por duas empresas. Para isso realizamos um estudo considerando duas variáveis, a empresa que produz o exemplar e o número de exemplares faltantes que deveriam ser recebidos pelo distribuidor, estas variáveis foram divididas da seguinte forma:

Iniciamos montando a tabela cruzada das observações:

  A B C Total
Empresa A 1093 1222 770 3085
Empresa B 1472 908 750 3130
Total 2565 2130 1520

6215

Tabela 9.1.1: Tabela cruzada. 

 

Agora calculamos as frequências esperadas:

$$E_{ij}=n~\cfrac{n_{i.}}{n}~\cfrac{n_{.j}}{n}=\cfrac{n_{i.}~n_{.j}}{n}~~~~~~\begin{array}{c}i=1,2 \\j=1,2,3\end{array} $$

 

$$E_{11}=\cfrac{3085*2566}{6215}=1273,21$$

$$E_{12}=\cfrac{3085*2130}{6215}=1057,29$$

$$E_{13}=\cfrac{3085*1520}{6215}=754,50$$

$$E_{21}=\cfrac{3130*2565}{6215}=1291,79$$

$$E_{22}=\cfrac{3130*2130}{6215}=1072,71$$

$$E_{23}=\cfrac{3130*1520}{6215}=765,50$$

Dessa forma, montamos uma tabela das frequências esperadas:

  A B C
Empresa A 1273,21 1057,29 754,50
Empresa B 1291,79 1072,71 765,50

Tabela 9.1.2: Frequências esperadas. 

 

Agora calculamos os valores padronizados:

$$Q^2_{ij}=\cfrac{(O_{ij}-E_{ij})^2}{E_{ij}}~~~~~~\begin{array}{c}i=1,2 \\j=1,2,3\end{array} $$

 

$$Q^2_{11}=\cfrac{(1093-1273,71)^2}{1273,71}=25,51$$

$$Q^2_{12}=\cfrac{(1222-1057,29)^2}{1057,29}=25,66$$

$$Q^2_{13}=\cfrac{(770-754,50)^2}{754,50}=0,32$$

$$Q^2_{21}=\cfrac{(1472-1291,79)^2}{1291,79}=25,14$$

$$Q^2_{22}=\cfrac{(908-1072,71)^2}{1072,71}=25,29$$

$$Q^2_{23}=\cfrac{(750-765,50)^2}{765,50}=0,31$$

Dessa forma, montamos uma tabela com os valores de $ Q^2 $ no ponto $ (i,j) $:

  A B C
Empresa A 25,51 25,66 0,32
Empresa B 25,14 25,29 0,31

Tabela 9.1.3: Valores de $ Q^2 $ no ponto $ (i,j) $.

 

$$Q^2_{obs}=\sum^r_{i=1}\sum^c_{j=1}\cfrac{(O_{ij}-E_{ij})^2}{E_{ij}}=25,51+25,66+0,32+25,14+25,29+0,31=102,23$$

$$\mbox{p-valor}=P[102,23\textgreater \chi^2_{(2-1)(3-1)}|H_0]=6,31744E^{-23}$$

 

Como obtemos $ Q^2_{obs}=102,23 $ e do $ p-valor=6,31744E^{-23} $, rejeitarmos a hipótese nula. Portanto, concluímos que existe dependência entre a empresa e a falta de exemplares, ao nível de significância de 5%, ou seja, não são independentes.

Agora calculamos as medidas de associação:

1. Coeficiente de contingência quadrático médio:

$$\Phi^2=\cfrac{Q^2_{obs}}{n}=\cfrac{102,23}{6215}=0,016$$

2. Coeficiente de contingência 

$$P=\sqrt{\cfrac{\frac{Q^2_{obs}}{n}}{1+\frac{Q^2_{obs}}{n}}}=\sqrt{\cfrac{Q^2_{obs}}{n+Q^2_{obs}}}=\sqrt{\cfrac{102,23}{6215+102,23}}=0,127$$

3. Coeficiente de Tschuprov

$$T=\sqrt{\cfrac{\frac{Q^2_{obs}}{n}}{(r-1)(c-1)}}=\sqrt{\cfrac{\frac{102,23}{6215}}{(3-1)(2-1)}}=0,091$$

4. Coeficiente de Cramer

$$C=\cfrac{\frac{Q^2_{obs}}{n}}{\min\{r-1;c-1\}}=\cfrac{\frac{102,23}{6215}}{\min\{3-1,2-1\}}=0,016$$

Notamos que nos 4 casos o valor do coeficiente é muito baixo, o que significa que a associação entre as variáveis é muito pequena.

Veja a seguir os resultados obtidos pelo software Action para o mesmo exemplo.

Sobre o Portal Action

O Portal Action é mantido pela Estatcamp - Consultoria Estatística e Qualidade, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.

Facebook

CONTATO

  •  Maestro Joao Seppe, 900, São Carlos - SP | CEP 13561-180
  • Telefone: (16) 3376-2047
  • E-Mail: [email protected]