3.1 - Teste de Tukey

Teste de Tukey (TSD - Tukey Significant Difference)

O Teste proposto por Tukey (1953) é também  conhecido como teste de Tukey da diferença honestamente significativa (honestly significant difference)(HSD) e teste de Tukey da diferença totalmente significativa (wholly significant difference)(WSD). É um teste exato em que, para  a família de todas as $ c=\frac{1}{2}k(k-1) $ comparações duas a duas, a taxa de erro da família dos testes (FWER) é exatamente $ \alpha $ (e o intervalo de confiança é exatamente 1-$ \alpha $). Métodos de comparações múltiplas exatos são raros. O teste de Tukey tem sido mostrado analiticamente ótimo, no sentido que, entre todos  os procedimentos que resultam em intervalos de confiança com mesmo tamanho para todas diferenças duas a duas com coeficiente de confiança da família  de pelo menos $ 1-\alpha $, o teste de Tukey resulta em intervalos menores. Isso quer dizer que, se a família consiste em todas comparações duas a duas e o teste de Tukey pode ser usado, ele resultará em intervalos menores que qualquer outro método de comparação múltipla de uma etapa.

A estratégia de Tukey consiste em definir a menor diferença significativa. Tal procedimento utiliza a amplitude da distribuição studentizada.

Suponhamos que temos $ k $ observações independentes, Y1,...,Yk, de uma distribuição normal com média μ e variância σ2. Seja $ w $ a amplitude para esse conjunto de observações, assim

$$w=\max(Y_{i})-\min(Y_{i}).$$

Suponhamos que temos uma estimativa s2 da variância σ2, que é baseada nos $ N-k $ graus de liberdade e é independente de Yi, em que $ N $ é o número total de observações. Dessa forma, a razão $ w/s $ é chamada amplitude studentizada e é denotada por $ q(k,N-k)=\frac{w}{s} $, em que $ q $ é um valor tabelado (ver Tabela do Teste de Tukey no apêndice).
Para tamanhos de amostras iguais (dados balanceados), o teste de Tukey declara duas médias significativamente diferentes se o valor absoluto de suas diferenças amostrais ultrapassar

$$TSD = q_{\alpha}(k,N-k)\sqrt{\frac{QME}{n}},$$

em que $ n $ é o número de réplicas do nível. Em outras palavras, rejeitamos a igualdade da média de dois níveis se $ |\bar{y_{i.}}-\bar{y_{j.}}|\textgreater TSD $.
Um intervalo de confiança de 100(1-α)%  para a diferença entre todos os pares das médias  é dado como
$$\bar{y_{i.}}-\bar{y_{j.}}-q_{\alpha}(k,N-k)\sqrt{\frac{QME}{n}}\leq\mu_{i}-\mu_{j}\leq\bar{y_{i.}}-\bar{y_{j.}}+q_{\alpha}(k,N-k)\sqrt{\frac{QME}{n}},~~i\neq j.$$

Quando o tamanho das amostras são diferentes (dados não balanceados), o teste de Tukey é modificado e é chamado por vários escritores de Teste de Tukey-kramer. Esse teste não é exato, mas é minimamente conservativo no sentido em que a  FWER real é muitas vezes menor que $ \alpha $. O teste de Tukey-kramer  declara duas médias significativamente diferentes se o valor absoluto de suas diferenças amostrais ultrapassar

$$TSD=\dfrac{q_{\alpha}(k,N-k)}{\sqrt{2}}\sqrt{QME\left(\dfrac{1}{n_{i}}+\dfrac{1}{n_{j}}\right)}$$

e o intervalo de confiança, para $ {i}\neq{j} $ é

$$\bar{y_{i.}}-\bar{y_{j.}}-\dfrac{q_{\alpha}(k,N-k)}{\sqrt{2}}\sqrt{QME\left(\dfrac{1}{n_{i}}+ \dfrac{1}{n_{j}}\right)}\leq\mu_{i}-\mu_{j}\leq\bar{y_{i.}}-\bar{y_{j.}}+\dfrac{q_{\alpha}(k,N-k)}{\sqrt{2}}\sqrt{QME \left(\dfrac{1}{n_{i}}+\dfrac{1}{n_{j}}\right)}$$

O teste de Tukey-Kramer também tem sido confirmado analiticamente que, para dados não balanceados, fornece intervalos uniformemente mais curtos que qualquer um do outros MCM de uma etapa para a família de todas as comparações duas a duas.

 Exemplo 3.1.1

Para os dados do Exemplo 1, vamos calcular o valor de TSD e verificar quais níveis são iguais.

Fator Resistência_da_Fibra
15 7
15 7
15 15
15 11
15 9
20 12
20 17
20 12
20 18
20 18
25 14
25 18
25 18
25 19
25 19
30 19
30 25
30 22
30 19
30 23
35 7
35 10
35 11
35 15
35 11

clique aqui para efetuar o download dos dados utilizados nesse exemplo

Como os dados são balanceados, temos que:


$$TSD=q_{\alpha}(k,N-k)\sqrt{\frac{QME}{n}}$$


$$TSD=q_{0,05}(5,20)\sqrt{\frac{8,06}{5}}$$


$$TSD=4,232\sqrt{1,612}$$


$$TSD=5,373$$

Rejeitamos a igualdade entre dois níveis se:

$ \mid \overline{y}_{i.}-\overline{y}_{j.}\mid\textgreater 5,373 $

$ |\overline{y}_{i.}-\overline{y}_{j.}| $ $ \mbox{Resultado} $ $ |\overline{y}_{i.}-\overline{y}_{j.}| $ $ \mbox{Resultado} $
$ |\overline{y}_{15}-\overline{y}_{20}| $ $ 5,6 $ $ \mid\overline{y}_{20}-\overline{y}_{30}\mid $ $ 6,2 $
$ |\overline{y}_{15}-\overline{y}_{25}| $ $ 7,8 $ $ \mid\overline{y}_{20}-\overline{y}_{35}\mid $ $ 4,6 $
$ |\overline{y}_{15}-\overline{y}_{30}| $ $ 11,8 $ $ \mid\overline{y}_{25}-\overline{y}_{30}\mid $ $ 4,0 $
$ |\overline{y}_{15}-\overline{y}_{35}| $ $ 1,0 $ $ \mid\overline{y}_{25}-\overline{y}_{35}\mid $ $ 6,8 $
$ |\overline{y}_{20}-\overline{y}_{25}| $ $ 2,2 $ $ \mid\overline{y}_{30}-\overline{y}_{35}\mid $ $ 10,8 $

Usando o software Action temos os seguintes resultados:

Conclusão:

Ao considerarmos um nível de significância de 5%, não rejeitamos a hipótese de igualdade entre as médias dos níveis: (15,35); (20,25); (20,35); (25,30).

Exemplo 3.1.2 (Dados não balanceados): 

 Uma empresa tem interesse em testar quatro  tipos de modelos de pacotes para um  novo cereal matinal. Vinte lojas com volumes aproximadamente iguais de vendas foram selecionadas. Para cada loja foi atribuído aleatoriamente um dos modelos de pacotes, com cada modelo de pacote atribuído a cinco lojas. Um incêndio ocorreu em uma loja durante o período de estudo, por isso tal estabelecimento   teve que ser retirado da pesquisa. Assim, um dos modelos foi testado em apenas quatro lojas. As lojas foram escolhidas a fim de  serem comparadas em relação ao volume de vendas. Condições relevantes que possam afetar as vendas como preço, promoções  e disposição das prateleiras foram mantidas as mesmas para todas as lojas no experimento. Os dados desse experimento seguem abaixo. Vamos calcular o valor de TSD e verificar quais níveis são iguais.

Pacotes     Lojas     Total Média Nº de lojas
i $ Y_{i1} $ $ Y_{i2} $ $ Y_{i3} $ $ Y_{i4} $ $ Y_{i4} $ $ Y_{i} $ $ \bar{Y_{i.}} $ $ n_{i} $
1 11 17 16 14 15 73 14,6 5
2 12 10 15 19 11 67 13,4 5
3 23 20 18 17   78 19,5 4
4 27 33 22 26 28 136 27,2 5

Para efetuarmos as análises do software Action devemos montar a tabela da seguinte maneira: 

Fator Vendas
1 11
1 17
1 16
1 14
1 15
2 12
2 10
2 15
2 19
2 11
3 23
3 20
3 18
3 17
4 27
4 33
4 22
4 26
4 28

 clique aqui para efetuar o download dos dados utilizados nesse exemplo 

Usando o software Action, a tabela da ANOVA para esses dados é

Temos interesse em encontrar o intervalo de confiança de 95% para o Teste de Tukey para esses dados não balanceados. Para comparar os modelos de pacotes 1 e 2, por exemplo, obtemos:


$$TSD=\dfrac{q_{\alpha}(k,N-k)}{\sqrt{2}}\sqrt{QME\left(\dfrac{1}{n_{i}}+ \dfrac{1}{n_{j}}\right)}$$

$$TSD=\dfrac{q_{0,05}(4,15)}{\sqrt{2}}\sqrt{10,546\left(\dfrac{1}{n_{1}}+\dfrac{1}{n_{2}}\right)}$$

$$TSD=\dfrac{4,08}{\sqrt{2}}\sqrt{10,546\left(\dfrac{1}{5}+\dfrac{1}{5}\right)}=5,925.$$

Desse modo, o intervalo de confiança para  $ \mu_{1}-\mu_{2} $ é


$$\bar{y_{1.}}-\bar{y_{3.}}-TSD\leq\mu_{1}-\mu_{3}\leq\bar{y_{1.}}-\bar{y_{3.}}+TSD$$

$$(14,6-13,4)-5,925\leq\mu_{1}-\mu_{3}\leq(14,6-13,4)+5,925$$

$$-4,72\leq\mu_{1}-\mu_{2}\leq7,12$$

 Para comparar os modelos de pacotes 1 e 3, obtemos:


$$TSD=\dfrac{q_{\alpha}(k,N-k)}{\sqrt{2}}\sqrt{QME\left(\dfrac{1}{n_{i}}+ \dfrac{1}{n_{j}}\right)}$$

$$TSD=\dfrac{q_{0,05}(4,15)}{\sqrt{2}}\sqrt{10,546\left(\dfrac{1}{n_{1}}+\dfrac{1}{n_{3}}\right)}$$

$$TSD=\dfrac{4,08}{\sqrt{2}}\sqrt{10,546\left(\dfrac{1}{5}+\dfrac{1}{4}\right)}=6,28.$$

Assim, o intervalo de confiança para  $ \mu_{1}-\mu_{3} $ é


$$\bar{y_{1.}}-\bar{y_{3.}}-TSD\leq\mu_{1}-\mu_{3}\leq\bar{y_{1.}}-\bar{y_{3.}}+TSD$$

$$(14,6-19,5)-6,28\leq\mu_{1}-\mu_{3}\leq(14,6-19,5)+6,28$$

$$-11,18\leq\mu_{1}-\mu_{2}\leq1,38$$

De maneira análoga, encontramos os intervalos de confianças  de 95% para a diferença das outras médias.


$$-18,52\leq\mu_{1}-\mu_{4}\leq-6,68$$

$$-12,38\leq\mu_{2}-\mu_{3}\leq-0,17$$

$$-19,72\leq\mu_{2}-\mu_{4}\leq-7,88$$

$$-13,97\leq\mu_{3}-\mu_{4}\leq-1,42$$

Como os dados não são balanceados e temos neste exemplos dois valores distintos para TSD, consideramos aqui a média aritmética das duas taxas, ou seja, $ TSD=\frac{5,96+6,28}{2}=6,12 $.

Assim, rejeitamos a igualdade entre dois níveis se:

 $ |\bar{y_{i.}}-\bar{y_{j.}}|\textgreater6,12 $

  $ \mbox{Resultado} $   $ \mbox{Resultado} $
$ |\bar{y_{1.}}-\bar{y_{2.}}| $ $ 1,2 $ $ |\bar{y_{2.}}-\bar{y_{3.}}| $ $ 6,1 $
$ |\bar{y_{1.}}-\bar{y_{3.}}| $ $ 4,9 $ $ |\bar{y_{2.}}-\bar{y_{4.}}| $ $ 13,8 $
$ |\bar{y_{1.}}-\bar{y_{4.}}| $ $ 12,6 $ $ |\bar{y_{3.}}-\bar{y_{4.}}| $ $ 7,7 $

Usando o software Action temos os seguintes resultados:

Conclusão:

Ao considerarmos um nível de significância de 5%, não rejeitamos a hipótese de igualdade entre as médias dos níveis: (1,2), (1,3) e (2,3).

 Para entender como executar essa função do Software Action, você pode consultar o manual do usuário.

 

 

Dúvidas sobre esse conteúdo? Comente:

ANOVA

Sobre o Portal Action

O Portal Action é mantido por Estatcamp - Consultoria Estatística e Qualidade e por DIGUP - Desenvolvimento de Sistemas e Consultoria Estatística, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.

Facebook

CONTATO

  •  28 de Setembro,2066 - B, São Carlos - SP | CEP 13560-270
  • Telefone: (16) 3376-2047
  • E-Mail: [email protected]