3.6 - Teste de HSU

Teste de HSU (Multiple Comparisons with the Best-MCB)

Vimos anteriormente o problema de compararmos  os tratamentos de estudo com um tratamento controle  que é usado como uma “referência” (Teste de Dunnet). Em algumas aplicações, a referência relevante (desconhecida) é o “melhor” tratamento, que é, o tratamento que tem maior valor de média (largest) ou menor (smallest), dependendo da análise de interesse. O teste proposto por Jason Hsu,  tem como característica comparar todos os tratamentos com o melhor.

Como motivação, consideremos a  seguinte situação. Suponhamos que entre cinco tratamentos que estão sendo comparados, dois tratamentos são tão ruins que,  a maioria dos pacientes que receberam um dos dois morreram dentro de um curto período de tempo. Então, possivelmente não é de interesse primordial  saber qual desses dois tratamentos é pior, a inferência  de que nenhum é melhor é suficiente. Suponhamos que o segundo melhor tratamento (entre os três restantes) é quase tão bom quanto o melhor tratamento verdadeiro. Assim, a inferência estatística que identifica ambos como praticamente o melhor pode ser de interesse, pois podem ter outras considerações que impactam na escolha do tratamento. Dessa maneira, nestas situações  todas as comparações duas a duas não são de interesse. A principal questão aqui é “Quais comparações são de interesse preliminar?”

Podemos caracterizar as comparações de interesse principais  nessas situações como “comparações múltiplas com o melhor.” Assim, se um efeito do tratamento maior é melhor,  mesmo que  o melhor tratamento seja desconhecido, podemos definir os parâmetros de interesse preliminar como

$$\max_{j=1,\ldots,k}\mu_{j}-\mu_{i},i=1,\ldots,k,\quad (3.6.1)$$

a diferença entre o efeito  do melhor tratamento verdadeiro e cada um dos $ k $ efeitos do tratamento.

Contudo, na maioria dos casos tona-se vantajoso comparar cada tratamento com o melhor dos outros tratamentos. Suponhamos  que o maior efeito do tratamento implica  em um tratamento melhor. Então os parâmetros


$$\mu_{i}-\max_{j\neq i}\mu_{j}, i=1,\ldots,k$$

contém todas as informações que os parâmetros  dados pela expressão (3.6.1).

Naturalmente, se o menor efeito do tratamento implica no melhor tratamento, então por simetria os parâmetros de interesse preliminares são


$$\mu_{i}-\min_{j\neq i}\mu_{j},i=1,\ldots,k.$$

Supondo que o melhor é a maior média entre os níveis do fator, vamos considerar um conjunto de intervalos com nível de confiança de $ (1-\alpha)100\% $ simultâneos para a diferença entre a média do i-ésimo nível do fator e o máximo entre as médias dos demais níveis do fator. O cálculo dos limites desses intervalos são obtidos usando as seguintes equações:


$$D^{-}_{i}=-\left[\overline{y_{i.}}-\max_{j \neqi}(\overline{y_{j.}})-d_{\alpha}(k,N-k)\sqrt{2\left(\frac{QME}{n}\right)}~\right]^-~~~~~~\mbox{Limite Inferior}$$


$$D^{+}_{i}=\left[\overline{y_{i.}}-\max_{j \neqi}(\overline{y_{j.}})+d_{\alpha}(k,N-k)\sqrt{2\left(\frac{QME}{n}\right)}~\right]^+~~~~~~\mbox{Limite Superior}$$

sendo que $ d_{\alpha}(k,N-k) $ é um valor tabelado (ver Tabela hsu no Apêndice) que depende do número de níveis ($ k $) e do número de graus de liberdade dos erros ($ N-k $) e $ n_i $ é o número de réplicas do nível $ i $ (para dados não balanceados). Para dados balanceados todos os $ n_i $ são iguais.

Se o intervalo ($ D^-_i~;~D^+_i $) assumir somente valores positivos, consideramos que o $ i $-ésimo nível do fator é o melhor.

Agora, suponhamos que o melhor á a menor média entre os níveis do fator, ou o a maior média é melhor, mas temos interesse em fazer comparação múltipla com o “pior” tratamento, assim os parâmetros de interesse são $ \mu_{i}-\min_{j\neq i}\mu_{j},i=1,\ldots,k. $Considerando um conjunto de intervalos com nível de confiança de $ (1-\alpha)100\% $ simultâneos para a diferença entre a média do i-ésimo nível do fator e o mínimo entre as médias dos demais níveis do fator. O cálculo dos limites desses intervalos são obtidos usando as seguintes equações:


$$D^{-}_{i} = -\left[\overline{y_{i.}} - \min_{j \neq i}(\overline{y_{j.}}) - d_{\alpha}(k,N-k)\sqrt{2\left(\frac{\text{QME}}{n_i}\right)}~\right]^-~~~~~~\mbox{Limite Inferior}$$

$$D^{+}_{i} = \left[\overline{y_{i.}} - \min_{j \neq i}(\overline{y_{j.}}) +d_{\alpha}(k,N-k)\sqrt{2\left(\frac{\text{QME}}{n_i}\right)}~\right]^+~~~~~~\mbox{Limite Superior}$$

sendo que $ d_{\alpha}(k,N-k) $ é um valor tabelado (ver Tabela do Teste HSU no Apêndice) que depende do número de níveis ($ k $) e do número de graus de liberdade dos erros ($ N-k $) e $ n_i $ é o número de réplicas do nível $ i $ (para dados não balanceados). Para dados balanceados todos os $ n_i $ são iguais.

Se  o intervalo ($ D^-_i~;~D^+_i $) assumir somente valores negativos, consideramos que o $ i $-ésimo nível do fator é o melhor.

Para simplificar a análise e disposição dos resultados em um gráfico, realizamos a seguinte transformação dos limites dos intervalos de confiança. Para cada valor de $ D_i $, calculamos:


$$[D_i^-]^\prime = \min\{0,D_i^-\} = \left\{\begin{array}{ll}D_i^-~~~\mbox{se} ~x \textless 0 \\0~~~~\mbox{caso contrário} \\\end{array}\right. \mbox{ e }~~~(3.4.1)$$


$$[D_i^+]^\prime = \max\{0,D_i^+\} = \left\{\begin{array}{ll} D_i^+~~~\mbox{se} ~x \textgreater 0 \\0 ~~~~\mbox{caso contrário} \\\end{array}\right.~~~(3.4.2)$$

Exemplo 3.6.1:

Voltando ao Exemplo 1.1, da resistência da fibra sintética, vamos calcular os Intervalos de Confiança para todos os níveis, supondo que quanto maior a resistência da fibra sintética melhor.

Fator Resistencia_da_Fibra
15 7
15 7
15 15
15 11
15 9
20 12
20 17
20 12
20 18
20 18
25 14
25 18
25 18
25 19
25 19
30 19
30 25
30 22
30 19
30 23
35 7
35 10
35 11
35 15
35 11

clique aqui para efetuar o download dos dados utilizados nesse exemplo

$ \mbox{Nível} $ $ \overline{y}_{i.} $ $ \max_{j\neqi}(\overline{y}_{j.}) $ $ \overline{y}_{i.}-max_{j\neqi}(\overline{y}_{j.}) $
$ 15 $ $ 9,8 $ $ 21,6 $ $ -11,8 $
$ 20 $ $ 15,4 $ $ 21,6 $ $ -6,2 $
$ 25 $ $ 17,6 $ $ 21,6 $ $ -4,0 $
$ 30 $ $ 21,6 $ $ 17,6 $ $ 4,0 $
$ 35 $ $ 10,8 $ $ 21,6 $ $ -10,8 $

Como $ d_{\alpha}(k,N-k)=2,305 $, $ QME=8,06 $ e $ n=5 $. Então:

$$d_{\alpha}(k,N-k)\sqrt{2\left(\frac{QME}n}\right)}=4,138$$

Para o nível $ 15 $, temos que:


$$D^-_1=-[-11,8 - 4,138]^-$$


$$=-[-15,938]^-$$


$$=-15,938$$


$$D^+_1=[-11,8 + 4,138]^+$$


$$=[-7,662]^+$$


$$=0$$

Repetindo este procedimento para os demais níveis, obtemos

$ \mbox{Nível} $ $ D^-_i $ $ \mbox{Centro} $ $ D^+_i $
$ 15 $ $ -15,938 $ $ -11,8 $ $ 0 $
$ 20 $ $ -10,338 $ $ -6,2 $ $ 0 $
$ 25 $ $ -8,138 $ $ -4,0 $ $ 0,138 $
$ 30 $ $ -0,138 $ $ 4,0 $ $ 8,138 $
$ 35 $ $ -14,938 $ $ -10,8 $ $ 0 $

Como o Intervalo de Confiança referente ao nível 30, possui grandes partes dos valores positivos, podemos dizer que ele é o melhor entre os demais.

Usando o software Action temos os seguintes resultados:

 

Conclusão:

Como o intervalo de confiança referente ao nível $ 30 $, possui grandes partes dos valores positivos, podemos dizer que ele é o melhor entre os demais.

 Para entender como executar essa função do Software Action, você pode consultar o manual do usuário.

Exemplo 3.6.2:

A presença de insetos prejudiciais em campos de exploração agrícola pode ser detectada examinando os insetos presos nas placas cobertas com um material pegajoso erguidas nos campos. Foram relatados o número de besouros na  folha do cereal presos quando 24 placas soram colocadas no campo de aveia em um determinado mês.  Haviam 24 placas associadas em 4 grupos (6 placas em cada grupo) de acordo com as cores verde, branco, roxo e azul. Ao nível de significância de 0,05% vamos aplicar o Teste de HSU para  esse exemplo. Os dados para esse exemplo estão na sequência.

Cor Insetos
verde 45
verde 59
verde 48
verde 46
verde 38
verde 47
branco 21
branco 12
branco 14
branco 17
branco 13
branco 17
roxo 37
roxo 32
roxo 15
roxo 25
roxo 39
roxo 41
azul 16
azul 11
azul 20
azul 21
azul 14
azul 7

clique aqui para efetuar o download dos dados utilizados nesse exemplo

Cor
 
$ \bar{y_{i}} $ $ \min_{j}(\bar{y_{j}}) $ $ \bar{y}_{i.}-\min_{j\neq i}(\bar{y}_{j.}) $
Verde $ 47,17 $ $ 14,83 $  $ 32,33 $
Branco $ 15,67 $ $ 14,83 $  $ 0,833 $
Roxo $ 31,5 $ $ 14,83 $  $ 16,67 $
Azul $ 14,83 $ $ 15,67 $  $ -0,833 $

Usando o software Action a tabela da ANOVA para esses dados é

 Para entender como executar essa função do Software Action, você pode consultar o manual do usuário.

 

Temos que $ d_{o,05}(4,20)=2,192 $, $ QME=46,025 $ e $ n=6 $. Dessa maneira,

$$d_{\alpha}(k,N-k)\sqrt{2\left(\frac{QME}{n}\right)}= 8,585$$

Para a cor verde, temos:

$$D_{1}^{-}=-(47,17-14,83-8,585)^{-}=-(20,7)^{-}=0$$


$$D_{1}^{+}=(47,17-14,83+8,585)^{+}=(43,98)^{+}=40,919$$

Repetindo esse procedimento para as demais cores (níveis), obtemos:

Cor $ D_{i}^{-} $ Média $ D_{i}^{+} $
Verde 0 32,333 40,919
Azul -9,419 -0,833 7,752
Branco  -7,752  0,833  9,419 
Roxo 0 16,667 25,252

Como o intervalo de confiança referente à cor azul possui grandes partes dos valores negativos, podemos dizer que ele é o melhor entre os demais.

Usando o software Action temos os seguintes resultados:

 

Conclusão:

Como o intervalo de confiança referente à cor azul possui grandes partes dos valores negativos, podemos dizer que ele é o melhor entre os demais.

 Para entender como executar essa função do Software Action, você pode consultar o manual do usuário.

Dúvidas sobre esse conteúdo? Comente:

ANOVA

Sobre o Portal Action

O Portal Action é mantido por Estatcamp - Consultoria Estatística e Qualidade e por DIGUP - Desenvolvimento de Sistemas e Consultoria Estatística, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.

Facebook

CONTATO

  •  28 de Setembro,2066 - B, São Carlos - SP | CEP 13560-270
  • Telefone: (16) 3376-2047
  • E-Mail: [email protected]