- (16) 3376-2047
- [email protected]
- Portfólio de Serviços
- AT
Vimos anteriormente o problema de compararmos os tratamentos de estudo com um tratamento controle que é usado como uma “referência” (Teste de Dunnet). Em algumas aplicações, a referência relevante (desconhecida) é o “melhor” tratamento, que é, o tratamento que tem maior valor de média (largest) ou menor (smallest), dependendo da análise de interesse. O teste proposto por Jason Hsu, tem como característica comparar todos os tratamentos com o melhor.
Como motivação, consideremos a seguinte situação. Suponhamos que entre cinco tratamentos que estão sendo comparados, dois tratamentos são tão ruins que, a maioria dos pacientes que receberam um dos dois morreram dentro de um curto período de tempo. Então, possivelmente não é de interesse primordial saber qual desses dois tratamentos é pior, a inferência de que nenhum é melhor é suficiente. Suponhamos que o segundo melhor tratamento (entre os três restantes) é quase tão bom quanto o melhor tratamento verdadeiro. Assim, a inferência estatística que identifica ambos como praticamente o melhor pode ser de interesse, pois podem ter outras considerações que impactam na escolha do tratamento. Dessa maneira, nestas situações todas as comparações duas a duas não são de interesse. A principal questão aqui é “Quais comparações são de interesse preliminar?”
Podemos caracterizar as comparações de interesse principais nessas situações como “comparações múltiplas com o melhor.” Assim, se um efeito do tratamento maior é melhor, mesmo que o melhor tratamento seja desconhecido, podemos definir os parâmetros de interesse preliminar como
$$\max_{j=1,\ldots,k}\mu_{j}-\mu_{i},i=1,\ldots,k,\quad (3.6.1)$$
a diferença entre o efeito do melhor tratamento verdadeiro e cada um dos $k$ efeitos do tratamento.
Contudo, na maioria dos casos tona-se vantajoso comparar cada tratamento com o melhor dos outros tratamentos. Suponhamos que o maior efeito do tratamento implica em um tratamento melhor. Então os parâmetros
$$\mu_{i}-\max_{j\neq i}\mu_{j}, i=1,\ldots,k$$
contém todas as informações que os parâmetros dados pela expressão (3.6.1).
Naturalmente, se o menor efeito do tratamento implica no melhor tratamento, então por simetria os parâmetros de interesse preliminares são
$$\mu_{i}-\min_{j\neq i}\mu_{j},i=1,\ldots,k.$$
Supondo que o melhor é a maior média entre os níveis do fator, vamos considerar um conjunto de intervalos com nível de confiança de $(1-\alpha)100\%$ simultâneos para a diferença entre a média do i-ésimo nível do fator e o máximo entre as médias dos demais níveis do fator. O cálculo dos limites desses intervalos são obtidos usando as seguintes equações:
$$D^{-}_{i}=-\left[\overline{y_{i.}}-\max_{j \neqi}(\overline{y_{j.}})-d_{\alpha}(k,N-k)\sqrt{2\left(\frac{QME}{n}\right)}~\right]^-~~~~~~\mbox{Limite Inferior}$$
$$D^{+}_{i}=\left[\overline{y_{i.}}-\max_{j \neqi}(\overline{y_{j.}})+d_{\alpha}(k,N-k)\sqrt{2\left(\frac{QME}{n}\right)}~\right]^+~~~~~~\mbox{Limite Superior}$$
sendo que $d_{\alpha}(k,N-k)$ é um valor tabelado (ver Tabela hsu no Apêndice) que depende do número de níveis ($k$) e do número de graus de liberdade dos erros ($N-k$) e $n_i$ é o número de réplicas do nível $i$ (para dados não balanceados). Para dados balanceados todos os $n_i$ são iguais.
Se o intervalo ($D^-_i~;~D^+_i$) assumir somente valores positivos, consideramos que o $i$-ésimo nível do fator é o melhor.
Agora, suponhamos que o melhor á a menor média entre os níveis do fator, ou o a maior média é melhor, mas temos interesse em fazer comparação múltipla com o “pior” tratamento, assim os parâmetros de interesse são $\mu_{i}-\min_{j\neq i}\mu_{j},i=1,\ldots,k.$Considerando um conjunto de intervalos com nível de confiança de $(1-\alpha)100\%$ simultâneos para a diferença entre a média do i-ésimo nível do fator e o mínimo entre as médias dos demais níveis do fator. O cálculo dos limites desses intervalos são obtidos usando as seguintes equações:
$$D^{-}_{i} = -\left[\overline{y_{i.}} - \min_{j \neq i}(\overline{y_{j.}}) - d_{\alpha}(k,N-k)\sqrt{2\left(\frac{\text{QME}}{n_i}\right)}~\right]^-~~~~~~\mbox{Limite Inferior}$$
$$D^{+}_{i} = \left[\overline{y_{i.}} - \min_{j \neq i}(\overline{y_{j.}}) +d_{\alpha}(k,N-k)\sqrt{2\left(\frac{\text{QME}}{n_i}\right)}~\right]^+~~~~~~\mbox{Limite Superior}$$
sendo que $d_{\alpha}(k,N-k)$ é um valor tabelado (ver Tabela do Teste HSU no Apêndice) que depende do número de níveis ($k$) e do número de graus de liberdade dos erros ($N-k$) e $n_i$ é o número de réplicas do nível $i$ (para dados não balanceados). Para dados balanceados todos os $n_i$ são iguais.
Se o intervalo ($D^-_i~;~D^+_i$) assumir somente valores negativos, consideramos que o $i$-ésimo nível do fator é o melhor.
Para simplificar a análise e disposição dos resultados em um gráfico, realizamos a seguinte transformação dos limites dos intervalos de confiança. Para cada valor de $D_i$, calculamos:
$$[D_i^-]^\prime = \min\{0,D_i^-\} = \left\{\begin{array}{ll}D_i^-~~~\mbox{se} ~x \textless 0 \\0~~~~\mbox{caso contrário} \\\end{array}\right. \mbox{ e }~~~(3.4.1)$$
$$[D_i^+]^\prime = \max\{0,D_i^+\} = \left\{\begin{array}{ll} D_i^+~~~\mbox{se} ~x \textgreater 0 \\0 ~~~~\mbox{caso contrário} \\\end{array}\right.~~~(3.4.2)$$
Voltando ao Exemplo 1.1, da resistência da fibra sintética, vamos calcular os Intervalos de Confiança para todos os níveis, supondo que quanto maior a resistência da fibra sintética melhor.
Fator | Resistencia_da_Fibra |
15 | 7 |
15 | 7 |
15 | 15 |
15 | 11 |
15 | 9 |
20 | 12 |
20 | 17 |
20 | 12 |
20 | 18 |
20 | 18 |
25 | 14 |
25 | 18 |
25 | 18 |
25 | 19 |
25 | 19 |
30 | 19 |
30 | 25 |
30 | 22 |
30 | 19 |
30 | 23 |
35 | 7 |
35 | 10 |
35 | 11 |
35 | 15 |
35 | 11 |
clique aqui para efetuar o download dos dados utilizados nesse exemplo
$\mbox{Nível}$ | $\overline{y}_{i.}$ | $\max_{j\neqi}(\overline{y}_{j.})$ | $\overline{y}_{i.}-max_{j\neqi}(\overline{y}_{j.})$ |
$15$ | $9,8$ | $21,6$ | $-11,8$ |
$20$ | $15,4$ | $21,6$ | $-6,2$ |
$25$ | $17,6$ | $21,6$ | $-4,0$ |
$30$ | $21,6$ | $17,6$ | $4,0$ |
$35$ | $10,8$ | $21,6$ | $-10,8$ |
Como $d_{\alpha}(k,N-k)=2,305$, $QME=8,06$ e $n=5$. Então:$$d_{\alpha}(k,N-k)\sqrt{2\left(\frac{QME}n}\right)}=4,138$$
Para o nível $15$, temos que:
$$D^-_1=-[-11,8 - 4,138]^-$$
$$=-[-15,938]^-$$
$$=-15,938$$
$$D^+_1=[-11,8 + 4,138]^+$$
$$=[-7,662]^+$$
$$=0$$
Repetindo este procedimento para os demais níveis, obtemos
$\mbox{Nível}$ | $D^-_i$ | $\mbox{Centro}$ | $D^+_i$ |
$15$ | $-15,938$ | $-11,8$ | $0$ |
$20$ | $-10,338$ | $-6,2$ | $0$ |
$25$ | $-8,138$ | $-4,0$ | $0,138$ |
$30$ | $-0,138$ | $4,0$ | $8,138$ |
$35$ | $-14,938$ | $-10,8$ | $0$ |
Como o Intervalo de Confiança referente ao nível 30, possui grandes partes dos valores positivos, podemos dizer que ele é o melhor entre os demais.
Usando o software Action temos os seguintes resultados:
Como o intervalo de confiança referente ao nível $30$, possui grandes partes dos valores positivos, podemos dizer que ele é o melhor entre os demais.
![]() |
Para entender como executar essa função do Software Action, você pode consultar o manual do usuário. |
A presença de insetos prejudiciais em campos de exploração agrícola pode ser detectada examinando os insetos presos nas placas cobertas com um material pegajoso erguidas nos campos. Foram relatados o número de besouros na folha do cereal presos quando 24 placas soram colocadas no campo de aveia em um determinado mês. Haviam 24 placas associadas em 4 grupos (6 placas em cada grupo) de acordo com as cores verde, branco, roxo e azul. Ao nível de significância de 0,05% vamos aplicar o Teste de HSU para esse exemplo. Os dados para esse exemplo estão na sequência.
Cor | Insetos |
verde | 45 |
verde | 59 |
verde | 48 |
verde | 46 |
verde | 38 |
verde | 47 |
branco | 21 |
branco | 12 |
branco | 14 |
branco | 17 |
branco | 13 |
branco | 17 |
roxo | 37 |
roxo | 32 |
roxo | 15 |
roxo | 25 |
roxo | 39 |
roxo | 41 |
azul | 16 |
azul | 11 |
azul | 20 |
azul | 21 |
azul | 14 |
azul | 7 |
clique aqui para efetuar o download dos dados utilizados nesse exemplo
Cor |
$\bar{y_{i}}$ | $\min_{j}(\bar{y_{j}})$ | $\bar{y}_{i.}-\min_{j\neq i}(\bar{y}_{j.})$ |
Verde | $47,17$ | $14,83$ | $32,33$ |
Branco | $15,67$ | $14,83$ | $0,833$ |
Roxo | $31,5$ | $14,83$ | $16,67$ |
Azul | $14,83$ | $15,67$ | $-0,833$ |
Usando o software Action a tabela da ANOVA para esses dados é
![]() |
Para entender como executar essa função do Software Action, você pode consultar o manual do usuário. |
Temos que $d_{o,05}(4,20)=2,192$, $QME=46,025$ e $n=6$. Dessa maneira,
$$d_{\alpha}(k,N-k)\sqrt{2\left(\frac{QME}{n}\right)}= 8,585$$
Para a cor verde, temos:
$$D_{1}^{-}=-(47,17-14,83-8,585)^{-}=-(20,7)^{-}=0$$
$$D_{1}^{+}=(47,17-14,83+8,585)^{+}=(43,98)^{+}=40,919$$
Repetindo esse procedimento para as demais cores (níveis), obtemos:
Cor | $D_{i}^{-}$ | Média | $D_{i}^{+}$ |
Verde | 0 | 32,333 | 40,919 |
Azul | -9,419 | -0,833 | 7,752 |
Branco | -7,752 | 0,833 | 9,419 |
Roxo | 0 | 16,667 | 25,252 |
Como o intervalo de confiança referente à cor azul possui grandes partes dos valores negativos, podemos dizer que ele é o melhor entre os demais.
Usando o software Action temos os seguintes resultados:
Como o intervalo de confiança referente à cor azul possui grandes partes dos valores negativos, podemos dizer que ele é o melhor entre os demais.
![]() |
Para entender como executar essa função do Software Action, você pode consultar o manual do usuário. |
O Portal Action é mantido pela Estatcamp - Consultoria Estatística e Qualidade, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.