Poder e tamanho da amostra para ANOVA 1 fator

Você está aqui

O poder do teste estatístico é definido como a probabilidade de rejeitar a hipótese nula, dado que a mesma é falsa. Na prática, é importante que se tenham testes com nível de significância próximos do nível de significância nominal e que o poder seja alto, mesmo em situações de amostras pequenas. Na suposição de amostras provenientes de uma distribuição Normal, hipóteses da forma $ H_{0} $ : $ \mu = 0 $ versus $ H_{1} $ : $ \mu \neq 0 $ podem ser avaliadas a partir da estatítica t-Student. Alternativamente, na suposição de simetria, podemos utilizar o teste não-paramétrico de Wilcoxon. Para ambos, os testes, quando essas suposições estão satisfeitas, esperamos que o erro do Tipo I esteja próximo do nível de significância nominal e que o poder seja alto. Por outro lado, quando ocorre a quebra de alguma destas suposições, é importante avaliar o comportamento da taxa de rejeição de $ H_{0} $ quando a mesma é verdadeira. Essa taxa de rejeição é definida como o tamanho empírico do teste e pode ser calculada via simulação Monte Carlo, gerando amostras sob a hipótese nula. Por outro lado, ao gerarmos valores sob a hipótese alternativa, temos que a proporção de vezes em que $ H_{0} $ é rejeitada define o poder de um teste estatístico.

Entre os dois tipos de erros, há relação: quando $ \alpha $ aumenta $ \beta $ diminui e vice-versa, quando $ \alpha $ diminui $ \beta $ aumenta. O caminho para reduzir $ \alpha $ e $ \beta $ simultaneamente é aumentar o tamanho da amostra. A tabela seguinte mostra as probabilidades dos dois tipos de erro.

  $ H_0 $ verdadeiro  $ H_0 $ falso
Probabilidade de Não Rejeitar $ H_0 $ $ 1-\alpha $ $ \beta $
Probabilidade de Rejeitar $ H_0 $ $ \alpha $ $ 1-\beta $

Ao definirmos os valores do tamanho da amostra $ n $ e do nível de significância $ \alpha $, antes de realizarmos o teste de hipóteses, é possível obtermos valores da probabilidade $ \beta $ de cometer um erro tipo II em função de possíveis valores verdadeiros do parâmetro declarado na hipótese nula.

O objetivo é conhecer quão bem o teste de hipóteses controla o erro do tipo II, ou qual a probabilidade de rejeitar a hipótese nula se realmente for falsa.

Essa informação é obtida da probabilidade complementar de $ \beta $, ou seja, $ 1- \beta $, denominada poder do teste contra um possível valor verdadeiro do parâmetro declarado na hipótese nula.

Para um determinado teste de hipóteses é possível definirmos valores verdadeiros do parâmetro declarado na hipótese nula e, para cada um deles, calcularmos a probabilidade $ 1- \beta. $ Com isso, geramos a função poder e seu correspondente gráfico da curva do poder do teste.

Pelo estudo do Poder do teste F para 1 fator, referimos que a probabilidade da regra de decisão implicará na escolha por $ H_{1}. $ Aqueles com as médias dos tratamentos diferentes. Mais especificamente, o Poder é dado pela seguinte expressão:

Poder$ = P(F^* \textgreater F(1 - \alpha, k - 1, N - k)|\phi) $

em que $ \phi $ é o parâmetro de não centralidade, e é obtido através da seguinte equação:

$$\phi =\frac{\displaystyle 1}{\displaystyle \sigma}~\sqrt{\sum^n_{i=1}\dfrac{n_{i}(\mu_{i}-\mu_{.})^2}{\displaystyle k}}\ \ \text{e}$$

$$\mu_{.} = \displaystyle\sum^n_{i=1}\dfrac{ n_{i}\mu_{i}}{N}$$

Quando todos os fatores da amostra tem tamanho n, o parêmetro $ \phi $ é obtido pela equação:

$ \phi = \dfrac{\displaystyle 1}{ \sigma} ~ \sqrt{\frac{\displaystyle n}{\displaystyle k}{\displaystyle\sum^n_{i=1} (\mu_{i} - \mu_{.})^2}} $    em que    $ n_{i} \equiv n $ e
$ \mu_{.} =\displaystyle \sum^n_{i=1}\frac{\mu_{i}}{k}, $ pois $ N = n.k $

As probabilidade do Poder do Teste são calculadas através da distribuição F não central. Além disso,

$ \bullet $ Temos que $ \nu_{1} $ é o número de graus de liberdade do numerador para $ F^* $. Para o modelo da ANOVA, $ \nu_{1} = k - 1 $, ou número de níveis menos 1.

$ \bullet $ O nível de significância é dado por $ \alpha $, geralmente usamos $ \alpha = 0,05 $.

$ \bullet $ Temos que $ \nu_{2} $ é o número de graus de liberdade do denominador para $ F^* $. No modelo da ANOVA temos:

$$\nu_{2} = N - k ~~~\overset{N = n.k}{\displaystyle =}~~~ n.k - k = k(n - 1)$$

O planejamento das amostras para experimento de 1 fator com níveis fixos é feito utilizando o parâmentro de não centralidade para igualdade das amostras. No entanto, em vez de exigirmos uma especificação direta do nível $ \mu_{i} $, para o qual é importante controlar o erro do tipo II, ela apenas exige uma diferença mínima do nível do fator das médias, porque ela é importante no que tange a detecção das diferenças entre os $ \mu_{i} $, com probabilidade alta. Esta diferença mínima é denotada por $ \Delta $.

$ \Delta =\max\{\mu_i\}-\min\{\mu_i\}  $

Algumas especificações devem ser feitas, como:

$ \bullet $ O nível $ \alpha $ é o risco do erro do tipo I a ser controlada.

$ \bullet $ A magnitude da diferença mínima $ \Delta $ de $ \mu_{i} $, é importante, pois ela será a tolerância do teste com probabilidade alta. A magnitude de $ \sigma $, que o desvio padrão da probabilidade da distribuição de Y, e ela é especificada em termos da relação:

$$ \frac{\displaystyle \Delta}{\displaystyle \sigma}$$

$ \bullet $ O nível $ \beta $ é o risco do erro do tipo II a ser controlada. O Poder do Teste é dado por:

$$1 - \beta$$

Explicação direta de $ \dfrac{\Delta}{\sigma} $: a diferença mínima é explicada diretamente em unidade de desvio padrão $ \sigma $.

Nota: Embora não especifiquemos $ \dfrac{\Delta}{\sigma} $ diretamente. Estes planejamento exigem o do valor do desvio padrão $ \sigma $ antecipado. Isso não é tanta vantagem visto como um dado significativo de especificação do $ \Delta $ em unidades de $ \sigma. $ Ele irá frequentemente exigir o conhecimento do tamanho aproximado do desvio padrão.

Com isso o parâmentro de não centralidade será dado como:

$$\phi = \sqrt{\frac{\displaystyle n}{\displaystyle 2.k}}\left(\frac{\displaystyle \Delta }{\displaystyle \sigma}\right)\quad (1)$$

 

Exemplo 1.3.1: 

Considere os dados do Exemplo 1.

clique aqui para efetuar o download dos dados utilizados nesse exemplo

Primeiramente calcularemos o valor de $ \Delta $:

$ \Delta =\max\{\mu_i\}-\min\{\mu_{i}\}= 21,6 - 9,8 = 11,8 $

Temos então que o parâmetro de não centralidade é dado por:

$$\phi = \sqrt{\frac{\displaystyle n}{\displaystyle 2.k}}\left(\frac{\displaystyle \Delta }{\displaystyle \sigma}\right) = \sqrt{\frac{\displaystyle 5}{\displaystyle 2\times5}}\left(\frac{\displaystyle 11,8 }{\displaystyle 5,151698749}\right) = 1,6196$$

Por fim, obtemos os seguintes resultados:

$ \Delta $ Nº de níveis (k) Observações por nível (n) Desvio padrão ($ \sigma $)
11,8 5 5 5,151

O valor calculado do Poder do Teste será:

Poder$ = P(F^* \textgreater F(1 - \alpha, k - 1, N - k)|\phi) = 0,7346 $

Veja a seguir os resultados obtidos pelo software Action Stat para o mesmo exemplo.

 Para entender como executar essa função do Software Action Stat, você pode consultar o manual do usuário.

 

Cálculo do tamanho da amostra

 

Para calcularmos o tamanho da amostra, basta isolarmos o tamanho da amostra $ n $ da equação (1). Com isso, obtemos:

$$n=\dfrac{2k\phi^2\sigma^2}{\Delta^2}$$

Exemplo 1.3.2: 

Neste exemplo, calculamos o tamanho da amostra para um experimento em que desejamos detectar uma diferença mínima de $ \Delta =11,8, $ para $ k=5 $ níveis, variabilidade (desvio-padrão) de $ s=5,151 $ e poder do teste de $ 1-\beta=0,734. $

De fato, para um poder de $ 1-\beta=0,734 $ temos que o parâmetro de não centralidade da distribuição F é dado por $ \phi $ de 1,6196. Logo, temos que


$$n=\dfrac{2k\phi^2\sigma^2}{\Delta^2}=\dfrac{2\times 5\times(1,6196)^2(5,151)^2}{(11,8)^2}=4,9984\approx 5$$

Portanto o tamanho da amostra para este experimento é de $ n=5. $

Veja a seguir os resultados obtidos pelo software Action Stat para o mesmo exemplo.

 Para entender como executar essa função do Software Action Stat, você pode consultar o manual do usuário.

 

 

 

Dúvidas sobre esse conteúdo? Comente:

ANOVA

Sobre o Portal Action

O Portal Action é mantido por Estatcamp - Consultoria Estatística e Qualidade e por DIGUP - Desenvolvimento de Sistemas e Consultoria Estatística, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.

Facebook

CONTATO

  •  28 de Setembro,2066 - B, São Carlos - SP | CEP 13560-270
  • Telefone: (16) 3376-2047
  • E-Mail: [email protected]