Poder e tamanho da amostra para ANOVA 1 fator

Você está aqui

O poder do teste estatístico é definido como a probabilidade de rejeitar a hipótese nula, dado que a mesma é falsa. Na prática, é importante que se tenham testes com nível de significância próximos do nível de significância nominal e que o poder seja alto, mesmo em situações de amostras pequenas. Na suposição de amostras provenientes de uma distribuição Normal, hipóteses da forma $H_{0}$ : $\mu = 0$ versus $H_{1}$ : $\mu \neq 0$ podem ser avaliadas a partir da estatítica t-Student. Alternativamente, na suposição de simetria, podemos utilizar o teste não-paramétrico de Wilcoxon. Para ambos, os testes, quando essas suposições estão satisfeitas, esperamos que o erro do Tipo I esteja próximo do nível de significância nominal e que o poder seja alto. Por outro lado, quando ocorre a quebra de alguma destas suposições, é importante avaliar o comportamento da taxa de rejeição de $H_{0}$ quando a mesma é verdadeira. Essa taxa de rejeição é definida como o tamanho empírico do teste e pode ser calculada via simulação Monte Carlo, gerando amostras sob a hipótese nula. Por outro lado, ao gerarmos valores sob a hipótese alternativa, temos que a proporção de vezes em que $H_{0}$ é rejeitada define o poder de um teste estatístico.

Entre os dois tipos de erros, há relação: quando $\alpha$ aumenta $\beta$ diminui e vice-versa, quando $\alpha$ diminui $\beta$ aumenta. O caminho para reduzir $\alpha$ e $\beta$ simultaneamente é aumentar o tamanho da amostra. A tabela seguinte mostra as probabilidades dos dois tipos de erro.

  $H_0$ verdadeiro  $H_0$ falso
Probabilidade de Não Rejeitar $H_0$ $1-\alpha$ $\beta$
Probabilidade de Rejeitar $H_0$ $\alpha$ $1-\beta$

Ao definirmos os valores do tamanho da amostra $n$ e do nível de significância $\alpha$, antes de realizarmos o teste de hipóteses, é possível obtermos valores da probabilidade $\beta$ de cometer um erro tipo II em função de possíveis valores verdadeiros do parâmetro declarado na hipótese nula.

O objetivo é conhecer quão bem o teste de hipóteses controla o erro do tipo II, ou qual a probabilidade de rejeitar a hipótese nula se realmente for falsa.

Essa informação é obtida da probabilidade complementar de $\beta$, ou seja, $1- \beta$, denominada poder do teste contra um possível valor verdadeiro do parâmetro declarado na hipótese nula.

Para um determinado teste de hipóteses é possível definirmos valores verdadeiros do parâmetro declarado na hipótese nula e, para cada um deles, calcularmos a probabilidade $1- \beta.$ Com isso, geramos a função poder e seu correspondente gráfico da curva do poder do teste.

Pelo estudo do Poder do teste F para 1 fator, referimos que a probabilidade da regra de decisão implicará na escolha por $H_{1}.$ Aqueles com as médias dos tratamentos diferentes. Mais especificamente, o Poder é dado pela seguinte expressão:

Poder$= P(F^* \textgreater F(1 - \alpha, k - 1, N - k)|\phi)$

em que $\phi$ é o parâmetro de não centralidade, e é obtido através da seguinte equação:

$$\phi =\frac{\displaystyle 1}{\displaystyle \sigma}~\sqrt{\sum^n_{i=1}\dfrac{n_{i}(\mu_{i}-\mu_{.})^2}{\displaystyle k}}\ \ \text{e}$$
$$\mu_{.} = \displaystyle\sum^n_{i=1}\dfrac{ n_{i}\mu_{i}}{N}$$

Quando todos os fatores da amostra tem tamanho n, o parêmetro $\phi$ é obtido pela equação:

$\phi = \dfrac{\displaystyle 1}{ \sigma} ~ \sqrt{\frac{\displaystyle n}{\displaystyle k}{\displaystyle\sum^n_{i=1} (\mu_{i} - \mu_{.})^2}}$    em que    $n_{i} \equiv n$ e
$\mu_{.} =\displaystyle \sum^n_{i=1}\frac{\mu_{i}}{k},$ pois $N = n.k$

As probabilidade do Poder do Teste são calculadas através da distribuição F não central. Além disso,

$\bullet$ Temos que $\nu_{1}$ é o número de graus de liberdade do numerador para $F^*$. Para o modelo da ANOVA, $\nu_{1} = k - 1$, ou número de níveis menos 1.

$\bullet$ O nível de significância é dado por $\alpha$, geralmente usamos $\alpha = 0,05$.

$\bullet$ Temos que $\nu_{2}$ é o número de graus de liberdade do denominador para $F^*$. No modelo da ANOVA temos:

$$\nu_{2} = N - k ~~~\overset{N = n.k}{\displaystyle =}~~~ n.k - k = k(n - 1)$$

O planejamento das amostras para experimento de 1 fator com níveis fixos é feito utilizando o parâmentro de não centralidade para igualdade das amostras. No entanto, em vez de exigirmos uma especificação direta do nível $\mu_{i}$, para o qual é importante controlar o erro do tipo II, ela apenas exige uma diferença mínima do nível do fator das médias, porque ela é importante no que tange a detecção das diferenças entre os $\mu_{i}$, com probabilidade alta. Esta diferença mínima é denotada por $\Delta$.

$\Delta =\max\{\mu_i\}-\min\{\mu_i\} $

Algumas especificações devem ser feitas, como:

$\bullet$ O nível $\alpha$ é o risco do erro do tipo I a ser controlada.

$\bullet$ A magnitude da diferença mínima $\Delta$ de $\mu_{i}$, é importante, pois ela será a tolerância do teste com probabilidade alta. A magnitude de $\sigma$, que o desvio padrão da probabilidade da distribuição de Y, e ela é especificada em termos da relação:

$$ \frac{\displaystyle \Delta}{\displaystyle \sigma}$$

$\bullet$ O nível $\beta$ é o risco do erro do tipo II a ser controlada. O Poder do Teste é dado por:
$$1 - \beta$$

Explicação direta de $\dfrac{\Delta}{\sigma}$: a diferença mínima é explicada diretamente em unidade de desvio padrão $\sigma$.

Nota: Embora não especifiquemos $\dfrac{\Delta}{\sigma}$ diretamente. Estes planejamento exigem o do valor do desvio padrão $\sigma$ antecipado. Isso não é tanta vantagem visto como um dado significativo de especificação do $\Delta$ em unidades de $\sigma.$ Ele irá frequentemente exigir o conhecimento do tamanho aproximado do desvio padrão.

Com isso o parâmentro de não centralidade será dado como:

$$\phi = \sqrt{\frac{\displaystyle n}{\displaystyle 2.k}}\left(\frac{\displaystyle \Delta }{\displaystyle \sigma}\right)\quad (1)$$

 

Exemplo 1.3.1: 

Considere os dados do Exemplo 1.

clique aqui para efetuar o download dos dados utilizados nesse exemplo

Primeiramente calcularemos o valor de $\Delta$:

$\Delta =\max\{\mu_i\}-\min\{\mu_{i}\}= 21,6 - 9,8 = 11,8$

Temos então que o parâmetro de não centralidade é dado por:

$$\phi = \sqrt{\frac{\displaystyle n}{\displaystyle 2.k}}\left(\frac{\displaystyle \Delta }{\displaystyle \sigma}\right) = \sqrt{\frac{\displaystyle 5}{\displaystyle 2\times5}}\left(\frac{\displaystyle 11,8 }{\displaystyle 5,151698749}\right) = 1,6196$$

Por fim, obtemos os seguintes resultados:

$\Delta$ Nº de níveis (k) Observações por nível (n) Desvio padrão ($\sigma$)
11,8 5 5 5,151

O valor calculado do Poder do Teste será:

Poder$= P(F^* \textgreater F(1 - \alpha, k - 1, N - k)|\phi) = 0,7346$

Veja a seguir os resultados obtidos pelo software Action Stat para o mesmo exemplo.

 Para entender como executar essa função do Software Action Stat, você pode consultar o manual do usuário.

 

Cálculo do tamanho da amostra

 

Para calcularmos o tamanho da amostra, basta isolarmos o tamanho da amostra $n$ da equação (1). Com isso, obtemos:

$$n=\dfrac{2k\phi^2\sigma^2}{\Delta^2}$$

Exemplo 1.3.2: 

Neste exemplo, calculamos o tamanho da amostra para um experimento em que desejamos detectar uma diferença mínima de $\Delta =11,8,$ para $k=5$ níveis, variabilidade (desvio-padrão) de $s=5,151$ e poder do teste de $1-\beta=0,734.$

De fato, para um poder de $1-\beta=0,734$ temos que o parâmetro de não centralidade da distribuição F é dado por $\phi$ de 1,6196. Logo, temos que

$$n=\dfrac{2k\phi^2\sigma^2}{\Delta^2}=\dfrac{2\times 5\times(1,6196)^2(5,151)^2}{(11,8)^2}=4,9984\approx 5$$

Portanto o tamanho da amostra para este experimento é de $n=5.$

Veja a seguir os resultados obtidos pelo software Action Stat para o mesmo exemplo.

 Para entender como executar essa função do Software Action Stat, você pode consultar o manual do usuário.

 

 

 

ANOVA

Sobre o Portal Action

O Portal Action é mantido pela Estatcamp - Consultoria Estatística e Qualidade, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.

Facebook

CONTATO

  •  Maestro Joao Seppe, 900, São Carlos - SP | CEP 13561-180
  • Telefone: (16) 3376-2047
  • E-Mail: [email protected]