1 - ANOVA - Fatores Aleatórios (Um Fator)

Você está aqui

Os módulos anteriores foram dedicados a um estudo de vários modelos com características comuns e que os mesmos números de observações foram tiradas de cada tratamento ou grupo em cada linha da subamostra. Quando esses números são os mesmos, os dados são conhecidos como dados balanceados, agora, quando o número de observações nas linhas não são todas iguais, os dados são conhecidos como dados desbalanceados. Em geral, é desejável ter um número igual de observações em cada subclasse, pois os experimentos com dados desbalanceados são muito mais complexas e difíceis de analisar e interpretar do que as com dados balanceados.

No entanto, em muitas situações práticas, nem sempre é possível ter um número igual de observações para os tratamentos ou grupos. Mesmo se um experimento é bem planejado para ser balanceado, podendo ter problemas durante à execução devido a circunstâncias além do controle do experimentador, por exemplo, valores faltando ou exclusão de observações com defeito pode resultar em diferentes tamanhos de amostra em diferentes grupos. Em muitos casos, os dados podem surgir através de amostragens, em que o número de observações por grupo não pode ser determinada, ou por meio de um experimento destinado a produzir dados balanceados, mas que na verdade podem resultar em dados desbalanceados. Podemos citar como exemplo, que plantas ou animais podem morrer, máquinas podem quebrar ou falhar e ainda os pacientes podem ser retirados do estudo.

As inferências sobre as componentes de variância para dados desbalanceados são muito mais complicadas do que as de dados balanceados. A razão é que a análise de variância de dados balanceados é bastante simples uma vez que há uma única partição da soma de quadrados total em componentes das somas de quadrados, que sob as suposições padrões de distribuição seguem um múltiplo de uma distribuição Qui-Quadrado. Este múltiplo sendo o produto dos graus de liberdade e quadrados médios esperados de um dos efeitos aleatórios. Assim, hipóteses sobre os efeitos do tratamento podem ser testadas pela divisão de quadrados médios de um dos efeitos pelo erro quadrático médio apropriado para formar uma relação de teste de variância F. Já os dados desbalanceados não tem estas propriedades,  já que não existe uma única partição da soma de quadrados total e, consequentemente, não há uma única de análise de variância. Além disso, em qualquer decomposição dada, o somas de quadrados de componentes não são independentes ou identicamente distribuídos como variáveis do tipo Qui-Quadrado, e correspondente a qualquer tratamento quadrático médio em particular, significa que não existe um erro quadrático médio com esperança igual sob a hipótese nula.

Neste módulo apresentamos o modelo de um fator aleatório com dados balanceados, ressaltamos que as deduções são similares ao modelo da ANOVA com efeitos fixos. A seguir, temos o seguinte modelo


$$y_{ij}=\mu+\alpha_i+\varepsilon_{ij}\quad\left\{\begin{array}{c}i=1,\dots, k\\j=1,\dots,r \\\end{array}\right.~~~~(1.1)$$

Para este modelo $ \mu $ é um parâmetro comum a todos os tratamentos e representa a média geral dos dados, $ \alpha_{i} $ é o efeito devido ao i-ésimo nível do fator. A variável aleatória $ \varepsilon_{ij} $ corresponde ao erro aleatório experimental, isto é, a variabilidade não explicada pelo modelo devido a variações presentes em diversas fontes não consideradas no estudo.

Além disso, assumimos que o erro tem distribuição Normal com média zero e variância $ \sigma^{2}_{\varepsilon} $ e que os erros são mutuamente independentes. Com isso, temos que


$$\varepsilon_{ij}\sim~N(0,\sigma^{2}_{\varepsilon}).$$

Agora, para o efeito $ \alpha_i $, assumimos que tem distribuição Normal com média zero e variância $ \sigma^2_{\alpha}. $ Assumimos também que os efeitos são mutuamente independentes. Assim,


$$\alpha_{i}\sim~N(0,\sigma^{2}_{\alpha}).$$

Além disso, assumimos que não temos correlação entre o efeito $ \alpha_i $ e o erro experimental $ \varepsilon_{ij} $ para todos $ i,j. $ Para ilustrarmos este modelo temos o exemplo a seguir:

Exemplo 1.1

Um especialista em educação quer avaliar o nível de ensino de matemática para alunos do ensino fundamental das escolas de sua cidade. Para isto, foi realizado uma amostragem entre os alunos das escolas, no qual foi aplicado uma prova. À partir dos dados coletados na tabela, o que podemos dizer a respeito da uniformidade do ensino entre as escolas?

Nota Escola
A B C D
1 3,94 4,23 5,2 3,86
2 4,45 5,69 6,3 3,74
3 4,43 5,37 9,92 4,35
4 6,21 4,5 7,38 5
5 3,63 3,78 9,41 5,99
6 5,89 6,19 8,47 3,95
7 6,36 5,43 6,74 2,84
8 3,89 5,64 7,93 5,37
9 5,84 5,74 8,91 4,39
10 5,15 4,2 4,99 3,89
11 4,16 2,91 6,91 2,06
12 4,44 6,92 8,73 2,72
13 4,8 6,84 5,61 3,29
14 4,04 5,91 8,89 3,14
15 4,15 6,74 6,28 3,61
16 3,46 5,09 7,38 5,38
17 4,04 8,01 6,85 4,24
18 3,29 4,45 6,57 3,58
19 3,7 4,36 8,38 5,01
20 3,8 4,76 8,06 3,97

Tabela 1.1: Notas dos alunos do ensino fundamental na prova de matemática em cada escola.

clique aqui para efetuar o download dos dados utilizados nesse exemplo

Inicialmente, foi feito uma análise descritiva dos dados, para facilitar a interpretação dos mesmos e a aplicação do modelo da ANOVA.

Figura 1.1: Boxplot das Notas dos alunos do ensino fundamental na prova de matemática em cada escola.

 Para entender como executar essa função do Software Action, você pode consultar o manual do usuário.

Através do boxplot, notamos que a escola C tem notas maiores que as demais, 7,4 em média, em comparação com as outras escola de ensino fundamental. O objetivo deste exemplo é na uniformidade do ensino nas escola, para isto, vamos aplicar o método da ANOVA para respondermos esta pergunta.

Neste exemplo simples, os k níveis são escolhidos aleatoriamente de uma população de níveis e podemos estender as conclusões para todos os demais níveis da população, que no nosso caso são os alunos de cada escola. Neste caso, os efeitos são variáveis aleatórias e denominados efeitos aleatórios, a seguir vamos particionar a variabilidade total dos dados.

 

Dúvidas sobre esse conteúdo? Comente:

ANOVA

Sobre o Portal Action

O Portal Action é mantido por Estatcamp - Consultoria Estatística e Qualidade e por DIGUP - Desenvolvimento de Sistemas e Consultoria Estatística, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.

Facebook

CONTATO

  •  28 de Setembro,2066 - B, São Carlos - SP | CEP 13560-270
  • Telefone: (16) 3376-2047
  • E-Mail: [email protected]