Decomposição da Soma de Quadrados Total
A técnica da ANOVA está associada a partição da variabilidade total dos dados em componentes. A soma de quadrados total é definida como medida da variabilidade total dos dados,
![]() |
Intuitivamente isto é razoável, pois se dividirmos SQT pelos seus graus de liberdade (
), obtemos a variância amostral dos dados.
Somando e subtraindo
obtemos
![]() |
![]() |
Entretanto, o produto cruzado na equação acima é nulo, pois
![]() |
![]() |
![]() |
![]() |
logo
![]() |
isto é,
![]() |
Observações:
I. Soma de Quadrados do Fator A (
) é o desvio das médias estimadas em cada tratamento (nível) em torno da média geral dos dados.Representa a variabilidade devido aos diferentes níveis do fator A.
II. Soma de Quadrados do Erro (
) é o desvio das observações em torno da média estimada do seu nível (tratamento).Representa a variabilidade dentro de cada nível do fator A.
Graus de Liberdade e Estimativas da Variância
O conceito de grau de liberdade está sempre associado a uma soma de quadrados. Considere
elementos, então
![]() |
Como a soma dos desvios
é nula, concluímos que para determinarmos todos os desvios basta conhecermos
desvios, pois o último desvio será determinado pela relação
![]() |
Assim, dizemos que a soma quadrática
tem
graus de liberdade.
Como temos
observações, isso nos dá
graus de liberdade para a soma de quadrados total (SQT). Além disso, temos
níveis (tratamentos) do fator
, assim teremos
graus de liberdade para a soma de quadrados relativo aos níveis (SQA)
![]() |
Finalmente, dentro de cada nível temos
réplicas e portanto teremos
graus de liberdade para cada estimativa da variabilidade devido ao erro experimental 
Assim, para a soma de quadrados devido ao erro experimental
![]() |
temos que os graus de liberdade correspondem a
graus de liberdade. Sabemos que a
variância amostral do nível
é
![]() |
Então podemos escrever
![]() |
que corresponde a um estimador da variância do erro experimental (
). Similarmente, se não existe diferença entre os
níveis do fator
, podemos utilizar a variação dentro dos níveis com relação a média geral como uma estimativa da variância
. Especificamente,
![]() |
é uma estimativa de
se a média dos níveis são iguais. Observe que para todo
, a quantidade
![]() |
é uma estimativa da variância da média do nível
(
). Então, obtemos que
![]() |
corresponde a uma estimativa de
, caso não tenha diferença entre as médias dos níveis dos fatores. Com isso, a quebra da soma de quadrados total em duas somas de quadrados nos fornece duas estimativas para a variância. A primeira baseada na variabilidade dentro dos níveis e a segunda baseada na variabilidade entre os níveis. Se não existe diferença entre as médias, estas duas estimativas devem ser bastante próximas, caso contrário, suspeitamos que a diferença entre as estimativas é causada pela diferença entre as médias dos tratamentos.
Outra forma para calcularmos os graus de liberdade consiste em determinarmos o valor esperado das componentes SQA e SQE. O termo que multiplica
corresponde aos graus de liberdade.
Vamos calcular o valor esperado destes quadrados médios.
![]() |
![]() |
![]() |
![]() |
Substituindo as informações do modelo em
e
, obtemos
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
De forma análoga, temos:
![]() |
![]() |
![]() |
![]() |
Substituindo as informações do modelo em
e
, obtemos
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
pois
e
Com isso podemos definir os quadrados médios como
![]() |
Portanto, como argumentamos anteriormente, o QME é um bom estimador para a variância pois
![]() |
![]() |
assim, se não existe diferença entre os níveis (tratamentos) do fator
(isto é,
), QMA também é um bom estimador para a variância. Entretanto, se existe diferença entre as médias dos níveis, o valor esperado do quadrado médio do fator
(devido aos níveis) é maior do que
.
Assim, temos os seguintes graus de liberdade:
![]() |
Graus de liberdade | ![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
Com isso, está claro que para testarmos as hipóteses sobre diferenças entre as médias dos níveis, podemos comparar o quadrado médio do tratamento (QMA) com o quadrado médio do erro (QME). A seguir, vamos apresentar um método para fazermos essa comparação.


![$$SQT=\sum_{i=1}^{k}\sum_{j=1}^{n_{i}}\left[(y_{ij}-\overline{y}_{i.})+(\overline{y}_{i.}-\overline{y}_{..})\right]^{2}$$](/sites/default/files/tex/a171a2d90174a023e72f1c20be093f2d8da6c3d7.png)
















![$$E[SQE]=E\left[\sum_{i=1}^{k} \sum_{j=1}^{n_{i}}(y_{ij}-\overline{y}_{i.})^{2}\right]$$](/sites/default/files/tex/62d34befad671c7c15405ffd5337dee5a33a5cb8.png)
![$$=E\left[\sum_{i=1}^{k}\sum_{j=1}^{n_{i}}(y_{ij}^2-2y_{ij}\overline{y}_{i.}+\overline{y}_{i.}^2)\right]$$](/sites/default/files/tex/03cf512a0998de487f3720c6d1ed1b18f6ef6380.png)
![$$=E\left[ \sum_{i=1}^{k}\sum_{j=1}^{n_{i}}y_{ij}^2-2\sum_{i=1}^{k} n_{i}\overline{y}_{i.}^2+\sum_{i=1}^{k} n_{i}\overline{y}_{i.}^2\right]$$](/sites/default/files/tex/05168c1e142cf2f805563af662dc342b6f5de5c5.png)
![$$=E\left[\sum_{i=1}^{k}\sum_{j=1}^{n_{i}}y_{ij}^{2}-\sum_{i=1}^{k}\frac{1}{n_i} y_{i.}^{2} \right]$$](/sites/default/files/tex/9b4b9c830becf123e194bea5cc42a407f9c5f925.png)
![$$E[SQE]=E\left[\sum_{i=1}^{k}\sum_{j=1}^{n_{i}}(\mu+\alpha_{i}+\varepsilon_{ij})^{2}-\sum_{i=1}^{k}\frac{1}{n_i}\left(\sum_{j=1}^{n_{i}}(\mu+\alpha_{i}+\varepsilon_{ij})\right)^{2}\right]$$](/sites/default/files/tex/be91d4cb0311fc731a4d8293e5e1c65638d6f5d6.png)

![$$-\left.\sum_{i=1}^{k} \frac{1}{n_i} \left( n_i^2\mu^2+n_i^2\alpha_i^2+\sum_{j=1}^{n_{i}}\varepsilon_{ij}^2+2n_i^2\mu\alpha_i+2n_i\mu\sum_{j=1}^{n_{i}}\varepsilon_{ij}+2n_i\alpha_i\sum_{j=1}^{n_{i}}\varepsilon_{ij} \right) \right]$$](/sites/default/files/tex/e9c7f1cd0633d331b7492a56e15072429634d3f6.png)

![$$-\left.\left( N\mu^2+\sum_{i=1}^{k} n_i\alpha_i^2+\sum_{i=1}^{k}\sum_{j=1}^{n_{i}}\frac{\varepsilon_{ij}^2}{n_i}+2\mu\sum_{i=1}^{k} n_i\alpha_i+ 2\mu\sum_{i=1}^{k}\sum_{j=1}^{n_{i}}\varepsilon_{ij}+2\sum_{i=1}^{k}\sum_{j=1}^{n_{i}}\alpha_i\varepsilon_{ij} \right)\right]$$](/sites/default/files/tex/4e35b164d2ac22c2f61ed5a66e1e5c0d7ff14c9f.png)
![$$=E\left[\sum_{i=1}^{k}\sum_{j=1}^{n_{i}}\varepsilon_{ij}^2-\sum_{i=1}^{k}\sum_{j=1}^{n_{i}}\frac{\varepsilon_{ij}^2}{n_i}\right]$$](/sites/default/files/tex/7a6ccaf981b55eaaf4751156839648ec947b9930.png)
![$$=E\left[\sum_{i=1}^{k}\sum_{j=1}^{n_{i}}\left(1-\frac{1}{n_i}\right)\varepsilon_{ij}^2\right]$$](/sites/default/files/tex/600bb0fbbe9ef51457de1e9e12265f2b30c3cd93.png)

![$$=\sum_{i=1}^{k}\sum_{j=1}^{n_{i}}\left(1-\frac{1}{n_i}\right)(Var(\varepsilon_{ij}^2)+[E(\varepsilon_{ij})]^2), \quad \text{mas } E(\varepsilon_{ij})=0, \text{ então}$$](/sites/default/files/tex/e542e7e45a597eeb60c58c81a90f6836b64aa409.png)

![$$E[SQA]=E\left[\sum_{i=1}^{k}\sum_{j=1}^{n_{i}}(\overline{y}_{i.}-\overline{y}_{..})^2 \right]$$](/sites/default/files/tex/20083fed460b339b5defa309fd9d168d956ffb10.png)
![$$=E\left[\sum_{i=1}^{k}\sum_{j=1}^{n_{i}}(\overline{y}_{i.}^2-2\overline{y}_{i.}\overline{y}_{..}+\overline{y}_{..}^2)\right] \text{ mas }\overline{y}_{i.}=\frac{y_{i.}}{n_i}\text{ e }\overline{y}_{..}=\frac{\sum\limits_{i=1}^k y_{i.}}{N}, \text{ então}$$](/sites/default/files/tex/0d100a22ad3c2fead004c25b64d2b269ae9a13c4.png)
![$$=E\left[\sum_{i=1}^{k}\frac{y_{i.}^2}{n_i}-2\,N\overline{y}_{..}^2 + N \overline{y}_{..}^2\right]$$](/sites/default/files/tex/c98dabb19e9b105bef1adfc4d0e877ab7492726a.png)
![$$=E\left[\sum_{i=1}^{k}\frac{y_{i.}^2}{n_i}-\frac{y_{..}^2}{N}\right]$$](/sites/default/files/tex/586035d47764e2d165f7af767959b4c77b251076.png)
![$$E[SQA]=E\left[\sum_{i=1}^{k}\frac{1}{n_i}\left(\sum_{j=1}^{n_{i}}(\mu+\alpha_i+\varepsilon_{ij})\right)^2-\frac{1}{N}\left(\sum_{i=1}^{k}\sum_{j=1}^{n_{i}} (\mu+\alpha_i+\varepsilon_{ij})\right)^2\right]$$](/sites/default/files/tex/571df1984a354f58e33288f2dbec44a3b613607a.png)
![$$=E\left[\sum_{i=1}^{k}\frac{1}{n_i}\left(n_i\mu+n_i\alpha_i+\sum_{j=1}^{n_{i}}\varepsilon_{ij}\right)^2-\frac{1}{N}\left(\sum_{i=1}^{k}\left[n_i\mu+n_i\alpha_i+\sum_{j=1}^{n_{i}}\varepsilon_{ij}\right]\right)^2\right]$$](/sites/default/files/tex/fe2bf8467cf3e35adff13459dfa010d50531df83.png)
![$$=E\left[\sum_{i=1}^{k}\frac{1}{n_i}\left(n_i\mu+n_i\alpha_i+\sum_{j=1}^{n_{i}}\varepsilon_{ij}\right)^2-\frac{1}{N}\left(N\mu+ \sum_{i=1}^{k} n_i\alpha_i+ \sum_{i=1}^{k} \sum_{j=1}^{n_{i}}\varepsilon_{ij}\right)^2\right]$$](/sites/default/files/tex/2fa9ab9ac31182e41408280fc9fb84ae302a12de.png)

![$$-\left.\frac{1}{N}\left(N^2\mu^2+ 2N\mu\sum_{i=1}^{k}\sum_{j=1}^{n_{i}}\varepsilon_{ij}+(\sum_{i=1}^{k}\sum_{j=1}^{n_{i}}\varepsilon_{ij})^2\right)\right]$$](/sites/default/files/tex/86aa41d59c21544bab33747a815f8add716223a9.png)

![$$+\left.2\sum_{i=1}^{k}\sum_{j=1}^{n_{i}}\alpha_i\varepsilon_{ij}- N\mu^2-2\mu\sum_{i=1}^{k}\sum_{j=1}^{n_{i}}\varepsilon_{ij}-\frac{1}{N}(\sum_{i=1}^{k}\sum_{j=1}^{n_{i}}\varepsilon_{ij})^2 \right]$$](/sites/default/files/tex/347efcd3a71ae594a19437c510f6c9dce3aad54e.png)
![$$=E\left[\sum_{i=1}^{k} n_i\alpha_i^2+\sum_{i=1}^{k}\frac{1}{n_i}(\sum_{j=1}^{n_{i}}\varepsilon_{ij})^2+2\sum_{i=1}^{k} \sum_{j=1}^{n_{i}}\alpha_i\varepsilon_{ij}-\frac {1}{N}(\sum_{i=1}^{k}\sum_{j=1}^{n_{i}}\varepsilon_{ij})^2\right]$$](/sites/default/files/tex/b564316718da3aa3b3e4fda81fb245242783f497.png)

![$$=\sum_{i=1}^{k} n_i\alpha_i^2+\sum_{i=1}^{k} \frac{1}{n_i}\sum_{j=1}^{n_{i}}\left[Var(\varepsilon_{ij})+E^2(\varepsilon_{ij})\right]-\frac{1}{N} \sum_{i=1}^{k}\sum_{j=1}^{n_{i}} \left[Var(\varepsilon_{ij})+E^2(\varepsilon_{ij})\right]$$](/sites/default/files/tex/b33f559d57385fccf8e446b9e2a56c753e86d1d3.png)



![$$E[QME]=E\left[\frac{SQE}{N-k}\right]=\frac{1}{N-k}E[SQE]=\sigma^2;~~~\mbox{e}$$](/sites/default/files/tex/a625e74f99d4f83232a89a57335cac3197c32d6a.png)
![$$E[QMA]=E\left[\frac{SQA}{k-1}\right]=\frac{1}{k-1}E[SQA]=\sigma^2+\frac{\sum_{i=1}^{k} n_i\alpha_i^2}{k-1}$$](/sites/default/files/tex/f5d71158ddbdcdbfac6ea57466dbccd1dca5ee15.png)







