2.2 - Decomposição da Soma de Quadrados

Você está aqui

Aqui, vamos "quebrar" a variabilidade total dos dados, denominada soma de quadrados total, em diversos componentes. Neste caso, mostramos que

$ SQ_T = SQ_A + SQ_B + SQ_{AB} + SQ_E $

no qual $ SQ_T $ é a soma de quadrados total, $ SQ_A $ é a soma de quadrados do fator A, $ SQ_B $ é a soma de quadrados do fator $ B $, $ SQ_{AB} $ é a soma de quadrados da interação $ A\times B $ e $ SQ_E $ é a soma de quadrados do erro. Para isto, temos que


$$\sum_{i=1}^{a}\sum_{j=1}^{b}\sum_{k=1}^{r}(y_{ijk}- \overline{y}_{...})^2=$$


$$=\sum_{i=1}^{a}\sum_{j=1}^{b}\sum_{k=1}^{r}\left[(\overline{y}_{i..}-\overline{y}_{...})+(\overline{y}_{.j.}-\overline{y}_{...})+(\overline{y}_{ij.}-\overline{y}_{i..}-\overline{y}_{.j.}+\overline{y}_{...})+ (y_{ijk}-\overline{y}_{ij.})\right]^2 $$

Após algumas manipulações algébricas, obtemos que


$$\sum_{i=1}^{a}\sum_{j=1}^{b}\sum_{k=1}^{r}(y_{ijk}-\overline{y}_{...})^2=b~r \sum_{i=1}^{a}(\overline{y}_{i..}-\overline{y}_{...})^2 +a~r\sum_{j=1}^{b}(\overline{y}_{.j.}-\overline{y}_{...})^2 +r~\sum_{i=1}^{a}\sum_{j=1}^{b}(\overline{y}_{ij.}-\overline{y}_{i..}-\overline{y}_{.j.}+\overline{y}_{...})^2$$


$$+\sum_{i=1}^{a}\sum_{j=1}^{b}\sum_{k=1}^{r}(y_{ijk}-\overline{y}_{ij.})^2$$

Portanto


$$SQ_T=\sum_{i=1}^{a}\sum_{j=1}^{b}\sum_{k=1}^{r}(y_{ijk}-\overline{y}_{...})^2$$


$$SQ_A=b~r\sum_{i=1}^{a}(\overline{y}_{i..}-\overline{y}_{...})^2$$


$$SQ_B=a~r\sum_{j=1}^{b}(\overline{y}_{.j.}-\overline{y}_{...})^2$$


$$SQ_{AB}=r~\sum_{i=1}^{a}\sum_{j=1}^{b}(\overline{y}_{ij.}-\overline{y}_{i..}-\overline{y}_{.j.}+\overline{y}_{...})^2$$


$$SQ_E=\sum_{i=1}^{a}\sum_{j=1}^{b}\sum_{k=1}^{r}(y_{ijk}-\overline{y}_{ij.})^2 $$

Uma forma conveniente para se calcular a soma de quadrados é utilizar o cálculo de variância amostral. Na Tabela 2.2.1 apresentamos quais variâncias devemos calcular.

Fator A Fator B    
1 2  $ \ldots $ b Média  
1

 $ y_{111},\ldots,y_{11r} $

$ s^2_{11} $

 $ y_{121},\ldots,y_{12r} $

$ s^2_{12} $

 $ \ldots $

 $ y_{1b1},\ldots,y_{1br} $

$ s^2_{1b} $

 $ \overline{y}_{1..} $  $ s^2_A $
2

 $ y_{211},\ldots,y_{21r} $

$ s^2_{21} $

 $ y_{221},\ldots,y_{22r} $

$ s^2_{22} $

 $ \ldots $

 $ y_{2b1},\ldots,y_{2br} $

$ s^2_{2b} $

 $ \overline{y}_{2..} $

 

 $ \vdots $  $ \vdots $  $ \vdots $  $ \vdots $  $ \vdots $  $ \vdots $
a

 $ y_{a11},\ldots,y_{a1r} $

$ s^2_{a1} $

 $ y_{a21},\ldots,y_{a2r} $

$ s^2_{a2} $

 $ \ldots $

 $ y_{ab1},\ldots,y_{abr} $

$ s^2_{ab} $

 $ \overline{y}_{a..} $
Média  $ \overline{y}_{.1.} $   $ \overline{y}_{.2.} $  $ \ldots $  $ \overline{y}_{.b.} $  $ \overline{y}_{...} $  
 
   $ s^2_B $  

Tabela 2.2.1: Entrada de dados e variâncias.

Portanto,


$$SQ_T=(a~b~r - 1)~s^2_g~~~(2.2.1)$$


$$SQ_A=b~r~(a - 1)~s^2_A~~~(2.2.2)$$


$$SQ_B=a~r~(b - 1)~s^2_B~~~(2.2.3)$$


$$SQ_E=(r - 1)~\sum_{i=1}^{a}\sum_{j=1}^{b}~s^2_{ij}~~~(2.2.4)$$


$$SQ_{AB}=SQ_T-SQ_B-SQ_A-SQ_E~~~(2.2.5)$$

Sendo que:

  • $ s^2_g $: representa a variância amostral com relação a todos os dados,
       
    $$s^2_g~=~\frac{1}{a~b~r~-~1}\sum_{i=1}^{p}\sum_{j=1}^{b}\sum^{r}_{k=1}(y_{ijk}~-~\overline{y}_{...})^2;$$

  • $ s^2_A $: representa a variância amostral com relação as médias dos níveis do Fator A,
        
    $$s^2_A~=~\frac{1}{a~-~1}\sum^{a}_{i=1}(\overline{y}_{i..}~-~\overline{y}_{...})^2;$$

  • $ s^2_B $: representa a variância amostral com relação as médias dos níveis do Fator B,
            
    $$s^2_B~=~\frac{1}{b~-~1}\sum^{b}_{j=1}(\overline{y}_{.j.}~-~\overline{y}_{...})^2; \quad \mbox{e}$$

  • $ s^2_{ij} $: representa a variância amostral com relação a cada combinação de A e B,
        
    $$s^2_{ij}~=~\frac{1}{r~-~1}\sum^{r}_{k=1}(y_{ijk}~-~\overline{y}_{ij.})^2.$$

Cálculo dos Graus de Liberdade

O número de graus de liberdade em uma soma de quadrados é a quantidade de elementos independentes nessa soma. Por exemplo, consideremos a soma de quadrados $ \sum\limits_{i=1}^{a}(\overline{y}_{i..}- \overline{y}_{...})^2 $. Neste caso, como $ \sum\limits_{i=1}^{a}(\overline{y}_{i..}-\overline{y}_{...})=0 $, nem todos os elementos $ (\overline{y}_{1..}-\overline{y}_{...}),\ldots, (\overline{y}_{a..}-\overline{y}_{...}) $ são independentes. Portanto, temos $ (a-1) $ graus de liberdade. Nesse sentido, os respectivos graus de liberdade associados a cada soma de quadrados são:

 

Efeito Grau de Liberdade
Fator A a - 1
Fator B b - 1
Interação $ A \times B $ $ (a - 1)(b - 1) $

Erro

$ a~b~(r - 1) $
Total $ a~b~r - 1 $

Cálculo dos quadrados médios
 

Cada soma de quadrados dividido por seu grau de liberdade determina o quadrado médio (QM), ou seja


$$QM_A~~~=~~~\frac{SQ_A}{a - 1}~~~(2.2.6)~~~~~~~~~~~~~~~\mbox{Fator A}$$


$$QM_B~~~=~~~\frac{SQ_B}{b - 1}~~~(2.2.7)~~~~~~~~~~~~~~~\mbox{Fator B}$$


$$QM_{AB}~~~=~~~\frac{SQ_{AB}}{(a - 1)(b - 1)}~~~(2.2.8)~~~~\mbox{A\times B}$$


$$QM_E~~~=~~~\frac{SQ_E}{a~b~(r - 1)}~~~(2.2.9)~~~~~~~~~\mbox{Réplica}$$

Considerando as expressões (2.2.1)-(2.2.5) e lembrando que o modelo está restrito às condições (2.1.2)


$$\alpha_{.}=\ds\sum_{i=1}^{a}\alpha_i=0,\\\beta_{.}=\ds\sum_{j=1}^{b}\beta_j=0,\\\tau_{.j}=\ds\sum_{i=1}^{a}\tau_{ij}=0,\\\tau_{i.}=\ds\sum_{j=1}^{b}\tau_{ij}=0,$$

vamos calcular o valor esperado do QM.

Para o Fator $ A $, temos que


$$E(QM_A)~~~=~~~ E\left(\frac{SQ_A}{a - 1}\right) ~=~\frac{1}{a - 1}E(SQ_A)$$


$$~~~=~~~ \frac{1}{a - 1}~E \left[b~r \sum^{a}_{i=1}\left(\overline{Y}_{i..}~-~\overline{Y}_{...}\right)^2\right]$$


$$~~~=~~~ \frac{b~r}{a - 1}~E\left[\sum^{a}_{i=1}\overline{Y}^2_{i..}~-~a~\overline{Y}_{...}^2\right]~=~\frac{b~r}{a-1}\left[\sum^{a}_{i=1}E(\overline{Y}^2_{i..})~-~a~E(\overline{Y}_{...}^2)\right]$$

Sabemos que


$$\overline{Y}_{i..}~\sim~N \left(\mu + \alpha_{i}+\overline{\beta_.}+\overline{\tau}_{i.}~;~\frac{\sigma^2}{b~r}\right),~~~~~~~~~~~~\overline{Y}_{...}~\sim~N\left(\mu+\overline{\alpha}_{.}+\overline{\beta}_{.}+\overline{\tau}_{..}~;~\frac{\sigma^2}{a~b~r}\right)$$

com

$ \overline{\alpha}_{.}~=\ds\cfrac{\alpha_{.}}{a} $,$ \overline{\beta}_{.}~=\ds\cfrac{\beta_{.}}{b} $,

$ \overline{\tau}_{i.}=\ds\cfrac{\tau_{i.}}{a} $,

$ \overline{\tau}_{.j}=\ds\cfrac{\tau_{.j}}{b} $,

e $ \overline{\tau}_{..}~=\ds\cfrac{\tau_{..}}{a b} $.

Lembrando das restrições (2.1.2), ficamos com


$$\overline{Y}_{i..}~\sim~N \left(\mu + \alpha_{i} ~;~\frac{\sigma^2}{b~r}\right),~~~~~~~~~~~~\overline{Y}_{...}~\sim~N \left(\mu ~;~\frac{\sigma^2}{a~b~r}\right).$$

Com isso,


$$E(QM_A)~~~=~~~ \frac{b~r}{a - 1}~\left[\sum^{a}_{i=1}\left[\mbox{var}(\overline{Y}_{i..})+(E(\overline{Y}_{i..}))^2\right]~-~a~\left[\mbox{var}(\overline{Y}_{...})+(E(\overline{Y}_{...}))^2\right]\right]$$

usando as restrições (2.1.2) temos


$$~~~=~~~ \sigma^2 + \frac{b~r}{a - 1}~\sum^{a}_{i=1}\left(\alpha_i+\overline{\alpha}_{.}+ \overline{\tau}_{i.}+\overline{\tau}_{..}\right)^2 =\sigma^2+\frac{b~r}{a-1}~\sum^{a}_{i=1}\left(\alpha_i\right)^2$$

De forma semelhante obtemos as esperanças dos demais quadrados médios. Resumidamente temos:


$$E(QM_A)~~~=~~~\sigma^2+\frac{b~r}{a-1}~\sum^{a}_{i=1}\left(\alpha_i\right)^2$$


$$E(QM_B)~~~=~~~\sigma^2 + \frac{a~r}{b - 1}~\sum^{b}_{j=1}\left(\beta_j\right)^2$$


$$E(QM_{AB})~~~=~~~\sigma^2 + \frac{r}{(b-1)(a-1)}~\sum^{a}_{i=1}\sum^{b}_{j=1}\left(\tau_{ij}\right)^2$$


$$E(QM_E)~~~=~~~\sigma^2$$

 

Dúvidas sobre esse conteúdo? Comente:

ANOVA

Sobre o Portal Action

O Portal Action é mantido por Estatcamp - Consultoria Estatística e Qualidade e por DIGUP - Desenvolvimento de Sistemas e Consultoria Estatística, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.

Facebook

CONTATO

  •  28 de Setembro,2066 - B, São Carlos - SP | CEP 13560-270
  • Telefone: (16) 3376-2047
  • E-Mail: [email protected]