3.1.3 - Análise dos efeitos via regressão linear

Você está aqui

Uma outra forma de analisar os efeitos dos fatores e das interações é definir um modelo de regressão linear, por exemplo, para um experimento com 2 fatores A e B, o modelo é definido da seguinte forma 

\[Y=\beta_{0}+\beta_{1}X_{i}+\beta_{2}X_{j}+\beta_{12}X_{i}X_{j}+\varepsilon\]

em que

  • $ \beta_{0} $ é a média geral da resposta
  • $ X_{i} $ assume valor -1 ou 1, dependendo do nível do fator A
  • $ X_{j} $assume valor -1 ou 1, dependendo do nível do fator B
  • $ X_{ij} = X_{i}X_{j} $.

As constantes desconhecidas βj são denominadas parâmetros e ε representa o erro experimental, isto é, a variabilidade devido a fatores aleatórios não controlados no experimento.

De forma geral, o modelo de regressão linear é dado por 

\[Y = \beta_{0} + \beta_{1}x_{1} + \beta_{2}x_{2} + ... +\beta_{k}x_{k}+ \varepsilon\]

Estimação dos Parâmetros

O método de mínimos quadrados é o mais utilizado para estimar os parâmetros do modelo de regressão linear. Para isso, consideramos p variáveis explicativas x, p+1 parâmetros do modelo e n observações, com n > p.

Os dados de uma regressão linear podem ser representados da seguinte forma:

$ \mathbf{Y} $ $  \mathbf{x}_{1} $ $ \mathbf{x}_{2} $ $ \dots $ $  \mathbf{x}_{p} $
$ y_{1} $ $ x_{11} $ $ x_{12} $ $ \dots $ $ x_{1p} $
$ y_{2} $ $ x_{21} $ $ x_{22} $ $ \dots $ $ x_{2p} $
$ \vdots $ $ \vdots $ $ \vdots $ $ \ddots $ $ \vdots $
$ y_{n}  $ $ x_{n1} $ $ x_{n2} $ $ \dots $ $ x_{np} $

Hipóteses: ε  é uma variável aleatória tal que: 

\[E[\varepsilon]=0~~\mbox{e}~~Var[\varepsilon]=\sigma^{2}\]

Consideremos o modelo, 

\[y_{i}=\beta_{0}+\beta_{1}x_{i1}+\beta_{2}x_{i2}+...+\beta_{p}x_{ip}+\varepsilon_{i}=\sum^{p}_{j=1}\beta_{j}x_{ij} + \varepsilon_{i}~~~~(3.1.3.1)\]

Também, supomos que os erros experimentais εi são não correlacionados, possuem média zero e variância constante.

O método dos mínimos quadrados determina valores dos β's da equação (3.1.3.1), para os quais a soma dos quadrados dos erros εi, seja minimizada. Como podemos ver no livro de Análise de Regressão no capítulo 2.3 Estimação dos Parâmetros do Modelo, os estimadores dos β's são dados por: 

\[\left\lbrace \begin{array}{l} n \widehat{\beta}_0+\widehat{\beta}_1 \displaystyle \sum_{i=1}^n x_{i1}+\widehat{\beta}_2 \displaystyle\sum_{i=1}^n x_{i2} + \ldots+\widehat{\beta}_p \displaystyle\sum_{i=1}^n x_{ip}=\sum_{i=1}^n y_i \label{eqminisquare1},\\\widehat{\beta}_0 \displaystyle\sum_{i=1}^n x_{i1} + \widehat{\beta}_1 \displaystyle\sum_{i=1}^n x_{i1}^2 + \widehat{\beta}_2 \displaystyle\sum_{i=1}^n x_{i1} x_{i2} + \ldots + \widehat{\beta}_p \displaystyle\sum_{i=1}^n x_{i1} x_{ip} = \displaystyle\sum_{i=1}^n x_{i1} y_i,\\ \vdots \qquad \qquad \qquad \qquad \vdots \nonumber\\ \widehat{\beta}_0 \displaystyle\sum_{i=1}^n x_{ip} + \widehat{\beta}_1 \displaystyle\sum_{i=1}^n x_{ip} x_{i1} + \widehat{\beta}_2 \displaystyle\sum_{i=1}^n x_{ip} x_{i2} + \ldots + \widehat{\beta}_p \displaystyle\sum_{i=1}^n x_{ip}^2=\displaystyle\sum_{i=1}^n x_{ip} y_i.\end{array}\right.\]

Este sistema de equações é resolvido por um método apropriado que utiliza a notação matricial. O modelo de regressão pode ser escrito na seguinte forma matricial 

\[Y = X \beta + \varepsilon\]

onde 

\[Y = \left[ \begin{array}{c}y_1\\y_2\\\vdots\\y_n\\\end{array}\right]~~,~~X=\left[\begin{array}{ccccc}1~~~~ x_{11}~~~~ x_{12}~~~~\ldots~~~~ x_{1p}\\1~~~~x_{22}~~~~x_{22} ~~~~\ldots~~~~x_{2p}\\\vdots~~~~\vdots~~~~\vdots~~~~\ddots~~~~\vdots\\1~~~~x_{n1}~~~~x_{n2}~~~~\ldots~~~~x_{np}\\\end{array}\right]~~,~~\beta=\left[ \begin{array}{c}\beta_0\\\beta_1\\\vdots\\\beta_p\\\end{array}\right]~~\mbox{e}~~ \varepsilon=\left[ \begin{array}{c}\varepsilon_1\\\varepsilon_2\\\vdots\\\varepsilon_n\\\end{array}\right].\]

Seguindo esta notação, os estimadores de β devem satisfazer 

\[\widehat{\beta}=(X^\prime X)^{-1} X^\prime Y\]

e o modelo de regressão linear ajustado e o vetor de resíduos são, respectivamente: 

\[\widehat{Y}=X\widehat{\beta} \quad \hbox{e} \quad \varepsilon=Y-\widehat{Y}.\]

Exemplo 3.1.3.1

Um experimento fatorial 22 pode ser representado conforme a tabela abaixo

Y I X1 X2 X1 x X2
0 1 -1 -1 +1
a 1 +1 -1 -1
b 1 -1 +1 -1
ab 1 +1 +1 +1

Matricialmente, podemos expressar o modelo da seguinte forma: 

\[\mathbf{Y}=X\vg{\beta}+\vg{\varepsilon}\]

onde 

\[\mathbf{Y}= \left(\begin{array}{c}(0)\\a\\b\\ab\\\end{array}\right),~X=\left(\begin{array}{cccc}1~~~-1~~~-1~~~+1\\1~~~+1~~~-1~~~-1\\1~~~-1~~~+1~~~-1\\1~~~+1~~~+1~~~+1\\\end{array}\right),~\vg{\beta}= \left(\begin{array}{c}\beta_0\\\beta_1\\\beta_2\\\beta_3\\\end{array}\right),~\varepsilon=\left(\begin{array}{c}\varepsilon_1\\\varepsilon_2\\\varepsilon_3\\\varepsilon_4\\\end{array}\right)\]


\[\widehat{\vg{\beta}}=\left[ \left(\begin{array}{cccc}+1~~+1~~+1~~+1\\-1~~+1~~-1~~+1 \\-1~~-1~~+1~~+1\\+1~~-1~~-1~~+1\\\end{array}\right)\left(\begin{array}{cccc}+1~~-1~~-1~~+1\\+1~~+1~~-1~~-1\\+1~~-1~~+1~~-1\\+1~~+1~~+1~~+1\\\end{array}\right)\right]^{-1}\left(\begin{array}{cccc}+1~~+1~~+1~~+1\\-1~~+1~~-1~~+1\\-1~~-1~~+1~~+1\\+1~~-1~~-1~~+1\\\end{array}\right)\left(\begin{array}{c}(0)\\a\\b\\ab\\\end{array}\right)\]


\[\widehat{\vg{\beta}}=\left(\begin{array}{cccc}4~~~0~~~0~~~0\\0~~~4~~~0~~~0\\0~~~0~~~4~~~0\\0~~~0~~~0~~~4\\\end{array}\right)^{-1} \left(\begin{array}{c}(0)+a+b+ab\\-(0)+a-b+ab\\-(0)-a+b+ab\\(0)-a-b+ab\\\end{array}\right)\]


\[\widehat{\vg{\beta}}=\left(\begin{array}{cccc}1/4~~~0~~~0~~~0\\0~~~1/4~~~0~~~0\\0~~~0~~~1/4~~~0\\0~~~0~~~0~~~1/4\\\end{array}\right)\left(\begin{array}{c}(0)+a+b+ab\\-(0)+a-b+ab\\-(0)-a+b+ab\\(0)-a-b+ab\\\end{array}\right)\]

para todo i = 1, ..., n.

Assim tem-se: 

$$\begin{flushleft}\widehat{\beta}_0=\ds\frac{\displaystyle{(0)+a+b+ab}}{\displaystyle 4}\end{flushleft}$$


$$\begin{flushleft}\widehat{\beta}_1=\ds\frac{\displaystyle{-(0)+a-b+ab}}{\displaystyle 4}=\frac{\mbox{efeito de }~A}{2}\end{flushleft}$$


$$\begin{flushleft}\widehat{\beta}_2=\ds\frac{\displaystyle{-(0)-a+b+ab}}{\displaystyle 4}=\frac{\mbox{efeito de }~B}{2}\end{flushleft}$$


$$\begin{flushleft}\widehat{\beta}_3=\ds\frac{\displaystyle{(0)-a-b+ab}}{\displaystyle 4}=\frac{\mbox{efeito de }~AB}{2}\end{flushleft}$$

Observe que os estimadores $ \widehat{\beta}_1,~\widehat{\beta}_2,~\widehat{\beta}_3 $ correspondem ao efeito do fator A dividido por 2, efeito do fator B dividido por 2 e efeito da interação AB dividido por 2, respectivamente.

Exemplo 3.1.3.2 

Calcular os coeficientes do modelo.

A B AB Y1 Y2 Y3 $ \overline{ Y} $ Tratamento
-1 -1 +1 28 25 27 26,67 (0)
+1 -1 -1 36 32 32 33,33 a
-1 +1 -1 18 19 23 20,00 b
+1 +1 +1 31 30 29 30,00 ab


} \quad \widehat{\beta_0}=(26,67+33,33+20+30)/4=27,50$$


}\quad \widehat{\beta_1}=(-26,67+33,33-20+30)/4=4,17$$


}\quad \widehat{\beta_2}=(-26,67-33,33+20+30)/4=-2,50$$


}\quad \widehat{\beta_3}=(26,67-33,33-20+30)/4=0,84$$

Desta forma, modelo ajustado é 

\[\widehat{\mathbf{Y}}=\widehat{\beta_0}+\widehat{\beta}_1X_1+\widehat{\beta}_2 X_2+\widehat{\beta}_{12}X_1X_2 = 27,50+4,17X_1-2,50X_2+0,84X_1X_2.\]

Propriedades dos estimadores de mínimos quadrados

Temos que 

\[E(\widehat{\vg{\beta}})= E[(X^\shortmid X)^{-1}X^\shortmid\mathbf{Y}]=E[(X^\shortmid X)^{-1} X^\shortmid (X\vg{\beta}+\varepsilon)]=\vg{\beta}\]

Portanto $ \widehat{\vg\beta} $ é um estimador não viciado para o parâmetro $ \vg{\beta} $. A matriz de covariância do estimador $ \widehat{\vg\beta} $ é dada por 

\[\mbox{Cov}(\widehat{\vg{\beta}})=\sigma^{2}(X^\prime X)^{-1}\]

Testes sobre os parâmetros individuais

Estes testes são muito importantes para verificar a influência de cada variável no modelo. Por exemplo, o modelo pode ser mais eficiente com a inclusão de outras variáveis ou com a exclusão de variáveis que estão no modelo. As hipóteses são definidas por: 

\beta_{j}\neq 0\\\end{array}\right.\]

Se a hipótese $ H_0 $ é verdadeira, a variável independente $ X_j $ pode ser retirada do modelo. A estatística do teste é dada por 

\[t_{0}=\cfrac{\displaystyle \widehat{\beta}_{j}}{\displaystyle \sqrt{\widehat{\sigma}^{2}C_{jj}}}\]

onde $ C_{jj} $ é um elemento da diagonal da matriz $ (X^\prime X)^{-1} $ correspondente a $ \widehat{\beta}_j $.

O critério do teste é dado a seguir:

  • Rejeitamos $ H_0 $ se $ \mid t_0 \mid\textgreater t_{(\alpha/2, n-k-1)} $;
  • Caso contrário não rejeitamos a hipótese nula.
  • O P-valor é dado por 
    \[2*P\left[~~t_{n-k-1}\textgreater \mid t_0 \mid ~~\displaystyle/~~H_0~\right]\]

Exemplo 3.1.3.3

Considere novamente os dados do Exemplo 3.1.1,

clique aqui para efetuar o download dos dados utilizados nesse exemplo

a) Obter as estimativas dos parâmetros do modelo;

b) Fazer testes de hipóteses para analisar a significância dos parâmetros.

Tratamento $ A $ $ B $ $ Y_1 $ $ Y_2 $ $ Y_3 $ $ \overline{Y} $
(0) -1 -1 26,6(1) 22,0(7) 22,8(10) 23,8
(a) +1 -1 40,9(4) 36,4(9) 36,7(12) 38
(b) -1 +1 11,8(3) 15,9(8) 14,3(11) 14
(ab) +1 +1 34,0(2) 29,0(5) 33,6(6) 32,2

O modelo, na forma matricial é $ \vg{Y}=\mathbf{X}\vg{\beta}+\vg{\varepsilon}, $ com 

$$\mathbf{Y}=\left(\begin{tabular}{r}26,6\\40,9\\11,8\\34\\22\\36,4\\15,9\\29\\22,8\\36,7\\14,3\\33,6\\\end{tabular}\right),\mathbf{X}=\left(\begin{tabular}{rrrr}~~~~~~~~(A)~(B)~(AB)\\~~~~~~1~-1~-1~~1\\~~~~~~1~~1~-1~-1\\~~~~~~1~-1~~1~-1\\~~~~~~1~~1~~1~~1\\~~~~~~1~-1~-1~~1\\~~~~~~1~~1~-1~-1\\~~~~~~1~-1~~1~-1\\~~~~~~1~~1~~1~~1\\~~~~~~1~-1~-1~~1\\~~~~~~1~~1~-1~-1\\~~~~~~1~-1~~1~-1\\~~~~~~1~~1~~1~~1\\\end{tabular}\right)$$

     

Podemos então estimar $ \vg{\beta} $ fazendo 

$$\vg{\widehat{\beta}}=\mathbf{(X^\prime X)^{-1}X^\prime Y}$$

Temos: 

$$(\mathbf{X^\prime X})^{-1}=\left[\left(\begin{tabular}{rrrrrrrrrrrr}1~~~1~~~1~~~1~~~1~~~1~~~1~~~1~~~1~~~1~~~1~~~1\\-1~~~1~~-1~~~1~~~-1~~~1~~~-1~~~1~~~-1~~~1~~-1~~~1\\-1~~-1~~~1~~~1~~~-1~~~-1~~~1~~~1~~~-1~~~-1~~~1~~~1\\1~~~-1~~~-1~~~1~~~1~~~-1~~~-1~~~1~~~1~~~-1~~-1~~~1\\\end{tabular}\right)\left(\begin{tabular}{rrrr}1~~-1~~-1~~~1\\1~~~1~~~-1~~-1\\1~~-1~~~1~~-1 \\1~~~1~~~1~~~1 \\1~~-1~~-1~~~1 \\1~~~1~~~-1~~-1\\1~~-1~~~1~~-1\\1~~~1~~~1~~~1\\1~~~-1~~-1~~~1\\1~~~1~~~-1~~-1\\1~~~-1~~~1~~-1\\1~~~1~~~1~~~1\\\end{tabular}\right)\right]^{-1}=$$


$$=\left(\begin{tabular}{rrrr}12~~~0~~~0~~~0\\0~~12~~~0~~~0\\0~~~0~~12~~~0\\0~~~0~~~0~~12 \\\end{tabular}\right)^{-1}=\left(\begin{tabular}{rrrr}$\frac{1}{12}$~~~0~~~0~~~0\\0~~~$\frac{1}{12}$~~~0~~~0\\0~~~0~~~$\frac{1}{12}$~~~0\\0~~~0~~~0~~~$\frac{1}{12}$\\\end{tabular}\right)$$

     


$$\mbox{ e }\mathbf{X^\prime Y}=\left(\begin{tabular}{rrrrrrrrrrrr}1~~~1~~~1~~~1~~~1~~~1~~~1~~~1~~~1~~~1~~~1~~~1\\-1~~~1~~-1~~~1~~-1~~~1~~~-1~~~1~~~-1~~~1~~~-1~~~1 \\-1~~-1~~~1~~~1~~-1~~~-1~~~1~~~1~~~-1~~~-1~~~1~~~1\\1~~~-1~~-1~~~1~~~1~~-1~~~-1~~~1~~~1~~-1~~~-1~~~1\\\end{tabular}\right)\left(\begin{tabular}{r}26,6\\40,9\\11,8\\34\\22\\36,4\\15,9\\29\\22,8\\36,7\\14,3\\33,6\\\end{tabular}\right) =\left(\begin{tabular}{r}324\\97,2\\-46,8\\12\\\end{tabular}\right)$$


$$\mbox{assim }\mathbf{(X^\prime X)^{-1}X^\prime Y}=\left(\begin{tabular}{rrrr}$\frac{1}{12}$~~~0~~~0~~~0\\0~~~$\frac{1}{12}$~~~0~~~0\\0~~~0~~~$\frac{1}{12}$~~~0\\0~~~0~~~0~~~$\frac{1}{12}$\\\end{tabular}\right)\left(\begin{tabular}{r}324\\97,2 \\-46,8\\12\\\end{tabular}\right)=\left(\begin{tabular}{r}27 \\8,1\\-3,9\\1\\\end{tabular}\right),$$

Portanto 

$$\widehat{\beta_0}=27$$


$$\widehat{\beta_1}=\displaystyle\frac{\mbox{efeito de A}}{2}=8,1$$


$$\widehat{\beta_2}=\displaystyle\frac{\mbox{efeito de B}}{2}=-3,9$$


$$\widehat{\beta_3}=\displaystyle\frac{\mbox{efeito de AB}}{2}=1$$


Os efeitos dos fatores e da interação já foram vistos no Exemplo 1.1.1, e são: 

\[A=16,2~~~\mbox{ e }~~~B=-7,8~~~\mbox{ e }~~~AB=2.\]

como já havíamos obtido anteriormente no Exemplo 3.1.1.

O modelo ajustado é 

\[\widehat{Y} = 27 + 8,1 X_{i} -3,9 X_{j} + 1 X_{i}X_{j}.\]

onde

  • $ x_i $ assume valor -1 ou 1, dependendo do nível do fator A
  • $ x_j $ assume valor -1 ou 1, dependendo do nível do fator B
  • $ x_{ij}=x_{i}x_j $.

Testes de significâncias para os parâmetros $ \beta_1, \beta_2, \beta_3. $ 

\beta_{i}\neq 0, i=1,\ldots,3\\\end{array}\right.$$

Estatística de teste 

$$t_{0}=\cfrac{\displaystyle \widehat{\beta}_{j}}{\displaystyle \sqrt{\widehat{\sigma}^{2}C_{jj}}}$$

onde $ C_{jj} $ é o elemento da matriz $ (X^\prime X)^{-1} $ correspondente a $ \widehat{\beta}_j $.

A matriz $ X^\prime X $ neste caso é dada por 

$$(X^\prime X)^{-1}=\left(\begin{tabular}{rrrr}$\cfrac{1}{12}$~~~0~~~0~~~0\\0~~~$\cfrac{1}{12}$~~~0~~~0\\0~~~0~~~ $\cfrac{1}{12}$~~~0\\0~~~0~~~0~~~$\cfrac{1}{12}$\\\end{tabular}\right), $$

ou seja,

$$C_{11}=C_{22}=C_{33}=\cfrac{1}{12}=0,0833$$

e

$$\widehat{\sigma}^2=\displaystyle\cfrac{SQ_E}{n-k-1}$$

,

onde $ SQ_E=\mathbf{Y}^\prime\mathbf{Y}-\vg{\beta}^\prime X^\prime \mathbf{Y}=9778,56-9729,84=48,72. $

Assim, 

$$\widehat{\sigma}^2=\cfrac{SQ_E}{n-k-1}=\frac{48,72}{12-3-1}=6,09,$$

Calcula-se os valores das estatísticas para os parâmetro do modelo

Para $ \beta_1 $:
$ t_0=\ds\cfrac{8,1}{\sqrt{6,09*0,0833}}=\ds\cfrac{8,1}{\sqrt{0,507297}}=\cfrac{8,1}{0,7122479}=11,37 $

Para $ \beta_2 $:
$ t_0=\ds\cfrac{-3,9}{\sqrt{6,09*0,0833}}=\ds\cfrac{-3,9}{\sqrt{0,507297}}=\cfrac{-3,9}{0,7122479}=-5,47 $

Para $ \beta_3 $:
$ t_0=\ds\cfrac{1}{\sqrt{6,09*0,0833}}=\ds\cfrac{1}{\sqrt{0,507297}}=\cfrac{1}{0,7122479}=1,4 $

Construindo uma Tabela com os valores acima e os p-valores temos

Termo Efeito Coeficiente da Regressão Desvio Padrão T P-valor
Média Geral   27 0,7124 37,9 0
A 16,2 8,1 0,7124 11,37 0
B -7,8 -3,9 0,7124 -5,47 0,0005
A*B 2 1 0,7124 1,4 0,198

O critério do teste é dado por:

  • Rejeitamos $ H_0 $ se $ |t_0| \textgreater t_{\alpha/2,n-k-1} $;
  • Caso contrário não rejeitamos a hipótese nula.

O valor de $ t_{0,025;12-3-1}= 2,306 $ e assim concluímos que, com nível α = 5%, que os fatores A e B são significativos e a interação AB não é significativa. Basta então ver que os coeficientes da regressão de A e B são respectivamente 8,1 e -3,9 e como estamos interessados em obter a menor resposta (menor tempo de reação), escolhemos os níveis A-B+.

 

Para entender como executar essa função do Software Action, você pode consultar:

 

 Para entender como executar essa função do Software Action, você pode consultar o manual do usuário.

Sobre o Portal Action

O Portal Action é mantido pela Estatcamp - Consultoria Estatística e Qualidade, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.

Facebook

CONTATO

  •  Maestro Joao Seppe, 900, São Carlos - SP | CEP 13561-180
  • Telefone: (16) 3376-2047
  • E-Mail: [email protected]