3.3 - Experimentos Fatoriais sem Réplicas

Você está aqui

Em algumas situações, o número de combinações dos fatores do experimento (tratamentos) é grande. Nestes casos, recursos podem estar disponíveis apenas para uma única execução do projeto, ou seja, o experimento não possuirá réplicas.

Um risco evidente quando se conduz um experimento sem réplicas é que o modelo ajustado pode levar a conclusões erradas. Além disto, neste caso não há estimativa interna de erro (erro puro).

Existem alguns método para tratar estes experimento, dentre elas citamos os métodos de Lenth e Daniel que são métodos objetivos para decidir quais efeitos são significativos na análise de experimentos sem réplicas, nas situações em que o modelo está saturado e assim, não há graus de liberdade para estimar a variância do erro. Consequentemente, é proposto um método para estimar uma quantidade semelhante ao erro padrão, chamado de pseudo erro padrão ou PSE.

3.3.1 Gráfico da Probabilidade Normal e Half-Normal

A utilização dos gráficos de probabilidade normal e half-normal para identificar efeitos possivelmente ativos (efeitos não nulos do ponto de vista estatístico). No estudo de experimento fatoriais sem réplicas Cuthbert Daniel (1959) propôs um método que avalia estes efeitos ativos. A ideia de Daniel é bastante utilizada até os dias atuais por ser simples e conseguir apontar a direção correta dos efeitos em grande parte dos experimentos.

A aplicação eficaz desses gráficos depende do fato das estimativas dos efeitos terem a mesma variância, e os pontos em que temos "efeitos esparsos" são detectados pelo método. Segundo Daniel, esperamos que apenas uma pequena fração dos contrastes sejam ativos dentre todos aqueles envolvidos no estudo. Nestes gráficos, os efeitos cujos pontos estiverem claramente afastados de uma reta imaginária, formada pela nuvem de pontos, serão julgados ativos.

Sejam $ \hat{c}_1,\hat{c}_2,\dots,\hat{c}_n $, os $ n $ efeitos estimados. Denote por $ \hat{c}_{(i)}, $ o i-ésimo dos $ n $ efeitos ordenados, $ \hat{c}_{(1)},\hat{c}_{(2)},\dots,\hat{c}_{(n)} $. Dessa forma, o gráfico de probabilidade normal pode ser obtido dispondo-se os pontos em um gráfico cujas coordenadas $ (x,y) $ são dadas por  

$$\left(\hat{c}_{(i)},\Phi^{-1}\left[\frac{(i-0,5)}{n}\right]\right)$$

em que $ \Phi^{-1}(.) $ é a função de distribuição acumulada da normal padrão. Alguns autores comentam sobre a preferência de utilizar o gráfico half-normal ao invés do gráfico de probabilidade normal. Segundo eles, uma das vantagens de utilizar o half-normal é o fato de que os efeitos possivelmente ativos vão se apresentar no canto superior direito do gráfico. O gráfico de probabilidade half-normal é obtido a partir da marcação dos pontos cujas coordenadas $ (x,y) $ são dadas por 

$$\left(|\hat{c}_{(i)}|,\Phi^{-1}\left[0,5+\frac{(i-0,5)}{n}\right]\right)$$

Exemplo 3.3.1

Um determinado produto químico é produzido em um vaso de pressão. Com o objetivo de estudar quais fatores influenciam na taxa de filtração do produto (Y), foi realizado um experimento fatorial em que se considerou 4 fatores: A (temperatura), B (pressão), C (concentração de formaldeido) e D (velocidade de agitação). Cada fator é observado em dois níveis. Segue na Tabela 3.3.1.1 a matriz de planejamento e a resposta dos dados, considerando um experimento sem réplicas.

Tratamento $ A $ $ B $ $ C $ $ D $ $ Y $
0 -1 -1 -1 -1 45
a 1 -1 -1 -1 71
b -1 1 -1 -1 48
ab 1 1 -1 -1 65
c -1 -1 1 -1 68
ac 1 -1 1 -1 60
bc -1 1 1 -1 80
abc 1 1 1 -1 65
d -1 -1 -1 1 43
ad 1 -1 -1 1 100
bd -1 1 -1 1 45
abd 1 1 -1 1 104
cd -1 -1 1 1 75
acd 1 -1 1 1 86
bcd -1 1 1 1 70
abcd 1 1 1 1 96

Tabela 3.3.1.1: Experimento - Taxa de filtração do produto.

clique aqui para efetuar o download dos dados utilizados nesse exemplo

Primeiramente, vamos calcular os pontos do gráfico. Após calculados os efeitos estimados $ \hat{c}_i $ em seguida calculamos $ (i-0,5)/n. $ Após este passo, calculamos os quantis da normal padrão $ \Phi^{-1}\left[\frac{(i-0,5)}{n}\right]. $ Por fim, ordenamos os efeitos estimados em módulo $ |\hat{c}_{(i)}|. $

Observe os resultado na tabela a seguir.

i $ \hat{c}_i $ $ \dfrac{i-0,5}{n} $ $ \Phi^{-1}\left[\frac{(i-0,5)}{n}\right] $ $ \hat{c}_{(i)} $
1 21,625 0,033333 -1,83391 0,125
2 3,125 0,1 -1,28155 0,375
3 9,875 0,166667 -0,96742 1,125
4 14,625 0,233333 -0,72791 1,375
5 0,125 0,3 -0,5244 1,625
6 -18,125 0,366667 -0,34069 1,875
7 2,375 0,433333 -0,16789 2,375
8 16,625 0,5 0 2,625
9 -0,375 0,566667 0,167894 3,125
10 -1,125 0,633333 0,340695 4,125
11 1,875 0,7 0,524401 9,875
12 4,125 0,766667 0,727913 14,625
13 -1,625 0,833333 0,967422 16,625
14 -2,625 0,9 1,281552 18,125
15 1,375 0,966667 1,833915 21,625

Conforme dito anteriormente plotamos um gráfico de coordenadas: 

$$\left(|\hat{c}_{(i)}|,\Phi^{-1}\left[\frac{(i-0,5)}{n}\right]\right)$$

Agora, vamos plotar a reta pelo método half-normal, para isto, tomamos o vetor $ (|\hat{c}_{(i)}| \quad-|\hat{c}_{(i)}|)^T. $ Em seguida calculamos o quantil da normal padrão para os percentis 0,25 e 0,75. 

Agora, para os dois percentis calculamos os índices dos quantis

$ j_k=1+(n-1)*\text{percentis},\quad k=1,2 $

Com isso, temos 

$$j_1=1+(15-1)*0,25=4,5\quad \text{e}\quad j_2=1+(15-1)*0,75=11,5$$

Como os índices são números inteiros, vamos truncar os índices anteriores: 

$$l_1=4\quad \text{e}\quad l_2=11$$

Também, tomamos os maiores inteiros dos índices $ j_k $ para $ k=1,2 $ 

$$h_1=[j_1]=5\quad\text{e}\quad h_2=[j_2]=12$$

e calculamos $ w_k=j_k--l_k,\quad k=1,2, $  e obtemos 

$$w_1=4,5-4=0,5\quad\text{e}\quad w_2=11,5-11=0,5$$

Outra informação importante são os quantis iniciais

$ q_0=\hat{c}_{(i)}[l_k]=(-1,125\quad 4,125)^T $

Logo, obtemos os quantis empíricos 

$$q_s=(1-w_k)*q_0+w_k*\hat{c}_{(i)[h_k]}=(0,75\quad 7)^T$$

Calculados $ q_s $ e os quantis da normal padrão, calculamos o coeficiente angular da reta, para isto usamos a fórmula $ y-y_0=m*(x-x_0) $ 

$$m=\dfrac{\Phi^{-1}(0,75)-\Phi^{-1}(0,25)}{7-(-0,75)}=0,2632155$$

e o intercepto é zero.

Portanto, obtemos o gráfico da direita a seguir. Vale lembrar que o da esquerda é o clássico QQ-Plot.

Figura 3.3.1.1: Gráfico de papel de probabilidade normal e half-normal (Daniel Plot).

3.3.2 Método de Lenth

O método de Lenth tem sido considerado por muitos autores na literatura como um método muito eficiente, quando trabalhamos com análise de experimentos fatoriais sem réplicas. Um ponto para análise destes experimentos, é o estudo de um número grande de contrastes e que as estimativas destes contrastes tenham a mesma variabilidade. O método de Lenth, assim como Daniel, parte do princípio de que tenhamos apenas poucos "efeitos esparsos'' (efeitos dispersos), que o autor trata como efeitos ativos (diferente de zero), ou seja, efeitos significativamente não nulos do ponto de vista estatístico.

Considere um experimento fatorial com dois níveis e suponha que existam $ m $ $ k_1,k_2,\dots,k_m $ contrastes $ c_1,c_2,\dots,c_m $ ou efeitos estimados independentes e que eles têm a mesma variância, denotada por $ \tau^2 $ com distribuição Normal $ N(k_i,\sigma^2). $ Sendo $ N $ o número de observações, por exemplo, temos que $ m=N-1 $ no caso de modelo saturado. Desta forma, temos que cada contraste ou efeito estimado é dado por 

$$c=\overline{y}_{+}-\overline{y}_{-},$$

sendo que $ \overline{y}_{+} $ é a média das $ N/2 $ observações no nível "alto'' do fator em questão e $ \overline{y}_{-} $ é a média das $ N/2 $ observações no nível "baixo''. Como já mencionado, cada contraste tem a mesma variância $ \tau^2=4 \sigma^2/N $, em que $ \sigma^2 $ é a variância do erro.

Sejam $ c_{1}, c_{2}, ..., c_{m} $ os contrastes ou efeitos estimados, com $ m=N-1 $. Inicialmente, calculamos a quantidade 

$$s_{0}=1,5 \times \text{mediana} \{|c_{j}|\}\quad j=1,\dots,m.$$

Então, calculamos o pseudo erro padrão (PSE) como sendo 

|c_{j}|\leq2,5 s_{0}\}\quad j=1,\dots,m,$$

sendo que o termo PSE é um estimador para $ \tau^2. $ Notamos que $ s_0 $ e $ PSE $ são bastante similares, com uma pequena diferença na mediana do $ PSE, $ que é mais restrita. Esta restrição é devido aos pontos ativos e é descrita no artigo Russel Lenth (1989), que é feita para obtermos estimativas consistentes para $ \tau. $

Em relação ao critério de decisão de quais efeitos são significativos, definimos uma margem de erro dos contrastes $ c_{i} $, denotada por ME. O valor da margem de erro é dada por

$$ME = t_{\{1-\frac{\alpha}{2};d\}} \times PSE,$$

sendo que $ t_{\{1-\frac{\alpha}{2};d\}} $ é o quantil $ (1-\frac{\alpha}{2}) $ da distribuição t-student com $ d $ graus de liberdade e $ \alpha $ é o nível de significância adotado. (Geralmente, utilizamos $ d=m/3 $ e $ \alpha=0,05 $). Assim, temos que ME é uma margem de erro para $ c_i $ com confiança aproximada de $ 95\% $. Contrastes que excedem o valor de ME em valor absoluto são considerados significativos com nível de significância de $ 95\% $, por exemplo.

Entretanto, quando há um grande número de contrastes $ m $, esperamos que uma ou duas estimativas de contrastes não significativos excedam o valor de ME, conduzindo a uma falsa conclusão. Desta forma, a fim de tratar estes casos, é definida uma margem de erro simultânea, que será denotada por SME. Esta medida é calculada multiplicando o pseudo erro padrão PSE por um fator $ t_{\gamma;d} $. De fato, 

$$SME = t_{\gamma;d} \times PSE,$$

em que 

$$\gamma=(1+0,95^{1/m})/2.$$

A constante $ \gamma $ vem do fato de que as estimativas dos contrastes são independentes. É usual construir um gráfico para exibir as informações aqui calculadas. Para isto, construímos um gráfico de barra mostrando os valores absolutos das estimativas dos contrastes ou efeitos estimados e adicionamos linhas de referências com os valores de ME e SME. Os contrastes cujas barras estendem a linha SME são considerados ativos. Já aqueles cujas barras não estendem a linha de referência ME são considerados inativos. Os contrastes cujas barras estão entre as linhas de referências ME e SME requerem um cuidado maior na decisão. A região entre as linhas ME e SME é dita região de incerteza e é necessário um bom argumento para decidir se o(s) contraste(s) é(são) significativo(s) ou não.

Critérios para avaliar os efeitos

  • Intervalo de Confiança:

O efeito é aceitável ao nível de significância $ \alpha $ se o efeito pertencer ao intervalo de confiança $ (1-\alpha )\times $ 100% com limites:

  • $ LI=\hat{c}_j-ME,\quad \text{Limite Inferior} $
  • $ LS=\hat{c}_j+ME,\quad \text{Limite Superior}\quad j=1,\dots,m $
  • Teste de Hipóteses:

Outro modo de avaliarmos os efeitos, é através do teste de hipóteses: 

 c_j\neq 0\quad\text{para}~~j=1,\dots,k.\end{array}\right.\]

Para isto, calculamos a estatística de Lenth, dada por: 

$$T_{L_j}=\frac{|\hat{c}_j|}{PSE}\sim t_{(d)},\quad j=1,\dots,k$$

sendo $ PSE $ o pseudo erro padrão, $ d $ o número de contrastes dividido por 3 e $ t_{(d)} $ a distribuição t-Student com $ d $ graus de liberdade. Portanto, obtemos a seguinte regra de decisão para um nível de significância $ \alpha. $

  • Se $ |T_{L_j}| \textgreater t_{(d;1-\alpha/2)} $ rejeitamos $ H_0, $ ou seja, o efeito é significativo do ponto de vista estatístico;
  • Se $ |T_{L_j}| \leq t_{(d;1-\alpha/2)} $ não rejeitamos $ H_0, $ ou seja, efeito não é significativo do ponto de vista estatístico.
  • P-valor:

representa o menor nível de significância para o qual rejeitamos $  H_0  $. Logo, para um nível de significância = 0,05 adotado, rejeitamos $  H_0  $ se o P-valor obtido for menor que 0,05, enquanto que não rejeitamos $  H_0  $ se o P-valor for maior que 0,05. Para o teste t, o P-valor é calculado na forma 

$$\text{p-valor}=2\times P[t_d\textgreater|T_{L_j}|~|~H_0]$$

Com isso, rejeitamos $ H_0 $ quando o p-valor for menor que o nível de significância $ \alpha $ proposto (usualmente 0,05), caso contrário (p-valor > $ \alpha $) não rejeitamos $ H_0. $

Exemplo 3.3.2

Considerando os dados do Exemplo 3.3.1 em que o objetivo é estudar quais fatores influenciam na taxa de filtração do produto (Y) e utilizando a Tabela 3.3.1.1, calcula-se as estimativas dos efeitos (efeitos principais) por cálculos diretos ou usando o modelo linear, como visto na Seção 3.2.2. As estimativas dos efeitos são dadas pela Tabela 3.3.2.1. 

Termo Estimativa dos Efeitos
A 21,625
B 3,125
C 9,875
D 14,625
AB 0,125
AC -18,125
AD 16,625
BC 2,375
BD -0,375
CD -1,125
ABC 1,875
ABD 4,125
ACD -1,625
BCD -2,625
ABCD 1,375

Tabela 3.3.2.1: Estimativas dos efeitos dos fatores.

Com os valores da Tabela 3.3.1.2, calculamos os valores de PSE, ME e SME. De fato, 

$$s_{0}=1,5 \times \text{mediana} \{21,625; 3,125; ...; 2,625; 1,375\} =3,938.$$

Desta forma, tem-se que 

 |c_{j}|\leq9,844\} = 2,625.$$

Adotando $ \alpha=0,05 $ e $ m=15 $, tem-se que $ d=5 $. Logo, $ t_{\{0,975;5\}}=2,571 $, $ \gamma=(1+0,95^{1/15})/2=0,998 $ e consequentemente, $ t_{0,998;5}=5,219 $. Portanto, segue que a margem de erro ME e a margem de erro simultânea SME são dados por 

$$SME = 13,699 \ \hbox{e} \ ME = 6,748.$$

Vamos adotar o efeito A para calcularmos o intervalo de confiança e a estatística t. Assim, o intervalo de confiança é dado por: 

$$LI=\hat{c}_j-ME=21,625-6,748$$


$$LS=\hat{c}_j+ME=21,625+6,748$$

E a estatística do teste: 

$$T_{L_j}=\frac{|\hat{c}_j|}{PSE}=\frac{21,625}{2,625}=8,238$$

Logo o p-valor é dado por: 

$$\text{p-valor}=2\times P[t_d\textgreater|T_{L_j}|~|~H_0]=2\times P[t_d\textgreater|8,238|~|~H_0]=0,0002$$

Resultados desse exemplo obtidos com o software Action:

Tabela 3.3.2.2: Análise do experimento sem réplicas 

Figura 3.3.2.1: Gráfico dos efeitos pelo método de Lenth.

Portanto, pelos resultados obtidos, temos que os fatores A, C, D, A:C e A:D são significativos. 

 Para entender como executar essa função do Software Action, você pode consultar o manual do usuário.

3.3.3 - Experimento de Youden

O estudo da robustez é geralmente parte de desenvolvimento do método. Caso não seja estudado durante o desenvolvimento do método, existe a necessidade de se realizar tal estudo. De acordo com INMETRO, a robustez  mede a sensibilidade que este apresenta face à pequenas variações nas condições experimentais que podem ser expressas como uma lista de materiais da amostra, analitos, condições de armazenamento, ambiental e/ou amostra, condições de preparação em que o método pode ser aplicado ou apresentado, sujeitas à pequenas modificações. Para todas as condições experimentais que possam, na prática, estar sujeitas a variações (por exemplo, estabilidade dos reagentes, a composição da amostra) quaisquer alterações podem afetar o resultado analítico e este deve ser indicado.

Por exemplo, a robustez de um método cromatográfico é avaliada pela variação de parâmetros como a concentração do solvente orgânico, pH e força iônica da fase móvel em HPLC, bem como o tempo de extração, agitação etc. As mudanças introduzidas refletem as alterações que podem ocorrer quando um método é transferido para outros laboratórios, analistas ou equipamentos. Visando essas mudanças o INMETRO recomenda o teste de Youden, que permite avaliar se modificações no método tem diferenças significativas. Outro ponto que pode avaliado neste método, é que podemos ordenar se uma combinação de influências podem causar diferenças significativas nos resultados finais. Neste método são realizados oito ensaios separadamente, visando determinar quais efeitos das diferentes etapas no procedimento analítico afetam o resultado. A tabela de planejamento pelo método de Youden é dado por:

  Parâmetro Analítico
Combinação Fatorial P1 P2 P3 P4 P5 P6 P7
1 A B C D E F G
2 A B c D e f g
3 A b C d E f g
4 A b c d e F G
5 a B C d e F g
6 a B c d E f G
7 a b C D e f G
8 a b c D E F g

Tabela 3.3.1: Planejamento experimental para avaliar a robustez pelo método de Youden.

Em cada parâmetro analítico da tabela (3.3.1), definimos o nível alto (letra maiúscula) como $ (+) $ e o nível baixo (letra minúscula) como $ (-). $ Assim, obtemos a tabela (3.3.2).

  Parâmetro Analítico
Combinação Fatorial P1 P2 P3 P4 P5 P6 P7
1 1 1 1 1 1 1 1
2 1 1 -1 1 -1 -1 -1
3 1 -1 1 -1 1 -1 -1
4 1 -1 -1 -1 -1 1 1
5 -1 1 1 -1 -1 1 -1
6 -1 1 -1 -1 1 -1 1
7 -1 -1 1 1 -1 -1 1
8 -1 -1 -1 1 1 1 -1

Tabela 3.3.2: Planejamento experimental para avaliar a robustez pelo método de Youden recodificado.

Para a analisar o experimento de Youden, primeiramente são calculados os efeitos apara cada parâmetro analítico, em seguida utilizamos o método de Lenth para avaliar se os efeitos ativos são significativos. Vamos aplicar estes conceitos no seguinte exemplo extraído do artigo de Isabela C. e Pianete.

Exemplo 3.3.2

Com objetivo de avaliar a robustez do método cromatográfico para a quantificação de lumefantrina, no experimento de Youden, e determinar parâmetros analíticos que apresentam maior influência nos resultados finais da análise. Sete parâmetros analíticos foram selecionados e  pequenas variações foram induzidas nos valores nominais do método.

clique aqui para efetuar o download dos dados utilizados nesse exemplo

Parâmetros Condições Nominais Variação
Original Nível Alto Original Nível Alto
Concentração de metanol na fase móvel 80% A 77% a
Fase Móvel ph 2,8 B 3,1 b
Temperatura da coluna 30ºC C 35ºC c
Vazão da Fase Móvel 1 D 1,2 d
Coluna fornecedora Symmetry E Ace e
Fornecedor de Metanol Tedia F Baker f
Modelo Cromatográfico Agilent G HP g

Tabela 3.3.3: Parâmetros analíticos.

Utilizando o experimento de Youden obtemos a seguinte tabela:

P1 P2 P3 P4 P5 P6 P7 Resposta
1 1 1 1 1 1 1 99,63
1 1 -1 1 -1 -1 -1 99,8
1 -1 1 -1 1 -1 -1 99,85
1 -1 -1 -1 -1 1 1 99,63
-1 1 1 -1 -1 1 -1 99,48
-1 1 -1 -1 1 -1 1 99,64
-1 -1 1 1 -1 -1 1 99,6
-1 -1 -1 1 1 1 -1 99,51

Tabela 3.3.4: Conjunto de dados.

Termo Estimativa dos efeitos
P1 0,17
P2 -0,01
P3 -0,005
P4 -0,015
P5 0,03
P6 -0,16
P7 -0,035

Tabela 3.3.5: Estimativa dos efeitos.

Com os valores da Tabela (3.3.5), calculamos os valores de PSE, ME e SME. Primeiramente, calculamos $ s_0 $ da seguinte forma 

$$s_{0}=1,5 \times mediana \{|c_{j}|\}=1,5 \times mediana \{0,005; 0,01; ...; 0,015; 0,035\} =0,03.$$

Desta forma, tem-se que 

 |c_{j}|\leq 0,075\} = 0,0225.$$

Adotando $ \alpha=0,05 $ e $ m=7 $, tem-se que $ d=2,333 $. Logo, $ t_{\{0,975;2,333\}}=3,76412307 $, $ \gamma=(1+0,95^{1/7})/2=0,996 $ e consequentemente, $ t_{0,996;2,333}=9,01 $. Portanto, segue que a margem de erro ME e a margem de erro simultânea SME são dados por 

$$SME= t_{\{0,975;2,333\}} \times PSE=0,20269 \ \hbox{e} \ ME =t_{0,996;2,333} \times PSE=0,08493.$$

Vamos adotar o efeito 1 para calcularmos o intervalo de confiança e a estatística t. Assim, o intervalo de confiança é dado por: 

$$LI=\hat{c}_1-ME=0,17-0,08493=0,0853$$

$$LS=\hat{c}_1-ME=0,17+0,08493=0,2547$$

A estatística t no ponto 1 é dado por: 

$$T_{L_1}=\frac{|\hat{c}_i|}{PSE}=\frac{|0,17|}{0,0225}=7,5556$$

com o quantil da distribuição t-Student $ t_{0,975,2,333}, $ ou calculamos o p-valor à partir da distribuição t-Student com $ 2,333 $ graus de liberdade e com nível de significância $ \alpha=0,05. $ Logo, p-valor é dado por: 

$$p-valor=2\times P[t_d\textgreater |T_{L_j}|~|~H_0]=2\times P[t_d\textgreater |7,5556|~|~H_0]=0,005$$

Como o p-valor é menor que o $ \alpha $ adotado (0,05), rejeitamos $ H_0 $ ao nível de significância de 5%. Portanto, a temperatura da coluna a vazão da faze móvel tem efeitos ativos. Para saber detalhes da influência destes dois parâmetros consulte o artigo de Isabela C. e Pianete.

Veja a seguir os resultados obtidos pelo software Action Stat para o mesmo exemplo.


Tabela 3.3.6: Análise do experimento sem réplicas pelo método de Lenth.

Tabela 3.3.7: Gráfico dos efeitos pelo método de Lenth.


Tabela 3.3.8: Gráfico de papel de probabilidade half-normal (Daniel Plot).

 Para entender como executar essa função do Software Action, você pode consultar o manual do usuário.

Sobre o Portal Action

O Portal Action é mantido pela Estatcamp - Consultoria Estatística e Qualidade, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.

Facebook

CONTATO

  •  Maestro Joao Seppe, 900, São Carlos - SP | CEP 13561-180
  • Telefone: (16) 3376-2047
  • E-Mail: [email protected]