Exemplo de estudo de longa duração

Você está aqui

Considere um experimento, no qual foi medida a degradação de uma droga para 5 lotes (BV, AJ, AN66, AV634, BZ8331). Para cada lote, medimos a concentração em diferentes níveis de tempo. Os níveis selecionados para o experimento foram (Tempo = 0, 3, 6, 9, 12, 18, 24 e 36 meses). O objetivo é avaliar a estabilidade da concentração de uma droga, avaliar a similaridade entre as curvas de degradação e calcular o tempo de prateleira.

Tempo Lote Concentração (Teor, %)
0 BV 104,7
12 BV 104,54
24 BV 105,54
0 AJ 101,04
3 AJ 106,42
6 AJ 105,04
9 AJ 105,2
12 AJ 104,74
18 AJ 102,02
24 AJ 101,56
36 AJ 104,32
0 AN66 99,32
3 AN66 101,92
6 AN66 99,78
9 AN66 98,88
12 AN66 99,6
18 AN66 99,66
24 AN66 98,26
36 AN66 99,24
0 AV634 103,52
3 AV634 106,34
6 AV634 104,26
9 AV634 104,08
12 AV634 102,44
18 AV634 102,38
24 AV634 104,18
0 BZ8331 102,16
3 BZ8331 98,66
6 BZ8331 102,62
9 BZ8331 100,16
12 BZ8331 98,54

clique aqui para efetuar o download dos dados utilizados nesse exemplo

De forma genérica, vamos utilizar a notação matricial para o modelo de análise de covariância (ANCOVA), conforme descrito abaixo:

\[Y = X \beta + \epsilon\]

no qual $ X $ é a matriz das covariáveis. A seguir, vamos desenvolver o modelo para o exemplo. Neste caso, a matriz de planejamento pode ser construída, na forma

A matriz $ X $ é dada por

Intercepto LoteAN66 LoteAV634 LoteBV LoteBZ8331 Tempo LoteAN66:Tempo LoteAV634:Tempo LoteBV:Tempo LoteBZ8331:Tempo
1 0 0 1 0 0 0 0 0 0
1 0 0 1 0 12 0 0 12 0
1 0 0 1 0 24 0 0 24 0
1 0 0 0 0 0 0 0 0 0
1 0 0 0 0 3 0 0 0 0
1 0 0 0 0 6 0 0 0 0
1 0 0 0 0 9 0 0 0 0
1 0 0 0 0 12 0 0 0 0
1 0 0 0 0 18 0 0 0 0
1 0 0 0 0 24 0 0 0 0
1 0 0 0 0 36 0 0 0 0
1 1 0 0 0 0 0 0 0 0
1 1 0 0 0 3 3 0 0 0
1 1 0 0 0 6 6 0 0 0
1 1 0 0 0 9 9 0 0 0
1 1 0 0 0 12 12 0 0 0
1 1 0 0 0 18 18 0 0 0
1 1 0 0 0 24 24 0 0 0
1 1 0 0 0 36 36 0 0 0
1 0 1 0 0 0 0 0 0 0
1 0 1 0 0 3 0 3 0 0
1 0 1 0 0 6 0 6 0 0
1 0 1 0 0 9 0 9 0 0
1 0 1 0 0 12 0 12 0 0
1 0 1 0 0 18 0 18 0 0
1 0 1 0 0 24 0 24 0 0
1 0 0 0 1 0 0 0 0 0
1 0 0 0 1 3 0 0 0 3
1 0 0 0 1 6 0 0 0 6
1 0 0 0 1 9 0 0 0 9
1 0 0 0 1 12 0 0 0 12

Realizando os calculos com o Action Stat, a tabela ANCOVA é dada por

Estimativa da Variabilidade:

Sabemos que a soma de quadrados do erro $ (SQE) $ satisfaz

$$\dfrac{SQE}{\sigma^2}\sim\chi^{2}_{n-(p+1)}.$$

Portanto, um estimador não viciado para $  \sigma^2  $ é dado por

$$\widehat{\sigma}^2=QME=\dfrac{SQE}{n-p-1}.$$

A estimativa da soma de quadrados do erro é dado por

$$SQE=Y^t \times \left( I - X\times (X^t\times X)^{-1}\times X^t \right)\times Y=53,592$$

e a estimativa da variabilidade é dada por

$$\widehat{\sigma}^2=QME=\dfrac{SQE}{n-p-1}=\frac{53,592}{31-10}=2,552$$

Comparação de Curvas

Na sequência, vamos análisar os testes de de igualdade de intercepto e paralelismo. Para realizar teste de igualdade do intercepto utilizamos o Teste F parcial, com as hipóteses:

 \beta_2 = \beta_3 = \beta_4 = \beta_5 = 0$$

 \text{pelo menos um }\beta_i \neq 0 \text{ para i =2,3,4 e 5}$$

No teste de paralelismo,  também utilizamos o Teste F parcial, com as hipóteses:

 \beta_6 = \beta_7 = \beta_8 = \beta_9 = 0$$

 \text{pelo menos um }\beta_i \neq 0 \text{ para i =6,7,8 e 9}$$

Utilizando o Action Stat para realizar os calculos, obtemos os seguintes resultados:

Conclusão: Observamos que o teste de Igualdade de Intercepto é rejeitado ao nível de 0,25 de significância, o que indica que os interceptos do modelo para cada lote são diferentes. No teste de Paralelismo não temos evidências para rejeitar a hipótese nula ao nível de significância de 0,25 e concluímos que um mesmo coeficiente angular pode ser ajustado para todos os lotes.

O próximo passo é estimar o modelo de regressão para o estudo. Observe que o teste de paralelismo identificou que $ \beta_6=\beta_7=\beta_8=\beta_9=0 $, isto é equivalente a um modelo sem interação entre os lotes e o tempo. Portanto, ajustando o modelo sem interação entre tempo e lote, encontramos as seguintes estimativas

Portanto, o modelo completo é dado por:

$$Y_i = \beta_0 + \beta_1*Tempo_i+\beta_2*LoteAN66_i+\beta_3*LoteAV634_i+\beta_4*LoteBV_i+\beta_5*LoteBZ8331_i+\epsilon_i$$

$$Y_i = 104,27-0,0357*Tempo_i-4,21*LoteAN66_i -0,0216*LoteAV634_i+1,08*LoteBV_i-3,632*LoteBZ8331_i+\epsilon_i$$

tal que $ Y_i $ representa o nível de concentração(teor,%) estimada para $ i=1,...,n $ e $ n=31 $ o total de dados.

Desta forma, podemos separar o modelo por lote:

  • Lote $ AJ $

$$Y_i = 104,27 -0,0357*Tempo$$

Note que a base para o calculo do Intercepto é utilizando o Lote $ AJ $

  • Lote $ AN66 $

$$Y_i = 104,27 -4,21 -0,0357*Tempo$$

$$Y_i = 100,06 -0,0357*Tempo$$
  • Lote $ AV634 $

$$Y_i = 104,27 -0,0216 -0,0357*Tempo$$

$$Y_i = 104,254 -0,0357*Tempo$$
  • Lote $ BV $

$$Y_i = 104,27 + 1,08 -0,0357*Tempo$$

$$Y_i = 105,35 -0,0357*Tempo$$
  • Lote $ BZ8331 $

$$Y_i = 104,27 -3,632-0,0357*Tempo$$

$$Y_i = 100,64 -0,0357*Tempo$$

Observe que temos apenas um modelo geral para o estudo, nesses modelos separados por lote estamos apenas atribuindo valores às covariáveis (0 ou 1) dependendo do lote que estamos interessados.

Em seguida, fixamos o limite inferior de aceitação em 90% e precisamos realizar previsões da resposta média por lote para os próximos 84 meses com um intervalo de confiança de 95%.  Estamos no caso do "Modelo 2" e portanto utilizamos  a formula $ 5.2.2 $. O limite inferior do intervalo de confiança de $ 95\% $ para $ \hat{y_i} $ é dado por

$$IC_{Inf}(\hat{y_i},95\%)=x_i\beta-\hat{\sigma}t_{n-K-2}\sqrt{x_i^T(X^TX)^{-1}x_i}$$

em que $ X $ é a matriz de planejamento que difinimos no inicio do exemplo. Vamos calcular o intervalo de confiança para o tempo (mes) $ T_i = 48 $ para o lote $ BV $.

$ x_{48}=\left[1,0,0,0,1,0,48\right] $

$ \hat{\beta}=\left[104,27;-4,21;-0,0216;1,08;-3,632;-0,0357\right] $

Então,

$$\hat{y_{48}} = x_{48}\hat{\beta} = 103,6408$$

$$\hat{\sigma} = \sqrt{\hat{\sigma^2}} =\sqrt{QME} = \sqrt{\dfrac{SQE}{31-4-2}} = \sqrt{\dfrac{Y^t \times \left( I - X\times (X^t\times X)^{-1}\times X^t \right)\times Y}{25}} = \sqrt{\dfrac{57,578}{25}} = 1,518$$

$$t_{31-4-2} = t_{25} = 1,708$$

$$\sqrt{x_{48}^T(X^TX)^{-1}x_{48}} = 0,8901$$

Finalmente,

$$IC_{Inf}(\hat{y_{49}},95\%)= 103,6408 - 1,518*1,708*0,8901 = 101,333$$

Temos que $ IC_{Inf}(\hat{y_{49}},95\%) =101,333 \textgreater 90 $, portanto ainda não encontramos a data de expiração.

Continuando os calculos para todos os lotes para todos os 84 meses com o Action Stat, observamos que em 84 meses não foi identicado um limite inferior de degradação abaixo de 90%. Nessa situação, dizemos que não foi possível estimar o tempo de expiração no período de 84 meses.

Clique aqui e veja como é simples realizar esta analise utilizando o Action Stat.

Sobre o Portal Action

O Portal Action é mantido pela Estatcamp - Consultoria Estatística e Qualidade, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.

Facebook

CONTATO

  •  Maestro Joao Seppe, 900, São Carlos - SP | CEP 13561-180
  • Telefone: (16) 3376-2047
  • E-Mail: [email protected]