5.2.1 - Análise para tecidos de fígado

Você está aqui

A avaliação da segurança alimentar humana é parte do processo de aprovação de medicamentos de origem animal destinados ao uso em animais produtores de alimentos. A abordagem de avaliação de risco é usado para avaliar a segurança alimentar humana de origem animal para os resíduos de drogas.

O perigo das drogas de origem animal é identificado e caracterizado à partir da segurança microbiana alimentar e informações toxicológicas, bem como a exposição do perigo para os seres humanos é investigado por informações de estudos de resíduos químicos.

Para os estudos destes resíduos químicos, consideramos duas variáveis Pos_Dose (dias após aplicada a dose) e log_fig (logaritmo da concentração de resíduos no tecido de fígado), neste caso, podemos estabelecer uma regressão linear simples cujo modelo estatístico é


$$Y_{i}=\beta_0+\beta_1~x_{i}+\varepsilon_{ij}\quad i=1,\cdots, n;\quad (5.3.1.1)$$

em que,

  • $ Y_{ij} $: representa a j-ésima medição do logaritmo da concentração de resíduos no tecido de fígado referente ao i-ésimo dia após aplicada a dose;
  • $ X_{i} $: representa o i-ésimo dia após aplicada a dose;
  • $ \beta_0 $: representa o coeficiente linear ou intercepto (concentração fictícia no tempo t=0);
  • $ \beta_1 $: representa o coeficiente angular;
  • $ \varepsilon_{ij} $: representa o j-ésimo erro cometido na medição do i-ésimo  logaritmo da concentração de resíduos no tecido de fígado. Consideramos que os $ \varepsilon_{ij} $ são independentes e identicamente distribuídos com distribuição $ N(0,\sigma^2) $ .

Para os dados da tabela 5.3.1, vamos seguir o passo 1 e inspecionar os dados.

Passo 1: Inspeção dos dados.

Neste passo é fundamental verificar os dados abaixo do limite de detecção e segundo EMEA, para estes dados  definimos estes valores como metade do limite de detecção.

Especificamente para este conjunto de dados, para a variável gordura, o dia 35 foi excluído do cálculo por causa de muitos valores abaixo do limite de detecção (10 de 12 observações). Já os dados de fígado no dia 35 não estavam disponíveis.

Com isso, temos o seguinte conjunto de dados:

N Pos_Dose log_fig
1 7 4,448516
2 7 4,954418
3 7 5,288267
4 7 3,449988
5 7 4,781641
6 7 4,682131
7 7 5,141664
8 7 3,540959
9 7 5,241747
10 7 4,212128
11 7 4,905275
12 7 5,015954
13 14 0
14 14 3,113515
15 14 4,10759
16 14 4,10759
17 14 3,85651
18 14 3,113515
19 14 2,424803
20 14 3,113515
21 14 3,901973
22 14 3,113515
23 14 3,701302
24 14 3,377588
25 21 3,583519
26 21 2,197225
27 21 2,197225
28 21 1,916923
29 21 2,890372
30 21 1,916923
31 21 4,682131
32 21 2,424803
33 21 0,832909
34 21 0,832909
35 21 3,210844
36 21 0,832909
37 28 1,504077
38 28 0,832909
39 28 2,424803
40 28 2,197225
41 28 0
42 28 1,504077
43 28 0
44 28 0
45 28 0,832909
46 28 1,916923
47 28 2,60269
48 28 0

Tabela 5.3.1.1: Resíduo marcador nos tecidos de fígado.

clique aqui para efetuar o download dos dados utilizados nesse exemplo

Agora, vamos para o passo 2.

Passo 2: Cálculo dos parâmetros regressão linear de dados log transformados.

Solução:

 

N Pos_Dose log_fig Pos_Dose^2 log_fig^2 Pos_Dose x log_fig
1 7 4,448516 49 19,7893 31,13961463
2 7 4,954418 49 24,54625 34,6809233
3 7 5,288267 49 27,96577 37,01786921
4 7 3,449988 49 11,90241 24,14991282
5 7 4,781641 49 22,86409 33,4714893
6 7 4,682131 49 21,92235 32,77491859
7 7 5,141664 49 26,4367 35,9916449
8 7 3,540959 49 12,53839 24,78671527
9 7 5,241747 49 27,47591 36,69222911
10 7 4,212128 49 17,74202 29,48489319
11 7 4,905275 49 24,06172 34,33692345
12 7 5,015954 49 25,1598 35,11168119
13 14 0 196 0 0
14 14 3,113515 196 9,693978 43,58921433
15 14 4,10759 196 16,87229 57,50625705
16 14 4,10759 196 16,87229 57,50625705
17 14 3,85651 196 14,87267 53,99114414
18 14 3,113515 196 9,693978 43,58921433
19 14 2,424803 196 5,879668 33,94723816
20 14 3,113515 196 9,693978 43,58921433
21 14 3,901973 196 15,22539 54,62761737
22 14 3,113515 196 9,693978 43,58921433
23 14 3,701302 196 13,69964 51,81822764
24 14 3,377588 196 11,4081 47,28622522
25 21 3,583519 441 12,84161 75,25389771
26 21 2,197225 441 4,827796 46,14171612
27 21 2,197225 441 4,827796 46,14171612
28 21 1,916923 441 3,674592 40,25537486
29 21 2,890372 441 8,354249 60,69780692
30 21 1,916923 441 3,674592 40,25537486
31 21 4,682131 441 21,92235 98,32475577
32 21 2,424803 441 5,879668 50,92085724
33 21 0,832909 441 0,693738 17,49109158
34 21 0,832909 441 0,693738 17,49109158
35 21 3,210844 441 10,30952 67,42771672
36 21 0,832909 441 0,693738 17,49109158
37 28 1,504077 784 2,262249 42,11416711
38 28 0,832909 784 0,693738 23,32145544
39 28 2,424803 784 5,879668 67,89447632
40 28 2,197225 784 4,827796 61,52228817
41 28 0 784 0 0
42 28 1,504077 784 2,262249 42,11416711
43 28 0 784 0 0
44 28 0 784 0 0
45 28 0,832909 784 0,693738 23,32145544
46 28 1,916923 784 3,674592 53,67383314
47 28 2,60269 784 6,773994 72,87531119
48 28 0 784 0 0
Soma 840 134,9284 17640 501,4721 1885,408284
Média 17,5 2,811008      

As médias amostrais das variáveis Dias após aplicada a dose (X) e Logaritmo da concentração de resíduos no tecido de fígado (Y) são, respectivamente, 


$$\overline{x}=\dfrac{1}{48}\sum_{i=1}^{48}x_i=17,5\quad\text{e}\quad\overline{y}=\dfrac{1}{48}\sum_{i=1}^{48} y_i=2,811008.$$

Além disso, na Tabela, apresentamos os valores de x2, y2 e xy para cada observação i=1,...,48. 

 

Da tabela calculamos as somas de quadrados da seguinte forma:


$$S_{xx}=\sum^n_{i=1}x_i^2-n\overline{x}^2=17640-48\times 17,5^2=2940$$


$$S_{yy}=\sum^n_{i=1}y_i^2-n\overline{y}^2= 501,4721 - 48 \times 2,811008^2=122,1872$$


$$S_{xy}=\sum^n_{i=1}x_i y_i-n\overline{x}\overline{y}=1885,408284 - 48 \times 17,5 \times 2,811008=-475,839.$$

Logo, as estimativas dos parâmetros $ \beta_{1} $ e $ \beta_{0} $ são, respectivamente


$$\widehat\beta_1=\dfrac{S_{xy}}{S_{xx}}=\dfrac{-475,839}{2940}=-0,16185\quad\text{e }\quad\widehat\beta_0=\overline{y}-\widehat{\beta}_1\overline{x}=2,811008-(-0,16185)\times 17,5=5,643382.$$

Portanto, o modelo ajustado é dado por


$$\log(\text{fígado})~=~5,64~-~0,16~\times\mbox{Pos}_{\text{dose}}.$$

Com isso, temos os seguintes resultados obtidos pelo software Action.

 Para entender como executar essa função do Software Action, você pode consultar o  manual do usuário.

Passo 3: Inspeção visual da linha de regressão.

Tanto a linha de regressão para o fígado e para a linha de regressão de gordura passada através todos os grupos de abate. Não há pontos de tempo devem ser excluídos no final ou no início da linha.

Passo 4: Homogeneidade das variâncias.

A seguir, apresentamos alguns testes obtidos pelo software Action. A EMEA cita algumas estatísticas como por exemplo o teste de Cochran, já o MAPA cita o teste de Brown-Forsythe.
Com isso, testamos a seguinte hipótese:


~\mbox{pelo menos um dos}~\sigma_i^2\mbox{'s}~\mbox{diferente,} \quad i=1,\ldots,k.\\\end{array}\right.$$

Todos os testes obtidos pelo software Action, p-valores acima do nível de significância $ \alpha=0,05. $ Logo não rejeitamos a hipótese nula de homocedasticidade, isto é, as variâncias são homogêneas.

 Para entender como executar essa função do Software Action, você pode consultar o  manual do usuário.

Passo 5: Teste de Falta de Ajuste (Lack of Fit).

Agora, vamos testar a falta de ajuste do modelo linear, para isto, considere as seguintes hipóteses:


 E(Y_i) \neq\beta_0+\beta_1~x_i~~\mbox{modelo linear inadequado}\\\end{array}\right.$$

Figura: ANOVA para o teste de linearidade da regressão.

De acordo com os resultados obtidos, temos que não rejeitamos a hipótese nula de que o modelo linear é adequado. No passo seguinte, vamos avaliar os resíduos do modelo.

Passo 6: Cálculo dos resíduos e gráficos da análise de diagnóstico de acordo com a recomendação da FDA 1983.

Primeiramente, vamos analisar a normalidade dos resíduos, porém observe os principais critérios para análise de resíduos.

 

Critério
Diagnóstico Fórmula Valor
hii (Leverage) $ 2\dfrac{p+1}{n} $ 0,12
DFFITS $ 2\sqrt{\dfrac{p}{n}} $ ±0,41
DCOOK 1 1
DFBETA $ \dfrac{2}{\sqrt{n}} $ ±0,29
Resíduos Padronizados (-2,2) 2
Resíduos Studentizados (-2,2) 2

Para isto considere as hipóteses:


 \hbox{Os dados não seguem uma distribuição normal.}\end{array}\right.\]

Dos resultados obtidos, pelo teste de Ryan-Joiner e Shapiro-Wilk, rejeitamos a hipótese de normalidade dos resíduos. Agora, vamos analisar os pontos influentes.

Dos resultados obtidos, temos que o ponto 13 é um ponto influente. Com isso, notamos uma melhora do modelo, como vemos a seguir.

Por fim, vamos avaliar outra suposição do modelo, que é a independência dos resíduos, para isto considere as hipóteses.


 \hbox{Os resíduos não são independentes.}\end{array}\right.\]

Dos resultados obtidos, temos que os resíduos são independentes (p-valor=0,74) ao nível de significância 5%.

 

Passo 7: O cálculo dos limites de tolerância superior unilateral de 95% (com um nível de confiança de 95%).

Neste passo, vamos primeiramente definir limites de tolerância, que é limites para uma percentagem de uma população. Em seguida definimos período de carência (Withdrawal time - WT) que é o tempo em que o limite superior de tolerância unilateral de 95% para resíduo está abaixo do LMR (Limite Máximo Residual), com 95% de confiança.

O intervalo de tolerância é um intervalo estatístico no qual uma determinada proporção de uma população encontra-se abaixo de 100p% (EMEA define como 95%) com confiança de 100(1-$ \alpha $)% (EMEA define com 95%).

Afim de calcular um período de carência, você temos que especificar duas porcentagens diferentes. A primeira expressa a fração (percentual) dos valores (animais) que o intervalo conterá. O segundo expressa com que confiança queremos ter. Se você definir o valor da segunda como 50%, então um intervalo de tolerância é o mesmo que um intervalo de predição.

Agora, para definirmos a tolerância limite, devemos ter dois conceitos em mente:

  1. Sem nível de confiança: Quando muitas amostras de mesmo tamanho são tomadas à partir da mesma população estável e os limites de tolerância calculados de cada vez, consequentemente, estes limites irão conter em média, 95% da população;
  2. Com nível de confiança: Quando muitas amostras do mesmo tamanho são tomadas à partir da mesma população estável e os limites de tolerância calculadas de cada vez, consequentemente, estes limites irão conter pelo menos 95% da população de uma média de 95% dos casos. 

Para entendermos melhor o que é um intervalo de tolerância, devemos entender o que é um intervalo de confiança. Um intervalo de confiança é um intervalo de valores que vão desde o limite inferior de confiança ao limite superior de confiança. Com isso, esperamos que essa faixa  deva incluir o parâmetro populacional de interesse, tais como, a média da população com um nível de confiança especificado.

Já o intervalo de tolerância estima o intervalo que deve conter uma determinada porcentagem de cada medição individual da população.  Isto porque intervalos de tolerância são baseadas em apenas uma amostra de toda a população, isto é, não podemos ter 100% de confiança que esse intervalo conterá a proporção especificada. Assim, existem duas proporções diferentes associados ao intervalo de tolerância, que é o grau de confiança e uma porcentagem de cobertura. Por exemplo, podemos ter 95% de confiança de que 95% da população está entre o intervalo especificado pelo intervalo de tolerância.

Resumindo, a bioequivalência está relacionada a um intervalo de confiança para um parâmetro (por exemplo, a média para 2 formulações). Já o período de carência está relacionada a um limite de tolerância (quantil 95% para União Europeia ou de 99% para os EUA) e é definido como o tempo em que o limite de tolerância superior unilateral de 95% para resíduo está abaixo do LMR, com 95% de confiança.

Depois de definidos os termos, vamos calcular a tolerância limite para esta aplicação específica, que é para modelo de regressão log-transformados. No cálculo da tolerância limite, usamos os valores ajustados do modelo de regressão linear $ \widehat{Y}_{ij}. $ Assim, temos que a tolerância limite unilateral segundo Wallis [14] para regressão linear com [100x(1-$ \alpha $)%]/[100xP%] para cada observação i (P é o nível de cobertura) é obtido por


$$TL_{\text{sup}}=\exp(\widehat{Y}_{i}+\widehat{\sigma}k_{1,i}), \quad i=p_0,\dots,p_f$$

em que $ \widehat{\sigma}=\sqrt{QME} $ é estimado pelo quadrado médio do erro, que é o desvio padrão dos resíduos, $ [p_0,p_f] $ é o intervalo do tempo de depleção escolhido para previsão.

$ k_{1,i} $ é dado por:


$$k_{1,i}=\dfrac{t^\star_{\left(n-p;1-\alpha\right)}(\sqrt{n^\star_i}Z^\star_P)}{\sqrt{n^\star_i}}$$

em que $ t^\star_{\left(n-p;1-\alpha\right)}(\gamma) $ é o quantil da distribuição t-Student não central com d graus de liberdade e $ \gamma $ é o parâmetro de não centralidade, com nível de confiança de (1-$ \alpha $). Já $ Z^\star_P $ é o quantil da distribuição normal padrão com nível de cobertura P. O parâmetro $ n^\star_i $ é dado por:


$$n^\star_i=\dfrac{\widehat{\sigma}^2}{se(\widehat{y}_i)^2}$$

Vamos tomar como exemplo Pos Dose igual a 26. Com isso temos que:


$$se(\widehat{y}_i)=\dfrac{1}{n}+\dfrac{(x_0-\overline{x})}{\displaystyle\sum^n_{i=1}(x_i-\overline{x})^2}=\dfrac{1}{48}+\dfrac{72,25}{2940}=0,213092$$

 


$$n^\star_i=\dfrac{QME}{se(\widehat{y}_i)^2}=\dfrac{1,052279924}{0,21309^2}=23,17381$$


$$Z_P=Z_{0,95}=1,64485$$

assim, temos que o parâmetro de não centralidade é $ \delta=\sqrt{n^\star_i}Z_{0,95}=\sqrt{23,17381}1,6485=7,91819, $ consequentemente


$$k_{1,i}=\dfrac{t^\star_{\left(n-p;1-\alpha\right)}(\sqrt{n^\star_i}Z^\star_P)}{\sqrt{n^\star_i}}=\dfrac{t^\star_{\left(46;0,95\right)}(7,91819)}{\sqrt{23,17381}}=\dfrac{10,37652}{4,813918}=2,155526$$

Portanto, a tolerância limite para o tempo de 26 (em dias) é dada por:


$$\log(TL_{\text{sup}})=\widehat{Y}_{i}+\widehat{\sigma}k_{1,i}=1,435+0,991\times 2,155526=3,575$$

A concentração em μg/kg é


$$TL_{\text{sup}}=\exp(\log(TL_{\text{sup}}))=e^{3,575}=35,7$$

Os demais pontos são calculados na tabela 5.3.1.2.

Pos_Dose $ \widehat{y} $ $ \sqrt{QME} $ $ a=(x_0-\overline{x})^2 $ $ b=\displaystyle\sum^{48}_{i=1}(x_i-\overline{x})^2 $ $ \frac{a}{b} $ $ \frac{1}{n}+\frac{a}{b} $ se n$ ^\star_i $ $ \delta $ $ t^\star(\delta) $ K log(LS) LS
26 1,435 0,991 72,25 2940 0,0246 0,0454 0,2131 21,626 7,649 10,069 2,165 3,581 35,903
27 1,273 0,991 90,25 2940 0,0307 0,0515 0,2270 19,057 7,180 9,533 2,184 3,438 31,110
28 1,112 0,991 110,25 2940 0,0375 0,0583 0,2415 16,835 6,749 9,042 2,204 3,295 26,990*
29 0,950 0,991 132,25 2940 0,0450 0,0658 0,2565 14,921 6,354 8,594 2,225 3,155 23,441
30 0,788 0,991 156,25 2940 0,0531 0,0740 0,2720 13,274 5,993 8,186 2,247 3,015 20,379
31 0,626 0,991 182,25 2940 0,0620 0,0828 0,2878 11,857 5,664 7,816 2,270 2,875 17,732
32 0,464 0,991 210,25 2940 0,0715 0,0923 0,3039 10,634 5,364 7,479 2,294 2,737 15,441
33 0,302 0,991 240,25 2940 0,0817 0,1026 0,3202 9,576 5,090 7,173 2,318 2,599 13,454

Tabela 5.3.1.2: Resultados do cálculo da Tolerância limite para depleção nos tecidos de fígado (LMR abaixo de 30μg/kg).

Passo 8: Determinação do período de segurança (período de carência para depleção de resíduos)

Do gráfico, notamos que o dia que intercepta o limite de tolerância para o LMR = log(30)μg/kg é 28. Portanto, o tempo de carência ou intervalo de segurança para depleção de resíduos é de 28 dias.

 

Análise de Regressão

Sobre o Portal Action

O Portal Action é mantido pela Estatcamp - Consultoria Estatística e Qualidade, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.

Facebook

CONTATO

  •  Maestro Joao Seppe, 900, São Carlos - SP | CEP 13561-180
  • Telefone: (16) 3376-2047
  • E-Mail: [email protected]