- Estatcamp: (16) 3376-2047 [email protected]
- [email protected] https://www.actionstat.com.br
A avaliação da segurança alimentar humana é parte do processo de aprovação de medicamentos de origem animal destinados ao uso em animais produtores de alimentos. A abordagem de avaliação de risco é usado para avaliar a segurança alimentar humana de origem animal para os resíduos de drogas.
O perigo das drogas de origem animal é identificado e caracterizado à partir da segurança microbiana alimentar e informações toxicológicas, bem como a exposição do perigo para os seres humanos é investigado por informações de estudos de resíduos químicos.
Para os estudos destes resíduos químicos, consideramos duas variáveis Pos_Dose (dias após aplicada a dose) e log_fig (logaritmo da concentração de resíduos no tecido de fígado), neste caso, podemos estabelecer uma regressão linear simples cujo modelo estatístico é
$$Y_{i}=\beta_0+\beta_1~x_{i}+\varepsilon_{ij}\quad i=1,\cdots, n;\quad (5.3.1.1)$$
em que,
Para os dados da tabela 5.3.1, vamos seguir o passo 1 e inspecionar os dados.
Passo 1: Inspeção dos dados.
Neste passo é fundamental verificar os dados abaixo do limite de detecção e segundo EMEA, para estes dados definimos estes valores como metade do limite de detecção.
Especificamente para este conjunto de dados, para a variável gordura, o dia 35 foi excluído do cálculo por causa de muitos valores abaixo do limite de detecção (10 de 12 observações). Já os dados de fígado no dia 35 não estavam disponíveis.
Com isso, temos o seguinte conjunto de dados:
N | Pos_Dose | log_fig |
1 | 7 | 4,448516 |
2 | 7 | 4,954418 |
3 | 7 | 5,288267 |
4 | 7 | 3,449988 |
5 | 7 | 4,781641 |
6 | 7 | 4,682131 |
7 | 7 | 5,141664 |
8 | 7 | 3,540959 |
9 | 7 | 5,241747 |
10 | 7 | 4,212128 |
11 | 7 | 4,905275 |
12 | 7 | 5,015954 |
13 | 14 | 0 |
14 | 14 | 3,113515 |
15 | 14 | 4,10759 |
16 | 14 | 4,10759 |
17 | 14 | 3,85651 |
18 | 14 | 3,113515 |
19 | 14 | 2,424803 |
20 | 14 | 3,113515 |
21 | 14 | 3,901973 |
22 | 14 | 3,113515 |
23 | 14 | 3,701302 |
24 | 14 | 3,377588 |
25 | 21 | 3,583519 |
26 | 21 | 2,197225 |
27 | 21 | 2,197225 |
28 | 21 | 1,916923 |
29 | 21 | 2,890372 |
30 | 21 | 1,916923 |
31 | 21 | 4,682131 |
32 | 21 | 2,424803 |
33 | 21 | 0,832909 |
34 | 21 | 0,832909 |
35 | 21 | 3,210844 |
36 | 21 | 0,832909 |
37 | 28 | 1,504077 |
38 | 28 | 0,832909 |
39 | 28 | 2,424803 |
40 | 28 | 2,197225 |
41 | 28 | 0 |
42 | 28 | 1,504077 |
43 | 28 | 0 |
44 | 28 | 0 |
45 | 28 | 0,832909 |
46 | 28 | 1,916923 |
47 | 28 | 2,60269 |
48 | 28 | 0 |
Tabela 5.3.1.1: Resíduo marcador nos tecidos de fígado.
clique aqui para efetuar o download dos dados utilizados nesse exemplo
Agora, vamos para o passo 2.
Passo 2: Cálculo dos parâmetros regressão linear de dados log transformados.
Solução:
N | Pos_Dose | log_fig | Pos_Dose^2 | log_fig^2 | Pos_Dose x log_fig |
1 | 7 | 4,448516 | 49 | 19,7893 | 31,13961463 |
2 | 7 | 4,954418 | 49 | 24,54625 | 34,6809233 |
3 | 7 | 5,288267 | 49 | 27,96577 | 37,01786921 |
4 | 7 | 3,449988 | 49 | 11,90241 | 24,14991282 |
5 | 7 | 4,781641 | 49 | 22,86409 | 33,4714893 |
6 | 7 | 4,682131 | 49 | 21,92235 | 32,77491859 |
7 | 7 | 5,141664 | 49 | 26,4367 | 35,9916449 |
8 | 7 | 3,540959 | 49 | 12,53839 | 24,78671527 |
9 | 7 | 5,241747 | 49 | 27,47591 | 36,69222911 |
10 | 7 | 4,212128 | 49 | 17,74202 | 29,48489319 |
11 | 7 | 4,905275 | 49 | 24,06172 | 34,33692345 |
12 | 7 | 5,015954 | 49 | 25,1598 | 35,11168119 |
13 | 14 | 0 | 196 | 0 | 0 |
14 | 14 | 3,113515 | 196 | 9,693978 | 43,58921433 |
15 | 14 | 4,10759 | 196 | 16,87229 | 57,50625705 |
16 | 14 | 4,10759 | 196 | 16,87229 | 57,50625705 |
17 | 14 | 3,85651 | 196 | 14,87267 | 53,99114414 |
18 | 14 | 3,113515 | 196 | 9,693978 | 43,58921433 |
19 | 14 | 2,424803 | 196 | 5,879668 | 33,94723816 |
20 | 14 | 3,113515 | 196 | 9,693978 | 43,58921433 |
21 | 14 | 3,901973 | 196 | 15,22539 | 54,62761737 |
22 | 14 | 3,113515 | 196 | 9,693978 | 43,58921433 |
23 | 14 | 3,701302 | 196 | 13,69964 | 51,81822764 |
24 | 14 | 3,377588 | 196 | 11,4081 | 47,28622522 |
25 | 21 | 3,583519 | 441 | 12,84161 | 75,25389771 |
26 | 21 | 2,197225 | 441 | 4,827796 | 46,14171612 |
27 | 21 | 2,197225 | 441 | 4,827796 | 46,14171612 |
28 | 21 | 1,916923 | 441 | 3,674592 | 40,25537486 |
29 | 21 | 2,890372 | 441 | 8,354249 | 60,69780692 |
30 | 21 | 1,916923 | 441 | 3,674592 | 40,25537486 |
31 | 21 | 4,682131 | 441 | 21,92235 | 98,32475577 |
32 | 21 | 2,424803 | 441 | 5,879668 | 50,92085724 |
33 | 21 | 0,832909 | 441 | 0,693738 | 17,49109158 |
34 | 21 | 0,832909 | 441 | 0,693738 | 17,49109158 |
35 | 21 | 3,210844 | 441 | 10,30952 | 67,42771672 |
36 | 21 | 0,832909 | 441 | 0,693738 | 17,49109158 |
37 | 28 | 1,504077 | 784 | 2,262249 | 42,11416711 |
38 | 28 | 0,832909 | 784 | 0,693738 | 23,32145544 |
39 | 28 | 2,424803 | 784 | 5,879668 | 67,89447632 |
40 | 28 | 2,197225 | 784 | 4,827796 | 61,52228817 |
41 | 28 | 0 | 784 | 0 | 0 |
42 | 28 | 1,504077 | 784 | 2,262249 | 42,11416711 |
43 | 28 | 0 | 784 | 0 | 0 |
44 | 28 | 0 | 784 | 0 | 0 |
45 | 28 | 0,832909 | 784 | 0,693738 | 23,32145544 |
46 | 28 | 1,916923 | 784 | 3,674592 | 53,67383314 |
47 | 28 | 2,60269 | 784 | 6,773994 | 72,87531119 |
48 | 28 | 0 | 784 | 0 | 0 |
Soma | 840 | 134,9284 | 17640 | 501,4721 | 1885,408284 |
Média | 17,5 | 2,811008 |
As médias amostrais das variáveis Dias após aplicada a dose (X) e Logaritmo da concentração de resíduos no tecido de fígado (Y) são, respectivamente,
$$\overline{x}=\dfrac{1}{48}\sum_{i=1}^{48}x_i=17,5\quad\text{e}\quad\overline{y}=\dfrac{1}{48}\sum_{i=1}^{48} y_i=2,811008.$$
Além disso, na Tabela, apresentamos os valores de x2, y2 e xy para cada observação i=1,...,48.
Da tabela calculamos as somas de quadrados da seguinte forma:
$$S_{xx}=\sum^n_{i=1}x_i^2-n\overline{x}^2=17640-48\times 17,5^2=2940$$
$$S_{yy}=\sum^n_{i=1}y_i^2-n\overline{y}^2= 501,4721 - 48 \times 2,811008^2=122,1872$$
$$S_{xy}=\sum^n_{i=1}x_i y_i-n\overline{x}\overline{y}=1885,408284 - 48 \times 17,5 \times 2,811008=-475,839.$$
Logo, as estimativas dos parâmetros $\beta_{1}$ e $\beta_{0}$ são, respectivamente
$$\widehat\beta_1=\dfrac{S_{xy}}{S_{xx}}=\dfrac{-475,839}{2940}=-0,16185\quad\text{e }\quad\widehat\beta_0=\overline{y}-\widehat{\beta}_1\overline{x}=2,811008-(-0,16185)\times 17,5=5,643382.$$
Portanto, o modelo ajustado é dado por
$$\log(\text{fígado})~=~5,64~-~0,16~\times\mbox{Pos}_{\text{dose}}.$$
Com isso, temos os seguintes resultados obtidos pelo software Action.
![]() |
Para entender como executar essa função do Software Action, você pode consultar o manual do usuário. |
Passo 3: Inspeção visual da linha de regressão.
Tanto a linha de regressão para o fígado e para a linha de regressão de gordura passada através todos os grupos de abate. Não há pontos de tempo devem ser excluídos no final ou no início da linha.
Passo 4: Homogeneidade das variâncias.
A seguir, apresentamos alguns testes obtidos pelo software Action. A EMEA cita algumas estatísticas como por exemplo o teste de Cochran, já o MAPA cita o teste de Brown-Forsythe.
Com isso, testamos a seguinte hipótese:
$$\left\{\begin{array}{ll}H_0:\sigma^2_1=\sigma^2_2 = ... =\sigma^2_k\\H_1:~\mbox{pelo menos um dos}~\sigma_i^2\mbox{'s}~\mbox{diferente,} \quad i=1,\ldots,k.\\\end{array}\right.$$
Todos os testes obtidos pelo software Action, p-valores acima do nível de significância $\alpha=0,05.$ Logo não rejeitamos a hipótese nula de homocedasticidade, isto é, as variâncias são homogêneas.
![]() |
Para entender como executar essa função do Software Action, você pode consultar o manual do usuário. |
Passo 5: Teste de Falta de Ajuste (Lack of Fit).
Agora, vamos testar a falta de ajuste do modelo linear, para isto, considere as seguintes hipóteses:
$$\left\{\begin{array}{cccl}H_0:E(Y_i)=\beta_0+\beta_1~x_i ~~\mbox{modelo linear adequado}\\H_1: E(Y_i) \neq\beta_0+\beta_1~x_i~~\mbox{modelo linear inadequado}\\\end{array}\right.$$
Figura: ANOVA para o teste de linearidade da regressão.
De acordo com os resultados obtidos, temos que não rejeitamos a hipótese nula de que o modelo linear é adequado. No passo seguinte, vamos avaliar os resíduos do modelo.
Passo 6: Cálculo dos resíduos e gráficos da análise de diagnóstico de acordo com a recomendação da FDA 1983.
Primeiramente, vamos analisar a normalidade dos resíduos, porém observe os principais critérios para análise de resíduos.
Critério | ||
Diagnóstico | Fórmula | Valor |
hii (Leverage) | $2\dfrac{p+1}{n}$ | 0,12 |
DFFITS | $2\sqrt{\dfrac{p}{n}}$ | ±0,41 |
DCOOK | 1 | 1 |
DFBETA | $\dfrac{2}{\sqrt{n}}$ | ±0,29 |
Resíduos Padronizados | (-2,2) | 2 |
Resíduos Studentizados | (-2,2) | 2 |
Para isto considere as hipóteses:
\[\left\{\begin{array}{l} H_0: \hbox{Os dados seguem uma distribuição normal} \\ H_1: \hbox{Os dados não seguem uma distribuição normal.}\end{array}\right.\]
Dos resultados obtidos, pelo teste de Ryan-Joiner e Shapiro-Wilk, rejeitamos a hipótese de normalidade dos resíduos. Agora, vamos analisar os pontos influentes.
Dos resultados obtidos, temos que o ponto 13 é um ponto influente. Com isso, notamos uma melhora do modelo, como vemos a seguir.
Por fim, vamos avaliar outra suposição do modelo, que é a independência dos resíduos, para isto considere as hipóteses.
\[\left\{\begin{array}{l} H_0: \hbox{Os resíduos são independentes} \\ H_1: \hbox{Os resíduos não são independentes.}\end{array}\right.\]
Dos resultados obtidos, temos que os resíduos são independentes (p-valor=0,74) ao nível de significância 5%.
Passo 7: O cálculo dos limites de tolerância superior unilateral de 95% (com um nível de confiança de 95%).
Neste passo, vamos primeiramente definir limites de tolerância, que é limites para uma percentagem de uma população. Em seguida definimos período de carência (Withdrawal time - WT) que é o tempo em que o limite superior de tolerância unilateral de 95% para resíduo está abaixo do LMR (Limite Máximo Residual), com 95% de confiança.
O intervalo de tolerância é um intervalo estatístico no qual uma determinada proporção de uma população encontra-se abaixo de 100p% (EMEA define como 95%) com confiança de 100(1-$\alpha$)% (EMEA define com 95%).
Afim de calcular um período de carência, você temos que especificar duas porcentagens diferentes. A primeira expressa a fração (percentual) dos valores (animais) que o intervalo conterá. O segundo expressa com que confiança queremos ter. Se você definir o valor da segunda como 50%, então um intervalo de tolerância é o mesmo que um intervalo de predição.
Agora, para definirmos a tolerância limite, devemos ter dois conceitos em mente:
Para entendermos melhor o que é um intervalo de tolerância, devemos entender o que é um intervalo de confiança. Um intervalo de confiança é um intervalo de valores que vão desde o limite inferior de confiança ao limite superior de confiança. Com isso, esperamos que essa faixa deva incluir o parâmetro populacional de interesse, tais como, a média da população com um nível de confiança especificado.
Já o intervalo de tolerância estima o intervalo que deve conter uma determinada porcentagem de cada medição individual da população. Isto porque intervalos de tolerância são baseadas em apenas uma amostra de toda a população, isto é, não podemos ter 100% de confiança que esse intervalo conterá a proporção especificada. Assim, existem duas proporções diferentes associados ao intervalo de tolerância, que é o grau de confiança e uma porcentagem de cobertura. Por exemplo, podemos ter 95% de confiança de que 95% da população está entre o intervalo especificado pelo intervalo de tolerância.
Resumindo, a bioequivalência está relacionada a um intervalo de confiança para um parâmetro (por exemplo, a média para 2 formulações). Já o período de carência está relacionada a um limite de tolerância (quantil 95% para União Europeia ou de 99% para os EUA) e é definido como o tempo em que o limite de tolerância superior unilateral de 95% para resíduo está abaixo do LMR, com 95% de confiança.
Depois de definidos os termos, vamos calcular a tolerância limite para esta aplicação específica, que é para modelo de regressão log-transformados. No cálculo da tolerância limite, usamos os valores ajustados do modelo de regressão linear $\widehat{Y}_{ij}.$ Assim, temos que a tolerância limite unilateral segundo Wallis [14] para regressão linear com [100x(1-$\alpha$)%]/[100xP%] para cada observação i (P é o nível de cobertura) é obtido por
$$TL_{\text{sup}}=\exp(\widehat{Y}_{i}+\widehat{\sigma}k_{1,i}), \quad i=p_0,\dots,p_f$$
em que $\widehat{\sigma}=\sqrt{QME}$ é estimado pelo quadrado médio do erro, que é o desvio padrão dos resíduos, $[p_0,p_f]$ é o intervalo do tempo de depleção escolhido para previsão.
Já $k_{1,i}$ é dado por:
$$k_{1,i}=\dfrac{t^\star_{\left(n-p;1-\alpha\right)}(\sqrt{n^\star_i}Z^\star_P)}{\sqrt{n^\star_i}}$$
em que $t^\star_{\left(n-p;1-\alpha\right)}(\gamma)$ é o quantil da distribuição t-Student não central com d graus de liberdade e $\gamma$ é o parâmetro de não centralidade, com nível de confiança de (1-$\alpha$). Já $Z^\star_P$ é o quantil da distribuição normal padrão com nível de cobertura P. O parâmetro $n^\star_i$ é dado por:
$$n^\star_i=\dfrac{\widehat{\sigma}^2}{se(\widehat{y}_i)^2}$$
Vamos tomar como exemplo Pos Dose igual a 26. Com isso temos que:
$$se(\widehat{y}_i)=\dfrac{1}{n}+\dfrac{(x_0-\overline{x})}{\displaystyle\sum^n_{i=1}(x_i-\overline{x})^2}=\dfrac{1}{48}+\dfrac{72,25}{2940}=0,213092$$
$$n^\star_i=\dfrac{QME}{se(\widehat{y}_i)^2}=\dfrac{1,052279924}{0,21309^2}=23,17381$$
$$Z_P=Z_{0,95}=1,64485$$
assim, temos que o parâmetro de não centralidade é $\delta=\sqrt{n^\star_i}Z_{0,95}=\sqrt{23,17381}1,6485=7,91819,$ consequentemente
$$k_{1,i}=\dfrac{t^\star_{\left(n-p;1-\alpha\right)}(\sqrt{n^\star_i}Z^\star_P)}{\sqrt{n^\star_i}}=\dfrac{t^\star_{\left(46;0,95\right)}(7,91819)}{\sqrt{23,17381}}=\dfrac{10,37652}{4,813918}=2,155526$$
Portanto, a tolerância limite para o tempo de 26 (em dias) é dada por:
$$\log(TL_{\text{sup}})=\widehat{Y}_{i}+\widehat{\sigma}k_{1,i}=1,435+0,991\times 2,155526=3,575$$
A concentração em μg/kg é
$$TL_{\text{sup}}=\exp(\log(TL_{\text{sup}}))=e^{3,575}=35,7$$
Os demais pontos são calculados na tabela 5.3.1.2.
Pos_Dose | $\widehat{y}$ | $\sqrt{QME}$ | $a=(x_0-\overline{x})^2$ | $b=\displaystyle\sum^{48}_{i=1}(x_i-\overline{x})^2$ | $\frac{a}{b}$ | $\frac{1}{n}+\frac{a}{b}$ | se | n$^\star_i$ | $\delta$ | $t^\star(\delta)$ | K | log(LS) | LS |
26 | 1,435 | 0,991 | 72,25 | 2940 | 0,0246 | 0,0454 | 0,2131 | 21,626 | 7,649 | 10,069 | 2,165 | 3,581 | 35,903 |
27 | 1,273 | 0,991 | 90,25 | 2940 | 0,0307 | 0,0515 | 0,2270 | 19,057 | 7,180 | 9,533 | 2,184 | 3,438 | 31,110 |
28 | 1,112 | 0,991 | 110,25 | 2940 | 0,0375 | 0,0583 | 0,2415 | 16,835 | 6,749 | 9,042 | 2,204 | 3,295 | 26,990* |
29 | 0,950 | 0,991 | 132,25 | 2940 | 0,0450 | 0,0658 | 0,2565 | 14,921 | 6,354 | 8,594 | 2,225 | 3,155 | 23,441 |
30 | 0,788 | 0,991 | 156,25 | 2940 | 0,0531 | 0,0740 | 0,2720 | 13,274 | 5,993 | 8,186 | 2,247 | 3,015 | 20,379 |
31 | 0,626 | 0,991 | 182,25 | 2940 | 0,0620 | 0,0828 | 0,2878 | 11,857 | 5,664 | 7,816 | 2,270 | 2,875 | 17,732 |
32 | 0,464 | 0,991 | 210,25 | 2940 | 0,0715 | 0,0923 | 0,3039 | 10,634 | 5,364 | 7,479 | 2,294 | 2,737 | 15,441 |
33 | 0,302 | 0,991 | 240,25 | 2940 | 0,0817 | 0,1026 | 0,3202 | 9,576 | 5,090 | 7,173 | 2,318 | 2,599 | 13,454 |
Tabela 5.3.1.2: Resultados do cálculo da Tolerância limite para depleção nos tecidos de fígado (LMR abaixo de 30μg/kg).
Passo 8: Determinação do período de segurança (período de carência para depleção de resíduos)
Do gráfico, notamos que o dia que intercepta o limite de tolerância para o LMR = log(30)μg/kg é 28. Portanto, o tempo de carência ou intervalo de segurança para depleção de resíduos é de 28 dias.
O Portal Action é mantido pela Estatcamp - Consultoria Estatística e Qualidade, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.