3.2 - Limite de detecção

Na análise do limite de detecção, temos como objetivo determinar a menor quantidade de microrganismos presentes na amostra, que consegue ser detectada sob condições experimentais estabelecidas. Para isto, utilizamos a regressão logística, uma técnica amplamente aplicada na análise de dados binários. No caso deste estudo, temos como variável resposta a "positivação'' ou "esterilidade'' da amostra. Portanto, esta variável resposta assume apenas dois valores, fato que impossibilita a aplicação de métodos tradicionais de regressão. Aqui, utilizamos um modelo de regressão logística para cada método, com variável independente o nível de contaminação (UFC/mL). Como temos interesse na relação entre o nível de contaminação (UFC/mL) e a probabilidade de positivação, optamos por estabelecer dois modelos (um para cada método).

Método Alternativo

Aqui, devemos considerar todos os microrganismos e lotes como um único conjunto de dados. Abaixo, apresentamos um resumo dos dados para os diferentes métodos e níveis de contaminação.

Método Contaminação Tamanho da Amostra Positivação Proporção
Alternativo 0,5 168 103  61,3%
Alternativo 2 168 133 79,2% 
Alternativo 5 168 166 98,8%
Alternativo 50 168 168 100% 

 Tabela 5.4.2.1: Resumo dos resultados.

Temos uma amostra de 672 observações independentes da terna $ (x_i,m_i,y_i ),i=1,\dots,n, $ no qual

  •  $ x_i $: é o valor da variável explicativa (contaminação);
  •  $ m_i $: é a quantidade de replicatas (número de ensaios);
  •  $ y_i $: é o número de replicatas detectadas (positivações) com microrganismos em replicatas;
  •  n: é o total de combinações.

Com isso, assumimos que a variável resposta tem distribuição de probabilidade binomial tal que:

$$P[Y_i=y_i]=\binom{m_i}{y_i}\pi_i^{y_i}(1-\pi_i)^{m_i-y_i}.$$

Para adequarmos a resposta média ao modelo linear usamos a função de ligação:

$$\pi_i=\pi(\text{Contaminação}_i)=\frac{e^{\beta_0+\beta_1\text{Contaminação}_i}}{1+e^{\beta_0+\beta_1\text{Contaminação}_i}},\, i=1,\ldots,n,$$

Que representa a probabilidade de positivação. Reescrevendo a equação obtemos:

$$g(X)=g(\text{Contaminação}_i)=\ln \left(\frac{\pi_i}{1-\pi_i}\right)=\beta_0+\beta_1\text{Contaminação}_i.\quad\quad (1)$$

em que:
  $ g(\text{Contaminação}_i) $ é a resposta (função de odds);
  $ \text{Contaminação}_i $ é a variável referente à contaminação (medida em UFC);
  $ \beta_0 $ e $ \beta_1 $ são os parâmetros do modelo.

Para estimarmos os parâmetros $ \beta_0 $ e $ \beta_1 $ utilizamos o método da máxima verossimilhança. De forma geral, o método de máxima verossimilhança nos fornece valores para os parâmetros desconhecidos que maximizam a probabilidade de se obter determinado conjunto de dados (probabilidade de positivação). Assumimos que $ (x_0,m_0,y_0 ), $ $ \dots, $ $ (x_n,m_n,y_n ), $ são independentes, assim, a função de verossimilhança é dada por:

$$P \left[ Y_1=y_1,\ldots,y_n|\beta_0,\beta_1\right]=\prod_{i=1}^n\binom{m_i}{y_i}\pi_i^{y_i}(1-\pi_i)^{m_i-y_i}$$

Assim, aplicando o logaritmo ($ \ln $) em ambos os lados da expressão anterior e usando a equação (1) obtemos a função de verossimilhança da seguinte forma:

$$L~(\beta_0,\beta_1,\beta_2|(x_i;m_i;y_i)=\sum^n_{i=1} y_i~\beta_0+\beta_1\text{Contaminação}_i.-\sum^n_{i=1}m_i\,\ln(1+e^{\beta_0+\beta_1\text{Contaminação}_i})$$

Os estimadores de máxima verossimilhança para os parâmetros $ \beta_0 $ e $ \beta_1 $ são os valores $ \hat{\beta}_0 $ e $ \hat{\beta}_1 $ que maximizam a função de verossimilhança.  Após obtermos as estimativas dos parâmetros do modelo podemos calcular as probabilidades ajustadas:

$$\text{Probabilidades Ajustadas}=\widehat{\pi}_i=\frac{e^{\widehat{g}(x_i)}}{1+e^{\widehat{g}(x_i)}},\quad\ i=1,\dots,n$$

em que

$$\hat{g}(X_i)=\hat{\beta}_0+\beta_1\text{Contaminação}_i\quad\text{(Estimador Logito)}$$

Após estimarmos os coeficientes, temos interesse em assegurar a significância das variáveis no modelo. Isto geralmente envolve formulação e teste de uma hipótese estatística para determinar se a variável independente no modelo é significativamente relacionada com a variável resposta. Assim, afim de testarmos as hipóteses utilizamos o teste de Wald. O teste de Wald é obtido por comparação entre a estimativa de máxima verossimilhança do parâmetro ($ \hat{\beta}_j $) e a estimativa de seu erro padrão. A razão resultante, sob a hipótese \beta_j=0 $ tem distribuição normal padrão. Assim, vamos considerar a seguinte hipótese:

{\beta}_{j}\neq0\end{array}\right.$$

A estatística do teste Wald para a regressão logística é

$$W_0=\frac{\hat{\beta}_0}{\widehat{DP}(\hat{\beta}_0)}=\frac{-0,00248}{0,18215}=-0,01362$$

$$W_1=\frac{\hat{\beta}_1}{\widehat{DP}(\hat{\beta}_1)}=\frac{0,76258}{0,10738}=7,10181$$

O p-valor é definido como $ P(|Z|\textgreater |W_j|) $, sendo que Z denota a variável aleatória da distribuição normal padrão.

Para o intercepto

$ \mbox{p-valor}=P(|Z|\textgreater -0,01362) = 0,989 $

Para a contaminação

$ \mbox{p-valor}=P(|Z|\textgreater 7,10181) = 0,000 $

As estimativas dos parâmetros, respectivos desvios padrão e o teste de Wald para análise da significância dos parâmetros são apresentados abaixo.

Tabela 5.4.2.2: Estimativa dos parâmetros.

A partir do modelo da regressão logística estimado para os dados, obtemos estimativas para a probabilidade de positivação em diferentes níveis de contaminação. Os resultados estão apresentados na Tabela 5.4.2.3. Com isso, definimos o limite de detecção como o nível de contaminação para o qual a probabilidade de positivação estimada esteja em 95 %.
A seguir, calculamos o limite de detecção para o método Alternativo.

O procedimento para detectar a contaminação do limite de detecção é realizada à partir dos seguintes passos. À partir das estimativas dos parâmetros do modelos obtemos a equação (1. O próximo passo é inverter essa equação e com isso obtemos:

$ \text{Limite de Detecção}=\dfrac{1}{\widehat{\beta}_1}\left[\ln \left(\frac {\pi_i} {1 - \pi_i}\right)-\widehat{\beta}_0\right]=\dfrac{1}{0,76}\left[\ln \left(\frac{0,95}{1 - 0,95}\right)-(-0,002)\right]=3,87~\text{UFC/mL} $

Tabela 5.4.2.3: Probabilidade de positivação do método Alternativo.

 

Figura 5.4.2.1: Limite de detecção do método Alternativo.

A seguir, medimos a qualidade do ajuste do modelo, para isto, usamos o teste de Pearson. Dos resultados obtidos, temos que o modelo está bem ajustado (p-valor$ = $0,36) ao nível de significância de 5%.

Tabela 5.4.2.4: Qualidade do ajuste do modelo (Teste de Pearson).

Também medimos a qualidade do ajuste por meio do teste de Deviance. Dos resultados obtidos, tem-se que o modelo está bem ajustado (p-valor$ = $0,34) ao nível de significância de 5%.

Tabela 5.4.2.5: Qualidade do ajuste do modelo (Teste de Deviance).

Tradicional

Abaixo apresentamos um resumo dos dados para os diferentes métodos e níveis de contaminação.

Método Contaminação Tamanho da Amostra Positivação Proporção
Tradicional 0,5 168 71 42,3%
Tradicional 2 168 99 58,9%
Tradicional 5 168 142 84,5%
Tradicional 50 168 168 100% 

Tabela 5.4.2.6: Resumo dos resultados.

Análogo aos procedimentos realizados para o método alternativo estimamos os parâmetros associados ao modelo de regressão binária com função de ligação logística a partir do método da máxima verossimilhança. As estimativas dos parâmetros, respectivos desvios padrão e o teste de Wald para análise da significância dos parâmetros são apresentados abaixo.

Tabela 5.4.2.7: Estimativa dos parâmetros.

A partir do modelo da regressão logística estimado para os dados, obtemos estimativas para a probabilidade de positivação em diferentes níveis de contaminação. Os resultados estão apresentados na Tabela 5.4.2.8. Com isso, definimos o limite de detecção como o nível de contaminação para o qual a probabilidade de positivação estimada esteja em 95 %.
A seguir, vamos calcular o limite de detecção para o método Tradicional.

O procedimento para detectar a contaminação do limite de detecção é análogo ao anterior. 

$ \text{Limite de Detecção}&=&\dfrac{1}{\widehat{\beta}_1}\left[\ln \left(\frac {\pi_i} {1 - \pi_i}\right)-\widehat{\beta}_0\right]=\dfrac{1}{0,45}\left[\ln \left(\frac{0,95}{1 - 0,95}\right)-(-0,53)\right]=7,79~\text{UFC/mL} $

Tabela 5.4.2.8: Probabilidade de positivação do método Tradicional.

Figura 5.4.2.2: Limite de detecção do método Tradicional.

A seguir, medimos a qualidade do ajuste do modelo, para isto, usamos o teste de Pearson. Dos resultados obtidos, temos que o modelo está bem ajustado (p-valor$ = $0,99) ao nível de significância de 5%.

Tabela 5.4.2.9: Qualidade do ajuste do modelo (Teste de Pearson).

Também medimos a qualidade do ajuste por meio do teste de Deviance. Dos resultados obtidos, tem-se que o modelo está bem ajustado (p-valor$ = $0,99) ao nível de significância de 5%.

Tabela 5.4.2.10: Qualidade do ajuste do modelo (Teste de Deviance).

Sobre o Portal Action

O Portal Action é mantido pela Estatcamp - Consultoria Estatística e Qualidade, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.

Facebook

CONTATO

  •  Maestro Joao Seppe, 900, São Carlos - SP | CEP 13561-180
  • Telefone: (16) 3376-2047
  • E-Mail: [email protected]