1.1 - RPP para Controle em Processos

A seguir, apresentamos uma metodologia para análise estatística dos resultados do controle em processo e do produto acabado. Nossa metodologia foi desenvolvida pela equipe do Portal Action em conjunto com diversas empresas farmacêuticas, como a EMS, União Química, Brainfarma, entre outras. A metodologia está bem fundamentada e segue requisitos do Guia da ANVISA (2012)[1]. A seguir, apresentamos o fluxo da análise estatística.

Figura 1.1.1: Fluxo das Análises dos Itens V e VI do  Guia da ANVISA (2012)[1]. 

A análise estatística está dividida em diversas fases. Primeiro, fazemos uma análise exploratória dos resultados. Nesta fase fazemos uma análise preliminar dos dados, com intuito de identificar valores extremos, que podem corresponder a erros de digitação, problemas na metodologia de medição ou simplesmente problemas no processo. Para identificar valores extremos, utilizamos o Box-Plot ou um teste apropriado, como o teste de Grubbs. Também avaliamos o comportamento empírico dos dados. Por exemplo, se temos um coeficiente de curtose muito alto, significa que as caudas da distribuição do dados são pesadas, este fato pode ter como causa problemas no processo de produção ou no sistema de medição. Uma análise mais detalhada desta fase será discutida nas aplicações. 

Figura 1.1.2: Análise Exploratória dos dados. 

Na sequência, vamos estudar a estabilidade dos resultados ao longo do tempo. Aqui, podemos aplicar diversas técnicas estatísticas. A mais simples são os gráficos de controle estatístico do processo (CEP).  Porém ressaltamos que está técnica é aplicada para avaliar não muitos subgrupos de dados. Por exemplo, ao considerarmos o peso médio de um comprimido, amostramos a cada intervalo de tempo (exemplo, meia hora) 20 comprimidos. Assim, temos um subgrupo racional de 20 comprimidos (tamanho da amostra) a cada meia hora (frequência) de produção. Se tivermos muitos subgrupos (acima de 150) a análise de estabilidade via gráficos de CEP não é a mais apropriada. Pois os testes de Nelson para identificar causas especiais são baseados em poucos subgrupos.  Por construção, sabemos que em média, a cada 367 pontos no gráfico é esperado pelo menos um ponto fora dos limites de controle. Assim, se construímos nosso gráfico de controle com  muitos pontos, temos chance alta de obtermos falsos alarmes. Na situação em que temos muitos subgrupos é melhor aplicarmos técnicas de séries temporais para avaliar a estabilidade do processo. Neste caso, sugerimos a aplicação de testes não paramétricos para identificar a presença ou não de tendência nos resultados do processo ao longo do tempo. Da mesma forma, aplicamos testes apropriados para avaliar a estacionariedade do processo. O estudo da estabilidade do processo nos fornece informação útil sobre o comportamento do processo. Por exemplo, se temos um processo instável, temos uma oportunidade de melhoria "simples",  pois basta identificarmos as causas de instabilidade para agirmos no processo. Em geral, as causas de instabilidade estão relacionadas com mudanças de lotes de matéria prima, mudanças de setup de máquina, mudanças de turno, entre outras. 

Figura 1.1.3: Estudo de Estabilidade. 

Após avaliarmos a estabilidade do processo, vamos estudar a "capacidade" do processo produzir conforme as necessidades dos clientes, ou seja, conforme as especificações de registro do produto. Aqui, é importante destacarmos que temos dois grupos de indicadores. Os índices de capacidade do processo e os índices de performance do processo. Os índices de capacidade comparam a variabilidade inerente do processo com a especificações. A variabilidade inerente do processo considera apenas as causas comuns de variação. Assim, este índice é avaliado somente quando o processo for estável. Por outro lado, os índices de performance do processo comparam a variabilidade total do processo com as especificações, no qual a variabilidade total engloba tanto as causas comuns quanto as causas especiais de variação. Assim, o índice de performance considera a realidade do processo e este é o índice que devemos considerar na nossa análise. Para calcularmos o índices de performance, devemos ter no mínimo 30 observações provenientes de pelo menos 10 lotes de produção, conforme Guia da ANVISA (2012) [1].  Na prática, devemos identificar uma distribuição apropriada para calcularmos os índices de performance do processo. Primeiro, checamos se podemos aproximar a distribuição dos dados pela distribuição normal. Aqui, utilizaremos os testes de normalidade dos dados, como o teste de Anderson-Darling. Caso a distribuição normal não seja adequada para modelar os dados, procuramos uma transformação que "normalize" os dados. As mais comuns são a transformação de Box-Cox e a transformação de Johnson. Na prática, nem sempre conseguimos uma transformação que normalize os dados. Nestes casos, tentamos ajustar uma outra distribuição de probabilidade aos dados. Por exemplo, podemos utilizar a distribuição de Weibull, Log-Normal, entre outras. Mais uma vez, não temos garantia de que vamos encontrar uma distribuição de probabilidade que se adeque aos nossos dados. Nestes casos, sugerimos o uso de técnicas não paramétricas para a estimação de densidades.  Com os índices de performance em mãos, devemos fazer uma análise cuidadosa dos índices e da probabilidade de produtos fora de especificações, que em geral, é calculada em PPM (partes por milhão). Ressaltamos que os critérios devem ser estabelecidos conforme tipo de produto e característica da qualidade. Para um produto crítico, como um injetável, temos um critério mais apertado. Por outro lado, para um produto menos crítico, como uma pomada para micose por exemplo, podemos ter um critério menos apertado. Da mesma forma, devemos ter algum critério de severidade para classificar as características do processo e produto. Na nossa opinião, toda característica com índice fora do especificado deve ser aberto um plano de melhoria.

Figura 1.1.4: Análise de Capacidade. 

No final realizamos uma comparação entre lotes produzidos no período, englobando tanto os lotes aprovados quanto os lotes reprovados. Para fazer uma comparação entre os lotes, vamos utilizar uma técnica apropriada de comparação múltipla. Aqui, ressaltamos de que precisamos no mínimo 9 medidas por lote (3 no início, 3 no meio e 3 no final). Se tivermos poucos lotes (menos que 15 lotes), podemos utilizar técnicas usuais de comparação múltipla como o método de Tukey. Por outro lado, se temos muitos lotes, os testes usuais não são satisfatórios e neste caso, utilizamos os métodos de comparação baseados na taxa de falso reconhecimento (False Discovery Rate -FDR). Caso tenhamos muitos grupos, significa que temos muitos lotes são distintos. Em geral, esta é uma informação importante para reduzirmos a variabilidade do processo. Neste caso, devemos identificar porquê o processo se altera quando mudamos o lote.  

Figura 1.1.5: Comparação Múltiplas dos Lotes. 

A equipe do Portal Action desenvolveu um módulo específico no Action Stat Pharma para rodarmos análises estatísticas aplicadas à Revisão Periódica de Produto (RPP). Para ilustramos nossa metodologia, apresentamos uma aplicação.

Uma indústria famacêutica mediu a massa de 5758 lotes comprimidos obtidos de mais de 500 lotes de produção. As especificações do produto são dadas por LIE=2,850 g e LSE=3,150 g. O objetivo é avaliar os controles em processo e o produto acabado. Para isto considere os dados no link a seguir:   

clique aqui para efetuar o download dos dados utilizados nesse exemplo

Com objetivo de avaliarmos os itens V e VI do  Guia da ANVISA (2012)[1] para RPP, seguimos o fluxograma apresentado na figura 1.1 da seção análise dos controle em processo e do porduto acabado. Inicialmente avaliamos a tendência, lembrando que temos mais de 500 lotes, logo avaliamos a tendência via séries temporais.

A seguir, avaliamos a tendência através do software Action Stat, para isto seguimos os passos:

1. Selecionamos na ferramenta RPP as Análise dos Controles. Como temos mais de 500 lotes, selecionamos Estabilidade/Séries Temporais.

2. O próximo passo é preencher a janela da Estabilidade/ Séries Temporais

3. Por fim, obtemos um relatório word com a seguinte saída:

Análise Descritiva

Inicialmente, apresentamos um resumo descritivo dos dados.

Tabela 1.1.1: Resumo descritivo dos dados
Análise Gráfica

Figura 1.1.1: Boxplot dos dados.

Análise de Tendência do Processo

Análise Gráfica

Figura 1.1.2: Gráfico da tendência dos dados.

Teste de Tendência

Para testarmos a tendência utilizamos as seguintes hipóteses:

 \text{As observações da série possuem tendência monotônica no tempo (Há tendência).}\end{array}\right.\]

que são as hipóteses do teste de Mann-Kendall para tendência.

Agora, avaliamos a tendências através do teste de Mann-Kendall e obtemos um p-valor de 0,4178. Logo, não rejeitamos a hipótese nula (as observações da série são independentes e identicamente distribuídas) ao nível de significância de 0,05 (5%) . Portanto, concluímos que não existe tendência significativa.

Tabela 1.1.3: Tabela do teste de Mann-Kendall para detecção de tendência.

Teste de Estacionariedade

Para testarmos a estacionariedade utilizamos as seguintes hipóteses:

 \text{Não existem raízes dentro do círculo unitário.}\end{array}\right.\]

que são as hipóteses do teste de Dickey-Fuller Aumentado é conhecido na literatura como teste ADF(Augmented Dickey-Fuller).

O p-valor obtido do teste de Dickey-Fuller (teste de estacionariedade) é de 0,01. Logo, rejeitamos a hipotese nula (existe pelo menos uma raiz dentro do círculo unitário) ao nível de significância de 0.05 . Concluímos que os dados são estacionários.

Tabela 1.1.4: Tabela do teste de Dickey-Fuller para análise de estacionariedade.

Análise de Capacidade e Performance do Processo

Teste de Normalidade

Inicialmente o teste de normalidade de Anderson-Darling foi utilizado para detectar a normalidade da população que provém os dados. O P-Valor associado à estatística de Anderson-Darling foi de 0, portanto ao nível de significância de 5% rejeitamos a hipótese de normalidade.

Figura 1.1.3: QQ-plot do conjunto de dados.

Análise com outras distribuições de probabilidade (não normal)

Dado que o conjunto de dados não possui distribuição normal e não foi possível utilizar nenhuma das transformações precisamos verificar a possibilidade de utilizar outras distribuições para o cálculo dos índces de performance.

Distribuições

As avaliarmos a aderência pelo teste de Anderson-Darling para verificar a adequação dos dados a outras distribuições, obtemos os resultados da tabela (1).

Tabela 1.1.5:Testes de Anderson-Darling para identificação da distribuição dos dados.

Verificamos que nenhuma das distribuições consideradas podem ser utilizadas para modelar a distribuição dos dados, portanto, precisamos utilizar o método não paramétrico de Kernel para a análise dos dados.

Método não paramétrico de Kernel

Como a hipótese de normalidade foi rejeita, não foi possível utilizar nenhuma das transformações e nem mesmo outras distribuições paramétricas puderam ser ajustadas aos dados. Utilizar o método não paramétrico de Kernel.

                                                                           Tabela 1.1.6:    Testes para verificar a qualidade do ajuste do método não paramétrico.

Figura 1.1.4: Gráfico da distribuição empírica dos dados.

Análise de performance do processo

Índices de performance do processo

Os índices de performance comparam as especificações com a variabilidade total do processo.

Índices Observados e Esperados

Com os dados amostrais e a distribuição ajustada, calculamos a quantidade observada e esperada de produtos fora de especificação em um lote de um milhão de produtos.

Tabela 1.1.7: Índices observados

Tabela 1.1.8: Índices esperados

Análise Gráfica

Abaixo apresentamos o histograma da distribuição dos dados em comparação com as espcificações.

Figura 1.1.5: Gráfico de Performance.

Comparação Multipla dos Lotes

 
Comparações Múltiplas

O próximo passo são as comparações múltiplas dos lotes para isto é necessário controlar o aumento da probabilidade global do Erro do tipo I. A taxa de erro utilizada  é o FDR (False Discovery Test) e a estatística utilizada é a de Kruskal-Wallis. A proporção de grupos encontrados em relação ao total de lotes é de 11,03%. Após comparações múltiplas temos os seguintes grupos:

Grupos

Frequência

Freq. Percentual

Média

Mediana

a

1

0,28986

3,0254

3,0295

ab

2

0,57971

3,0235

3,019

abc

1

0,28986

3,0136

3,0145

abcd

2

0,57971

3,0171

3,018

abcde

3

0,86957

3,011

3,013

abcdef

2

0,57971

3,0102

3,012

abcdefg

5

1,44928

3,0127

3,01

abcdefgh

6

1,73913

3,0105

3,009

bcdefgh

1

0,28986

3,0099

3,0085

bcdefghi

2

0,57971

3,0066

3,004

bcdefghij

11

3,18841

3,0058

3,005

bcdefghijk

14

4,05797

3,0009

3,003

bcdefghijkl

5

1,44928

3,01

3,007

bcdefghijklm

1

0,28986

3,0069

3,0065

cdefghijklm

5

1,44928

3,0102

3,005

cdefghijklmn

35

10,14493

3,0062

3,006

cdefghijklmno

31

8,98551

3,0103

3,008

defghijklmno

5

1,44928

3,0111

3,006

defghijklmnop

14

4,05797

3,0082

3,011

defghijklmnopq

4

1,15942

3,0094

3,004

efghijklmnopq

23

6,66667

2,9956

2,998

fghijklmnopq

24

6,95652

3,0037

3,006

ghijklmnopq

5

1,44928

2,9982

2,997

hijklmnopq

31

8,98551

2,9998

2,998

hijklmnopqr

3

0,86957

3,0039

3,0035

ijklmnopqr

1

0,28986

3,0007

3

jklmnopqr

31

8,98551

2,9935

2,996

jklmnopqrs

8

2,31884

3,0019

2,995

klmnopqrs

7

2,02899

2,9964

2,991

lmnopqrs

7

2,02899

3,0054

3,004

lmnopqrst

11

3,18841

3,0005

2,998

mnopqrst

21

6,08696

2,996

3

nopqrst

1

0,28986

2,9974

2,998

opqrst

10

2,89855

2,9959

2,995

pqrst

3

0,86957

2,9973

2,9955

qrst

4

1,15942

2,9954

2,9925

rst

2

0,57971

2,9848

2,98

st

1

0,28986

2,9875

2,983

t

2

0,57971

2,9819

2,992

Total

345

 

 

 

 

Tabela 1.1.9: Tabela de frequência do agrupamento por lotes.

Figura 1.1.6: Gráfico de Frequência do agrupamento por lotes.

 

Sobre o Portal Action

O Portal Action é mantido pela Estatcamp - Consultoria Estatística e Qualidade, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.

Facebook

CONTATO

  •  Maestro Joao Seppe, 900, São Carlos - SP | CEP 13561-180
  • Telefone: (16) 3376-2047
  • E-Mail: [email protected]