4.1 - Gráficos Média e Amplitude

Você está aqui

Quando lidamos com uma característica da qualidade que é uma variável, necessitamos monitorar tanto a média da característica da qualidade quanto a sua variabilidade. Para isto, supomos que a característica da qualidade tem distribuição de probabilidade com média μ e desvio padrão σ. Assim, para uma amostra aleatória X1, X2, ... , Xn de tamanho n, temos que a média amostral é dada por:

$$\overline{X}=\frac{X_1+X_2+\dots+X_n}{n}$$

Com isso, aplicando o Teorema Central do Limite para esta amostra aleatória, quando o tamanho da amostra aumenta, a distribuição amostral da média se aproxima de uma distribuição Normal com média μ e desvio padrão $ \sigma_{\overline{X}}=\frac{\sigma}{\sqrt{n}} $, ou seja, se o tamanho amostral é suficientemente grande, podemos assumir que a média amostral tem uma distribuição Normal. Consequentemente, o intervalo de confiança da média é dado por:

$$IC(\mu,1-\alpha)=\left(\mu_{\overline{X}}-Z_{\frac{\alpha}{2}}\frac{\sigma}{\sqrt{n}};\mu_{\overline{X}}+Z_{\frac{\alpha}{2}}\frac{\sigma}{\sqrt{n}}\right)~\quad (4.1.1)$$

Na prática, geralmente não conhecemos μ e σ, contudo, estes parâmetros são estimados a partir de amostras preliminares tomadas em subgrupos de pelo menos 20 a 25 amostras. Suponhamos que temos disponível m amostras, com cada uma contendo n observações sobre a característica da qualidade. Nas aplicações, o número de observações n é pequeno e geralmente resultam à partir da construção de subgrupos racionais, em que os custos de amostragem e de inspeção associadas com as medições das variáveis ​​são altas. Para o gráfico da média $ \overline{X} $, tomamos $ \overline{X}_1,\overline{X}_2,\dots,\overline{X}_m $ as médias de cada amostra, temos que o melhor estimador de $ \mu $ para o processo da média é dada por:

$$LC=\overline{\overline{X}}=\frac{\overline{X}_1+\overline{X}_2+\dots+\overline{X}_m}{m}$$

que é a linha central do gráfico $ \overline{X}. $

Agora, necessitamos da estimativa do desvio padrão, para isto, vamos estimar nesta seção pela amplitude $ R. $ Assim, para uma amostra aleatória X1, X2, ... , Xn de tamanho n, temos que a amplitude $ R $ é dada por:

$$R=X_{\text{máx}}-X_{\text{mín}}$$

Agora, seja $ R_1,R_2,\dots,R_m $ as amplitudes das m amostras, então a linha central (LC) ou a média das amplitudes é dada por:

$$\overline{R}=\frac{R_1+R_2+\dots+R_m}{m}$$

A seguir, vamos apresentar os principais tópicos para a construção do gráfico $ \overline{X} $ e $ R. $

  •  Os gráficos $ \overline{X} $ e $ R $ (média e amplitude) devem ser implementados simultaneamente, pois as funções se complementam. 
  • Objetivo: controlar a variabilidade do processo e detectar qualquer mudança que aconteça. 
  • Um processo pode sair de controle por alterações no seu nível ou na sua dispersão. As mudanças no nível (média) e  dispersão (variabilidade) do processo podem ser consequências de causas especiais, gerando defeitos.

 

Cálculo dos limites de controle

 

Para o desenvolvimento dos limites de controle, primeiramente vamos definir a variável aleatória $ W=\frac{R}{\sigma} $ chamada Amplitude Relativa. A principal propriedade de $ W $ é que sua média é a constante $ d_2 $ que depende do tamanho da amostra. Com isso, o estimador não viciado do desvio padrão $ \sigma $ da distribuição Normal é dada por $ \hat{\sigma}=\frac{\overline{R}}{d_2}, $ consequentemente para $ \overline{R}, $ temos que o estimador para o desvio padrão é dada por:

$$\hat{\sigma}=\frac{\overline{R}}{d_2}$$

Agora, temos as ferramentas necessárias para a construção dos limites de controle para o gráfico $ \overline{X} $ e $ R. $ Logo, usando a equação (4.1.1) e usando $ Z_{\frac{\alpha}{2}}=3 $ obtemos os limites de controle para o gráfico $ \overline{X} $ da seguinte forma

$$LSC=\mu_{\overline{X}}+3\frac{\sigma}{\sqrt{n}}=\overline{\overline{X}}+3\frac{\overline{R}}{d_2~\sqrt{n}}=\overline{\overline{X}}+\underbrace{\frac{3}{d_2~\sqrt{n}}}_{A_2}~\overline{R}\quad \Rightarrow\quad LSC=\overline{\overline{X}}+A_2~\overline{R}$$

e

$$LIC=\mu_{\overline{X}}-3\frac{\sigma}{\sqrt{n}}=\overline{\overline{X}}-3\frac{\overline{R}}{d_2~\sqrt{n}}=\overline{\overline{X}}-\underbrace{\frac{3}{d_2~\sqrt{n}}}_{A_2}~\overline{R}\quad \Rightarrow \quad LIC=\overline{\overline{X}}-A_2~\overline{R}$$

Assumindo que a característica de qualidade é normalmente distribuída, $ \hat{\sigma}_{R} $ é calculada à partir da distribuição Amplitude Relativa  $ W=\frac{R}{\sigma} $. Assim, o desvio padrão de $ W $ é dado por $ d_3 $ (para mais detalhes consulte o livro de Montgomery, D.C. (2001)), é uma constante que depende do tamanho da amostra . Logo, para $ R=W~\sigma $ o desvio padrão de $ R $ é dada por:

$$\hat{\sigma}_{R}=d_3~\sigma=d_3~\frac{\overline{R}}{d_2}$$

Portanto, os limites de controle para o gráfico $ R $ são dadas por:

$$LSC=\overline{R}+3~\hat{\sigma}_{R}=\overline{R}+3~d_3~\frac{\overline{R}}{d_2}=\overline{R}\underbrace{\left(1+3~\frac{d_3}{d_2}\right)}_{D_4}\quad \Rightarrow \quad LSC=D_4~\overline{R}$$

e

$$LIC=\overline{R}-3~\hat{\sigma}_{R}=\overline{R}-3~d_3~\frac{\overline{R}}{d_2}=\overline{R}\underbrace{\left(1-3~\frac{d_3}{d_2}\right)}_{D_3}\quad \Rightarrow\quad LIC=D_3~\overline{R}.$$

Resumindo temos que, 

  • Para as médias:

Limite Superior de Controle:

$$LSC = \overline{\overline{X}} + A_2 \ast \overline{R}$$

Linha Central:

$$LC = \overline{\overline{X}}$$

Limite Inferior de Controle:

$$LIC = \overline{\overline{X}} - A_2 \ast \overline{R}$$

  • Para as amplitudes:

Limite Superior de controle:

$$LSC = D_4 \ast \overline{R}$$

Linha Central:

$$LC = \overline{R}$$

Limite Inferior de Controle:

$$LIC = D_3 \ast \overline{R}$$

 

Disposição dos pontos nos gráficos $ \overline{X} $ e $ R $

Tendo calculado as Linhas Centrais e os Limites Inferiores e Superiores de Controle para os gráficos $ \overline{X} $ e $ R $, estamos em condições de dispor os pontos que representam as médias amostrais (no gráfico $ \overline{X} $) e as amplitudes amostrais (no gráfico $ R $), respectivamente.

Para facilitar a análise dos resultados é também recomendável colocar os gráficos um abaixo do outro e marcar os pontos correspondentes a uma mesma amostra na mesma reta vertical.

 

Fase I: Aplicação dos gráficos $ \overline{X} $ e $ R $

Na Fase I, quando amostras preliminares são usadas para construir os gráficos $ \overline{X} $ e $ R $ é de costume tratar os limites de controle obtidos como limites de controle teste. Eles permitem determinar se o processo estava sob controle quando as m amostras preliminares foram selecionadas. Para determinar se o processo estava sob controle quando amostras preliminares foram coletadas podemos plotar os valores de $ \overline{X} $ e $ R $ de cada amostra nos gráficos e analisar o resultado obtido. Se todos os pontos plotados estão dentro dos limites e nenhum comportamento sistemático é evidenciado, então concluímos que o processo estava sob controle no passado e os limites de controle teste são adequados para controlar a produção atual ou futura. É altamente desejável ter de 20 a 25 amostras ou subgrupos de tamanho n (tipicamente n está entre 3 e 5) para calcular os limites de controle teste. Podemos, é claro, trabalhar com menos dados, porém os limites de controle não são tão confiáveis.

Suponha que um ou mais valores de $ \overline{X} $ ou de $ R $ estejam fora de controle quando comparados com os limites de controle teste. Claramente, se os limites de controle para a produção atual ou futura são significativos eles devem ser baseados em dados de um processo que está sob controle. Entretanto, quando a hipótese de controle passada é rejeitada é necessário revisar os limites de controle teste. Isso é feito examinando cada um dos pontos fora de controle, procurando por uma causa assinalável. Se uma causa assinalável é encontrada, o ponto é descartado e os limites de controle teste são recalculados usando somente os pontos remanescentes. Então, esses pontos remanescentes são reexaminados para controle. (Note que os pontos que estavam sob controle inicialmente podem agora estar fora de controle, pois os limites de controle teste são geralmente mais severos do que os antigos.) Esse processo continua até que todos os pontos estejam sob controle, pontos para os quais os limites de controle teste são adotados para uso atual.

Em alguns casos, pode não ser possível encontrar uma causa assinalável para um ponto que caia fora de controle. Dessa forma, há dois caminhos a tomar. O primeiro deles é eliminar o ponto caso uma causa assinalável tenha sido encontrada. Não há nenhuma justificativa analítica para escolher essa ação, a não ser a de que os pontos que estejam fora dos limites de controle foram extraídos da distribuição de probabilidade de uma característica de um estado fora de controle. A alternativa então é manter o ponto (ou pontos) considerando os limites de controle teste como apropriados para o controle atual. É claro, se o ponto realmente não representa uma condição de fora de controle, os limites de controle resultantes serão muito largos. No entanto, se existe um ou dois desses pontos isso não distorcerá o gráfico de controle significamente. Se amostras futuras ainda indicarem controle então os pontos inexplicados podem provavelmente ser retirados seguramente.

Ocasionalmente, os valores amostrais iniciais de $ \overline{X} $ e $ R $ são plotados contra os limites de controle teste e muitos pontos cairão fora de controle. Claramente, se retirarmos arbitrariamente pontos fora de controle teremos uma situação insatisfatória, com poucos dados remanescentes para recalcular limites de controle confiáveis. Suspeitamos que esse tipo de abordagem ignoraria muita informação útil nos dados. Porém, procurar por uma causa assinalável para cada ponto fora de controle é improvável obter sucesso. Achamos que quando muitas amostras iniciais caem fora de controle contra os limites teste, é melhor concentrar sobre um padrão formado por esses pontos. Tais padrões quase sempre existirão. Geralmente, a causa assinalável associada com o padrão de pontos fora de controle é fácil de identificar. A remoção desse problema geralmente resulta em uma melhoria no processo (principal).

Revisão dos Limites de Controle e Linhas Centrais

O uso eficaz de um gráfico de controle requer revisão periódica dos limites de controle e das linhas centrais. Alguns práticos estabelecem períodos regulares para rever e fazer revisões dos limites dos gráficos de controle tais como toda semana, todo mês ou a cada 25, 50 ou 100 amostras. Ao revisar limites de controle devemos lembrar que é altamente desejável usar pelo menos 25 amostras ou subgrupos (algumas autoridades recomendam de 200 a 300 observações individuais) no cálculo dos limites de controle.

Algumas vezes o usuário substitui a linha central do gráfico $ \overline{X} $ pelo valor alvo, digamos $ \overline{\overline{X}}_{0} $. Se o gráfico $ R $ exibe controle pode ser útil deslocar a média do processo para o valor desejado, particularmente em processos onde a média pode ser mudada por um simples ajuste de uma variável manipulável do processo. Se a média não é facilmente influenciada por um simples ajuste do processo, então é provável ser uma função desconhecida e complexa de várias variáveis do processo e um valor alvo $ \overline{\overline{X}}_{0} $ pode não ser útil, assim como o uso daquele valor poderia resultar em muitos pontos fora dos limites de controle. Nesses casos, não saberíamos necessariamente se o ponto estava realmente associado à uma causa assinalável ou se foi plotado fora dos limites por causa de uma má escolha para a linha central.

Quando o gráfico $ R $ está fora de controle, eliminamos os pontos fora de controle e recalculamos um valor revisado de $ \overline{R} $. Esse valor é então usado para determinar novos limites e linha central do gráfico $ R $ e novos limites no gráfico $ \overline{X} $. Temos assim limites mais severos (apertados) em ambos os gráficos, tornando-os consistentes (com um desvio padrão $ \sigma $ consistente) com o uso do $ \overline{R} $ revisado na relação $ \overline{R}/d_{2} $. Essa estimativa de $ \sigma $ poderia ser usada como base das análises preliminares da capacidade do processo.

Exemplo 4.1.1:

Para aplicação dos gráficos $ \overline{X} $ e $ R $ consideremos dados correspondentes ao comprimento de peças em subgrupos de tamanho 5.

Tabela 4.1.1: Dados amostrais de comprimentos de peças.

X1 X2 X3 X4 X5 $ \overline{X} $ R
0,65 0,7 0,65 0,65 0,85 0,7 0,2
0,75 0,85 0,75 0,85 0,65 0,77 0,2
0,75 0,8 0,8 0,7 0,75 0,76 0,1
0,6 0,7 0,7 0,75 0,65 0,68 0,15
0,7 0,75 0,65 0,85 0,8 0,75 0,2
0,6 0,75 0,75 0,85 0,7 0,73 0,25
0,75 0,8 0,65 0,75 0,7 0,73 0,15
0,6 0,7 0,8 0,75 0,75 0,72 0,2
0,65 0,8 0,85 0,85 0,75 0,78 0,2
0,6 0,7 0,6 0,8 0,65 0,67 0,2
0,8 0,75 0,7 0,8 0,7 0,75 0,1
0,85 0,75 0,85 0,65 0,7 0,76 0,2
0,7 0,7 0,75 0,75 0,7 0,72 0,05
0,65 0,7 0,85 0,75 0,6 0,71 0,25
0,9 0,8 0,8 0,75 0,85 0,82 0,15
0,75 0,8 0,75 0,8 0,65 0,75 0,15
0,75 0,7 0,85 0,7 0,8 0,76 0,15
0,75 0,7 0,6 0,7 0,6 0,67 0,15
0,65 0,65 0,85 0,65 0,7 0,7 0,2
0,6 0,6 0,65 0,6 0,65 0,62 0,05
0,5 0,55 0,65 0,8 0,8 0,66 0,3
0,6 0,8 0,65 0,65 0,75 0,69 0,2
0,8 0,65 0,75 0,65 0,65 0,7 0,15
0,65 0,6 0,6 0,6 0,7 0,63 0,1
0,65 0,7 0,7 0,6 0,65 0,66 0,1

clique aqui para efetuar o download dos dados utilizados nesse exemplo

Etapas para a coleta das amostras e análise dos dados:

  1. Seleção da característica de qualidade do processo, focada no cliente.
  2. Registro das observações obtidas seguindo os critérios de amostragem racional. No exemplo foram escolhidos 5 itens por hora, durante m = 25 horas.
  3. Cálculo da média amostral $ \overline{X} $ e da amplitude amostral $ R $, para cada i = 1, 2, …, m. Os valores de $ \overline{X} $ e de $ R $ acompanham os valores em cada coluna.
  4. Cálculo da média das médias amostrais e da média das amplitudes amostrais, os quais são indicados, respectivamente, por $ \overline{\overline{X}} $ e $ \overline{R} $.

 

$$\overline{\overline{X}} = \dfrac{\hbox{Soma das Médias Amostrais}}{\hbox{Número de amostras}} = \dfrac{1}{m}\sum_{i=1}^{n}\overline{X}_i$$

 

$$\overline{R} = \dfrac{\hbox{Soma das Amplitudes Amostrais}}{\hbox{Número de amostras}} = \dfrac{1}{m}\sum_{i=1}^{n}R_{i}$$

 

Para os dados do nosso exemplo temos:

  • m = Número de amostras = 25
  • n = Tamanho das amostras = 5

$$\overline{\overline{X}} = \dfrac{0,70+0,77+\cdots+0,66}{25} = \dfrac{17,89}{25} = 0,7156$$

$$\overline{R} = \dfrac{0,20+0,20+\cdots+0,10}{25} = \dfrac{4,15}{25} = 0,166$$

Vamos agora calcular os limites de controle. No Apêndice se encontram os valores tabelados das constantes necessárias para o cálculo, assim para n = 5 temos, A2 = 0,577;  D3 = 0 e D4 = 2,114.

Aplicando as fórmulas, obtemos:

  • Para a média:

$$LSC= 0,7156 + (0,577 \ast 0,166) = 0,8113$$

$$LC= 0,7156$$

$$LIC = 0,7156 - (0,577 \ast 0,166) = 0,6198$$

  • Para a amplitude:

$$LSC = 2,114 \ast 0,166 = 0,3509$$

$$LC = 0,166$$

$$LIC = 0$$

A seguir temos os resultados obtidos pelo Software Action para esse exemplo.

Figura 4.1.1: Gráficos $ \overline{X} $ e $ R $.

O gráfico das amplitudes ($ R $) se encontra sob controle estatístico. No entanto, o gráfico $ \overline{X} $ apresenta um ponto a mais de 3 desvios padrão da linha central, indicando uma possível causa especial de variação.

Para entender como executar essa função do Software Action, você pode consultar o manual do usuário.

Fase II: Operação dos gráficos $ \overline{X} $ e $ R $

Uma vez que limites de controle confiáveis são estabelecidos, usamos o gráfico de controle para monitorar a produção futura. Esta é a chamada Fase II do uso do gráfico de controle.

Observando a Figura 4.1.1 notamos que os gráficos de controle indicam que o processo está sob controle, até o valor $ \overline{X} $ da amostra 15 ser plotado. Uma vez que esse ponto cai acima do limite superior de controle, poderíamos suspeitar que uma causa assinalável tenha ocorrido naquele instante ou antes. O padrão geral de pontos no gráfico $ \overline{X} $ de cerca de 38 subgrupos subsequentes é um indicativo de um deslocamento na média do processo.

Uma vez que o gráfico de controle é estabelecido e está sendo usado no monitoramento online do processo, muitas vezes tentaríamos usar as regras de sensibilidade (oito testes de não aleatoriedade ou as regras da Western Electric) para acelerar a detecção de mudanças. Entretanto, desencorajamos o uso rotineiro dessas regras de sensibilidade para o monitoramento online de um processo estável porque elas fazem aumentar fortemente a ocorrência de falsos alarmes.

Ao examinarmos os dados de um gráfico de controle é algumas vezes útil construir um gráfico de corridas (run chart) das observações individuais de cada amostra. Esse gráfico é algumas vezes chamado de tolerance chart ou tier diagram e pode revelar algum padrão nos dados ou mesmo mostrar que um valor particular de $ \overline{X} $ ou $ R $ foi produzido por uma ou duas observações incomuns na amostra. Um boxplot é geralmente uma maneira muito simples de construir o tier diagram.

 

Objetivos e interpretação dos gráficos $ \overline{X} $ e $ R $

A função dos gráficos é a de identificar/detectar qualquer evidência de que a média do processo e sua dispersão não estejam operando a níveis estáveis.

Se um ou mais pontos estão fora dos limites de controle (seja no gráfico $ \overline{X} $ ou $ R $) ou outro padrão de não aleatoriedade, existe um sinal de alerta (ou indicador) de que o processo não está sob controle estatístico.

Um dos objetivos da aplicação dos gráficos de controle é testar se um processo, não conhecido, está sob controle estatístico ou não e, caso o processo seja diagnosticado "fora de controle", orientar as ações para levar o processo ao estado de controle. Para atingir tais objetivos se procede da seguinte maneira:

  1. Dispostos todos os pontos correspondentes às médias amostrais e às amplitudes amostrais nos respectivos gráficos e não existindo nenhum padrão de não aleatoriedade, o processo é considerado "sob controle".
  2. Se algum ponto fora dos limites de controle ou qualquer outro padrão de não aleatoriedade é encontrado, consideramos que causas especiais de variação estão presentes. Estas causas deverão ser procuradas e corrigidas. Depois de corrigidas as causas que determinam o padrão de não aleatoriedade, novos limites e novas linhas centrais são calculadas, eliminando para este cálculo os elementos da amostra que determinam o padrão de não aleatoriedade. Este processo deverá ser repetido, interativamente, até que nenhum padrão de não aleatoriedade seja encontrado. Neste momento consideramos que o processo atingiu o estado de controle. Com o processo em estado de controle podemos aplicar os gráficos como instrumento para monitorar o processo e realizar melhorias contínuas.

 

Definindo Sinais "fora de controle" (Testes de Nelson)

A presença de um ou mais pontos além dos limites de controle é a primeira evidência de uma causa especial de variação no processo. Um ponto fora dos limites de controle em muitos casos significa que um ou mais dos pontos seguintes ocorreram:

  • O limite de controle ou o ponto no gráfico pode ter sido calculado errado ou plotado de maneira duvidosa;
  • O sistema de medição foi alterado, isto é, um avaliador diferente ou instrumento;
  • O sistema de medição não discrimina de maneira apropriada.

Existem muitos critérios para identificar causas especiais. Os mais usados serão discutidos a seguir. A decisão de qual critério usar depende do processo que está sendo estudado/controlado. Em geral, começamos de forma simples, apenas avaliamos pontos fora das linhas de controle. Conforme ganhamos experiência sobre o processo podemos aumentar os critérios para determinar mais causas especiais de variação

Nota 1: Com exceção feita ao primeiro critério, os números associados com os critérios não estabelecem uma ordem de uso. A determinação de qual critério usar depende das características do processo e das causas especiais e prioridades com o processo.

Nota 2: Devemos ter cuidado ao se aplicar muitos critérios, exceto naqueles em que fez sentido o uso de determinado critério.

Portanto, concluiremos que um processo está fora de controle se um ou mais dos critérios listados abaixo forem encontrados nos gráficos de controle. Os critérios são:

  • 1 ponto mais do que 3 desvios padrão a partir da linha central;
  • 7 pontos consecutivos no mesmo lado da linha central;
  • 6 pontos consecutivos, todos aumentando ou diminuindo;
  • 14 pontos consecutivos, alternando acima e abaixo;
  • 2 de 3 pontos consecutivos maior que 2 desvios padrão a partir da linha central (mesmo lado);
  • 4 de 5 pontos consecutivos maior que 1 desvio padrão a partir da linha central (mesmo lado);
  • 15 pontos consecutivos dentro de 1 desvio padrão da linha central (qualquer lado);
  • 8 pontos consecutivos maior que 1 desvio padrão a partir da linha central (qualquer lado).

A seguir serão ilustrados alguns exemplos dos testes.

Figura 4.1.2: Exemplo de 1 ponto mais do que 3 desvios padrão da linha central.

 

Figura 4.1.3: Exemplo de 7 pontos em sequência a partir da linha central.

 

Figura 4.1.4: Exemplo de 14 pontos em sequência alternando-se ao longo da linha central.

 

Figura 4.1.5: Exemplo de 2 de 3 pontos consecutivos, do mesmo lado da LC, maiores que 2 desvios
padrão.

 

Figura 4.1.6: Exemplo de 7 pontos, em linha, crescentes.

 

A Função Característica de Operação

A habilidade dos gráficos $ \overline{X} $ e $ R $ de detectar deslocamentos na qualidade do processo é descrita por suas curvas características de operação (CCO). A seguir apresentamos as CCO para gráficos usados para monitorar a fase II de um processo.

Considere a CCO para um gráfico $ \overline{X} $ com o desvio padrão $ \sigma $ conhecido e constante. Se a média desloca-se do valor sob controle, digamos $ \mu_{0}, $ para outro valor $ \mu_{1}=\mu_{0}+k\sigma, $ a probabilidade de não detectar esse deslocamento na primeira amostra subsequente ou risco $ \beta $ é dada por

$$\beta=\mbox{P}[LIC \leq \overline{X} \leq LSC~|~\mu=\mu_{1}=\mu_{0}+k\sigma]~~~~~~~~~~~~~~~~~~~~(4.1.1)$$

Uma vez que $ \overline{X} \sim \mbox{N}(\mu,~\sigma^{2}/n) $ e os limites superior e inferior de controle são

$$LSC = \mu_{0}+L \sigma/ \sqrt{n}~~~~~~~\mbox{e}~~~~~~~LIC =\mu_{0}-L \sigma/ \sqrt{n}$$

podemos reescrever a equação 4.1.1 como

$$\beta = \Phi\left[\dfrac{LSC-(\mu_{0}+k\sigma)}{\sigma/ \sqrt{n}}\right]-\Phi\left[\dfrac{LIC-(\mu_{0}+k\sigma)}{\sigma/ \sqrt{n}}\right]$$

$$=\Phi\left[\dfrac{\mu_{0}+L \sigma/ \sqrt{n}-(\mu_{0}+k\sigma)}{\sigma/ \sqrt{n}}\right]-\Phi\left[\dfrac{\mu_{0}-L \sigma/ \sqrt{n}-(\mu_{0}+k\sigma)}{\sigma/ \sqrt{n}}\right]$$

em que $ \Phi $ denota a função distribuição acumulada normal padrão. Com isso, temos

$$\beta=\Phi(L-k\sqrt{n})-\Phi(-L-k\sqrt{n})~~~~~~~~~~~~~~~~~~~~(4.1.2)$$

Para ilustrar a equação 4.1.2 vamos supor um gráfico $ \overline{X} $ com L = 3 (os limites usuais três sigma) e tamanho de amostra n=5. Queremos determinar a probabilidade de detectar um deslocamento para $ \mu_{1} = \mu_{0}+2\sigma $ na primeira amostra seguinte ao deslocamento. Então, desde que L=3, k=2 e n=5 temos

$$\beta=\Phi(3-2\sqrt{5})-\Phi(-3-2\sqrt{5}) = \Phi(-1,47)-\Phi(-7,37) = 0,0705$$

Este é o risco $ \beta, $ ou a probabilidade de não detectar o deslocamento. Dessa forma, a probabilidade que esse deslocamento seja detectado na primeira amostra subsequente é dada por

$$1-\beta = 1-0,0705 = 0,9295$$

Para construir a CCO para o gráfico $ \overline{X} $ devemos plotar o risco $ \beta $ contra a magnitude do deslocamento que queremos detectar, expresso em unidades (k) do desvio padrão, para vários tamanhos de amostra n. Essas probabilidades podem ser calculadas diretamente da equação 4.1.2.

Exemplo 4.1.2:

Consideremos L=3, n variando de 2 a 10 e diferentes valores para k obtemos as CCO apresentadas na Figura 4.1.7.

Figura 4.1.7: CCO para o gráfico $ \overline{X} $ com limites 3-sigma.

Tabela 4.1.2: Valores de $ \beta $ para diferentes valores de k e n.

A Figura 4.1.7 indica que para tamanhos de amostras típicos de quatro, cinco e seis o gráfico $ \overline{X} $ não é particularmente eficiente em detectar um deslocamento pequeno (da ordem de $ 1,5\sigma $ ou menos) na primeira amostra após deslocamento. Por exemplo, se o deslocamento é de $ 1,0\sigma $ e n=5, então da Figura 4.1.7 temos que $ \beta=0,75 $ aproximadamente. Assim, a probabilidade de que o deslocamento seja detectado na primeira amostra é $ 1-\beta=0,25. $ Entretanto, a probabilidade de que o deslocamento seja detectado na segunda amostra é $ \beta(1-\beta)=0,75\ast0,25=0,19, $ enquanto que a probabilidade de que ele seja detectado na terceira amostra é $ \beta^{2}(1- \beta)=(0,75^{2})\ast0,25=0,14 $. Assim, a probabilidade de que o deslocamento seja detectado na $ r $-ésima amostra subsequente é simplesmente ($ 1- \beta $) vezes a probabilidade de não se detectar o deslocamento em cada uma das $ r-1 $ amostras iniciais, ou

$$\beta^{r-1}(1-\beta)$$

Em geral, o número esperado de amostras tomadas antes que o deslocamento seja detectado é simplesmente o average run length (comprimento médio das corridas) ou 

$$ARL = \sum_{r=1}^{\infty}r \beta^{r-1}(1-\beta)=\dfrac{1}{1-\beta}$$

Portanto, no nosso exemplo temos

$$ARL = \dfrac{1}{1-\beta} = \dfrac{1}{0,25} = 4$$

Em outras palavras, o número esperado de amostras tomadas para detectar o deslocamento de $ 1,0\sigma $ com n=5 é 4.

A discussão acima fornece um argumento que dá suporte para o uso de amostras de tamanhos pequenos para o gráfico $ \overline{X} $. Muito embora tamanhos pequenos de amostras sempre resultam em um risco $ \beta $ relativamente grande, uma vez que as amostras são coletadas e testadas periodicamente existe uma boa chance de que o deslocamento seja detectado razoavelmente rápido, talvez não na primeira amostra seguinte ao deslocamento.

CCO para o gráfico $ R $ com limites $ 3\hat{\sigma}_{R} $

Para construir a CCO para o gráfico $ R $ utilizamos a distribuição da amplitude relativa $ W = R/\sigma. $ Suponhamos que o valor do desvio padrão do processo original seja $ \sigma_{0}. $ Então, a CCO descreve a probabilidade de não detectar um deslocamento para um novo valor de $ \sigma, $ digamos $ \sigma_{1}~\textgreater~\sigma_{0}, $ na primeira amostra subsequente ao deslocamento. Contudo, para determinarmos a chance de que tal deslocamento seja apanhado pelo gráfico $ R $ em uma única amostra, devemos calcular a probabilidade de que uma amostra (por exemplo de cinco itens) venha a ter uma amplitude menor ou igual ao LSC (limite superior de controle). Assim, basta calcular

$$\beta = \mbox{P}[R \leq LSC~|~\sigma = \sigma_{1} = k\sigma_{0}]$$

em que $ LSC = \overline{R}+3d_{3}\sigma_{0} $ e $ d_{3} $ uma constante tabelada no Apêndice.

A probabilidade de que $ R $ seja menor ou igual ao LSC é a mesma de que $ W $ seja menor ou igual a $ \mbox{LSC}/\sigma_{1}, $ ou seja,

$$\beta = \mbox{P}[R \leq LSC~|~\sigma = \sigma_{1}]=\mbox{P}\left[\dfrac{R}{\sigma_{1}} \leq \dfrac{\overline{R}}{\sigma_{1}}+3d_{3}\dfrac{\sigma_{0}}{\sigma_{1}}~|~\sigma = \sigma_{1}\right]$$

$$=\mbox{P}\left[W \leq \dfrac{\overline{R}}{\sigma_{0}}\ast\dfrac{\sigma_{0}}{\sigma_{1}}+3d_{3}\dfrac{\sigma_{0}}{\sigma_{1}}~|~\sigma = \sigma_{1}\right]~~~~~~~~~~~~~~~(4.1.3)$$

Podemos notar que para $ n \leq 6 $ as CCO apresentam probabilidades muito próximas de 1 para $ \sigma_{1}/\sigma_{0}~\textless~1, $ uma vez que nesses casos não há limite inferior. Dessa forma, a probabilidade de não detectar um deslocamento é dada pela equação 4.1.3. Para $ n~\textgreater~6, $ o gráfico $ R $ com limites $ 3\hat{\sigma}_{R} $ tem um limite inferior e então $ \beta $ é calculado como

$$\beta =\mbox{P}\left[\dfrac{\overline{R}}{\sigma_{0}}\ast\dfrac{\sigma_{0}}{\sigma_{1}} -3d_{3}\dfrac{\sigma_{0}}{\sigma_{1}}\leq W \leq \dfrac{\overline{R}}{\sigma_{0}}\ast\dfrac{\sigma_{0}}{\sigma_{1}}+3d_{3}\dfrac{\sigma_{0}}{\sigma_{1}}~|~\sigma = \sigma_{1}\right]$$

Portanto, com os cálculos apresentados acima obtemos as CCO's para o gráfico $ R, $ para n variando de 2 a 10, como mostra a Figura 4.1.8.

Figura 4.1.8: CCO para o gráfico $ R $ com limites 3-sigma.

Tabela 4.1.3: Valores de $ \beta $ para diferentes valores de k e n.

Observando a Figura 4.1.8 podemos notar que o gráfico $ R $ não é muito eficiente para detectar deslocamentos do processo para tamanhos pequenos de amostras. Por exemplo, se o desvio padrão do processo dobra (isto é, $ k = \sigma_{1}/\sigma_{0} = 2 $), que é um deslocamento razoavelmente grande, então amostras de tamanho 5 têm somente cerca de 40% de chance de detectar esse deslocamento em cada uma das amostras subsequentes. Muitos engenheiros da qualidade dizem que o gráfico $ R $ é insensível para deslocamentos pequenos ou moderados para os usuais subgrupos de tamanhos n=4, 5 ou 6. Se n > 10 ou 12, o gráfico $ S $ deveria ser usado ao invés do gráfico $ R. $

As CCO's das Figuras 4.1.7 e 4.1.8 assumem que os gráficos $ \overline{X} $ e $ R $ são usados para monitorar processos online, isto é, monitorar processo na fase II. É ocasionalmente útil estudar a performance estatística de um gráfico usado para analisar dados do passado (fase I). Isto pode dar alguma indicação de como o número de subgrupos preliminares usados para estabelecer o gráfico de controle afeta a habilidade do gráfico em detectar condições de fora de controle que pudesse existir quando os dados foram coletados. É de tais estudos analíticos, assim como da experiência prática que a recomendação para usar cerca de 20 a 25 subgrupos preliminares para estabelecer os gráficos $ \overline{X} $ e $ R $ faz sentido. 

 

Average Run Length (ARL) para o gráfico $ \overline{X} $

O Average Run Length é uma medida de equilíbrio do erro de Tipo I, que representa o controle excessivo ou alarme falso ou então do erro de Tipo II, que é o controle inadequado. É representado pelo número de amostras esperada de subgrupos entre os sinais "fora de controle". O Average Run Length pode ser expresso como

$$ARL = \dfrac{1}{\mbox{P (um~ponto~cair~fora~de~controle)}}$$

ou

$$ARL_{0} = \dfrac{1}{\mbox{P (Erro Tipo I)}} = \dfrac{1}{\alpha}$$

para o ARL "sob controle", e

$$ARL_{1} = \dfrac{1}{1-\beta}$$

para o ARL "fora de controle".

Esses resultados são realmente intuitivos. Se as observações plotadas no gráfico de controle são independentes, então o número de pontos que devem ser plotados até o primeiro ponto exceder os limites de controle é uma variável aleatória geométrica com parâmetro p. A média dessa distribuição é simplesmente 1/p, que é o comprimento médio das corridas (average run length).

Uma vez que é relativamente fácil desenvolver uma expressão geral de $ \beta $ para o gráfico $ \overline{X} $ detectar um deslocamento na média de $ k\sigma $ (equação 4.1.2), então não é difícil construir um conjunto de curvas ARL para o gráfico $ \overline{X}. $ A Figura 4.1.9 apresenta as curvas ARL para amostras de tamanhos n=2, 3, 4, 5, 6, 7, 8, 9 e 10 para o gráfico $ \overline{X}, $ sendo o ARL dado em termos do número esperado de amostras tomadas para detectar o deslocamento. Para ilustrar o uso da Figura 4.1.9 suponha que queremos detectar um deslocamento de $ 1,5\sigma $ usando uma amostra de tamanho n=3, então o número médio de amostras requeridas será $ ARL_{1}=3. $ Note também que se quiséssemos reduzir o $ ARL_{1} $ para aproximadamente 1 deveríamos aumentar o tamanho da amostra para n=16.

 

Figura 4.1.9: Average Run Length (amostras) para o gráfico $ \overline{X} $ com limites 3-sigma quando a média do processo desloca-se em $ k\sigma. $

Tabela 4.1.4: Valores de ARL para diferentes valores de k e n.

Os ARL's são objetos de algum criticismo como medidas de performance para gráficos de controle. Notamos que a distribuição do comprimento de corrida para um gráfico de controle de Shewhart é geométrica e que ela pode ser uma distribuição muito assimétrica, tal que a média (isto é, o ARL) pode não ser a melhor medida de um típico comprimento de corrida. Há outra questão referente ao ARL relacionada ao fato de que os cálculos para um gráfico de controle específico são geralmente baseados em estimativas dos parâmetros do processo. Isto resulta em inflação de ambos $ ARL_{0} $ e $ ARL_{1}. $ Por exemplo, suponha que a linha central do gráfico seja estimada perfeitamente mas o desvio padrão do processo seja superestimado em 10%. Isto resultaria em $ ARL_{0} = 517, $ consideravelmente mais afastado do valor "teórico" ou nominal de 370. Agora, com um processo normalmente distribuído, de maneira análoga vamos subestimar o desvio padrão do processo em 10%, o que resulta em um $ ARL_{0} = 268, $ um valor consideravelmente menor do que 370. A média é então (268+517)/2=392,5 , sugerindo que erros ao estimar o desvio padrão do processo resulta em ARL's superestimados.

Duas outras medidas de performance baseadas no ARL são algumas vezes de interesse. Uma delas é o tempo médio até o sinal, dado pelo número de períodos de tempo que ocorre até que um sinal seja gerado no gráfico de controle. Se amostras são tomadas em intervalos de tempo h (em horas), então o tempo médio até o sinal ou ATS (average time to signal) é  dado por

$$ATS =ARL \times h$$

Pode também ser útil expressar o ARL em termos do número esperado de unidades individuais amostradas - digamos I - ao invés do número de amostras tomadas para detectar um deslocamento. Se o tamanho da amostra é n, a relação entre I e ARL é dada por

$$I=n \times ARL$$

A Figura 4.1.10 apresenta um conjunto de curvas que descrevem o número esperado de unidades individuais (I) que devem ser amostradas para o gráfico $ \overline{X} $ para detectar um deslocamento de $ k\sigma. $ Note que para detectar um deslocamento de $ 1,5\sigma $ por exemplo, um gráfico $ \overline{X} $ com n=16 requer que aproximadamente 16 unidades sejam amostradas, sendo que se o tamanho da amostra fosse n=3 , somente cerca de 9 unidades seria requerida, em média. 

Figura 4.1.10: Average Run Length (unidades individuais) para o gráfico $ \overline{X} $ com limites 3-sigma quando a média do processo desloca-se em $ k\sigma. $

Tabela 4.1.5: Valores de I (unidades individuais) para diferentes valores de k e n.

Para entender como executar essa função do Software Action, você pode consultar o manual do usuário.

Sobre o Portal Action

O Portal Action é mantido pela Estatcamp - Consultoria Estatística e Qualidade, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.

Facebook

CONTATO

  •  Maestro Joao Seppe, 900, São Carlos - SP | CEP 13561-180
  • Telefone: (16) 3376-2047
  • E-Mail: [email protected]