Skip to main content

7.1 - Gráficos de controle multivariados para observações individuais

A seguir vamos apresentar a construção dos gráficos de controle multivariados para observações individuais, ou seja, para as observações que não possuem réplicas.

Para introduzir e ilustrar esse conceito vamos considerar dados dispostos de maneira geral como na Tabela 7.1.1.

Tabela 7.1.1: Entrada de dados

  Variáveis
Amostra $ X_1 $ $ X_2 $ $ \cdots $ $ X_p $
1 $ X_{11} $ $ X_{21} $ $ \cdots $ $ X_{p1} $
2 $ X_{12} $ $ X_{22} $ $ \cdots $ $ X_{p2} $
3 $ X_{13} $ $ X_{23} $ $ \cdots $ $ X_{p3} $
$ \vdots $ $ \vdots $ $ \vdots $ $ \vdots $ $ \vdots $
m $ X_{1m} $ $ X_{2m} $ $ \cdots $ $ X_{pm} $
Média $ \overline{X}_1 $ $ \overline{X}_2 $ $ \cdots $ $ \overline{X}_p $
Desvio padrão amostral $ s_1 $ $ s_2 $ $ \cdots $ $ s_p $

 

Gráfico de controle T2 de Hotelling

Para o cálculo da estatística T2 de Hotelling devemos seguir os passos abaixo.

1. Calcular a média para cada variável

$$\overline{X}_1, \overline{X}_2, \ldots, \overline{X}_p$$

2. Calcular as variâncias e covariâncias amostrais

$$S_1^2, \ldots, S_ik, \ldots, S_p^2$$

3. Calcular a estatística T2 para cada amostra

$$T^2 = (X_i - \overline{X})'S^{-1}(X_i - \overline{X})$$

em que

  • p é o número de variáveis
  • m é o número de amostras
  • S é a matriz de covariância amostral
  • S-1 é a matriz inversa de covariância amostral

Assim, os limites de controle são dados por

$$LIC = \dfrac{(m-1)^2}{m}B_{\left(\frac{\alpha}{2};~\frac{p}{2};~\frac{(m-p-1)}{2}\right)}$$

$$LSC = \dfrac{(m-1)^2}{m}B_{\left(1-\frac{\alpha}{2};~\frac{p}{2};~\frac{(m-p-1)}{2}\right)}$$

em que

$$B_{\left(\frac{\alpha}{2};~\frac{p}{2};~\frac{(m-p-1)}{2}\right)}~~~~\mbox{e}~~~~B_{\left(1-\frac{\alpha}{2};~\frac{p}{2};~\frac{(m-p-1)}{2}\right)}$$

indicam os quantis correspondentes à distribuição Beta.

A linha central do gráfico de controle é definido utilizando-se a mediana (isto é, o quantil de 50%) da distribuição Beta correspondente, indicado por

$$LC = B_{\left(0,50;~\frac{p}{2};~\frac{(m-p-1)}{2}\right)}$$

 

Gráfico de controle para a variância generalizada

O procedimento utilizado para construir os gráficos de controle para a variância generalizada é padronizar os dados utilizando o vetor de médias e a matriz de covariâncias amostrais. A padronização é feita da seguinte forma (Montgomery (2001)

$$Z_{ij} = \dfrac{ X_{ij} - \overline{X}_i}{S_i}$$

Desta forma, teremos uma matriz conforme apresentado no quadro a seguir

  Variáveis  
Amostra $ Z_1 $ $ Z_2 $ $ \cdots $ $ Z_p $ Desvio padrão amostral
1 $ Z_{11} $ $ Z_{21} $ $ \cdots $ $ Z_{p1} $ $ s_1 $
2 $ Z_{12} $ $ Z_{22} $ $ \cdots $ $ Z_{p2} $ $ s_2 $
3 $ Z_{13} $ $ Z_{23} $ $ \cdots $ $ Z_{p3} $ $ s_3 $
$ \vdots $ $ \vdots $ $ \vdots $ $ \vdots $ $ \vdots $ $ \vdots $
m $ Z_{1m} $ $ Z_{2m} $ $ \cdots $ $ Z_{pm} $ $ s_m $

Com os dados normalizados podemos construir um gráfico de controle utilizando o mesmo procedimento usado na construção do gráfico de controle usual do desvio padrão $ S $.

Dessa froma, os limites de controle são dados por

  • Limite superior de controle:

$$LSC = B_4 \ast \overline{S}$$

  • Linha Central:

$$LC = \overline{S}$$

  • Limite inferior de controle:

$$LIC = B_3 \ast \overline{S}$$

Exemplo 7.1.1: Temos um molde de areia onde peças de ferro são moldadas. Neste caso, nossas variáveis de interesse são a compactibilidade, o coeficiente de RCV1 e a plasticidade. Os dados são apresentados na tabela a seguir.

Tabela 7.1.2: Variáveis de Areia sem réplicas.

corrida peça Qtde Prod Qtde Refugo Compactabilidade RCV1 Plasticidade
E188 M20700300 6288 182 36,5 22,026 28,87
E189 M20900200 655 128 36,571 21,12 29,924
E190 M20701400 1290 33 36,167 21,182 29,368
E191 M20600400 3176 316 36,5 22,134 29,822
E192 M20900900 8052 129 37,4 21,93 28,774
E193 M20900900 4436 49 37,333 21,507 28,812
E194 M20701201 6424 245 37,167 23,132 29
E195 M20700300 6000 79 38 19,653 30,885
E196 M20900900 7986 183 38 19,653 30,885
E197 M20701500 9024 108 36,5 20,993 30,568
E198 M20700600 1680 41 38,25 20,733 28,84
E199 M20701301 4248 48 37,643 19,513 28,818
E200 M20900200 1190 32 37,667 20,613 29,035
E201 M20404400 2400 8 36,833 22,423 26,685
E202 M20701500 4752 126 37,333 20,29 28,527
E203 M20900900 3072 43 37,167 21,083 26,24
E204 M20701500 564 19 38 20,363 29,843
E205 M20701201 1192 28 37,667 21,147 29,273
E206 M20900200 1275 25 37,667 21,147 29,273
E207 M20600400 2056 537 36 22,89 27,753
E208 M20700300 7816 85 39 20,24 29,57
E209 M20900200 1040 44 36,333 19,9 27,89
E210 M20900900 1968 16 38 19,547 27,84
E211 M20701201 5016 52 36,333 19,9 27,633
E212 M20600400 1656 524 37,667 20,937 27,84

clique aqui para efetuar o download dos dados utilizados nesse exemplo

Para construir os gráficos de controle multivariados precisamos primeiramente saber quais variáveis são correlacionadas, com isso podemos trabalhar apenas com aquelas variáveis que conjuntamente influenciam o processo. Para obter a correlação entre as variáveis podemos utilizar a ferramenta Matriz de Correlação disponibilizada pelo Software Action.

Neste exemplo vamos considerar que as 3 variáveis estão correlacionadas para mostrar os cálculos com detalhes.

Cuidado! A correlação deve sempre ser analisada no caso multivariado para que os resultados não sejam mascarados.

A seguir apresentamos os passos para a construção dos gráficos de controle multivariados (T2 e Variância generalizada).

As médias das variáveis Compactabilidade, RCV1 e Plasticidade são, respectivamente, 37,267 ; 20,962  e  28,878. A matriz de covariâncias (S) e a matriz inversa (S-1) são dadas por

$$S = \left[\begin{array}{ccc} 0,5810~~~~-0,3629~~~~0,2243\\ -0,3629~~~~~~1,0728~~~~-0,2576\\ 0,2243~~~~-0,2576~~~~1,3649\\ \end{array}\right] ~~~~~\mbox{e}~~~~~ S^{-1} = \left[ \begin{array}{ccc} 2,2533~~~~0,7053~~~-0,2371\\ 0,7053~~~~~~1,1971~~~~~0,1101\\ -0,2371~~~~~0,1101~~~~~0,7924\\ \end{array}\right]$$

Cálculo dos limites de controle para T2 de Hotelling

O cálculo de T2 para a primeira corrida ( E188 ) é dado por

$$T^2 = (X_i - \overline{X})'S^{-1}(X_i - \overline{X})$$

$$ = [-0,767~~~~1,063~~~~-0,0087] \ast \left[ \begin{array}{ccc} 2,2533~~~~0,7053~~~-0,2371\\ 0,7053~~~~~~1,1971~~~~~0,1101\\ -0,2371~~~~~0,1101~~~~~0,7924\\ \end{array}\right] \ast \left[\begin{array}{c} -0,767 \\ 1,063 \\ -0,0087 \end{array} \right] = 1,5259$$

Para as outras amostras (corridas E189 a E212) o procedimento é análogo.

Os valores de T2 para todas as amostras estão dispostos no quadro abaixo.

corrida T2
E188 1,52595
E189 2,21678
E190 2,91648
E191 2,99512
E192 1,33373
E193 0,4124
E194 5,42531
E195 3,82223
E196 3,82223
E197 4,18464
E198 1,93979
E199 2,09762
E200 0,28603
E201 4,73986
E202 0,64975
E203 5,34417
E204 1,29344
E205 0,56833
E206 0,56833
E207 4,47276
E208 5,32076
E209 5,28861
E210 3,68312
E211 5,68977
E212 1,40279

Os limites de controle com um nível de confiança de 3σ = 99,73% são dados por

$$LIC = \dfrac{(m-1)^2}{m}B_{\left(\frac{\alpha}{2};~\frac{p}{2};~\frac{(m-p-1)}{2}\right)}~=~\dfrac{(25-1)^2}{25}B_{\left(0,00135;~\frac{3}{2};~\frac{(25-3-1)}{2}\right)}~=~0,03183$$

$$LC = \dfrac{(25-1)^2}{25}B_{\left(0,50;~\frac{3}{2};~\frac{(25-3-1)}{2}\right)}~=~2,402$$

$$LSC = \dfrac{(m-1)^2}{m}B_{\left(1-\frac{\alpha}{2};~\frac{p}{2};~\frac{(m-p-1)}{2}\right)}~=~\dfrac{(25-1)^2}{25}B_{\left(0,99865;~\frac{3}{2};~\frac{(25-3-1)}{2}\right)}~=~11,918$$

sendo

  • m = número de amostras = 25
  • p = número de variáveis correlacionadas = 3

 

Cálculo dos limites de controle para a variância generalizada

Vamos agora construir os limites de controle para a variância generalizada. Primeiramente calculamos a média e variância, daí procedemos a padronização de cada variável. Assim temos

Para Compactabilidade (X1)

$$\overline{X}_1 = \dfrac{36,5 + 36,571 + \ldots + 36,333 + 37,667}{25} = 37,267$$

$$S_1^2 = \dfrac{(36,5 - 37,267)^2 + \ldots + (37,667 - 37,267)^2}{24} = 0,581$$

Padronização:

$$\dfrac{(36,5 - 37,267)}{\sqrt{0,581}} = -1,00746$$

Para RCV1 (X2)

$$\overline{X}_2 = \dfrac{22,026 + 21,12 + \ldots + 19,9 + 20,937}{25} = 20,962$$

$$S_2^2 = \dfrac{(22,026 - 20,962)^2 + \ldots + (20,937 - 20,962)^2}{24} = 1,072$$

Padronização:  

$$\dfrac{(22,026 - 20,962)}{\sqrt{1,072}} = 1,027$$

Para Plasticidade (X3)

$$\overline{X}_3=\dfrac{28,87+29,924+\ldots+27,633+27,84}{25}=28,878$$

$$S_3^2=\dfrac{(28,87-28,878)^2+\ldots+(27,84-28,878)^2}{24}=1,364$$

Padronização:

$$\dfrac{(28,87-28,878)}{\sqrt{1,364}}=-0,00746$$

 As variáveis padronizadas para todas as amostras são dadas na Tabela 7.1.3.

Tabela 7.1.3: Variáveis padronizadas.

Compactabilidade RCV1 Plasticidade Desvios Padrão
-1,00746 1,027 -0,00746 1,01728
-0,91431 0,15231 0,89471 0,90934
-1,44433 0,21217 0,4188 1,02127
-1,00746 1,13127 0,8074 1,15273
0,17328 0,93432 -0,08964 0,53179
0,08538 0,52594 -0,05711 0,30396
-0,1324 2,09478 0,10381 1,22339
0,96044 -1,264 1,71728 1,54967
0,96044 -1,264 1,71728 1,54967
-1,00746 0,0297 1,44594 1,23157
1,28842 -0,22132 -0,03314 0,82272
0,49208 -1,39916 -0,05197 0,97363
0,52356 -0,33717 0,13377 0,43101
-0,57058 1,41028 -1,87772 1,65546
0,08538 -0,64901 -0,30106 0,36736
-0,1324 0,11659 -2,25862 1,3054
0,96044 -0,57853 0,82538 0,85222
0,52356 0,17838 0,33748 0,17277
0,52356 0,17838 0,33748 0,17277
-1,66342 1,86115 -0,96356 1,86598
2,27236 -0,69728 0,5917 1,48912
-1,22655 -1,02553 -0,8463 0,19023
0,96044 -1,36634 -0,88909 1,22898
-1,22655 -1,02553 -1,06628 0,10626
0,52356 -0,02437 -0,88909 0,71222

A última coluna da Tabela 7.1.3 é o desvio-padrão das variáveis padronizadas em relação a X1, X2 e X3, ou seja,

$$S = \sqrt{\dfrac{\sum_{1}^{p}X_i^{2} - p \ast \overline{X}^2}{p-1}}$$

Para a primeira linha, o valor 1,01728 é obtido através do cálculo de S, dado por

$$S = \sqrt{\dfrac{(2,06976) - 3 \ast (0,00403)^2}{2}} = 1,01728$$

Precisamos ainda calcular $ \overline{S}, $ dado por

$$\overline{S} = \dfrac{\mbox{Soma dos desvios padrão amostrais}}{\mbox{número de amostras}} = \dfrac{\mbox{soma das S_i}}{m}$$

ou seja,

$$\overline{S} = \dfrac{1,01728 + \ldots + 0,71222}{25} = \dfrac{22,8368}{25} = 0,913472$$

Assim a linha central do gráfico de controle é dado pela média dos desvios padrão, ou seja, para este exemplo é a média da última coluna da Tabela 7.1.3, obtendo assim o valor 0,913472. Com isso, o gráfico da variância generalizada com observações individuais segue o mesmo raciocínio do gráfico $ S $ usual.

Aplicando as fórmulas e utilizando o Apêndice para obter os valores de B3 = 0 e B4 = 2,266 (para n = 4) encontramos os limites de controle, que são dados por

$$LSC = B_4 \ast \overline{S} = 2,266 \ast 0,913472 = 2,0699$$

$$LC = \overline{S} = 0,913472$$

$$LIC = B_3 \ast \overline{S} = 0 \ast 0,913472 = 0$$

A seguir temos os resultados obtidos pelo Software Action para esse exemplo.


 


Figura 7.1.1: Gráficos T2 de Hotelling e Variância Generalizada.

Observando a Figura 7.1.1 percebemos que nenhum ponto está fora dos limites de controle e a variância permanece estável ao longo do período observado.

Para entender como executar essa função do Software Action, você pode consultar o manual do usuário.

Exemplo 7.1.2: A Tabela 7.1.4 apresenta dados da área industrial referentes à espessura de engrenagens de câmbio automotivo. A Figura 7.1.2 ilustra o formato da engrenagem.

Figura 7.1.2: Detalhe da engrenagem do câmbio.

Tabela 7.1.4: Dados referentes à espessura de engrenagens.

Posição1 Posição2 Posição3
98,208 98,209 21,996
98,209 98,220 22,002
98,206 98,204 21,999
98,206 98,206 21,998
98,204 98,214 21,998
98,209 98,203 21,983
98,202 98,212 21,981
98,196 98,221 21,980
98,215 98,201 21,986
98,194 98,227 21,993
98,200 98,210 21,981
98,206 98,207 21,983
98,212 98,200 22,004
98,211 98,200 22,009
98,212 98,199 22,008
98,191 98,166 22,008
98,206 98,205 22,009
98,192 98,207 21,982
98,203 98,202 21,993
98,195 98,206 21,990
98,207 98,204 21,999
98,188 98,199 21,989
98,219 98,222 21,997
98,196 98,205 21,998
98,220 98,227 22,001
98,193 98,213 21,985
98,194 98,217 21,988
98,200 98,200 21,983
98,199 98,199 21,980
98,199 98,197 21,985
98,199 98,198 21,984
98,196 98,206 21,982
98,203 98,207 21,984
98,201 98,206 21,986
98,197 98,161 21,989
98,192 98,205 21,984
98,208 98,172 22,011
98,175 98,195 21,983
98,176 98,196 21,983
98,172 98,195 21,983
98,197 98,201 21,999
98,195 98,211 21,993
98,196 98,206 21,993
98,201 98,219 21,989

clique aqui para efetuar o download dos dados utilizados nesse exemplo

Primeiramente vamos verificar se as variáveis Posição1, Posição2 e Posição3 são correlacionadas. Para obter a correlação entre elas vamos utilizar a ferramenta Matriz de Correlação do Software Action. Dessa forma, temos


Podemos ver que a correlação positiva (0,471) entre a Posição1 e a Posição3 é significativa, comprovada pelo p-valor de 0,001 que é menor do que o nível de significância adotado de 5%. Portanto, podemos concluir que apenas as variáveis Posição1 e Posição3 influenciam conjuntamente no processo, com isso vamos construir os gráficos de controle multivariados considerando apenas essas duas variáveis.

A seguir apresentamos os passos para a construção dos gráficos de controle multivariados (T2 de Hotelling e Variância generalizada).

As médias das variáveis Posição1 e Posição3 são, respectivamente, 98,2 e 21,992.

A matriz de covariâncias (S) e a matriz inversa (S-1) são dadas por

$$S = \left[\begin{array}{ccc} 0,000105~~~~~~~38,3226\\ 38,3226~~~~~~~0,000086\\ \end{array}\right] ~~~~~\mbox{e}~~~~~ S^{-1} = \left[ \begin{array}{ccc}-0,00000006~~~~~~~~~~~0,0261~~~~\\ ~~~~0,0261~~~~~~~-0,000000071\\ \end{array}\right]$$

Cálculo dos limites de controle para T2 de Hotelling

O cálculo de T2 para a primeira linha do conjunto de dados, considerando agora apenas as variáveis correlacionadas (Posição1 e Posição3), é da seguinte forma

$$T^2 = (X_i - \overline{X})'S^{-1}(X_i - \overline{X})$$

$$ = [0,008~~~~~0,004] \ast \left[ \begin{array}{ccc}-0,00000006~~~~~~~~~~~0,0261~~~~\\ ~~~~0,0261~~~~~~~-0,000000071\\ \end{array}\right] \ast \left[\begin{array}{c} 0,008 \\ 0,004 \end{array} \right] = 0,0000017$$

Para as outras linhas o procedimento para o cáculo da estatística T2 é análogo.

Portanto, os limites de controle com um nível de confiança de 3σ = 99,73% são dados por

$$LIC = \dfrac{(m-1)^2}{m}B_{\left(\frac{\alpha}{2};~\frac{p}{2};~\frac{(m-p-1)}{2}\right)}~=~\dfrac{(44-1)^2}{44}B_{\left(0,00135;~\frac{2}{2};~\frac{(44-2-1)}{2}\right)}~=~0,0028$$

$$LC = \dfrac{(44-1)^2}{44}B_{\left(0,50;~\frac{2}{2};~\frac{(44-2-1)}{2}\right)}~=~1,3971$$

$$LSC = \dfrac{(m-1)^2}{m}B_{\left(1-\frac{\alpha}{2};~\frac{p}{2};~\frac{(m-p-1)}{2}\right)}~=~\dfrac{(44-1)^2}{44}B_{\left(0,99865;~\frac{2}{2};~\frac{(44-2-1)}{2}\right)}~=~11,578$$

sendo

  • m = número de amostras = 44
  • p = número de variáveis correlacionadas = 2

 

Cálculo dos limites de controle para a variância generalizada

Vamos agora construir os limites de controle para a variância generalizada. Primeiramente calculamos a média e variância, daí procedemos a padronização de cada variável. Assim temos

Para Posição1 (X1)

$$\overline{X}_1 = \dfrac{98,208 + 98,209 + \ldots + 98,196 + 98,201}{44} = 98,2$$

$$S_1^2 = \dfrac{(98,208 - 98,2)^2 + \ldots + (98,201 - 98,2)^2}{43} = 0,000105$$

Padronização para o primeiro valor da variável Posição1:

$$\dfrac{(98,208 - 98,2)}{\sqrt{0,000105}} = 0,7843$$

Para Posição3 (X2)

$$\overline{X}_2 = \dfrac{21,996 + 22,002 + \ldots + 21,993 + 21,989}{44} = 21,992$$

$$S_2^2 = \dfrac{(21,996 - 21,992)^2 + \ldots + (21,989 - 21,992)^2}{43} = 0,0000861$$

Padronização para o primeiro valor da variável Posição3:   

$$\dfrac{(21,996 - 21,992)}{\sqrt{0,0000861}} = 0,431$$

O procedimento para a padronização dos outros valores das variáveis Posição1 e Posição3 é análogo.

O desvio-padrão das variáveis padronizadas em relação a X1 e X2 é dado por

$$S = \sqrt{\dfrac{\sum_{1}^{p}X_i^{2} - p \ast \overline{X}^2}{p-1}}$$

Logo, para a primeira linha o valor de S é obtido da seguinte forma

$$S = \sqrt{\dfrac{(0,8) - 2 \ast (0,608)^2}{1}} = 0,1564$$

Para as outras linhas do conjunto o cálculo é análogo.

Precisamos ainda calcular $ \overline{S}, $ dado por

$$\overline{S} = \dfrac{\mbox{Soma dos desvios padrão amostrais}}{\mbox{número de amostras}} = \dfrac{\mbox{soma das S_i}}{m}$$

ou seja,

$$\overline{S} = 0,5785$$

Assim a linha central do gráfico de controle é dado pela média dos desvios padrão. Com isso, o gráfico da variância generalizada com observações individuais segue o mesmo raciocínio do gráfico $ S $ usual.

Aplicando as fórmulas e utilizando o Apêndice para obter os valores de B3 = 0 e B4 = 2,568 (para n = 3) encontramos os limites de controle, que são dados por

$$LSC = B_4 \ast \overline{S} = 2,568 \ast 0,5785 = 1,4856$$

$$LC = \overline{S} = 0,5785$$

$$LIC = B_3 \ast \overline{S} = 0 \ast 0,5785 = 0$$

A seguir temos os resultados obtidos pelo Software Action para esse exemplo.

 

Podemos notar que o processo não manteve-se estável ao longo do período considerado.

Para entender como executar essa função do Software Action, você pode consultar o manual do usuário.