Skip to main content

7.2 - Gráficos de controle multivariados para observações com réplicas

A seguir apresentamos a construção dos gráficos de controle multivarados para observações com réplicas.

Para introduzir o conceito desses gráficos vamos considerar a entrada de dados, de forma geral, conforme a Tabela 7.2.1. Podemos observar agora que esses dados possuem réplicas.

Tabela 7.2.1: Entrada de dados.

  Variáveis
Amostra $ X_1 $ $ X_2 $ $ \cdots $ $ X_p $
1 $ X_{111} $ $ X_{211} $ $ \cdots $ $ X_{p11} $
1 $ X_{112} $ $ X_{212} $ $ \cdots $ $ X_{p12} $
$ \vdots $ $ \vdots $ $ \vdots $ $ \vdots $ $ \vdots $
1 $ X_{11n} $ $ X_{21n} $ $ \cdots $ $ X_{p1n} $
2 $ X_{121} $ $ X_{221} $ $ \cdots $ $ X_{p21} $
2 $ X_{122} $ $ X_{222} $ $ \cdots $ $ X_{p22} $
$ \vdots $ $ \vdots $ $ \vdots $ $ \vdots $ $ \vdots $
2 $ X_{12n} $ $ X_{22n} $ $ \cdots $ $ X_{p2n} $
3 $ X_{131} $  $ X_{231} $ $ \cdots $ $ X_{p31} $
3 $ X_{132} $ $ X_{232} $ $ \cdots $ $ X_{p32} $ 
$ \vdots $ $ \vdots $ $ \vdots $ $ \vdots $ $ \vdots $
3 $ X_{13n} $ $ X_{23n} $ $ \cdots $ $ X_{p3n} $
m $ X_{1m1} $ $ X_{2m1} $ $ \cdots $ $ X_{pm1} $
m $ X_{1m2} $  $ X_{2m2} $  $ \cdots $ $ X_{pm2} $ 
$ \vdots $ $ \vdots $ $ \vdots $ $ \vdots $ $ \vdots $
m $ X_{1mn} $  $ X_{2mn} $  $ \cdots $ $ X_{pmn} $ 

$ X_{ijk}: $ refere-se a k-ésima observação na j-ésima amostra da i-ésima variável.

Aqui i = 1, ..., p ; j = 1, ..., m  e  k = 1, ..., n.

Para o cálculo da estatística T2 de Hotelling devemos seguir os passos abaixo:

  • Calcular a média dentro de cada amostra para cada variável

$$\overline{X}_{ij.} = \dfrac{1}{n}\sum^{n}_{k=1}X_{ijk}~~~~\mbox{para}~i = 1, \ldots, p$$

  • Calcular o vetor de médias gerais por

$$\overline{X}_{...} = \dfrac{1}{m}\sum^{m}_{j=1}\overline{X}_{.j.}$$

  • Calcular o vetor de variâncias amostrais para cada amostra

$$S^2_{ij.} = \dfrac{1}{n - 1}\sum^{n}_{k=1}(X_{ijk} - \overline{X}_{ij.})^2~~~~\mbox{para}~i = 1, \ldots, p$$

  • Calcular as p(p - 1)/2 covariâncias amostrais, denotadas por $ S^2_{ilj}, $ para cada amostra

$$S^2_{ilj} = \dfrac{1}{n - 1}\sum^{n}_{k=1}(X_{ijk} - \overline{X}_{ij.})(X_{ljk} - \overline{X}_{lj.})~~~~\mbox{para}~i \neq l = 1, \ldots, p$$

  • Construir a matriz de covariância amostral S da seguinte forma

$$S = \left(\begin{array}{cccc} S^2_{11} ~~~~ S^2_{12} ~~~~ \cdots ~~~~ S^2_{1p}\\ S^2_{21} ~~~~ S^2_{22} ~~~~ \cdots ~~~~ S^2_{2p}\\ \vdots~~~~~~~ \vdots ~~~~~\cdots ~~~~~\vdots\\ S^2_{p1} ~~~~ S^2_{p2} ~~~~ \cdots ~~~~ S^2_{pp} \end{array} \right)$$

em que

$$S^2_{ii} = \dfrac{1}{m}\sum^{m}_{j=1}S^2_{iij},~~~~\mbox{para}~i = 1, \ldots, p$$

$$S^2_{il} = \dfrac{1}{m}\sum^{m}_{j=1}S^2_{ilj},~~~~\mbox{para}~i \neq l = 1, \ldots, p$$

  • Calcular a estatística T2 da seguinte forma

$$T_j^2 = n(\overline{X}_{.j.} - \overline{X}_{...})'S^{-1}(\overline{X}_{.j.} - \overline{X}_{...}), \mbox{para cada}~j = 1, ..., m$$

 

Limites de Controle para o gráfico de T2

Temos que a estatística $ T_j^2~\sim~\left(\dfrac{(mn - m)p}{mn - m - p + 1}\right)F_{(p,~mn - m - p + 1)}, $ para n > 1 (ver Johnson (2002)).

Limite inferior de controle (Montgomery (2001)):

$$LIC = \dfrac{p(m-1)(n-1)}{(mn - m - p + 1)}F_{\left(\alpha/2;~p;~mn-m-p+1\right)}$$

Linha Central (Montgomery (2001)):

$$LC = \dfrac{p(m-1)(n-1)}{(mn - m - p +1)}F_{\left(0,50;~p;~mn-m-p+1\right)}$$

Limite superior de controle (Montgomery (2001)):

$$LSC = \dfrac{p(m-1)(n-1)}{(mn - m - p + 1)}F_{\left(1-\alpha/2;~p;~mn-m-p+1\right)}$$

em que n = tamanho de cada amostra, m = número de amostras e p = quantidade de características.

 

Limites de Controle para a variância generalizada

$ \mid S \mid : $ determinante da matriz de covariância amostral, variância generalizada (Johnson (2002)).

Limite inferior de controle (Montgomery (2001)):

$$LIC = \dfrac{\mid S \mid}{b_1}(b_1 - 3\sqrt{b_2})$$

Linha Central (Montgomery (2001)):

$$LC = \mid S \mid$$

Limite superior de controle (Montgomery (2001)):

$$LSC = \dfrac{\mid S \mid}{b_1}(b_1 + 3\sqrt{b_2})$$

em que

$$b_1 = \dfrac{1}{(n-1)^p}\prod_{i=1}^p(n-i)$$

$$b_2 = \dfrac{1}{(n-1)^{2p}}\prod_{i=1}^p(n-i)\left[\prod_{j=1}^p(n-j+2) - \prod_{j=1}^p(n-j)\right]$$

sendo p = número de variáveis e n = número de observações em cada grupo.

Exemplo 7.2.1: Um químico está interessado em verificar a relação entre a quantidade de horas que determinados corpos-de-prova ficam submetidos à uma estufa e a porcentagem (%) de umidade neles contida. A estufa foi mantida a temperatura constante e tomamos amostras de tamanho 5 para cada dia. Os dados estão dispostos na Tabela 7.2.2.

Tabela 7.2.2: Dados do experimento.

Data da Medição CP Número de horas Umidade(%) Data da Medição CP Número de horas Umidade(%)
1/1/2001 1 1 7 1/6/2001 1 3 5,8
  2 2 6,5   2 3 5,6
  3 4 6   3 2 4
  4 6 7   4 2 4
  5 4 7   5 5 5,8
1/2/2001 1 2 7 1/7/2001 1 4 5,2
  2 2 7   2 6 6,4
  3 4 6,2   3 2 4,5
  4 1 6   4 3 1,5
  5 1 5,2   5 3 5,6
1/3/2001 1 5 7 1/8/2001 1 6 6
  2 2 5,4   2 3 5,8
  3 5 7   3 7 7
  4 3 7   4 4 4,5
  5 2 1,4   5 3 5,2
1/4/2001 1 4 6 1/9/2001 1 5 5,6
  2 4 6,2   2 4 4,5
  3 4 3,5   3 2 4,5
  4 2 4,5   4 1 6
  5 2 3   5 3 2
1/5/2001 1 3 4,2 1/10/2001 1 3 5,2
  2 3 6,5   2 4 6
  3 2 2,2   3 6 5,5
  4 4 5,5   4 3 7
  5 3 6   5 2 6,5

clique aqui para efetuar o download dos dados utilizados nesse exemplo

Primeiramente precisamos verificar se as variáveis a serem analisadas são correlacionadas. Para isso podemos utilizar a ferramenta Matriz de Correlação do Software Action.

Neste exemplo consideraremos que existe correlação entre as variáveis Número de horas e Umidade apenas para trabalhar com as mesmas conjuntamente e exemplicar os cálculos com detalhes.

Cuidado! A correlação deve sempre ser analisada no caso multivariado para que os resultados não sejam mascarados.

Para a primeira amostra (1/1/2001), temos:

$$S_{11}^2 = \dfrac{1}{4}[(1 - 3,4)^2 + (2 - 3,4)^2 + (4 - 3,4)^2 + (6 - 3,4)^2 + (4 - 3,4)^2] = 3,8$$

$$S_{22}^2 = \dfrac{1}{4}[(7 - 6,7)^2 + (6,5 - 6,7)^2 + (6 - 6,7)^2 + (7 - 6,7)^2 + (7 - 6,7)^2] = 0,2$$

$$S_{12} = \dfrac{1}{4}[(1 - 3,4)(7 - 6,7) + (2 - 3,4)(6,5 - 6,7) + (4 - 3,4)(6 - 6,7) + (6 - 3,4)(7 - 6,7)~+$$

$$+~(4 - 3,4)(7 - 6,7)] = 0,025$$

Cálculo dos limites de controle para T2 de Hotelling

O cálculo da estatística T2 para a primeira amostra é dado por

$$T^2 = n(\overline{X} - \overline{\overline{X}})'S^{-1}(\overline{X} - \overline{\overline{X}})$$

$$= 5 \ast [0,12~~~~1,3] \ast \left[\begin{array}{cc}~0,5427404~~~~~-0,2021607 \\ -0,2022607~~~~~0,5752761 \\ \end{array} \right] \ast \left[\begin{array}{c} 0,12 \\ 1,3 \\ \end{array} \right] = 4,58479$$

Na tabela a seguir temos as médias e variâncias para o gráfico T2 calculadas para todas as amostras.

Tabela 7.2.3: Médias e Variâncias para o gráfico T2.

Amostra $ \overline{X}_1 $ $ \overline{X}_2 $ $ S_{1}^2 $ $ S_{2}^2 $ $ S_{12} $ $ T^2 $
1 3,4 6,7 3,8 0,2 0,025 4,58479
2 2 6,28 1,5 0,572 0,3 8,95074
3 3,4 5,56 2,3 5,888 2,52 0,0739
4 3,2 4,64 1,2 2,073 0,89 1,55585
5 3 4,88 0,5 2,977 0,825 0,69618
6 3 5,04 1,5 0,908 0,9 0,38176
7 3,6 4,64 2,3 3,553 1,495 2,43094
8 4,6 5,7 3,3 0,87 1,225 4,18667
9 3 4,52 2,5 2,427 -0,2 1,9421
10 3,6 6,04 2,3 0,533 -0,53 1,04202
soma 32,8 54 21,2 20,001 7,45 25,84495
média 3,28 5,4 2,12 2,0001 0,745 2,584495

Com isso, podemos construir os limites de controle do gráfico T2, com um nível de confiança 3σ = 99,73%, dados a seguir.

Limite inferior de controle

$$LIC = \dfrac{p(m-1)(n-1)}{(mn - m - p + 1)}F_{\left(\alpha/2;~p;~mn-m-p+1\right)} = \dfrac{2(10 - 1)(5 - 1)}{(10 \ast 5 - 10 - 2 + 1)}F_{\left(0,00135;~2;~39\right)}$$

$$= 1,846154 \ast 0,0013509 = 0,0025$$

Limite central

$$LC = \dfrac{p(m-1)(n-1)}{(mn - m - p + 1)}F_{\left(0,50;~p;~mn-m-p+1\right)} = \dfrac{2(10 - 1)(5 - 1)}{(10 \ast 5 - 10 - 2 + 1)}F_{\left(0,50;~2;~39\right)}$$

$$= 1,846154 \ast 0,7056138 = 1,302672$$

Limite superior de controle

$$LSC = \dfrac{p(m-1)(n-1)}{(mn - m - p + 1)}F_{\left(1-\alpha/2;~p;~mn-m-p+1\right)} = \dfrac{2(10 - 1)(5 - 1)}{(10 \ast 5 - 10 - 2 + 1)}F_{\left(0,99865;~2;~39\right)}$$

$$= 1,846154 \ast 7,8650 = 14,520$$

Cálculo dos limites de controle para a variância generalizada

Vamos agora construir os limites de controle para a variância generalizada, os quais são dados por

$$LIC = \dfrac{\mid S \mid}{b_1}(b_1 - 3\sqrt{b_2}) = \dfrac{3,685}{0,75}(0,75 - 3\sqrt{0,84375}) = -9,85$$

Como o valor obtido para o LIC foi negativo, tomamos como valor mínimo o zero. Sendo assim, assumimos LIC = 0.

$$LC = ~\mid S \mid ~= det\left[\begin{array}{cc} 2,12 ~~~~ 0,745 \\ 0,745 ~~~~ 2,001 \\ \end{array}\right] = 3,685$$

$$LSC = \dfrac{\mid S \mid}{b_1}(b_1 + 3\sqrt{b_2}) = \dfrac{3,685}{0,75}(0,75 + 3\sqrt{0,84375}) = 17,225$$

A seguir temos os resultados obtidos pelo Software Action para esse exemplo.

 


Figura 7.2.1: Gráficos T2 e Variância generalizada.

Podemos notar pelos gráficos que o processo manteve-se estável ao longo do período.

Para entender como executar essa função do Software Action, você pode consultar o manual do usuário.