Skip to main content

6.4 - Teste de Shapiro-Wilk

O teste Shapiro-Wilk, proposto em 1965, é baseado na estatística W dada por:

\[W=\frac{b^2}{\displaystyle\sum_{i=1}^n (x_{(i)}-\bar{x})^2}\]

em que xi são os valores da amostra ordenados (x(1) é o menor). Menores valores de W são evidências de que os dados são normais. A constante b é determinada da seguinte forma

\[b=\left\{\begin{array}{l}\sum_{i=1}^{n/2}a_{n-i+1}\times (x_{(n-i+1)}-x_{(i)}) \ \hbox{se n é par} \\ \sum_{i=1}^{(n+1)/2}a_{n-i+1}\times (x_{(n-i+1)}-x_{(i)} \ \hbox{se n é ímpar}\end{array}\right.\]

em que an-i+1 são constantes geradas pelas médias, variâncias e covariâncias das estatísticas de ordem de uma amostra de tamanho n de uma distribuição Normal. Seus valores, tabelados, são dados abaixo.

Para realizar o teste de Shapiro-Wilk, devemos:

1. Formulação da Hipótese:

\[\displaystyle \left\{\begin{array}{l}H_0: \hbox{A amostra provém de uma população Normal} \\ H_1: \hbox{A amostra não provém de uma população Normal}\end{array}\right.\]

2. Estabelecer o Nível de significância do teste (α ), normalmente 0,05;

3. Calcular a estatística de teste:

  • Ordenar as n observações da amostra: x(1), x(2), x(3), ..., x(n);
  • Calcular $ \sum_{i=1}^n(x_i-\bar{x})^2 $;
  • Calcular b;
  • Calcular W.

4. Tomar a decisão: Rejeitar H0 ao nível de significância α se Wcalculado < Wα (os valores críticos da estatística W de Shapiro-Wilk são dados naTabela abaixo).

 

Exemplo 6.4.1: Considere novamente o Exemplo 6.1.1 sobre a medição de 10 peças.

1,90642 2,22488
2,10288 1,69742
1,52229 3,15435
2,61826 1,98492
1,42738 1,99568

clique aqui para efetuar o download dos dados utilizados nesse exemplo

Vamos testar

\[\left\{\begin{array}{l}H_0:  \ \hbox{os dados seguem uma distribuição normal} \ N(\mu,\sigma^2) \\  H_1: \ \hbox{os dados não seguem uma distribuição normal}  \end{array}\right.\]

Primeiramente, ordenamos os dados da amostra

x(1) 1,42738
x(2) 1,52229
x(3) 1,69742
x(4) 1,90642
x(5) 1,98492
x(6) 1,99568
x(7) 2,10288
x(8) 2,22488
x(9) 2,61826
x(10) 3,15435

Temos que $ \sum_{i=1}^n(x_i-\bar{x})^2=2,392327 $ e

i n-i+1 an-i+1 x(n-i+1) x(i) an-i+1(x(n-i+1)-x(i))
1 10 0,5739 3,15435 1,42738 0,991108
2 9 0,3291 2,61826 1,52229 0,360684
3 8 0,2141 2,22488 1,69742 0112929
4 7 0,1224 2,10288 1,90642 0,024047
5 6 0,0399 1,99568 1,98492 0,000429

Desta forma, segue que b = 1,484197 e, por fim, W é dado por

\[W=\frac{b^2}{\sum_{i=1}^n(x_i-\bar{x})^2}=\frac{2,217708}{2,392327}=0,927.\]

Pela regra de decisão do teste, Wcalculado = 0,927 > W(0,05;10) = 0,842, com o p-valor calculado por P[W > Wcalculado] = 0,4162 > α = 0,05. Assim, podemos afirmar com nível de significância de 5% que a amostra provém de uma população normal.

Veja a seguir os resultados obtidos pelo software Action.


Exemplo 6.4.2: Avaliar a normalidade dos dados referente a medição de 10 peças.

8; 9; 10; 10; 10; 12; 12; 16; 19; 24

clique aqui para efetuar o download dos dados utilizados nesse exemplo

Em seguida, calculamos $ \sum_{i=1}^n (x_i-\bar{x})^2=236 $ e a constante b:

i n-i+1 an-i+1 x(n-i+1) x(i) an-i+1(x(n-i+1)-x(i))
1 10 0,5739 24 8
9,1824
2 9 0,3291 19 9 3,2910
3 8 0,2141 16 10 1,2846
4 7 0,1224 12 10 0,2448
5 6 0,0399 12 10 0,0798
          b=14,0826

e por fim, W:

\[W=\frac{b^2}{\sum_{i=1}^n(x_i-\bar{x})^2}=\frac{14,0826^2}{236}=0,840.\]

Pela regra de decisão do teste, Wcalculado = 0,840 < W(0,05;10) = 0,842, com o p-valor calculado por P[W > Wcalculado] = 0,0443 < α = 0,05. Assim, podemos afirmar com nível de significância de 5% que a amostra não provém de uma população normal. Esse fato é confirmado pela aleatoriedade dos pontos em torno da reta.

Veja a seguir os resultados obtidos pelo software Action.


 

Para entender como executar essa função do Software Action, você pode consultar o manual do usuário.