6.3 - Teste de Anderson-Darling

Você está aqui

O teste de Anderson-Darling  (1952, 1954) pode ser utilizado para avaliar as seguintes hipóteses: 

 \ \hbox{A \ amostra \ não \ segue \ uma \ distribuição \ normal.}} \ \end{array}\right.\]

Para a distribuição Normal com função densidade de probabilidade 

\[f(x)=\frac{1}{\sqrt{2\pi\sigma^2}}\exp\left(-\frac{(x-\mu)^2}{2\sigma^2}\right) \ (-\infty \textless x \textless \infty).\]

a seguinte tabela fornece alguns valores de quantis e a estatística de Anderson Darling modificada, dada por 

\[A^2_m=\left(1+\frac{0,75}{n}+\frac{2,25}{n^2}\right)A^2.\]

Caso 0: O parâmetro $ \theta (\mu,\sigma^2) $ é totalmente conhecido.

Caso 1: $ \mu $ é  conhecido e $ \sigma^2 $ é estimado por $ s^2 $.

Caso 2:  $ \sigma^2 $ é conhecido e $ \mu $ é estimado por $ \overline{X} $.

Caso 3: Nenhum dos componentes de $ \theta = (\mu,\sigma^2) $ é conhecido e são estimados por ($ \overline{X},s^2 $)

Caso Modificação 15,0 10,0 5,0 2,5 1,0
Caso 0 - 1,610 1,933 2,492 3,070 3,857
Caso 1 - 0,784 0,897 1,088 1,281 1,541
Caso 2 - 1,443 1,761 2,315 2,890 3,682
Caso 3 $ A^2(1+(0,75/n)+(2,25/n^2)) $ 0,560 0,632 0,751 0,870 1,029

Em relação ao cálculo do p-valor, temos que este depende do valor da estatística de Anderson-Darling modificada $ A^{2}_{m} $. A partir do valor desta é utilizada uma interpolação que aproxima uma função exponencial. Apresentamos na tabela a seguir o cálculo do p-valor.

$ A^{2}_{m} $ P-valor
$ A^{2}_{m} \textless 0,200 $ $ p-valor = 1 - exp(-13,436 + 101,14 \times A^{2}_{m} - 223,73 \times (A^{2}_{m})^{2}) $
$ 0,200 \textless A^{2}_{m} \textless 0,340 $ $ p-valor = 1 - exp(-8,318 + 42,796 \times A^{2}_{m} - 59,938 \times (A^{2}_{m})^{2}) $
$ 0,340 \textless A^{2}_{m} \textless 0,600 $ $ p-valor = exp(0,9177 - 4,279 \times A^{2}_{m} - 1,38 \times (A^{2}_{m})^{2}) $
$ A^{2}_{m} \textgreater 0,600 $ $ p-valor = exp(1,2937 - 5,709 \times A^{2}_{m} + 0,0186 \times (A^{2}_{m})^{2}) $

Exemplo 6.3.1:

Considere novamente o Exemplo 6.1.1 sobre a medição de 10 peças.

1,90642 2,22488
2,10288 1,69742
1,52229 3,15435
2,61826 1,98492
1,42738 1,99568

clique aqui para efetuar o download dos dados utilizados nesse exemplo

Vamos testar 

 \ \hbox{os dados não seguem uma distribuição normal} \end{array}\right.\]

A média dos dados é $ \bar{X} = 2,0634 $ e o desvio padrão é $ s = 0,5156 $.

Dados Dados ordenados $ F(x_i) $ $ \ln(F(x_i)) $ $ \ln(1-F(x_i)) $
1,90642 1,42738 0,10865 -2,21958 -0,11502
2,10288 1,52229 0,14694 -1,91770 -0,15893
1,52229 1,69742 0,23887 -1,43184 -0,27295
2,61826 1,90642 0,38035 -0,96667 -0,47860
1,42738 1,98492 0,43947 -0,82219 -0,57887
2,22488 1,99568 0,44771 -0,80360 -0,59369
1,69742 2,10288 0,53048 -0,63397 -0,75605
3,15435 2,22488 0,62290 -0,47337 -0,97523
1,98492 2,61826 0,85906 -0,15192 -1,95942
1,99568 3,15435 0,98282 -0,01733 -4,06422

Utilizando a fórmula $ (\star) $, temos que 

\[D = -103,4169.\]


\[A^2=-n-\frac{D}{n}=-10+\frac{103,4169}{10}=0,3416856.\]

A estatística de Anderson Darling modificada para este caso (Caso 3 com μ e σ desconhecidos) é dada por: 

\[A_m^2=A^2\left(1+\frac{0,75}{n}+\frac{2,25}{n^2}\right)=0,375.\]

Como a estatística modificada resultou em $ A^{2}_{m} = 0,375 $, temos que o cálculo do p-valor é dado por: 

$$p-valor = exp(0,9177 - 4,279 \times A^{2}_{m} + 1,38 \times (A^{2}_{m})^{2})=exp(0,9177 - 4,279 \times 0,375 + 1,38 \times (0,375)^{2})=0,414374$$

Então, existe forte evidência de que os dados provém de uma distribuição Normal. 

Veja a seguir, os resultados obtidos a partir do software Action.

 

Exemplo 6.3.2:

Considere as seguintes medidas de peso de homens (em pounds): 148, 154, 158, 160, 161, 162, 166, 170, 182, 195, 236. Vamos testar: 

 \ \hbox{os dados não seguem uma distribuição normal} \end{array}\right.\]

clique aqui para efetuar o download dos dados utilizados nesse exemplo

A média dos dados é $ \bar{x} = 172 $ e o desvio padrão é $ s = 24,9520 $.

Calculando o valor de $ A^2 $
Dados Dados ordenados $ F(x_i) $ $ \ln(F(x_i)) $ $ \ln(1-F(x_i)) $
154 148 0,168063 -1,78341 -0,184
148 154 0,235336 -1,44674 -0,26832
170 158 0,287372 -1,24698 -0,3388
161 160 0,315285 -1,15428 -0,37875
160 161 0,329662 -1,10969 -0,39997
166 162 0,344295 -1,06626 -0,42204
162 166 0,404986 -0,9039 -0,51917
158 170 0,468057 -0,75916 -0,63122
182 182 0,655705 -0,42204 -1,06626
195 195 0,821676 -0,19641 -1,72415
236 236 0,99484 -0,00517 -5,26684

Utilizando a fórmula $ (\star) $, temos: 

\[D= -131,4145.\]


\[A^2=-\frac{D}{n}-n=\frac{131,4145}{11}-11=0,9467719.\]

A estatística de Anderson Darling modificada para esse caso (Caso 3 com $ \mu $ e $ \sigma $ desconhecidos) é dada por: 

\[A_m^2=A^2\left(1+\frac{0,75}{n}+\frac{2,25}{n^2}\right)=0,9467719\times(1+0,06818182+0,01859504)=1,02893.\]

Temos que o p-valor é dado por:

$$p-valor = exp(1,2937 - 5,709 \times A^{2}_{m} + 0,0186 \times (A^{2}_{m})^{2})=exp(1,2937 - 5,709 \times 1,02893 + 0,0186 \times (1,02893)^{2}) = 0,01044824 \simeq 1\%$$

Portanto, o p-valor é aproximadamente 1%. Então, existe forte evidência de que os dados não provém de uma distribuição Normal. 

Veja a seguir os resultados obtidos pelo software Action.

Para entender como executar essa função do Software Action, você pode consultar o manual do usuário.

Inferência

Sobre o Portal Action

O Portal Action é mantido pela Estatcamp - Consultoria Estatística e Qualidade, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.

Facebook

CONTATO

  •  Maestro Joao Seppe, 900, São Carlos - SP | CEP 13561-180
  • Telefone: (16) 3376-2047
  • E-Mail: [email protected]