6.1 - Teste de Anderson-Darling

Você está aqui

O problema que vamos considerar aqui é o de testar a hipótese de que uma dada amostra tenha sido retirada de uma dada população com função de distribuição acumulada contínua $F(x)$, isto é, seja $x_1,x_2,\ldots,x_n$ uma amostra aleatória e suponha que um provável candidato para a FDA dos dados seja $F(x)$, então, o teste de hipóteses para verificar a adequabilidade da distribuição é: \[\left\{\begin{array}{l}H_0: \ \hbox{a amostra tem distribuição} \ F(x) \\ H_1: \ \hbox{a amostra não tem distribuição} \ F(x) \end{array}\right.\]

Anderson e Darling (1952, 1954) propuseram a seguinte estatística para este teste \[\displaystyle A^2=n\int_{-\infty}^{\infty}\frac{[F_n(x)-F(x)]}{F(x)(1-F(x))}dF(x)\]

onde $F_n(x)$ é a função de distribuição acumulada empírica definida como \[F_{n}(x)=\left\{\begin{array}{l}0,\mbox{se}~x \ \textless \ x_{(1)}\\\cfrac{k}{n},\mbox{se}~x_{(k)}\leq x \ \textless \ x_{(k + 1)}\\1,\hbox{se}~x\geq~x_{(n)}\end{array} \right.\]

e $x_{(1)}\leq x_{(2)}\leq\ldots\leq x_{(n)}$, são as estatísticas de ordem da amostra aleatória.

A estatística $A^2$ pode ser colocada numa forma equivalente: \[A^2=-n-\frac{1}{n}\sum_{i=1}^n[(2i-1)\ln(F(x_{(i)}))+(2(n-i)+1)\ln(1-F(x_{(i)}))]\]

A transformação $F(x_{(i)})$ leva $x_{(i)}$ em $U_{(i)}$ de uma amostra de tamanho n com distribuição uniforme em $(0,1)$. Logo, \[A^2=-n-\frac{1}{n}D\qquad(\star)\]

em que $D$ é dado por \[D=\sum_{i=1}^n[(2i-1)\ln(U_{(i)})+(2(n-i)+1)\ln(1-U_{(i)})]\]

Para calcular o valor da estatística $A^2$ procedemos da seguinte forma:

  • Ordenamos os valores da amostra: $x_{(1)}\leq x_{(2)}\leq \ldots\leq x_{(n)}$;
  • Quando necessário, estime os parâmetros da distribuição de interesse;
  • Calcule $U_i = F(x_{(i)})$ e calcule o valor da estatística de Anderson Darling \[\displaystyle A^2=-n-\frac{1}{n}\sum_{i=1}^n[(2i-1)(\ln(U_{(i)})+(2(n-i)+1)\ln(1-U_{(i)})]\]
  • Para cada uma das distribuições calcule, se for o caso, o valor da estatística modificada de acordo com as tabelas dadas para cada uma delas.

Para uma distribuição com parâmetros conhecidos temos os valores da função de distribuição acumulada da estatística $A^2$ tabulados em Peter and Lewis (1960). O problema surge quando um ou dois dos parâmetros da distribuição precisam ser estimados. Para contornar esse problema Stephens (1974, 1976, 1977) utilizou métodos assintóticos para tabular os valores dessas probabilidades quando os parâmetros das distribuições são desconhecidos.

Nas próximas seções apresentamos o teste de Anderson-Darling para algumas distribuições contínuas.

Sobre o Portal Action

O Portal Action é mantido pela Estatcamp - Consultoria Estatística e Qualidade, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.

Facebook

CONTATO

  •  Maestro Joao Seppe, 900, São Carlos - SP | CEP 13561-180
  • Telefone: (16) 3376-2047
  • E-Mail: [email protected]