6.1.1 - Distribuição Log Normal

Você está aqui

Para a distribuição Log-Normal com função densidade de probabilidade dada por: 

$$f(x) = \dfrac{1}{\sqrt{2 \pi}\, \, x \sigma} \, \exp \left[-\dfrac{1}{2} \left(\dfrac{\log (x) - \mu}{\sigma} \right)^2\right] ,\qquad x~\textgreater~0, -\infty~\textless~\mu~\textless~\infty \ \text{e} \ \sigma~\textgreater~0$$

Temos que a distribuição Log-normal surge quando se toma o exponencial da distribuição Normal, desta forma os dados podem ser analisados segundo uma distribuição Normal caso se trabalhe com o logaritmo dos dados ao invés dos valores originais. A seguinte tabela fornece alguns valores de quantis e a estatística de Anderson Darling modificada, dada por \[A^2_m=\left(1+\frac{0,75}{n}+\frac{2,25}{n^2}\right)A^2\]

Caso 0: O parâmetro $\theta (\mu,\sigma^2)$ é totalmente conhecido.

Caso 1: $\mu$ é  conhecido e $\sigma^2$ é estimado por $s^2$.

Caso 2:  $\sigma^2$ é conhecido e $\mu$ é estimado por $\overline{X}$.

Caso 3: Nenhum dos componentes de $\theta = (\mu,\sigma^2)$ é conhecido e são estimados por ($\overline{X},s^2$)

Caso Modificação 15,0 10,0 5,0 2,5 1,0
Caso 0 - 1,610 1,933 2,492 3,070 3,857
Caso 1 - 0,784 0,897 1,088 1,281 1,541
Caso 2 - 1,443 1,761 2,315 2,890 3,682
Caso 3 $A^2(1+(0,75/n)+(2,25/n^2))$ 0,560 0,632 0,751 0,870 1,029

Em relação ao cálculo do p-valor, temos que este depende do valor da estatística de Anderson-Darling modificada $A_{m}^{2}$. A partir do valor desta é utilizada uma interpolação que aproxima uma função exponencial. Apresentamos na tabela a seguir o cálculo do p-valor.

$A^{2}_{m}$ P-valor
$A^{2}_{m} \textless 0,200$ $p-valor = 1 - exp(-13,436 + 101,14 \times A^{2}_{m} - 223,73 \times (A^{2}_{m})^{2})$
$0,200 \textless A^{2}_{m} \textless 0,340$ $p-valor = 1 - exp(-8,318 + 42,796 \times A^{2}_{m} - 59,938 \times (A^{2}_{m})^{2})$
$0,340 \textless A^{2}_{m} \textless 0,600$ $p-valor = exp(0,9177 - 4,279 \times A^{2}_{m} - 1,38 \times (A^{2}_{m})^{2})$
$A^{2}_{m} \textgreater 0,600$ $p-valor = exp(1,2937 - 5,709 \times A^{2}_{m} + 0,0186 \times (A^{2}_{m})^{2})$

Observação: Como trabalhamos com o logaritmo dos dados e por consequência com a distribuição normal, temos que a estatística modificada $A^2$, os casos citados dos parâmetros e a tabela são iguais, tanto para a distribuição Normal quanto para a Log-normal, para mais detalhes Teste de Anderson-Darling para a distribuição Normal.

Exemplo 6.1.1: 

A seguir, apresentamos os dados ordenados e os valores utilizados para os cálculos da estatística de Anderson-Darling:

$i$ $x_i$ $log(x_i)$ $F_x$ $D_i$
1 0,1366026 -1,9906790 0,0177512 -5,804454
2 0,1670097 -1,7897036 0,0297473 -13,474327
3 0,1692331 -1,7764784 0,1027915 -26,012798
$\vdots$ $\vdots$ $\vdots$ $\vdots$ $\vdots$
50 6,6128613 1,8890164 0,9824390 -5,796058

clique aqui para efetuar o download dos dados utilizados nesse exemplo

Vamos testar:

$$\left\{\begin{array}{l}H_0: \ \hbox{Os \ dados \ seguem \ distribuição \ Log-normal.} \\ H_1: \ \hbox{Os \ dados \ não \ seguem \ distribuição \ Log-normal.} \end{array}\right.$$

Para calcular a estatística de Anderson-Darling, devemos tomar o logaritmo dos dados, $log(x_i)$, como dado na tabela acima. Após isto, devemos estimar os parâmetros da distribuição, visto que estes não são conhecidos. As estimativas dos parâmetros são dadas por:

$$ \overline{X}=\frac{X_1+\ldots+X_n}{n} = \frac{-1,9906790 + ... + 1,8890164}{50} = -0,05284422 $$

$$ \displaystyle s^2=\sum_{i=1}^n\frac{(X_i-\overline{X})^2}{n-1} = \sum_{i=1}^{50}\frac{(-1,9906790 - 0,01)^2 + ... + (1,8890164- 0,01)^2}{50-1} = 0,9216453 $$

Utilizando a fórmula $(\star)$, temos que \[D = -2524,497.\]

\[A^2=-n-\frac{D}{n}=-50+\frac{-2524,497}{50}=0,4899346.\]

A estatística de Anderson Darling modificada para este caso (Caso 3, com μ e σ desconhecidos) é dada por: \[A_m^2=A^2\left(1+\frac{0,75}{n}+\frac{2,25}{n^2}\right)=0,4977246.\]

Calculando o p-valor temos:

$$p-valor = exp(0,9177 - 4,279 \times A^{2}_{m} + 1,38 \times (A^{2}_{m})^{2})=exp(0,9177 - 4,279 \times 0,4977246 + 1,38 \times (0,4977246)^{2})=0,2114153$$

Adotando o nível de significância de $5\%$, temos que existe forte evidência de que os dados provém de uma distribuição Log-normal. 

 

Sobre o Portal Action

O Portal Action é mantido pela Estatcamp - Consultoria Estatística e Qualidade, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.

Facebook

CONTATO

  •  Maestro Joao Seppe, 900, São Carlos - SP | CEP 13561-180
  • Telefone: (16) 3376-2047
  • E-Mail: [email protected]