Transformação de Dados

Você está aqui

A transformação Box-Cox é uma das possíveis maneiras de resolver problemas para dados que não obedecem os pressupostos da análise de variância, como normalidade dos dados.

Campo de Entrada

Dados de entrada Dados numéricos organizados em matriz coluna.
Opções Escolha do método de transformação a ser utilizado.

Detalhes

A transformação Box-Cox consiste em determinar um $ \lambda $, para que os dados transformados possam ter uma distribuição normal.
A equação usada é dada por 

$$Y_i = \left\{ \begin{array}{ll} \ln(X_i),~~~~~~\textrm{if $\lambda = 0$,} \\ \\ \dfrac{X_i^{\lambda} - 1}{\lambda},~~~~\textrm{if $\lambda \neq 0$}\end{array} \right.$$

onde $ X_i $ é o valor do conjunto de dados inicial e $ Y_i $ os dados transformados.

 

A transformação de Johnson é constituído por três famílias de distribuições, geradas a partir da seguinte função:

$$Y = \gamma + \eta k_i(X, \lambda, \varepsilon)$$

em que $ Y $ representa a variável normal padronizada, $ X $ é a observação a ser transformada, $ \eta, \gamma, \lambda $ e $ \varepsilon $ são os parâmetros específicos da transformação de Johnson que precisam ser estimados. A função $ k_i(X,\lambda,\varepsilon) $ é a função que caracteriza cada família do sistema de curvas. 

As três famílias características do sistema de curvas de Johnson são:

 k_1(X,\lambda, \varepsilon) = senh^{-1}\left(\dfrac{X-\varepsilon}{\lambda}\right), \quad \text{em que} \quad -\infty \textless X \textless\infty$$

 k_2(X,\lambda, \varepsilon) = ln\left(\dfrac{X-\varepsilon}{\lambda+ \varepsilon -X}\right), \quad \text{em que} \quad \varepsilon \textless X \textless \varepsilon + \lambda$$

 k_3(X,\lambda, \varepsilon) = ln\left(\dfrac{X-\varepsilon}{\lambda}\right), \quad \text{em que} \quad \varepsilon \textless X \textless \infty$$

Desta forma, a transformação é dada por

Família Transformação
$ S_U $ $ Y = \gamma + \eta senh^{-1}\left(\dfrac{X - \varepsilon}{\lambda}\right) $
$ S_B $ $ Y = \gamma + \eta ln\left(\dfrac{X - \varepsilon}{\lambda + \varepsilon - X}\right) $
$ S_L $ $ Y = \gamma^{*} + \eta ln(X - \varepsilon) $

 

em que $ Y $ corresponde aos dados transformados. 

Referências

Box, G. E. P. and Cox, D. R. (1964) An analysis of transformations (with discussion). Journal of the Royal Statistical Society B, 26, 211–252.

Slifker, J. F., & Shapiro, S. S. (1980). The Johnson system: selection and parameter estimation. Technometrics, 22(2), 239-246.

Exemplos

A seguir alguns exemplos utilizando a ferramenta Transformação de Dados do Action Stat.

Manual - Estatística Básica

Sobre o Portal Action

O Portal Action é mantido pela Estatcamp - Consultoria Estatística e Qualidade, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.

Facebook

CONTATO

  •  Maestro Joao Seppe, 900, São Carlos - SP | CEP 13561-180
  • Telefone: (16) 3376-2047
  • E-Mail: [email protected]