- Estatcamp: (16) 3376-2047 [email protected]
- [email protected] https://www.actionstat.com.br
A distribuição normal mista é a mistura de duas ou mais distribuições normais, ou seja, as distribuições compostas são normais. Essa distribuição é geralmente usada para modelar dados cujo pico e caldas são maiores do que a normal. A Figura 6.18.1 representa o histograma de um conjunto de dados simulados e a curva normal com a mesma média e variância usadas na simulação. Note que a distribuição empírica é mais alta e possui caldas mais longas comparadas à distribuição normal. Para maiores detalhes sobre a distribuição normal mista veja Sylvia Frühwirth-Schnatter (2006)
Figura 6.18.1: Histograma de uma distribuição normal mista com a curva da distribuição normal.
Sejam $X_1, X_2, \ldots, X_n$ variáveis aleatórias com distribuição normal em que suas funções densidades de probabilidade são dadas, respectivamente, por $p_1, p_2, \ldots, p_n$, em que $p_i \sim N(\mu_i,\sigma^2_i), i=1,\ldots,n.$
A função densidade de probabilidade da distribuição normal mista é dada por,
$$ f(x) = \sum_{i=1}^n w_i p_i(x) = \sum_{i=1}^n w_i \dfrac{1}{\sigma_i \sqrt{2\pi}} \exp \left\lbrace \dfrac{ -(x-\mu_i)^2}{ 2 \sigma^2_i } \right\rbrace, $$
em que, $\sum_{i=1}^n w_i = 1$
A função de distribuição é dada por,
$$F(x) = \sum_{i=1}^n w_i \Phi \left( \dfrac{x-\mu_i}{\sigma_i} \right),$$
em que $\Phi(\cdot)$ é a função de distribuição da $N(0,1)$
Notação: $X\sim\text{Normal Mista}(\boldsymbol\mu, \boldsymbol\sigma^2, \mathbf{w})$
em que $\boldsymbol\mu= (\mu_1, \mu_2, \cdots, \mu_n)$, $\boldsymbol\sigma^2=(\sigma^2_1, \sigma^2_2, \cdots, \sigma^2_n)$ e $\mathbf{w} = (w_1, w_2, \cdots, w_n)$
Figura 6.18.2: Curva da função densidade de probabilidade da distribuição normal mista
Figura 6.18.3: Curva da função de distribuição da normal mista
Como vimos na seção 6.18 Distribuições Mistas, a esperança e a variância da distribuição normal mista são dadas por,
$$E(X) = \sum_{i=1}^n w_i E[X_i] = \sum_{i=1}^n w_i \mu_i$$
$$Var(X) = E[(X-\mu)^2] = \sum_{i=1}^n w_i( (\mu_i-\mu)^2 + \sigma^2_i )$$
Médias iguais e variâncias diferentes}
Considere duas populações tais que $X_1 \sim N(0,1)$ e $X_2 \sim N(0,25)$. Calculando a esperança e a variância, considerando $w_1=w_2=1/2$ temos,
$$E(X) = \left(\frac{1}{2} \times 0 \right) + \left( \frac{1}{2} \times 0 \right) = 0$$
$$Var(X) = \frac{1}{2} \left[ (0-0)^2 + 1 \right] + \frac{1}{2} \left[ (0-0)^2 + 25 \right] = \frac{1}{2} ( 1 + 25 ) = 26 \times \frac{1}{2} = 13$$
Geralmente quando as médias são iguais a densidade se assemelha a de uma distribuição normal, entretanto com as caldas mais longas e com o pico mais alto. No gráfico da Figura 6.18.4, é apresentado o histograma desses dados simulados e as curvas da distribuição normal e da normal mista.
Figura 6.18.4: Distribuição normal mista. Componentes mistas com médias iguais e variâncias diferentes
Médias diferentes
Considere duas populações tais que $X_1 \sim N(0,1)$ e $X_2 \sim N(5,1)$. Calculando a esperança e a variância, considerando $w_1=w_2=1/2$ temos,
$$ E(X) = (\frac{1}{2} \times 0) + (\frac{1}{2} \times 5) = 0 + \frac{5}{2} = \frac{5}{2}$$
$$ Var(X) = \frac{1}{2} \left[ (0-5/2)^2 + 1 \right] + \frac{1}{2} \left[ (5-5/2)^2 + 1 \right] = \frac{1}{2} \left[ 25/4 + 1 + 25/4 + 1 \right] = \frac{1}{2} \times \frac{29}{2} = \frac{29}{4}$$
Geralmente quando as médias são diferentes a densidade da distribuição mista apresenta picos referentes as médias $\mu_i$ das componentes. No gráfico da Figura 6.18.5, é apresentado o histograma desses dados simulados e as curvas da distribuição normal e da normal mista.
Figura 6.18.5: Distribuição normal mista. Componentes mistas com médias diferentes
O Portal Action é mantido pela Estatcamp - Consultoria Estatística e Qualidade, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.