- Estatcamp: (16) 3376-2047 [email protected]
- [email protected] https://www.actionstat.com.br
A distribuição normal truncada é uma distribuição de probabilidade de uma variável aleatória normal delimitada inferiormente, superiormente ou ambos. Essa distribuição tem ampla aplicação em estatística e econometria, por exemplo, ela é usada para modelar saídas binárias no modelo probito e modelar dados com censura no modelo tobito. Para detalhes de exemplos em econometria veja Greene, William H. (2003).
Seja $Y$ uma variável aleatória $N(\mu,\sigma^2)$ com função densidade de probabilidade
$$g(y)=\frac{1}{\sigma\sqrt{2\pi}}\exp\left\lbrace-\frac{(y-\mu)^2}{2\sigma^2}\right\rbrace, y \in \Re$$
e função de distribuição
$$G(y) = \int_{-\infty}^y g(z) dz.$$
A variável aleatória contínua $X$ tem distribuição normal truncada em $[a,b]$ com os parâmetros $\mu, \sigma^2$ se sua função densidade de probabilidade for dada por
$$f(x)=\left\{\begin{array}{l} \dfrac{\dfrac{1}{\sigma\sqrt{2\pi}}\exp\left(-\frac{(x-\mu)^2}{2\sigma^2}\right)}{G(b)-G(a)}, \ \hbox{se} \ a\leq x\leq b;\\ 0, \ \hbox{caso contrário}\end{array}\right.$$
ou em termos da função da distribuição acumulada da normal padrão, $\Phi(\cdot)$, temos
$$f(x)=\left\{\begin{array}{l} \dfrac{\frac{1}{\sigma}\phi\left(\dfrac{x-\mu}{\sigma}\right)}{\Phi\left(\dfrac{b-\mu}{\sigma}\right)-\Phi\left(\dfrac{a-\mu}{\sigma}\right)}, \ \hbox{se} \ a\leq x\leq b;\\ 0, \ \hbox{caso contrário}\end{array}\right.$$
$$X \sim NT(\mu,\sigma^2;a,b)$$
A demonstração ocorre direto da equação (1).
Note que
$$g(x) = \dfrac{1}{\sigma \sqrt{2\pi} } \exp \left\lbrace -\dfrac{1}{2} \left( \dfrac{x-\mu}{\sigma} \right)^2 \right\rbrace = \dfrac{1}{\sigma}\dfrac{1}{\sqrt{2\pi} } \exp \left\lbrace -\dfrac{1}{2} \left( \dfrac{x-\mu}{\sigma} \right)^2 \right\rbrace = \dfrac{1}{\sigma} \phi \left( \dfrac{x-\mu}{\sigma} \right)$$
No caso em que o truncamento é simples à direita, temos
$$f(x) = P( X = x) = P( Y=y | y \leq b) = \dfrac { P( Y=y ; y \leq b ) }{ P( y \leq b) } = \dfrac{P(Y=y)}{ P( y \leq b) } = \dfrac{ g(y) }{G(b)}$$
No caso em que o truncamento é simples à esquerda, temos
$$f(x) = P( X = x) = P( Y=y | y \geq a) = \dfrac { P( Y=y ; y \geq a ) }{ P( y \geq a) } = \dfrac{P(Y=y)}{ P( y \geq a) } = \dfrac{ g(y) }{1-G(a)}$$
A função de distribuição é dada por:
$$F(x) = \dfrac{ G(x) - G(a) }{ G(b) - G(a) } = \dfrac{ \Phi( \frac{x-\mu}{\sigma} ) - \Phi( \frac{a-\mu}{\sigma} ) }{ \Phi( \frac{b-\mu}{\sigma} ) - \Phi( \frac{a-\mu}{\sigma} ) },$$
onde $\Phi(\cdot)$ é a função de distribuição da normal padrão.
$$F(x) = \int_a^x f(x)dx = \int_a^x \dfrac{ g(x) }{ G(b) - G(a) } dx = \dfrac{1}{G(b) - G(a)} \int_a^x g(x) dx = \dfrac{ G(x) - G(a) }{ G(b) - G(a) }$$
A esperança é dada por:
$$E(X) = \mu + \dfrac{ \phi \left( \frac{a-\mu}{\sigma} \right) - \phi \left( \frac{b-\mu}{\sigma} \right) }{ \Phi \left( \frac{b-\mu}{\sigma} \right) - \Phi \left( \frac{a-\mu}{\sigma} \right) } \sigma,$$
em que $\phi(\cdot)$ é a f.d.p. e $\Phi(\cdot)$ é a função de distribuição da distribuição normal padrão.
$$E(X) = E(Y | Y \leq b) = \mu -\sigma \dfrac{\phi \left( \frac{b-\mu}{\sigma} \right) }{ G(b) }$$
$$E(X) = E(Y | Y \geq a) = \mu +\sigma \lambda( \alpha ),$$
em que $\alpha = \dfrac{ a-\mu }{ \sigma }$ e $\lambda( \alpha ) = \dfrac{ \phi( \alpha )}{ 1 - G(a) }$
A variância é dada por:
$$Var(X) = \left[ 1 + \dfrac{ \left( \dfrac{a - \mu}{\sigma } \right) \phi \left( \dfrac{a - \mu}{\sigma } \right) - \left( \dfrac{b - \mu}{\sigma } \right) \phi \left( \dfrac{b - \mu}{\sigma } \right) }{ G(b) - G(a) } \right] \sigma^2 - \left[ \dfrac{ \phi \left( \dfrac{a - \mu}{\sigma } \right) - \phi \left( \dfrac{b - \mu}{\sigma } \right) } { G(b) - G(a) } \right]^2 \sigma^2,$$
em que $\phi(\cdot)$ é a função densidade de probabilidade da distribuição normal padrão.
$$Var(X) = Var( Y | Y \leq b) = \sigma^2 \left[ 1 - \beta \dfrac{ \phi(\beta) }{ G(b) } - \left( \dfrac{ \phi( \beta) }{ G(b) } \right)^2 \right],$$
em que $\beta = \dfrac{b - \mu}{ \sigma }$
$$Var(X) = Var( Y | Y \geq a) = \sigma^2 [ 1 - \delta( \alpha ) ],$$
em que $\alpha = \dfrac{ a-\mu }{ \sigma }, \delta( \alpha ) = \lambda(\alpha) [ \lambda(\alpha) - \alpha ]$ e $\lambda( \alpha ) = \dfrac{ \phi( \alpha )}{ 1 - G(a) }$
Figura 1: Exemplos de curvas da distribuição normal truncada
Considere o Exemplo 6.2.4 em que o peso médio de 800 porcos de uma fazenda é de 64kg e o desvio padrão é de 15kg. Suponha que este peso seja distribuído de forma normal. Entretanto, devido à sua raça, cada porco peso no mínimo 30kg e no máximo 120kg. Quantos porcos pesarão entre 42kg e 73kg?
Seja $X_i$ a variável aleatória que representa o peso de um porco.
Como admitido no enunciado, $X_i \sim NT(64, 15^2; 30, 120), i=1, \ldots, 800.$
Assim, a probabilidade de um porco $i$ estar entre 42kg e 73kg é
$$P( 42 \leq X_i \leq 73) = P( X_i \leq 73) - P(X_i \leq 42) = F(73) - F(42),$$
em que $F(\cdot)$ é a função de distribuição de $X$.
Utilizando a fórmula da função de distribuição, temos,
$$P( 42 \leq X_i \leq 73) = F(73) - F(42) =$$
$$= \dfrac{ \Phi\left( \dfrac{73-64}{15} \right) - \Phi\left( \dfrac{30-64}{15} \right) }{ \Phi\left( \dfrac{120-64}{15} \right) - \Phi\left( \dfrac{30-64}{15} \right) } - \dfrac{ \Phi\left( \dfrac{42-64}{15} \right) - \Phi\left( \dfrac{30-64}{15} \right) }{ \Phi\left( \dfrac{120-64}{15} \right) - \Phi\left( \dfrac{30-64}{15} \right) } =$$
$$=\dfrac{ 0,7257 - 0,0117 }{0,999 - 0,0117} - \dfrac{ 0,0712 - 0,0117 }{ 0,999 - 0,0117 } =$$
$$= \dfrac{0,714}{0,9882} - \dfrac{0,0595}{0,9882} =$$
$$= 0,7225 - 0,0602 = 0,6623 (66,23\%)$$
Portanto, a quantidade esperada de porcos entre 42kg e 73kg é de $800 \times 0,6623 = 529,8523 \approx 530$
A área hachurada do gráfico da Figura 2, representa a probabilidade do porco pesar entre 42kg e 73kg, como calculado acima.
Figura 2: Gráfico da distribuição normal com média 64, desvio padrão 15, truncada de 30 a 120, destacando a área entre 42 e 73.
Suponha que o peso de uma melancia seja normalmente distribuído com média 7kg e desvio padrão de 2,5kg. As melancias abaixo de 3kg são descartadas pelo produtor e não são repassadas para o mercado.
a) Calcule o peso médio esperado e o desvio padrão de uma melancia no mercado.
Usando a fórmula da esperança para o truncamento simples à esquerda temos,
$$\alpha = \dfrac{ a-\mu }{ \sigma } = \frac{3-7}{2,5} = -1,6$$
e
$$\lambda( \alpha ) = \lambda( -1,6 ) = \dfrac{ \phi( -1,6 )}{ 1 - \Phi \left( \dfrac{3-7}{2,5} \right) } =\dfrac{ \phi( -1,6 )}{ 1 - \Phi \left( -1,6 \right) } = \dfrac{0,1109}{0,9452} = 0,1173$$
Assim,
$$E(X) = \mu + \sigma \lambda(\alpha) = 7 + 2,5 \times 0,1173 = 7,2933Kg \approx 7,3Kg$$
Variância e desvio padrão:
Agora,
$$\delta(\alpha) = \lambda(\alpha)[ \lambda(\alpha)-1 ] = 0,1173(0,1173-1) = -0,1035$$
Assim,
$$\text{Var}(X) = \sigma^2 (1 - \delta(\alpha) ) = 2,5^2 (1 -(-0,1035)) = 6,8971$$
Extraindo a raiz quadrada da variância chegamos ao desvio padrão
$$s = \sqrt{\text{Var}(X)} = \sqrt{6,8971} = 2,6262kg \approx 2,6kg$$
O Portal Action é mantido pela Estatcamp - Consultoria Estatística e Qualidade, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.