6.17.1 - Distribuição normal truncada

Você está aqui

A distribuição normal truncada é uma distribuição de probabilidade de uma variável aleatória normal delimitada inferiormente, superiormente ou ambos. Essa distribuição tem ampla aplicação em estatística e econometria, por exemplo, ela é usada para modelar saídas binárias no modelo probito e modelar dados com censura no modelo tobito. Para detalhes de exemplos em econometria veja Greene, William H. (2003).

Definição:

Seja $ Y $ uma variável aleatória $ N(\mu,\sigma^2) $ com função densidade de probabilidade

$$g(y)=\frac{1}{\sigma\sqrt{2\pi}}\exp\left\lbrace-\frac{(y-\mu)^2}{2\sigma^2}\right\rbrace, y \in \Re$$

e função de distribuição 

$$G(y) = \int_{-\infty}^y g(z) dz.$$

 

A variável aleatória contínua $ X $ tem distribuição normal truncada em $ [a,b] $ com os parâmetros $ \mu, \sigma^2 $ se sua função densidade de probabilidade for dada por

$$f(x)=\left\{\begin{array}{l} \dfrac{\dfrac{1}{\sigma\sqrt{2\pi}}\exp\left(-\frac{(x-\mu)^2}{2\sigma^2}\right)}{G(b)-G(a)}, \ \hbox{se} \ a\leq x\leq b;\\ 0, \ \hbox{caso contrário}\end{array}\right.$$

ou em termos da função da distribuição acumulada da normal padrão, $ \Phi(\cdot) $, temos

$$f(x)=\left\{\begin{array}{l} \dfrac{\frac{1}{\sigma}\phi\left(\dfrac{x-\mu}{\sigma}\right)}{\Phi\left(\dfrac{b-\mu}{\sigma}\right)-\Phi\left(\dfrac{a-\mu}{\sigma}\right)}, \ \hbox{se} \ a\leq x\leq b;\\ 0, \ \hbox{caso contrário}\end{array}\right.$$

Notação:

$$X \sim NT(\mu,\sigma^2;a,b)$$

 

Demonstração:

A demonstração ocorre direto da equação (1).

Note que

$$g(x) = \dfrac{1}{\sigma \sqrt{2\pi} } \exp \left\lbrace -\dfrac{1}{2} \left( \dfrac{x-\mu}{\sigma} \right)^2 \right\rbrace = \dfrac{1}{\sigma}\dfrac{1}{\sqrt{2\pi} } \exp \left\lbrace -\dfrac{1}{2} \left( \dfrac{x-\mu}{\sigma} \right)^2 \right\rbrace = \dfrac{1}{\sigma} \phi \left( \dfrac{x-\mu}{\sigma} \right)$$

No caso em que o truncamento é simples à direita, temos

$$f(x) = P( X = x) = P( Y=y | y \leq b) = \dfrac { P( Y=y ; y \leq b ) }{ P( y \leq b) } = \dfrac{P(Y=y)}{ P( y \leq b) } = \dfrac{ g(y) }{G(b)}$$

No caso em que o truncamento é simples à esquerda, temos

$$f(x) = P( X = x) = P( Y=y | y \geq a) = \dfrac { P( Y=y ; y \geq a ) }{ P( y \geq a) } = \dfrac{P(Y=y)}{ P( y \geq a) } = \dfrac{ g(y) }{1-G(a)}$$

A função de distribuição é dada por:

$$F(x) = \dfrac{ G(x) - G(a) }{ G(b) - G(a) } = \dfrac{ \Phi( \frac{x-\mu}{\sigma} ) - \Phi( \frac{a-\mu}{\sigma} ) }{ \Phi( \frac{b-\mu}{\sigma} ) - \Phi( \frac{a-\mu}{\sigma} ) },$$

onde $ \Phi(\cdot) $ é a função de distribuição da normal padrão.

Demonstração:

$$F(x) = \int_a^x f(x)dx = \int_a^x \dfrac{ g(x) }{ G(b) - G(a) } dx = \dfrac{1}{G(b) - G(a)} \int_a^x g(x) dx = \dfrac{ G(x) - G(a) }{ G(b) - G(a) }$$

A esperança é dada por:

$$E(X) = \mu + \dfrac{ \phi \left( \frac{a-\mu}{\sigma} \right) - \phi \left( \frac{b-\mu}{\sigma} \right) }{ \Phi \left( \frac{b-\mu}{\sigma} \right) - \Phi \left( \frac{a-\mu}{\sigma} \right) } \sigma,$$

em que $ \phi(\cdot) $ é a f.d.p. e $ \Phi(\cdot) $ é a função de distribuição da distribuição normal padrão.

  • Quando o truncamento é simples à direita, temos, 

$$E(X) = E(Y | Y \leq b) = \mu -\sigma \dfrac{\phi \left( \frac{b-\mu}{\sigma} \right) }{ G(b) }$$
  • Quando o truncamento é simples à esquerda, temos, 

$$E(X) = E(Y | Y \geq a) = \mu +\sigma \lambda( \alpha ),$$

em que $ \alpha = \dfrac{ a-\mu }{ \sigma } $ e $ \lambda( \alpha ) = \dfrac{ \phi( \alpha )}{ 1 - G(a) } $ 

A variância é dada por:

$$Var(X) = \left[ 1 + \dfrac{ \left( \dfrac{a - \mu}{\sigma } \right) \phi \left( \dfrac{a - \mu}{\sigma } \right) - \left( \dfrac{b - \mu}{\sigma } \right) \phi \left( \dfrac{b - \mu}{\sigma } \right) }{ G(b) - G(a) } \right] \sigma^2 \] \[- \left[ \dfrac{ \phi \left( \dfrac{a - \mu}{\sigma } \right) - \phi \left( \dfrac{b - \mu}{\sigma } \right) } { G(b) - G(a) } \right]^2 \sigma^2,$$

em que $ \phi(\cdot) $ é a função densidade de probabilidade da distribuição normal padrão.

  • Quando o truncamento é simples à direita, temos, 

$$Var(X) = Var( Y | Y \leq b) = \sigma^2 \left[ 1 - \beta \dfrac{ \phi(\beta) }{ G(b) } - \left( \dfrac{ \phi( \beta) }{ G(b) } \right)^2 \right],$$

em que $ \beta = \dfrac{b - \mu}{ \sigma } $

  • Quando o truncamento é simples à esquerda, temos, 

$$Var(X) = Var( Y | Y \geq a) = \sigma^2 [ 1 - \delta( \alpha ) ],$$

em que $ \alpha = \dfrac{ a-\mu }{ \sigma }, \delta( \alpha ) = \lambda(\alpha) [ \lambda(\alpha) - \alpha ] $ e $ \lambda( \alpha ) = \dfrac{ \phi( \alpha )}{ 1 - G(a) } $

Figura 1: Exemplos de curvas da distribuição normal truncada

Exemplo 6.17.1.1:

Considere o Exemplo 6.2.4 em que o peso médio de 800 porcos de uma fazenda é de 64kg e o desvio padrão é de 15kg. Suponha que este peso seja distribuído de forma normal. Entretanto, devido à sua raça, cada porco peso no mínimo 30kg e no máximo 120kg. Quantos porcos pesarão entre 42kg e 73kg?

Seja $ X_i $ a variável aleatória que representa o peso de um porco. 
Como admitido no enunciado, $ X_i \sim NT(64, 15^2; 30, 120), i=1, \ldots, 800. $
Assim, a probabilidade de um porco $ i $ estar entre 42kg e 73kg é

$$P( 42 \leq X_i \leq 73) = P( X_i \leq 73) - P(X_i \leq 42) = F(73) - F(42),$$

em que $ F(\cdot) $ é a função de distribuição de $ X $.
Utilizando a fórmula da função de distribuição, temos,

$$P( 42 \leq X_i \leq 73) = F(73) - F(42) =$$

$$= \dfrac{ \Phi\left( \dfrac{73-64}{15} \right) - \Phi\left( \dfrac{30-64}{15} \right) }{ \Phi\left( \dfrac{120-64}{15} \right) - \Phi\left( \dfrac{30-64}{15} \right) } - \dfrac{ \Phi\left( \dfrac{42-64}{15} \right) - \Phi\left( \dfrac{30-64}{15} \right) }{ \Phi\left( \dfrac{120-64}{15} \right) - \Phi\left( \dfrac{30-64}{15} \right) } =$$

$$=\dfrac{ 0,7257 - 0,0117 }{0,999 - 0,0117} - \dfrac{ 0,0712 - 0,0117 }{ 0,999 - 0,0117 } =$$

$$= \dfrac{0,714}{0,9882} - \dfrac{0,0595}{0,9882} =$$

$$= 0,7225 - 0,0602 = 0,6623 (66,23\%)$$

Portanto, a quantidade esperada de porcos entre 42kg e 73kg é de $ 800 \times 0,6623 = 529,8523 \approx 530 $

A área hachurada do gráfico da Figura 2, representa a probabilidade do porco pesar entre 42kg e 73kg, como calculado acima.

Figura 2: Gráfico da distribuição normal com média 64, desvio padrão 15, truncada de 30 a 120, destacando a área entre 42 e 73.

Exemplo 6.17.1.2:

Suponha que o peso de uma melancia seja normalmente distribuído com média 7kg e desvio padrão de 2,5kg. As melancias abaixo de 3kg são descartadas pelo produtor e não são repassadas para o mercado.

a) Calcule o peso médio esperado e o desvio padrão de uma melancia no mercado.

Usando a fórmula da esperança para o truncamento simples à esquerda temos,

$$\alpha = \dfrac{ a-\mu }{ \sigma } = \frac{3-7}{2,5} = -1,6$$

$$\lambda( \alpha ) = \lambda( -1,6 ) = \dfrac{ \phi( -1,6 )}{ 1 - \Phi \left( \dfrac{3-7}{2,5} \right) } =\dfrac{ \phi( -1,6 )}{ 1 - \Phi \left( -1,6 \right) } = \dfrac{0,1109}{0,9452} = 0,1173$$

Assim,

$$E(X) = \mu + \sigma \lambda(\alpha) = 7 + 2,5 \times 0,1173 = 7,2933Kg \approx 7,3Kg$$

Variância e desvio padrão:
Agora, 

$$\delta(\alpha) = \lambda(\alpha)[ \lambda(\alpha)-1 ] = 0,1173(0,1173-1) = -0,1035$$

Assim, 

$$\text{Var}(X) = \sigma^2 (1 - \delta(\alpha) ) = 2,5^2 (1 -(-0,1035)) = 6,8971$$

Extraindo a raiz quadrada da variância chegamos ao desvio padrão
      

$$s = \sqrt{\text{Var}(X)} = \sqrt{6,8971} = 2,6262kg \approx 2,6kg$$

Probabilidades

Sobre o Portal Action

O Portal Action é mantido pela Estatcamp - Consultoria Estatística e Qualidade, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.

Facebook

CONTATO

  •  Maestro Joao Seppe, 900, São Carlos - SP | CEP 13561-180
  • Telefone: (16) 3376-2047
  • E-Mail: [email protected]