6.2 - Distribuição Normal

Você está aqui

A distribuição normal conhecida também como distribuição gaussiana é sem dúvida a mais importante distribuição contínua. Sua importância se deve a vários fatores, entre eles podemos citar o teorema central do limite, o qual é um resultado fundamental em aplicações práticas e teóricas, pois ele garante que mesmo que os dados não sejam distribuídos segundo uma normal a média dos dados converge para uma distribuição normal conforme o número de dados aumenta. Além disso diversos estudos práticos tem como resultado uma distribuição normal. Podemos citar como exemplo a altura de uma determinada população em geral segue uma distribuição normal. Entre outras características físicas e sociais tem um comportamento gaussiano, ou seja, segue uma distribuição normal.

Definição 6.2.1:

Uma variável aleatória contínua $ X $ tem distribuição Normal se sua função densidade de probabilidade for dada por:


\[f(x)=\frac{1}{\sqrt{2\pi\sigma^2}}\exp\left[-\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2\right], \quad x\in(-\infty,\infty).\]

 

Usamos a notação $ X\sim N(\mu,\sigma^2). $

A variação natural de muitos processos industriais é realmente aleatória. Embora as distribuições de muitos processos possam assumir uma variedade de formas, muitas variáveis observadas possuem uma distribuição de frequências que é, aproximadamente, uma distribuição de probabilidade Normal.

Probabilidade é a chance real de ocorrer um determinado evento, isto é, a chance de ocorrer uma medida em um determinado intervalo. Por exemplo, a frequência relativa deste intervalo, observada à partir de uma amostra de medidas, é a aproximação da probabilidade. E a distribuição de frequências é a aproximação da distribuição de probabilidades.

A distribuição é normal quando tem a forma de "sino":

Para achar a área sob a curva normal devemos conhecer dois valores numéricos, a média $ \mu $ e o desvio padrão $ \sigma $. A Figura a seguir mostra algumas áreas importantes:

Quando $ \mu $ e $ \sigma $ são desconhecidos (caso mais comum), estes valores serão estimados por $ \overline{X} $ e $ s $, respectivamente, a partir da amostra, em que $ \overline{X}=\displaystyle\frac{1}{n}\sum_{i=1}^{n}x_i $ e $ s=\sqrt{\displaystyle\frac{1}{n-1}\sum_{i=1}^{n}(x_i-\overline{X})^2} $

Para cada valor de $ \mu $ e/ou $ \sigma $ temos uma curva de distribuição de probabilidade. Porém, para se calcular áreas específicas, faz-se uso de uma distribuição particular: a "distribuição normal padronizada", também chamada de Standartizada ou reduzida, o qual é a distribuição normal com $ \mu=0 $ e $ \sigma=1 $. Para obter tal distribuição, isto é, quando se tem uma variável $ X $ com distribuição normal com média $ \mu $ diferente de $ 0 $ (zero) e/ou desvio padrão $ \sigma $ diferente de $ 1 $ (um), devemos reduzi-la a uma variável $ Z $, efetuando o seguinte cálculo


\[Z=\frac{x-\mu}{\sigma}.\]

 

Assim, a distribuição passa a ter média $ \mu=0 $ e desvio padrão $ \sigma= 1 $. Pelo fato da distribuição ser simétrica em relação à média $ \mu= 0 $, a área à direita é igual a área à esquerda de $ \mu $. Por ser uma distribuição muito usada, existem tabelas a qual encontramos a resolução de suas integrais. Assim, a tabela fornece áreas acima de valores não negativos que vão desde $ 0,00 $ até $ 4,09 $. Veja o gráfico da curva Normal padronizada na Figura abaixo.

Exemplo 6.2.1:  

Calcular a área sob a curva para $ Z $ maior que $ 2,75 $.

A área sob a curva normal para $ Z $ maior do que $ 2,75 $ é dada por


\[\mathbb{P}(Z\geq 2,75)= \int_{2,75}^{\infty}\frac{1}{\sqrt{2\pi}}\exp\left[-\frac{x^2}{2}\right]=1-0,9970=0,003;\]

 

ou seja, a probabilidade de $ Z $ ser maior do que $ 2,75 $ é $ 0,3\% $.

Exemplo 6.2.2:

Determine a área sob a curva de uma normal padronizada para $ z $ entre $ -0,204 $ e $ 1,93 $.

Para este cálculo, precisamos determinar:


\[\mathbb{P}(-0,20 \leq Z\leq 1,93)=\mathbb{P}(Z\leq 1,93)-\mathbb{P}(Z\leq -0,2)=0,9732-0,4207=0,5525.\]

 

Assim, a área que procuramos é $ 0,5525 $.

Exemplo 6.2.3:  

Suponha que a espessura média de arruelas produzidas em uma fábrica tenha distribuição normal com média $ 11,15 $mm e desvio padrão $ 2,238 $mm. Qual a porcentagem de arruelas que tem espessura entre $ 8,70 $mm e $ 14,70 $mm?

Para encontrar a porcentagem de arruelas com a espessura desejada devemos encontrar a área abaixo da curva normal, compreendida entre os pontos $ 8,70 $ e $ 14,70 $mm. 

Para isso, temos que encontrar dois pontos da distribuição normal padronizada.

O primeiro ponto é


\[Z_1 = \frac{8,70 - 11,15 }{2,238} = -1,09.\]

 

A área para valores maiores do que $ -1,09 $ é $ 0,8621 $, ou seja, $ 86,21\% $. Portanto, a área para valores menores do que $ -1,09 $ é de $ 0,1379 $.

O segundo ponto é:


\[Z_2 = \frac{14,70 - 11,15 }{2,238} = 1,58.\]

 

A área para valores maiores do que $ 1,58 $ é $ 0,0571 $, ou seja, $ 5,71\% $Logo, o que procuramos é a área entre $ Z_1 $ e $ Z_2 $, que é dada por


\[1 - (0,1379 + 0,0571) = 1 - 0,195 = 0,8050.\]

Logo, a porcentagem de arruelas com espessura entre $ 8,70 $ e $ 14,70 $ (limites de tolerância da especificação) é de $ 80,50\% $.

Exemplo 6.2.4:

Suponha que o peso médio de $ 800 $ porcos de uma certa fazenda é de $ 64 $kg, e o desvio padrão é de $ 15 $kg. Supondo que este peso seja distribuído de forma normal, quantos porcos pesarão entre $ 42 $kg e $ 73 $kg.

Para resolvermos este problema primeiramente devemos padroniza-lo, ou seja,


\[Z=\frac{x-64}{15} \sim N(0,1).\]

 

Então o valor padronizado de $ 42 $kg é de $ \frac{42-64}{15}\approx -1,47 $ e de $ 73 $kg é de $ 0,6 $.

Assim a probabilidade é de


\[\mathbb{P}(-1,47 \leq Z\leq 0,6)=\mathbb{P}(Z\leq 0,6)-\mathbb{P}(Z\leq -1,47)=0,7257-0,0708=0,6549.\]

 

Portanto, o número aproximado que se espera de porcos entre $ 42 $kg e $ 73 $kg é $ 800\cdot 0,6549\approx 524 $.

Exemplo 6.2.5: 

Suponha que $ X $ siga uma distribuição normal com média $ 0 $ e variância $ 1 $, ou seja, $ X~ \sim ~N(0,1) $. Então $ Y=\sigma X+\mu~\sim ~N(\mu,\sigma^2) $.

De fato,


\[F_Y(y)=\mathbb{P}(Y\leq y)=\mathbb{P}(\sigma X + \mu \leq y)=\mathbb{P}\left(X\leq \frac{y-\mu}{\sigma}\right)=\int_{-\infty}^{y}\frac{1}{\sqrt{2\pi\sigma^2}}exp\{\frac{-(t-\mu)^2}{2\sigma^2}\}dt.\]

 

E portanto, concluímos que $ Y~\sim ~N(\mu,\sigma) $.

Exemplo 6.2.6:

Suponha que $ X $ seja uma variável aleatória tal que $ X~\sim ~N(\mu;\sigma^2) $. Seja $ Y=aX+b $, mostremos que $ Y $ também tem distribuição normal, sabendo que a e b são constantes reais.

De fato,


\[F_Y(y)=\mathbb{P}(Y\leq y)=\mathbb{P}(aX+b\leq y)=\mathbb{P}\left(X\leq\displaystyle \frac{y-b}{a}\right)=\int_{-\infty}^{\frac{y-b}{a}}f_{X}(t)dt\]

 

Fazendo uma mudança de variável; s=at+b temos que $ \frac{dt}{ds}=\frac{1}{a} $ e então


\[F_Y(y)=\int_{-\infty}^{y}\frac{1}{|a|}f_{X}\left(\frac{s-b}{a}\right)ds=\int_{-\infty}^{y}\frac{1}{|a|}\frac{1}{\sqrt{2\pi\sigma^2}}\exp\left[-\frac{1}{2}\left(\frac{\frac{s-b}{a}-\mu}{\sigma}\right)^2\right]ds\]

 

de onde concluímos que


\[F_Y(y)=\int_{-\infty}^{y}\frac{1}{\sqrt{a^2}}\frac{1}{\sqrt{2\pi\sigma^2}}\exp\left[-\frac{1}{2}\left(\frac{s-(a\mu+b)}{a\sigma}\right)^2\right]=\int_{-\infty}^{y}\frac{1}{\sqrt{2\pi a^2\sigma^2}}\exp\left[-\frac{1}{2}\left(\frac{s-(a\mu+b)}{a\sigma}\right)^2\right]\]

 

e, portanto $ Y~\sim ~N[a\mu+b;(a\sigma)^2]. $

 

Probabilidades

Sobre o Portal Action

O Portal Action é mantido pela Estatcamp - Consultoria Estatística e Qualidade, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.

Facebook

CONTATO

  •  Maestro Joao Seppe, 900, São Carlos - SP | CEP 13561-180
  • Telefone: (16) 3376-2047
  • E-Mail: [email protected]