5.4 - Distribuição hipergeométrica

Você está aqui

Considere uma população com $ N $ objetos nos quais $ M $ são classificados como do tipo $ A $ e $ N-M $ são classificados como do tipo $ B $. Por exemplo, em um lote de $ 100 $ ($ N $) peças temos $ 10 $ ($ M $) peças defeituosas e $ 90 $ ($ N-M $) peças conformes. Tomamos uma amostra ao acaso, sem reposição e não ordenada de $ n $ objetos. Seja $ X $ a variável aleatória que conta o número de objetos classificados como do tipo $ A $ na amostra. Então a distribuição de probabilidade de $ X $ é dada por:


\[\mathbb{P}\left(X=k\right)=\frac{\left(\begin{array}{c}M\\k\end{array}\right)\left(\begin{array}{c}N-M\\n-k\end{array}\right)}{\left(\begin{array}{c}N\\n\end{array}\right)}\]

 

sendo $ k $ inteiro e $ \max\{0,n-(N-M)\}\leq k \leq \min\{M,n\} $.

Definição 5.4.1:

Diremos que uma variável aleatória $ X $ tem distribuição hipergeométrica de parâmetros $ M $, $ N $ e $ n $ se sua função de probabilidade for dada da maneira acima. Denotamos $ X \sim \ \text{Hgeo}(M,N,n) $

Exemplo 5.4.1:

Seja $ X $ a variável aleatória que segue o modelo hipergeométrico com parâmetros $ N=10 $, $ M=5 $ e $ n=4 $. Determine a probabilidade $ \mathbb{P}(X\leq 1) $.

Para calcular a probabilidade procurada precisamos.


\[\mathbb{P}(X\leq 1)=\mathbb{P}(X=0)+\mathbb{P}(X=1)=\frac{\left(\begin{array}{c}5\\0\end{array}\right) + \left(\begin{array}{c}5\\4\end{array}\right)}{\left(\begin{array}{c}10\\4\end{array}\right)} + \frac{\left(\begin{array}{c}5\\1\end{array}\right)\left(\begin{array}{c}5\\3\end{array}\right)}{\left(\begin{array}{c}10\\4\end{array}\right)}=\frac{5}{210}+\frac{50}{210}\approx 0,2619.\]

 

Exemplo 5.4.2:

Uma empresa fabrica um tipo de tomada que são embalados em lote de $ 25 $ unidades. Para aceitar o lote enviado por essa fábrica, o controle de qualidade da empresa tomou o seguinte procedimento: sorteia-se um lote e desse lote selecionam-se $ 8 $ tomadas para teste, sem reposição. Se for constatado, no máximo, duas tomadas defeituosas, aceita-se o lote fornecido pela fábrica. Se o lote sorteada tiver $ 7 $ peças defeituosas, qual a probabilidade de se aceitar o lote?

 Observamos aqui que o tamanho da população é o tamanho do lote, ou seja, $ N=25 $,  das quais temos $ M = 7 $ defeituosas e sorteamos uma amostra de tamanho $ n=8 $. Então, seja $ X $ a variável aleatória que representa o número de peças defeituosas encontradas na amostra. Desta forma $ X\sim \ \text{Hgeo}(7, 25, 8) $ e então, a probabilidade de se aceitar o lote é igual a probabilidade de que $ X $ seja menor ou igual a $ 2 $, ou seja, 


\[\mathbb{P}\left(\hbox{aceitar o lote}\right)=\mathbb{P}[X\leq 2]=\mathbb{P}(X=0)+\mathbb{P}(X=1)+\mathbb{P}(X=2)\]

 

ou seja,


\[\mathbb{P}\left(\hbox{aceitar o lote}\right)=\frac{\left(\begin{array}{c}7\\0\end{array}\right)\left(\begin{array}{c}25-7\\8-0\end{array}\right)}{\left(\begin{array}{c}25\\8\end{array}\right)}+\frac{\left(\begin{array}{c}7\\1\end{array}\right)\left(\begin{array}{c}25-7\\8-1\end{array}\right)}{\left(\begin{array}{c}25\\8\end{array}\right)}+\frac{\left(\begin{array}{c}7\\2\end{array}\right)\left(\begin{array}{c}25-7\\8-2\end{array}\right)}{\left(\begin{array}{c}25\\8\end{array}\right)}=0,0010069.\]

 

Exemplo 5.4.3:

Suponha que $ 3 $ moedas comemorativas foram colocadas por engano em um cofrinho no qual já haviam algumas moedas comuns, o qual ficou contendo um total de $ 12 $ moedas. Suponha que, devido a dificuldade de tirar as moedas do cofrinho sem quebrá-lo, vamos retirar ao acaso um total de $ 4 $ moedas, qual a probabilidade de retirarmos no mínimo $ 1 $ moeda comemorativa?

Observemos que o modelo hipergeométrico se encaixa bem ao nosso problema com $ N=12 $, $ M=3 $ e $ n=4 $Seja $ X $ a variável aleatória que conta o número de moedas comemorativas retiradas do cofrinho.

Então, estamos interessado no cálculo de $ \mathbb{P}(X\geq 1) $ que é dado por


\[\mathbb{P}(X\geq 1)=1-\mathbb{P}(X=0)=1-\frac{\left(\begin{array}{c}3\\0\end{array}\right)\left(\begin{array}{c}9\\4\end{array}\right)}{\left(\begin{array}{c}12\\4\end{array}\right)}\approx 0,7454.\]

 

Exemplo 5.4.4:

Uma urna contém $ 10 $ bolas, das quais $ 6 $ são brancas e $ 4 $ pretas. Suponha que décimos retirar $ 5 $ bolas da urna qual a probabilidade de que das $ 5 $ bolas retiradas $ 3 $ sejam brancas?

Para este problema basta usarmos a distribuição hipergeométrica, com $ M=6 $, $ k=3 $, $ N=10 $ e $ n=5 $.


\[\mathbb{P}\left(X=3\right)=\frac{\left(\begin{array}{c}6\\3\end{array}\right)\left(\begin{array}{c}4\\2\end{array}\right)}{\left(\begin{array}{c}10\\5\end{array}\right)}=\frac{10}{21}.\]

 

Exemplo 5.4.5: 

Vamos mostrar que quando a população é muito grande a distribuição hipergeométrica converge para uma binomial, ou seja, se $ X\sim \ \text{Hgeo}(M,N,n) $, então


\[\lim_{N\rightarrow \infty}\mathbb{P}\left(X=k\right) = \left(\begin{array}{c}n\\k\end{array}\right)p^k(1-p)^{n-k}\]

 

em que $ p = M/N $.

De fato,


\[\mathbb{P}\left(X=k\right)=\frac{\left(\begin{array}{c}M\\x\end{array}\right)\left(\begin{array}{c}N-M\\n-k\end{array}\right)}{\left(\begin{array}{c}N\\n\end{array}\right)}=\frac{M!}{k!(M-k)!}\frac{(N-M)!}{(n-k)!(N-M-n+k)!}\frac{n!(N-n)!}{N!}\]

 

de onde segue que


\[\mathbb{P}\left(X=k\right)=\frac{n!}{k!(n-k)!}\frac{M!}{(M-k)!}\frac{(N-M)!}{(N-M-n+k)!}\frac{(N-n)!}{N!}\]

 

e daí


\[\mathbb{P}\left(X=k\right)=\left(\begin{array}{c}n\\k\end{array}\right)\frac{[M(M-1)\cdots (M-k+1)][(N-M)(N-M-1)\cdots (N-M-n+k+1)]}{N(N-1)\cdots (N-n+1)}.\]

 

Portanto,


\[\mathbb{P}\left(X=k\right)=\left(\begin{array}{c}n\\k\end{array}\right)\frac{\left[\left(\frac{M}{N}\right)\left(\frac{M-1}{N}\right)\cdots\left(\frac{M-k+1}{N}\right)\right]\left[\left(\frac{N-M}{N}\right)\left(\frac{N-M-1}{N}\right)\cdots\left(\frac{N-M-n+k+1}{N}\right)\right]}{\left(\frac{N}{N}\right)\left(\frac{N-1}{N}\right)\left(\frac{N-1}{N}\right)\cdots\left(\frac{N-n+1}{N}\right)}.\]

 

Assim, tomando $ p=M/N $. Temos que


\[\mathbb{P}\left(X=k\right)=\left(\begin{array}{c}n\\k\end{array}\right)\frac{\left[p\left(p-\frac{1}{N}\right)\cdots\left(p-\frac{k-1}{N}\right)\right]\left[(1-p)\left(1-p-\frac{1}{N}\right)\cdots\left(1-p-\frac{n-k-1}{N}\right)\right]}\left(1-\frac{1}{N}\right)\cdots\left(1-\frac{n-1}{N}\right)}\]

 

e, tomando o limite em N, temos que


\[\lim_{N\rightarrow \infty}\mathbb{P}\left(X=k\right)=\lim_{N \rightarrow \infty}\left(\begin{array}{c}n\\k\end{array}\right)\frac{\left[p\left(p-\frac{1}{N}\right)\cdots\left(p-\frac{k-1}{N}\right)\right]\left[(1-p)\left(1-p-\frac{1}{N}\right)\left(1-p-\frac{n-k-1}{N}\right)\right]}{\left(1-\frac{1}{N}\right)\cdots\left(1-\frac{n-1}{N}\right)}.\]

 

de onde podemos concluir que


\[\lim_{N\rightarrow\infty}\mathbb{P}\left(X=k\right)=\left(\begin{array}{c}n\\k\end{array}\right) \frac{p^k (1-p)^{n-k}}{1^n}=\left(\begin{array}{c}n\\k\end{array}\right) p^k (1-p)^{n-k}.\]

 

Função Geradora de Momentos, Valor Esperado e Variância

A função geradora de momentos da hipergeométrica existe, mas ela é escrita dependendo de uma função introduzida por Gauss conhecida como função hipergeométrica. Essa função é a solução da seguinte equação diferencial:


\[x(x-1)\frac{d^2}{dx^2}y + [(a+b+1)x-c]\frac{d}{dx}y+aby=0.\]

 

A função hipergeométrica é dada por:


\[F(a,b,c,x)=1+\frac{ab}{c}x+\frac{a(a+1)b(b+1)}{2c(c+1)}x^2+\frac{a(a+1)(a+2)b(b+1)(b+2)}{6c(c+1)(c+2)}x^3\cdots\]

 

que pode ser escrita como


\[F(a,b,c,x)=1+ \sum_{i=0}^{\infty}\frac{(a+i)!(b+i)!c!}{i!(a-1)!(b-1)!(c+i)!}x^{i+1}.\]

 

Assim a função geradora de momentos da distribuição hipergeométrica é dada por:


\[M_X(t)=\sum_{i=0}^{n}e^{ti}\frac{\left(\begin{array}{c}M\\k\end{array}\right)\left(\begin{array}{c}N-M\\n-k\end{array}\right)}{\left(\begin{array}{c}N\\n\end{array}\right)}=\frac{\left(\begin{array}{c}N-M\\n\end{array}\right)F(-n,-M,N-M-n+1,e^t)}{\left(\begin{array}{c}N\\n\end{array}\right)}.\]

 

O valor esperado de uma variável aleatória $ X $ com distribuição hipergeométrica com parâmetros $ N $, $ M $ e $ n $ é dado por


\[\mathbb{E}\left(X\right)=\sum_{k=0}^{n}kP[X=k]=\sum_{k=0}^{n}k\frac{\left(\begin{array}{c}M\\k\end{array}\right)\left(\begin{array}{c}N-M\\n-k\end{array}\right)}{\left(\begin{array}{c}N\\n\end{array}\right)}=\sum_{k=0}^{n}\frac{kM!}{k!(M-k)!}\frac{n!(N-n)!}{N!}\left(\begin{array}{c}N-M\\n-k\end{array}\right)\]


\[\mathbb{E}\left(X\right)=\sum_{k=0}^{n}\left(\begin{array}{c}N-M\\n-k\end{array}\right) \frac{M(M-1)!}{(k-1)!(M-k)!}\frac{n(n-1)!(N-n)!}{N(N-1)!}=\frac{nM}{N}\sum_{k=1}^{n}\frac{\left(\begin{array}{c}N-M\\n-k\end{array}\right)\left(\begin{array}{c}M-1\\k-1\end{array}\right)}{\left(\begin{array}{c}N-1\\n-1\end{array}\right)}\]

 

Portanto,


\[\mathbb{E}\left(X\right)=\frac{nM}{N}\frac{1}{\left(\begin{array}{c}N-1\\n-1\end{array}\right)}\sum_{k=1}^{n}\left(\begin{array}{c}N-k\\n-k\end{array}\right)\left(\begin{array}{c}M-1\\k-1\end{array}\right)\]

 

e, assim,


\[\mathbb{E}\left(X\right)=\frac{nM}{N}\frac{1}{\left(\begin{array}{c}N-1\\n-1\end{array}\right)}\sum_{k=0}^{n-1}\left(\begin{array}{c}N-k\\n-k-1\end{array}\right)\left(\begin{array}{c}M-1\\k\end{array}\right)=\frac{nM}{N}\frac{\left(\begin{array}{c}N-1\\n-1\end{array}\right)}{\left(\begin{array}{c}N-1\\n-1\end{array}\right)}=n\frac{M}{N}.\]

 

Vamos agora calcular a variância.


\[\mathbb{E}\left(X^2\right)=\sum_{k=0}^{n}k^2\mathbb{P}\left(X=k\right)=\sum_{k=0}^{n}[k(k-1)+k]\mathbb{P}\left(X=k\right)=\sum_{k=0}^{n}x(x-1)\mathbb{P}\left(X=k\right)+\sum_{k=0}^{n}x\mathbb{P}\left(X=k\right)=\]


\[\sum_{k=0}^{n}x(x-1)\frac{\left(\begin{array}{c}M\\k\end{array}\right)\left(\begin{array}{c}N-k\\n-k\end{array}\right)}{\left(\begin{array}{c}N\\n\end{array}\right)}+\mathbb{E}\left(X\right)=\]


\[\sum_{k=2}^{n}k(k-1)\frac{M(M-1)(M-2)!}{k(k-1)(k-2)!(M-k)!}\left(\begin{array}{c}N-M\\n-x\end{array}\right)\frac{n(n-1)(n-2)!(N-n)!}{N(N-1)(N-2)!}+\mathbb{E}\left(X\right)=\]


\[\sum_{k=2}^{n}\frac{M(M-1)n(n-1)}{N(N-1)}\frac{\left(\begin{array}{c}M-2\\k-2\end{array}\right)\left(\begin{array}{c}N-k\\n-k\end{array}\right)}{\left(\begin{array}{c}N-2\\n-2\end{array}\right)}+\mathbb{E}\left(X\right)=\]


\[\frac{M(M-1)n(n-1)}{N(N-1)}\frac{1}{\left(\begin{array}{c}N-2\\n-2\end{array}\right)}\sum_{k=2}^{n}\left(\begin{array}{c}M-2\\k-2\end{array}\right)\left(\begin{array}{c}N-k\\n-k\end{array}\right)+\mathbb{E}\left(X\right)=\]


\[\frac{M(M-1)n(n-1)}{N(N-1)}\frac{1}{\left(\begin{array}{c}N-2\\n-2\end{array}\right)}\sum_{k=0}^{n-2}\left(\begin{array}{c}M-2\\k\end{array}\right)\left(\begin{array}{c}N-k\\n-k-2\end{array}\right)+\mathbb{E}\left(X\right)=\]


\[\frac{M(M-1)n(n-1)}{N(N-1)}\frac{\left(\begin{array}{c}N-2\\n-2\end{array}\right)}{\left(\begin{array}{c}N-2\\n-2\end{array}\right)}+\mathbb{E}\left(X\right)=\frac{M(M-1)n(n-1)}{N(N-1)}+\mathbb{E}\left(X\right)=\frac{M(M-1)n(n-1)}{N(N-1)}+\frac{nM}{N}.\]

 

Então, a variância é dada por


\[\text{Var}\left(X\right)=\mathbb{E}\left(X^2\right)-\mathbb{E}^2\left(X\right)=\frac{M(M-1)n(n-1)}{N(N-1)}+\frac{nM}{N}-\left(\frac{nM}{N}\right)^2=n\frac{M}{N}\frac{(N-M)}{N}\left(1-\frac{n-1}{N-1}\right)\]

Probabilidades

Sobre o Portal Action

O Portal Action é mantido pela Estatcamp - Consultoria Estatística e Qualidade, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.

Facebook

CONTATO

  •  Maestro Joao Seppe, 900, São Carlos - SP | CEP 13561-180
  • Telefone: (16) 3376-2047
  • E-Mail: [email protected]