5.4 - Distribuição hipergeométrica

Você está aqui

Considere uma população com $N$ objetos nos quais $M$ são classificados como do tipo $A$ e $N-M$ são classificados como do tipo $B$. Por exemplo, em um lote de $100$ ($N$) peças temos $10$ ($M$) peças defeituosas e $90$ ($N-M$) peças conformes. Tomamos uma amostra ao acaso, sem reposição e não ordenada de $n$ objetos. Seja $X$ a variável aleatória que conta o número de objetos classificados como do tipo $A$ na amostra. Então a distribuição de probabilidade de $X$ é dada por:

\[\mathbb{P}\left(X=k\right)=\frac{\left(\begin{array}{c}M\\k\end{array}\right)\left(\begin{array}{c}N-M\\n-k\end{array}\right)}{\left(\begin{array}{c}N\\n\end{array}\right)}\]

 

sendo $k$ inteiro e $\max\{0,n-(N-M)\}\leq k \leq \min\{M,n\}$.

Definição 5.4.1:

Diremos que uma variável aleatória $X$ tem distribuição hipergeométrica de parâmetros $M$, $N$ e $n$ se sua função de probabilidade for dada da maneira acima. Denotamos $X \sim \ \text{Hgeo}(M,N,n)$

Exemplo 5.4.1:

Seja $X$ a variável aleatória que segue o modelo hipergeométrico com parâmetros $N=10$, $M=5$ e $n=4$. Determine a probabilidade $\mathbb{P}(X\leq 1)$.

Para calcular a probabilidade procurada precisamos.

\[\mathbb{P}(X\leq 1)=\mathbb{P}(X=0)+\mathbb{P}(X=1)=\frac{\left(\begin{array}{c}5\\0\end{array}\right) + \left(\begin{array}{c}5\\4\end{array}\right)}{\left(\begin{array}{c}10\\4\end{array}\right)} + \frac{\left(\begin{array}{c}5\\1\end{array}\right)\left(\begin{array}{c}5\\3\end{array}\right)}{\left(\begin{array}{c}10\\4\end{array}\right)}=\frac{5}{210}+\frac{50}{210}\approx 0,2619.\]

 

Exemplo 5.4.2:

Uma empresa fabrica um tipo de tomada que são embalados em lote de $25$ unidades. Para aceitar o lote enviado por essa fábrica, o controle de qualidade da empresa tomou o seguinte procedimento: sorteia-se um lote e desse lote selecionam-se $8$ tomadas para teste, sem reposição. Se for constatado, no máximo, duas tomadas defeituosas, aceita-se o lote fornecido pela fábrica. Se o lote sorteada tiver $7$ peças defeituosas, qual a probabilidade de se aceitar o lote?

 Observamos aqui que o tamanho da população é o tamanho do lote, ou seja, $N=25$,  das quais temos $M = 7$ defeituosas e sorteamos uma amostra de tamanho $n=8$. Então, seja $X$ a variável aleatória que representa o número de peças defeituosas encontradas na amostra. Desta forma $X\sim \ \text{Hgeo}(7, 25, 8)$ e então, a probabilidade de se aceitar o lote é igual a probabilidade de que $X$ seja menor ou igual a $2$, ou seja, 

\[\mathbb{P}\left(\hbox{aceitar o lote}\right)=\mathbb{P}[X\leq 2]=\mathbb{P}(X=0)+\mathbb{P}(X=1)+\mathbb{P}(X=2)\]

 

ou seja,

\[\mathbb{P}\left(\hbox{aceitar o lote}\right)=\frac{\left(\begin{array}{c}7\\0\end{array}\right)\left(\begin{array}{c}25-7\\8-0\end{array}\right)}{\left(\begin{array}{c}25\\8\end{array}\right)}+\frac{\left(\begin{array}{c}7\\1\end{array}\right)\left(\begin{array}{c}25-7\\8-1\end{array}\right)}{\left(\begin{array}{c}25\\8\end{array}\right)}+\frac{\left(\begin{array}{c}7\\2\end{array}\right)\left(\begin{array}{c}25-7\\8-2\end{array}\right)}{\left(\begin{array}{c}25\\8\end{array}\right)}=0,0010069.\]

 

Exemplo 5.4.3:

Suponha que $3$ moedas comemorativas foram colocadas por engano em um cofrinho no qual já haviam algumas moedas comuns, o qual ficou contendo um total de $12$ moedas. Suponha que, devido a dificuldade de tirar as moedas do cofrinho sem quebrá-lo, vamos retirar ao acaso um total de $4$ moedas, qual a probabilidade de retirarmos no mínimo $1$ moeda comemorativa?

Observemos que o modelo hipergeométrico se encaixa bem ao nosso problema com $N=12$, $M=3$ e $n=4$. Seja $X$ a variável aleatória que conta o número de moedas comemorativas retiradas do cofrinho.

Então, estamos interessado no cálculo de $\mathbb{P}(X\geq 1)$ que é dado por

\[\mathbb{P}(X\geq 1)=1-\mathbb{P}(X=0)=1-\frac{\left(\begin{array}{c}3\\0\end{array}\right)\left(\begin{array}{c}9\\4\end{array}\right)}{\left(\begin{array}{c}12\\4\end{array}\right)}\approx 0,7454.\]

 

Exemplo 5.4.4:

Uma urna contém $10$ bolas, das quais $6$ são brancas e $4$ pretas. Suponha que décimos retirar $5$ bolas da urna qual a probabilidade de que das $5$ bolas retiradas $3$ sejam brancas?

Para este problema basta usarmos a distribuição hipergeométrica, com $M=6$, $k=3$, $N=10$ e $n=5$.

\[\mathbb{P}\left(X=3\right)=\frac{\left(\begin{array}{c}6\\3\end{array}\right)\left(\begin{array}{c}4\\2\end{array}\right)}{\left(\begin{array}{c}10\\5\end{array}\right)}=\frac{10}{21}.\]

 

Exemplo 5.4.5: 

Vamos mostrar que quando a população é muito grande a distribuição hipergeométrica converge para uma binomial, ou seja, se $X\sim \ \text{Hgeo}(M,N,n)$, então

\[\lim_{N\rightarrow \infty}\mathbb{P}\left(X=k\right) = \left(\begin{array}{c}n\\k\end{array}\right)p^k(1-p)^{n-k}\]

 

em que $p = M/N$.

De fato,

\[\mathbb{P}\left(X=k\right)=\frac{\left(\begin{array}{c}M\\x\end{array}\right)\left(\begin{array}{c}N-M\\n-k\end{array}\right)}{\left(\begin{array}{c}N\\n\end{array}\right)}=\frac{M!}{k!(M-k)!}\frac{(N-M)!}{(n-k)!(N-M-n+k)!}\frac{n!(N-n)!}{N!}\]

 

de onde segue que

\[\mathbb{P}\left(X=k\right)=\frac{n!}{k!(n-k)!}\frac{M!}{(M-k)!}\frac{(N-M)!}{(N-M-n+k)!}\frac{(N-n)!}{N!}\]

 

e daí

\[\mathbb{P}\left(X=k\right)=\left(\begin{array}{c}n\\k\end{array}\right)\frac{[M(M-1)\cdots (M-k+1)][(N-M)(N-M-1)\cdots (N-M-n+k+1)]}{N(N-1)\cdots (N-n+1)}.\]

 

Portanto,

\[\mathbb{P}\left(X=k\right)=\left(\begin{array}{c}n\\k\end{array}\right)\frac{\left[\left(\frac{M}{N}\right)\left(\frac{M-1}{N}\right)\cdots\left(\frac{M-k+1}{N}\right)\right]\left[\left(\frac{N-M}{N}\right)\left(\frac{N-M-1}{N}\right)\cdots\left(\frac{N-M-n+k+1}{N}\right)\right]}{\left(\frac{N}{N}\right)\left(\frac{N-1}{N}\right)\left(\frac{N-1}{N}\right)\cdots\left(\frac{N-n+1}{N}\right)}.\]

 

Assim, tomando $p=M/N$. Temos que

\[\mathbb{P}\left(X=k\right)=\left(\begin{array}{c}n\\k\end{array}\right)\frac{\left[p\left(p-\frac{1}{N}\right)\cdots\left(p-\frac{k-1}{N}\right)\right]\left[(1-p)\left(1-p-\frac{1}{N}\right)\cdots\left(1-p-\frac{n-k-1}{N}\right)\right]}{\left(1-\frac{1}{N}\right)\cdots\left(1-\frac{n-1}{N}\right)}\]

 

e, tomando o limite em N, temos que

\[\lim_{N\rightarrow \infty}\mathbb{P}\left(X=k\right)=\lim_{N \rightarrow \infty}\left(\begin{array}{c}n\\k\end{array}\right)\frac{\left[p\left(p-\frac{1}{N}\right)\cdots\left(p-\frac{k-1}{N}\right)\right]\left[(1-p)\left(1-p-\frac{1}{N}\right)\left(1-p-\frac{n-k-1}{N}\right)\right]}{\left(1-\frac{1}{N}\right)\cdots\left(1-\frac{n-1}{N}\right)}.\]

 

de onde podemos concluir que

\[\lim_{N\rightarrow\infty}\mathbb{P}\left(X=k\right)=\left(\begin{array}{c}n\\k\end{array}\right) \frac{p^k (1-p)^{n-k}}{1^n}=\left(\begin{array}{c}n\\k\end{array}\right) p^k (1-p)^{n-k}.\]

 

Função Geradora de Momentos, Valor Esperado e Variância

A função geradora de momentos da hipergeométrica existe, mas ela é escrita dependendo de uma função introduzida por Gauss conhecida como função hipergeométrica. Essa função é a solução da seguinte equação diferencial:

\[x(x-1)\frac{d^2}{dx^2}y + [(a+b+1)x-c]\frac{d}{dx}y+aby=0.\]

 

A função hipergeométrica é dada por:

\[F(a,b,c,x)=1+\frac{ab}{c}x+\frac{a(a+1)b(b+1)}{2c(c+1)}x^2+\frac{a(a+1)(a+2)b(b+1)(b+2)}{6c(c+1)(c+2)}x^3\cdots\]

 

que pode ser escrita como

\[F(a,b,c,x)=1+ \sum_{i=0}^{\infty}\frac{(a+i)!(b+i)!c!}{i!(a-1)!(b-1)!(c+i)!}x^{i+1}.\]

 

Assim a função geradora de momentos da distribuição hipergeométrica é dada por:

\[M_X(t)=\sum_{i=0}^{n}e^{ti}\frac{\left(\begin{array}{c}M\\k\end{array}\right)\left(\begin{array}{c}N-M\\n-k\end{array}\right)}{\left(\begin{array}{c}N\\n\end{array}\right)}=\frac{\left(\begin{array}{c}N-M\\n\end{array}\right)F(-n,-M,N-M-n+1,e^t)}{\left(\begin{array}{c}N\\n\end{array}\right)}.\]

 

O valor esperado de uma variável aleatória $X$ com distribuição hipergeométrica com parâmetros $N$, $M$ e $n$ é dado por

\[\mathbb{E}\left(X\right)=\sum_{k=0}^{n}kP[X=k]=\sum_{k=0}^{n}k\frac{\left(\begin{array}{c}M\\k\end{array}\right)\left(\begin{array}{c}N-M\\n-k\end{array}\right)}{\left(\begin{array}{c}N\\n\end{array}\right)}=\sum_{k=0}^{n}\frac{kM!}{k!(M-k)!}\frac{n!(N-n)!}{N!}\left(\begin{array}{c}N-M\\n-k\end{array}\right)\]

\[\mathbb{E}\left(X\right)=\sum_{k=0}^{n}\left(\begin{array}{c}N-M\\n-k\end{array}\right) \frac{M(M-1)!}{(k-1)!(M-k)!}\frac{n(n-1)!(N-n)!}{N(N-1)!}=\frac{nM}{N}\sum_{k=1}^{n}\frac{\left(\begin{array}{c}N-M\\n-k\end{array}\right)\left(\begin{array}{c}M-1\\k-1\end{array}\right)}{\left(\begin{array}{c}N-1\\n-1\end{array}\right)}\]

 

Portanto,

\[\mathbb{E}\left(X\right)=\frac{nM}{N}\frac{1}{\left(\begin{array}{c}N-1\\n-1\end{array}\right)}\sum_{k=1}^{n}\left(\begin{array}{c}N-k\\n-k\end{array}\right)\left(\begin{array}{c}M-1\\k-1\end{array}\right)\]

 

e, assim,

\[\mathbb{E}\left(X\right)=\frac{nM}{N}\frac{1}{\left(\begin{array}{c}N-1\\n-1\end{array}\right)}\sum_{k=0}^{n-1}\left(\begin{array}{c}N-k\\n-k-1\end{array}\right)\left(\begin{array}{c}M-1\\k\end{array}\right)=\frac{nM}{N}\frac{\left(\begin{array}{c}N-1\\n-1\end{array}\right)}{\left(\begin{array}{c}N-1\\n-1\end{array}\right)}=n\frac{M}{N}.\]

 

Vamos agora calcular a variância.

\[\mathbb{E}\left(X^2\right)=\sum_{k=0}^{n}k^2\mathbb{P}\left(X=k\right)=\sum_{k=0}^{n}[k(k-1)+k]\mathbb{P}\left(X=k\right)=\sum_{k=0}^{n}x(x-1)\mathbb{P}\left(X=k\right)+\sum_{k=0}^{n}x\mathbb{P}\left(X=k\right)=\]

\[\sum_{k=0}^{n}x(x-1)\frac{\left(\begin{array}{c}M\\k\end{array}\right)\left(\begin{array}{c}N-k\\n-k\end{array}\right)}{\left(\begin{array}{c}N\\n\end{array}\right)}+\mathbb{E}\left(X\right)=\]

\[\sum_{k=2}^{n}k(k-1)\frac{M(M-1)(M-2)!}{k(k-1)(k-2)!(M-k)!}\left(\begin{array}{c}N-M\\n-x\end{array}\right)\frac{n(n-1)(n-2)!(N-n)!}{N(N-1)(N-2)!}+\mathbb{E}\left(X\right)=\]

\[\sum_{k=2}^{n}\frac{M(M-1)n(n-1)}{N(N-1)}\frac{\left(\begin{array}{c}M-2\\k-2\end{array}\right)\left(\begin{array}{c}N-k\\n-k\end{array}\right)}{\left(\begin{array}{c}N-2\\n-2\end{array}\right)}+\mathbb{E}\left(X\right)=\]

\[\frac{M(M-1)n(n-1)}{N(N-1)}\frac{1}{\left(\begin{array}{c}N-2\\n-2\end{array}\right)}\sum_{k=2}^{n}\left(\begin{array}{c}M-2\\k-2\end{array}\right)\left(\begin{array}{c}N-k\\n-k\end{array}\right)+\mathbb{E}\left(X\right)=\]

\[\frac{M(M-1)n(n-1)}{N(N-1)}\frac{1}{\left(\begin{array}{c}N-2\\n-2\end{array}\right)}\sum_{k=0}^{n-2}\left(\begin{array}{c}M-2\\k\end{array}\right)\left(\begin{array}{c}N-k\\n-k-2\end{array}\right)+\mathbb{E}\left(X\right)=\]

\[\frac{M(M-1)n(n-1)}{N(N-1)}\frac{\left(\begin{array}{c}N-2\\n-2\end{array}\right)}{\left(\begin{array}{c}N-2\\n-2\end{array}\right)}+\mathbb{E}\left(X\right)=\frac{M(M-1)n(n-1)}{N(N-1)}+\mathbb{E}\left(X\right)=\frac{M(M-1)n(n-1)}{N(N-1)}+\frac{nM}{N}.\]

 

Então, a variância é dada por

\[\text{Var}\left(X\right)=\mathbb{E}\left(X^2\right)-\mathbb{E}^2\left(X\right)=\frac{M(M-1)n(n-1)}{N(N-1)}+\frac{nM}{N}-\left(\frac{nM}{N}\right)^2=n\frac{M}{N}\frac{(N-M)}{N}\left(1-\frac{n-1}{N-1}\right)\]

Probabilidades

Sobre o Portal Action

O Portal Action é mantido pela Estatcamp - Consultoria Estatística e Qualidade, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.

Facebook

CONTATO

  •  Maestro Joao Seppe, 900, São Carlos - SP | CEP 13561-180
  • Telefone: (16) 3376-2047
  • E-Mail: [email protected]