6.3 - Distribuição qui-quadrado

Você está aqui

A distribuição qui-quadrada pode ser interpretada de duas formas, como um caso particular da distribuição gamma, que será analisada mais adiante, ou como sendo a soma de normais padronizadas ao quadrado. Tome $X_i\sim N(0,1)$ então 

\[\sum_{j=1}^{r}X^2_j=\chi^{2}_{r}.\]

 

Esse fato será demonstrado no teorema 6.3.1.

Definição 6.3.1:

Uma variável aleatória contínua $X$ tem distribuição qui-quadrado com $\nu$ graus de liberdade se sua função densidade for dada por:

\[f(x)=\frac{1}{2^{\nu/2}\Gamma(\nu/2)}x^{(v/2)-1}\exp\left(-\frac{x}{2}\right); \ \nu \ > \ 0, \ x \ > \ 0\]

 

sendo $\Gamma(\omega)=\displaystyle\int_0^{\infty}x^{\omega-1}e^{-x}dx, \ \omega \ > \ 0$. Denotamos $X\sim \chi_{\nu}^2$.

O gráfico abaixo mostra a função qui-quadrado com 2 graus de liberdade.

Notemos pelo gráfico da distribuição qui-quadrado que ela é assimétrica e positiva, isto vale para qualquer grau de liberdade. Sua positividade é fácil de ser verificada, pois ela é soma de normais ao quadrado, portanto só pode ser positiva. A distribuição qui-quadrado possui diversas aplicações na inferência estatística. 

Para entender a ideia de graus de liberdade, consideremos um conjunto de dados qualquer. Graus de liberdade é o número de valores deste conjunto de dados que podem variar após terem sido impostas certas restrições a todos os valores. Por exemplo, consideremos que $10$ estudantes obtiveram em um teste média $8,0$. Assim, a soma das $10$ notas deve ser $80$ (restrição). Portanto, neste caso, temos um grau de liberdade de $10-1=9$, pois as nove primeiras notas podem ser escolhidas aleatoriamente, contudo a $10$ª nota deve ser igual a [$80$ - (soma das $9$ primeiras)]. 

Observação 6.3.1: 

Se $X~\sim ~\chi^{2}_{\nu}$, então temos que $X~\sim ~Gamma(\frac{\nu}{2},\frac{1}{2})$, ou seja a distribuição qui-quadrado é um caso particular da distribuição Gama. A distribuição Gama será apresentada no tópico 6.9.

Exemplo 6.3.1: 

Suponha que $y_1, \ldots,y_n$ sejam variáveis aleatórias normais independentes e identicamente distribuídas com média $\mu$ e desvio padrão $\sigma$. Então, temos que a estatística

\[Q_n=\frac{\displaystyle \sum_{i=1}^n(y_i-\overline{y})^2}{\sigma^2}=\frac{(n-1)s^2}{\sigma^2}\]

 

tem distribuição qui-quadrado com $(n-1)$ graus de liberdade, onde $s$ é o desvio padrão amostral.

O número de graus de liberdade de uma soma de quadrados corresponde ao número de elementos independentes na soma de quadrados. Considerando novamente $y_1,\ldots,y_n$ variáveis aleatórias normais independentes e identicamente distribuídas com média $\mu$ e desvio padrão $\sigma$, temos que os elementos da soma de quadrados $y_1-\overline{y},y_2-\overline{y},\ldots,y_n-\overline{y}$ não são todos independentes. Na realidade, somente $(n - 1)$ destes elementos são independentes, implicando que $s$ tem $(n - 1)$ graus de liberdade. Podemos encontrar mais detalhes sobre isso na apostila de inferência

Exemplo 6.3.2:

Suponha agora que $X$ segue uma distribuição qui-quadrado com $17$ graus de liberdade e queremos encontrar $x_1$ e $x_2$ tais que $P(x_1 \leq X \leq x_2)=0,95$. Para isto notemos que

\[\mathbb{P}(x_1 \leq X \leq x_2)=\mathbb{P}(X \leq x_2)-P(X \leq x_1)=0,95\]

 

o que implica que

\[\mathbb{P}(x_1\leq X\leq x_2) = 0,975-0,025=\mathbb{P}(X\leq 30,191)-\mathbb{P}(X\leq 7,564).\]

 

Assim $x_1=7,564$ e $x_2=30,191$.

Observação 6.3.1:

Observamos que poderíamos ter encontrado outros valores de $x_1$ e $x_2$ para os quais $\mathbb{P}(x_1\leq X\leq x_2) = 0,95$, porém, na prática, sempre buscamos por valores de forma que as probabilidade $\mathbb{P}(X \ < \ x_1) =\mathbb{P}(X \ > \ x_2)$.

Exemplo 6.3.3:

Seja $X$ uma variável aleatória com distribuição normal padronizada. Vamos mostrar que $X^2$, segue uma distribuição $\chi^2$ com um grau de liberdade.

Seja $Y=X^2$, então

\[\mathbb{P}(Y\leq y)=\mathbb{P}(-\sqrt{y}\leq X \leq \sqrt{y})=\displaystyle\frac{1}{\sqrt{2\pi}}\int_{-\sqrt{y}}^{\sqrt{y}}e^{-\frac{x^2}{2}}dx=\frac{2}{\sqrt{2\pi}}\int_{0}^{\sqrt{y}}e^{-\frac{x^2}{2}}dx.\]

 

Observe que na última igualdade foi usado o fato da função normal padronizada ser simétrica em torno de zero. Agora basta apenas fazermos uma mudança de variável tomando $t=\sqrt{y}$, então $\displaystyle \frac{dt}{dx}=\displaystyle \frac{t^{-\frac{1}{2}}}{2}$, assim obtemos que:

\[\mathbb{P}(Y\leq y)=\frac{1}{\sqrt{2}\sqrt{\pi}}\int_{0}^{y}t^{-\frac{1}{2}}e^{-\frac{t}{2}}dt.\]

 

Aqui vale uma observação, para mostramos que $Y$ segue uma distribuição qui-quadrado, precisamos usar o fato de que $\Gamma\left(\frac{1}{2}\right)=\sqrt{\pi}$, e portanto a distribuição acima é uma $\chi^2_1$.

Teorema 6.3.1:

Sejam $X_i~\sim ~N(0,1)$ variáveis aleatórias independentes, com $i=1, \cdots , \nu$ e $\nu \in \Bbb{N}$. Então $Z=\displaystyle \sum_{i=1}^{\nu}(X_i)^2$ segue uma distribuição qui-quadrado com $\nu$ graus de liberdade.

Vamos demonstrar este teorema via a função geradora de momentos. Como as variáveis aleatórias $X_1 , \cdots , X_n$ são independentes, temos que

\[M_Z(t)=\mathbb{E}[e^{tZ}]=\mathbb{E}\left(e^{t\left(\sum_{i=1}^{\nu}(X_i)\right)}\right)=\mathbb{E}\left(\prod_{i=1}^{\nu}e^{t(X_i)^2}\right)= \prod_{i=1}^{\nu}\mathbb{E}\left(e^{t(X_i)^2}\right).\]

 

Mas

\[\mathbb{E}\left(e^{t(X_i)^2}\right)=\int e^{tx_i^2}\left(\frac{1}{\sqrt{2\pi}}\right)e^{-(1/2)x_i^2}dx_i=\int \frac{1}{\sqrt{2\pi}}e^{-(1/2)(1-2t)x_i^2}dx_i\]

 

e, portanto,

\[\mathbb{E}\left(e^{t(X_i)^2}\right)=\frac{1}{\sqrt{1-2t}}\int\frac{\sqrt{1-2t}}{\sqrt{2\pi}}e^{-(1/2)(1-2t)x_i^2}dx_i=\left(\frac{1}{1-2t}\right)^{\frac{1}{2}}\]

 

 em que a última integral é igual a 1, pois se trata justamente de uma normal com média zero e variância $1/(1-2t)$. Portanto,

\[\mathbb{E}\left(e^{tZ}\right)\prod_{i=1}^{\nu}\mathbb{E}\left(e^{tX_i}\right)= \prod_{i=1}^{\nu}\frac{1}{\sqrt{1-2t}}=\left(\frac{1}{1-2t}\right)^{\nu/2}.\]

 

corresponde a função geradora de momentos da distribuição qui-quadrado com $\nu$ graus de liberdade. E o resultado segue.

Função Geradora de Momentos, Valor Esperado e Variância

Como visto no Teorema 6.3.1, se $X$ é uma variável aleatória com distribuição qui-quadrado com $\nu$ graus de liberdades, sua função geradora de momentos é dada por:

\[M_X(t)=\mathbb{E}\left(e^{tX}\right)=\left(\frac{1}{1-2t}\right)^{\frac{\nu}{2}}.\]

 

Desta forma, temos que

\[M^\prime_X(t)=\nu\left(\frac{1}{1-2t}\right)^{\frac{\nu+2}{2}}\]

 

e

\[M^{\prime\prime}_X(t)=(\nu^2+2\nu)\left(\frac{1}{1-2t}\right)^{\frac{\nu+4}{2}}.\]

 

Portanto, podemos calcular o valor de esperado e a variância da variável $X$. De fato, temos que 

\[\mathbb{E}\left(X\right)=M^\prime_X(0)=\nu\left(\frac{1}{1}\right)^{\frac{\nu+2}{2}}=\nu\]

 

e

\[\text{Var}\left(X\right)=\mathbb{E}\left(X^2\right)-\mathbb{E}^2\left(X\right)=M^{\prime\prime}_X(0)-(M^\prime_X(0))^2\]

 

de onde concluímos que

\[\text{Var}\left(X\right)=(\nu^2+2\nu)\left(\frac{1}{1}\right)^{\frac{\nu+4}{2}}-\nu^2=\nu^2+2\nu-\nu^2=2\nu.\]

Probabilidades

Sobre o Portal Action

O Portal Action é mantido pela Estatcamp - Consultoria Estatística e Qualidade, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.

Facebook

CONTATO

  •  Maestro Joao Seppe, 900, São Carlos - SP | CEP 13561-180
  • Telefone: (16) 3376-2047
  • E-Mail: [email protected]