Skip to main content

6.3 - Distribuição qui-quadrado

A distribuição qui-quadrada pode ser interpretada de duas forma, como um caso particular da distribuição gamma, que será analisada mais adiante, ou como sendo a soma de normais padronizada ao quadrado. Tomamos, tome $ X_i\sim N(0,1) $ então 

\[\sum_{j=1}^{r}X^2_j=\chi^{2}_{r}.\]

Esse fato será demonstrado no teorema 6.3.1.

 

Definição 6.3.1: Uma variável aleatória contínua $ X $ tem distribuição qui-quadrado com $ \nu $ graus de liberdade se sua função densidade for dada por:

\[f(x)=\frac{1}{2^{\nu/2}\Gamma(\nu/2)}x^{(v/2)-1}\exp\left(-\frac{x}{2}\right); \ \nu \ \textgreater \ 0, \ x \ \textgreater \ 0\]

sendo $ \Gamma(\omega)=\displaystyle\int_0^{\infty}x^{\omega-1}e^{-x}dx, \ \omega \ \textgreater \ 0 $. Denotamos $ X\sim \chi_{\nu}^2 $.

 

O gráfico abaixo mostra a função qui-quadrado com 2 graus de liberdade.

Notemos pelo gráfico da distribuição qui-quadrado que ela é assimétrica e positiva, isto vale para qualquer grau de liberdade. Sua positividade é fácil de ser verificada, pois ela é soma de normais ao quadrado, portanto só pode ser positiva. A distribuição qui-quadrado possui diversas aplicações na inferência estatística. 

Para entender a ideia de graus de liberdade, consideremos um conjunto de dados qualquer. Graus de liberdade é o número de valores deste conjunto de dados que podem variar após terem sido impostas certas restrições a todos os valores. Por exemplo, consideremos que $ 10 $ estudantes obtiveram em um teste média $ 8,0 $. Assim, a soma das $ 10 $ notas deve ser $ 80 $ (restrição). Portanto, neste caso, temos um grau de liberdade de $ 10-1=9 $, pois as nove primeiras notas podem ser escolhidas aleatoriamente, contudo a $ 10 $ª nota deve ser igual a [$ 80 $ - (soma das $ 9 $ primeiras)]. 

Observação 6.3.1: Se $ X~\sim ~\chi^{2}_{\nu} $, então temos que $ X~\sim ~Gamma(\frac{\nu}{2},\frac{1}{2}) $, ou seja a distribuição qui-quadrado é um caso particular da distribuição Gama. A distribuição Gama será apresentada no tópico 6.9.

Exemplo 6.3.1: Suponha que $ y_1, \ldots,y_n $ sejam variáveis aleatórias normais independentes e identicamente distribuídas com média $ \mu $ e desvio padrão $ \sigma $. Então, temos que a estatística

\[Q_n=\frac{\displaystyle \sum_{i=1}^n(y_i-\overline{y})^2}{\sigma^2}=\frac{(n-1)s^2}{\sigma^2}\]

tem distribuição qui-quadrado com $ (n-1) $ graus de liberdade, onde $ s $ é o desvio padrão amostral.

O número de graus de liberdade de uma soma de quadrados corresponde ao número de elementos independentes na soma de quadrados. Considerando novamente $ y_1,\ldots,y_n $ variáveis aleatórias normais independentes e identicamente distribuídas com média $ \mu $ e desvio padrão $ \sigma $, temos que os elementos da soma de quadrados $ y_1-\overline{y},y_2-\overline{y},\ldots,y_n-\oveline{y} $ não são todos independentes. Na realidade, somente $ (n - 1) $ destes elementos são independentes, implicando que $ s $ tem $ (n - 1) $ graus de liberdade. Podemos encontrar mais detalhes sobre isso na apostila de inferência

 

Exemplo 6.3.2: Suponha agora que $ X $ segue uma distribuição qui-quadrado com $ 17 $ graus de liberdade e queremos encontrar $ x_1 $ e $ x_2 $ tais que $ P(x_1 \leq X \leq x_2)=0,95 $. Para isto notemos que

\[\mathbb{P}(x_1 \leq X \leq x_2)=\mathbb{P}(X \leq x_2)-P(X \leq x_1)=0,95\]

o que implica que

\[\mathbb{P}(x_1\leq X\leq x_2) = 0,975-0,025=\mathbb{P}(X\leq 30,191)-\mathbb{P}(X\leq 7,564).\]

Assim $ x_1=7,564 $ e $ x_2=30,191 $.

 

Observação 6.3.1: Observamos que poderíamos ter encontrado outros valores de $ x_1 $ e $ x_2 $ para os quais $ \mathbb{P}(x_1\leq X\leq x_2) = 0,95 $, porém, na prática, sempre buscamos por valores de forma que as probabilidade $ \mathbb{P}(X \ \textless \ x_1) =\mathbb{P}(X \ \textgreater \ x_2) $.

 

Exemplo 6.3.3: Seja $ X $ uma variável aleatória com distribuição normal padronizada. Vamos mostrar que $ X^2 $, segue uma distribuição $ \chi^2 $ com um grau de liberdade.

Seja $ Y=X^2 $, então

\[\mathbb{P}(Y\leq y)=\mathbb{P}(-\sqrt{y}\leq X \leq \sqrt{y})=\displaystyle\frac{1}{\sqrt{2\pi}}\int_{-\sqrt{y}}^{\sqrt{y}}e^{-\frac{x^2}{2}}dx=\frac{2}{\sqrt{2\pi}}\int_{0}^{\sqrt{y}}e^{-\frac{x^2}{2}}dx.\]

Observe que na última igualdade foi usado o fato da função normal padronizada ser simétrica em torno de zero. Agora basta apenas fazermos uma mudança de variável tomando $ t=\sqrt{y} $, então $ \displaystyle \frac{dt}{dx}=\displaystyle \frac{t^{-\frac{1}{2}}}{2} $, assim obtemos que:

\[\mathbb{P}(Y\leq y)=\frac{1}{\sqrt{2}\sqrt{\pi}}\int_{0}^{y}t^{-\frac{1}{2}}e^{-\frac{t}{2}}dt.\]

Aqui vale uma observação, para mostramos que $ Y $ segue uma distribuição qui-quadrado, precisamos usar o fato de que $ \Gamma\left(\frac{1}{2}\right)=\sqrt{\pi} $, e portanto a distribuição acima é uma $ \chi^2_1 $.

 

Teorema 6.3.1: Sejam $ X_i~\sim ~N(0,1) $ variáveis aleatórias independentes, com $ i=1, \cdots , \nu $ e $ \nu \in \Bbb{N} $. Então $ Z=\displaystyle \sum_{i=1}^{\nu}(X_i)^2 $ segue uma distribuição qui-quadrado com $ \nu $ graus de liberdade.

Vamos demonstrar este teorema via a função geradora de momentos. Como as variáveis aleatórias $ X_1 , \cdots , X_n $ são independentes, temos que

\[M_Z(t)=\mathbb{E}[e^{tZ}]=\mathbb{E}\left(e^{t\left(\sum_{i=1}^{\nu}(X_i)\right)}\right)=\mathbb{E}\left(\prod_{i=1}^{\nu}e^{t(X_i)^2}\right)= \prod_{i=1}^{\nu}\mathbb{E}\left(e^{t(X_i)^2}\right).\]

Mas

\[\mathbb{E}\left(e^{t(X_i)^2}\right)=\int e^{tx_i^2}\left(\frac{1}{\sqrt{2\pi}}\right)e^{-(1/2)x_i^2}dx_i=\int \frac{1}{\sqrt{2\pi}}e^{-(1/2)(1-2t)x_i^2}dx_i\]

e, portanto,

\[\mathbb{E}\left(e^{t(X_i)^2}\right)=\frac{1}{\sqrt{1-2t}}\int\frac{\sqrt{1-2t}}{\sqrt{2\pi}}e^{-(1/2)(1-2t)x_i^2}dx_i=\left(\frac{1}{1-2t}\right)^{\frac{1}{2}}\]

 em que a última integral é igual a 1, pois se trata justamente de uma normal com média zero e variância $ 1/(1-2t) $. Portanto,

\[\mathbb{E}\left(e^{tZ}\right)\prod_{i=1}^{\nu}\mathbb{E}\left(e^{tX_i}\right)= \prod_{i=1}^{\nu}\frac{1}{\sqrt{1-2t}}=\left(\frac{1}{1-2t}\right)^{\nu/2}.\]

corresponde a função geradora de momentos da distribuição qui-quadrado com $ \nu $ graus de liberdade. E o resultado segue.

 

Função Geradora de Momentos, Valor Esperado e Variância

 

Como visto no Teorema 6.3.1, se $ X $ é uma variável aleatória com distribuição qui-quadrado com $ \nu $ graus de liberdades, sua função geradora de momentos é dada por:

\[M_X(t)=\mathbb{E}\left(e^{tX}\right)=\left(\frac{1}{1-2t}\right)^{\frac{\nu}{2}}.\]

Desta forma, temos que

\[M'_X(t)=\nu\left(\frac{1}{1-2t}\right)^{\frac{\nu+2}{2}}\]

e

\[M''_X(t)=(\nu^2+2\nu)\left(\frac{1}{1-2t}\right)^{\frac{\nu+4}{2}}.\]

Portanto, podemos calcular o valor de esperado e a variância da variável $ X $. De fato, temos que 

\[\mathbb{E}\left(X\right)=M'_X(0)=\nu\left(\frac{1}{1}\right)^{\frac{\nu+2}{2}}=\nu\]

e

\[\text{Var}\left(X\right)=\mathbb{E}\left(X^2\right)-\mathbb{E}^2\left(X\right)=M''_X(0)-M'^2_X(0)\]

de onde concluímos que

\[\text{Var}\left(X\right)=(\nu^2+2\nu)\left(\frac{1}{1}\right)^{\frac{\nu+4}{2}}-\nu^2=\nu^2+2\nu-\nu^2=2\nu.\]