Skip to main content

7 - Convergência de variáveis aleatórias

O teorema central do limite é um resultado estatístico fundamental e muito utilizado em aplicações práticas, pois quando a distribuição da população de eventos não seguem uma distribuição Normal, a distribuição da média dos dados converge para a distribuição Normal conforme o tamanho da amostra aumenta. Assim, qualquer que seja a distribuição de seus dados, para um número suficientemente grande de observações, a distribuição de probabilidade da média se aproxima da distribuição Normal com média μ e variância σ2/n. Para ilustrar, considere uma população $ X $ que possui distribuição exponencial com parâmetro $ \lambda = 1 $, isto é, $ X\sim \ \text{Exp}(1) $. Vamos realizar um estudo da distribuição amostral de $ \overline{X} $.

Inicialmente, vamos plotar o histograma da população que possui distribuição exponencial com parâmetro $ \lambda =1 $ e tamanho de amostra 500.

clique aqui para efetuar o download dos dados utilizados nesse exemplo


Figura 7.1: histograma dos dados da população com distribuição exponencial com parâmetro λ=1.

 Para entender como executar essa função do Software Action, você pode consultar o manual do usuário.

Note que o gráfico do conjunto de dados segue uma distribuição não simétrica, diferente da curva da distribuição Normal (linha vermelha). Vamos fazer um resumo descritivo dos dados da população.


Figura 7.2: Resumo descritivo da população.

 

 Para entender como executar essa função do Software Action, você pode consultar o manual do usuário.

Observamos que no caso de toda população, a média a média populacional é aproximadamente 1 e o desvio padrão da média é dada por $ \dfrac{s}{\sqrt{n}}=\dfrac{0,95961}{\sqrt{500}}=0,042915. $ Afim de aplicar o teorema do limite central (TCL), vamos tomar 1000 amostras aleatórias dessa população, cujo tamanho da amostra é dois. De cada uma destas 1000 amostras calculamos a média, em seguida verificamos o comportamento dos dados. A seguir, vamos plotar o histograma dos dados e fazer um resumo descritivo.

clique aqui para efetuar o download dos dados utilizados nesse exemplo


Figura 7.3: histograma usando grupos de 2.

 

 Para entender como executar essa função do Software Action, você pode consultar o manual do usuário.

Figura 7.4: Resumo descritivo para amostras de tamanho 2.

 Para entender como executar essa função do Software Action, você pode consultar o manual do usuário.

Com amostras de tamanho 2, ainda não obtemos resultados satisfatórios. Com isso, vamos tomar 1000 amostras aleatórias de tamanho 10. De cada uma destas 1000 amostras calculamos a média, em seguida verificamos o comportamento dos dados. A seguir, vamos plotar o histograma dos dados e fazer um resumo descritivo.

clique aqui para efetuar o download dos dados utilizados nesse exemplo

Figura 7.5: histograma para amostras de tamanho $ n=10. $

 Para entender como executar essa função do Software Action, você pode consultar o manual do usuário.

 

Figura 7.6: Resumo descritivo para amostras de tamanho 10.

 

 Para entender como executar essa função do Software Action, você pode consultar o manual do usuário.

Agora, para amostras de tamanho 2, ainda não obtemos resultados satisfatórios. Por fim, vamos tomar 1000 amostras aleatórias de tamanho 250. De cada uma destas 1000 amostras calculamos a média, em seguida verificamos o comportamento dos dados. A seguir, vamos plotar o histograma dos dados e fazer um resumo descritivo.

clique aqui para efetuar o download dos dados utilizados nesse exemplo

Figura 7.7: histograma para amostras de tamanho $ n=250. $

 Para entender como executar essa função do Software Action, você pode consultar o manual do usuário.

Figura 7.8: Resumo descritivo para amostras de tamanho 250.

 

 Para entender como executar essa função do Software Action, você pode consultar o manual do usuário.

Como percebemos este gráfico já possui uma distribuição similar a da distribuição Normal. Da distribuição da média populacional obtemos $ \mu=\overline{X}=1 $ e $ \sigma_{\overline{X}}=\dfrac{s}{\sqrt{n}}=\dfrac{0,95961}{\sqrt{500}}=0,042915. $ Observamos pela figura 7.8 que a diferença entre os dados com amostras de tamanho 250 e a distribuição da média empírica (erro) é de 0,004 para a média e de 0,00012 para o desvio padrão. Para reforçar isto, vamos realizar um teste de normalidade (para mais detalhes consulte o conteúdo de inferência estatística), em que realizamos o seguinte teste de hipótese (para mais detalhes consulte o conteúdo teste de hipóteses):

\[\left\{\begin{array}{l}H_0:  \ \hbox{os dados seguem uma distribuição normal}\\  H_1: \ \hbox{os dados não seguem uma distribuição normal}  \end{array}\right.\]


Figura 7.9: Teste de normalidade segundo critério de Anderson e Darling.

 Para entender como executar essa função do Software Action, você pode consultar o manual do usuário.

Notamos que à partir do teste de Anderson e Darling, obtemos um p-valor de 0,53 (para mais detalhes consulte o conteúdo cálculo e interpretação do p-valor). Então, existe forte evidência de que os dados provém de uma distribuição Normal. A seguir, apresentamos um gráfico resumindo todos os passos deste estudo.

 

Figura 7.10: Todos os passos do estudo.

Logo, quando a distribuição da população não seguem uma distribuição Normal, a distribuição da média dos dados converge para a distribuição Normal conforme o tamanho da amostra aumenta.

Portanto, o teorema central do limite (TCL) pode ser resumido como. Para amostras grandes, a distribuição amostral da média pode ser aproximada pela distribuição Normal. Mais especificamente, consideramos uma amostra aleatória simples de tamanho n, retirada de uma população com média μ e variância σ2. Representando tal amostra por n variáveis aleatórias independentes X1,...,Xn, e denotando sua média por $ \overline{X} $, temos pelo teorema central do limite, que quando n for suficientemente grande, a variável Z dada por

\[\frac{\overline{X}-\mu}{\sigma / \sqrt{n}}\]

tem distribuição aproximadamente Normal com média 0 e variância 1 (N(0,1)).

A lei dos grandes números é um dos principais teoremas assintóticos da estatística. Intuitivamente, visualizamos através de um gráfico (figura 7.10) a lei dos grandes números, que diz que a média aritmética dos valores observados tendem a esperança da variável aleatória. 

Figura 7.11: Ideia intuitiva da lei dos grandes números.

No gráfico a linha reta representa a média da variável aleatória, enquanto que a outra linha representa a média dos valores observados. Notemos que conforme aumenta o número de observações a média aritmética dos valores observados tende para a média da variável aleatórios.

A seguir, vamos mostrar os resultados com detalhes sobre a lei dos grandes números e do teorema central do limite (TCL).