2 - Distribuições Amostrais

Você está aqui

Neste tópico, vamos estudar as distribuições amostrais associadas aos principais modelos estatísticos.

Definição 2.1: 

Uma amostra aleatória de n elementos de uma população é representada pelas variáveis aleatórias $ X_1,X_2,\ldots,X_n $, no qual cada $ X_i $, com $ i = 1,2,\ldots,n $ representa um elemento da amostra. Se $ X_i $ e $ X_j $ são independentes e possuem mesma função de probabilidade (ou função densidade de probabilidade), para todo $ i\neq j $, dizemos que os elementos da amostra são independentes e igualmente distribuídos (i.i.d).

Definição 2.2:

Seja $ X_1,X_2,\ldots,X_n $ uma amostra aleatória i.i.d. de tamanho $ n $ de uma população e seja $ T(x_1,x_2,\ldots,x_n) $ uma função real ou vetorial cujo domínio inclui o espaço amostral de $ (X_1,X_2,\ldots,X_n) $. Neste caso, dizemos que a variável ou vetor aleatório $ Y = T(x_1,x_2,\ldtos,X_n) $ é chamado de estatística. A distribuição de probabilidade da estatística Y é chamada de distribuição amostral de Y. Uma estatística associada a algum parâmetro populacional é também chamada de estimador.

Exemplo 2.1:

Seja $ X_1,X_2,\ldots,X_n $ uma amostra aleatória de uma população. A média amostral é a média aritmética dos valores da amostra. A média amostral é uma estatística denotada por $ \overline{X} $, ou seja, 

\[\overline{X}=\frac{X_1+\ldots+X_n}{n}=\frac{1}{n}\sum_{i=1}^n X_i.\]

A variância amostral é a estatística definida por 

\[s^2=\frac{1}{n-1}\sum_{i=1}^n(X_i-\overline{X})^2\]

e o desvio-padrão amostral é a estatística definida por 

\[s=\sqrt{\frac{1}{n-1}\sum_{i=1}^n(X_i-\overline{X})^2}.\]

Motivação:

A média populacional $ \mu $ representa a média de todos os indivíduos ou objetos que estão sendo estudados. Mas geralmente, nem todos os indivíduos podem ser medidos. Em geral, somente uma amostra de todos os indivíduos está disponível para nós e a média baseada nesta amostra, $ \overline{X} $, é usada para estimar a média populacional $ \mu $. Um problema de fundamental importância é saber se a média amostral $ \overline{X} $ é um bom estimador da média populacional $ \mu $. De maneira similar, quando calculamos o desvio padrão amostral, $ s $, este valor pode ser considerado uma boa estimativa do desvio padrão populacional?  

Exemplo 2.2:

Considere uma urna com 5 bolas, onde cada bola tem um número com os números de 1 a 5. Retirando uma bola da urna, seja $ X $ a variável aleatória que assume o número da bola. Utilizando reamostragem com reposição, qual a distribuição amostral da média $ \overline{X} $?

Consideremos inicialmente uma única retirada $ X_1 $ da urna. Como temos uma única retirada, a média $ \overline{X} = X_1 $. Com isso temos que

$ \mathbb{P}(\overline{X}=1) $ 0,2
$ \mathbb{P}(\overline{X}=2) $ 0,2
$ \mathbb{P}(\overline{X}=3) $ 0,2
$ \mathbb{P}(\overline{X}=4) $ 0,2
$ \mathbb{P}(\overline{X}=5) $ 0,2

Para entender como executar essa função do Software Action, você pode consultar o manual do usuário.

Então, para uma amostra de tamanho $ n=1 $, temos que a distribuição amostral da média tem a mesma distribuição da variável aleatória $ X $.

Considere agora duas retiradas independentes e com reposição, $ X_1 $ e $ X_2 $. A tabela a seguir mostra todos os possíveis valores para a média amostral $ \overline{X} $, considerando as retiradas $ X_1 $ e $ X_2 $.

X2\X1 1 2 3 4 5
1 1 1,5 2 2,5 3
2 1,5 2 2,5 3 3,5
3 2 2,5 3 3,5 4
4 2,5 3 3,5 4 4,5
5 3 3,5 4 4,5 5

Deste modo, temos que

$ \mathbb{P}(\overline{X}=1) $ 1/25
$ \mathbb{P}(\overline{X}=1,5) $ 2/25
$ \mathbb{P}(\overline{X}=2) $ 3/25
$ \mathbb{P}(\overline{X}=2,5) $ 4/25
$ \mathbb{P}(\overline{X}=3) $ 5/25
$ \mathbb{P}(\overline{X}=3,5) $ 4/25
$ \mathbb{P}(\overline{X}=4) $ 3/25
$ \mathbb{P}(\overline{X}=4,5) $ 2/25
$ \mathbb{P}(\overline{X}=5) $ 1/25

Ou seja, temos o seguinte gráfico de barras para a função de probabilidade da média amostral $ \overlinde{X} $

Para entender como executar essa função do Software Action, você pode consultar o manual do usuário.

Considerando 3 retiradas independentes e com reposição temos o seguinte gráfico para a função de probabilidade da média amostral $ \overline{X} $

Para entender como executar essa função do Software Action, você pode consultar o manual do usuário.

Nas seções a seguir veremos que, quanto maior o tamanho amostral, a distribuição da média amostral tende a uma distribuição normal com média $ \mathbb{E}(\overline{X})=\mathbb{E}(X) $ e variância $ \text{Var}(\overline{X})= \ \text{Var}(X)/n $.

Com um procedimento análogo, podemos obter as distribuições amostrais de outras estatísticas de interesse. Por exemplo, vamos considerar no mesmo exemplo anterior, duas retiradas da urna com reposição e estudar a distribuição amostral do desvio-padrão $ s $A tabela a seguir mostra todos os possíveis valores para o desvio-padrão $ s $, considerando as retiradas $ X_1 $ e $ X_2 $.

X2\X1 1 2 3 4 5
1 0 0,7071 1,4142 2,1213 2,8284
2 0,7071 0 0,7071 1,4142 2,1212
3 1,4142 0,7071 0 0,7071 1,4142
4 2,1213 1,4142 0,7071 0 0,7171
5 2,8284 2,1213 1,4142 0,7071 0

Deste modo, temos que

$ \mathbb{P}(s=0) $ $ 5/25 $
$ \mathbb{P}(s=0,7071) $ $ 8/25 $
$ \mathbb{P}(s=1,4142) $ $ 6/25 $
$ \mathbb{P}(s=2,1213) $ $ 4/25 $
$ \mathbb{P}(s=2,8284) $ $ 2/25 $

Para entender como executar essa função do Software Action, você pode consultar o manual do usuário.

Dúvidas sobre esse conteúdo? Comente:

Inferência

Sobre o Portal Action

O Portal Action é mantido por Estatcamp - Consultoria Estatística e Qualidade e por DIGUP - Desenvolvimento de Sistemas e Consultoria Estatística, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.

Facebook

CONTATO

  •  Maestro Joao Seppe, 900, São Carlos - SP | CEP 13561-180
  • Telefone: (16) 3376-2047
  • E-Mail: [email protected]