Skip to main content

2 - Distribuições Amostrais

Definição 2.1:  Uma amostra aleatória de n elementos de uma população é representanda pelas variáveis aleatórias X1, X2, ..., Xn, onde cada Xi, com i = 1, 2, ..., n representa um elemento da amostra. Se Xi e Xj são independentes e possuem mesma função de probabilidade (ou função densidade de probabilidade), para todo i ≠ j, dizemos que os elementos da amostra são independentes e igualmente distribuidos (i.i.d).

Definição 2.2: Seja X1, X2, ..., Xn uma amostra aleatória i.i.d. de tamanho n de uma população e seja T(x1, x2, ..., xn) uma função real ou vetorial cujo domínio inclui o espaço amostral de (X1, X2, ..., Xn). Neste caso, dizemos que a variável ou vetor aleatório Y = T(x1, x2, ..., xn) é chamado de estatística. A distribuição de probabilidade da estatística Y é chamada de distribuição amostral de Y. Uma estatística associada a algum parâmetro populacional é também chamada de estimador.

Exemplo 2.1: Seja X1, X2, ..., Xn uma amostra aleatória de uma população. A média amostral é a média aritmética dos valores da amostra. A média amostral é uma estatística denotada por $ \overline{X} $, ou seja,

\[\overline{X}=\frac{X_1+\ldots+X_n}{n}=\frac{1}{n}\sum_{i=1}^n X_i.\]

A variância amostral é a estatística definida por

\[S^2=\frac{1}{n-1}\sum_{i=1}^n(X_i-\overline{X})^2\]

e o desvio-padrão amostral é a estatística definida por

\[S=\sqrt{S^2}=\sqrt{\frac{1}{n-1}\sum_{i=1}^n(X_i-\overline{X})^2}.\]

Motivação: A média populacional μ representa a média de todos os indivíduos ou objetos que estão sendo estudados. Mas geralmente, nem todos os indivíduos podem ser medidos. Em geral, somente uma amostra de todos os indivíduos está disponível para nós e a média baseada nesta amostra, $ \overline{X} $, é usada para estimar a média populacional μ. Um problema de fundamental importância é saber se a média amostral $ \overline{X} $ é um bom estimador da média populacional μ. De maneira similar, quando calculamos o desvio padrão amostral, s, este valor pode ser considerado uma boa estimativa do desvio padrão populacional?  

Exemplo 2.2: Considere uma urna com 5 bolas, onde cada bola tem um número com os números de 1 a 5. Retirando uma bola da urna, seja X a variável aleatória que assume o número da bola. Utilizando reamostragem com reposição, qual a distribuição amostral da média $ \overline{X} $?

Consideremos inicialmente uma única retirada X1 da urna. Como temos uma única retirada, a média $ \overline{X} = X_1 $. Com isso temos que

$ P(\overline{X}=1) $ 0,2
$ P(\overline{X}=2) $ 0,2
$ P(\overline{X}=3) $ 0,2
$ P(\overline{X}=4) $ 0,2
$ P(\overline{X}=5) $ 0,2

 

Para entender como executar essa função do Software Action, você pode consultar o manual do usuário.

Então, para uma amostra de tamanho n=1, temos que a distribuição amostral da média tem a mesma distribuição da variável aleatória X.

Considere agora duas retiradas independentes e com reposição, X1 e X2. A tabela a seguir mostra todos os possíveis valores para a média amostral $ \overline{X} $, considerando as retiradas X1 e X2.

X2\X1 1 2 3 4 5
1 1 1,5 2 2,5 3
2 1,5 2 2,5 3 3,5
3 2 2,5 3 3,5 4
4 2,5 3 3,5 4 4,5
5 3 3,5 4 4,5 5

Deste modo, temos que

$ P(\overline{X}=1) $ 1/25
$ P(\overline{X}=1,5) $ 2/25
$ P(\overline{X}=2) $ 3/25
$ P(\overline{X}=2,5) $ 4/25
$ P(\overline{X}=3) $ 5/25
$ P(\overline{X}=3,5) $ 4/25
$ P(\overline{X}=4) $ 3/25
$ P(\overline{X}=4,5) $ 2/25
$ P(\overline{X}=5) $ 1/25

Ou seja, temos o seguinte gráfico de barras para a função de probabilidade da média amostral $ \overlinde{X} $

 

Para entender como executar essa função do Software Action, você pode consultar o manual do usuário.

 

Considerando 3 retiradas independentes e com reposição temos o seguinte gráfico para a função de probabilidade da média amostral $ \overline{X} $


 

Para entender como executar essa função do Software Action, você pode consultar o manual do usuário.

 

Nas seções a seguir veremos que, quanto maior o tamanho amostral, a distribuição da média amostral tende a uma distribuição normal com média $ E(\overline{X})=E(X) $ e variância $ Var(\overline{X})=Var(X)/n $.

Com um procedimento análogo, podemos obter as distribuições amostrais de outras estatísticas de interesse. Por exemplo, vamos considerar no mesmo exemplo anterior, duas retiradas da urna com reposição e estudar a distribuição amostral do desvio-padrão S. X2

A tabela a seguir mostra todos os possíveis valores para o desvio-padrão S, considerando as retiradas X1 e X2.

X2\X1 1 2 3 4 5
1 0 0,7071 1,4142 2,1213 2,8284
2 0,7071 0 0,7071 1,4142 2,1212
3 1,4142 0,7071 0 0,7071 1,4142
4 2,1213 1,4142 0,7071 0 0,7171
5 2,8284 2,1213 1,4142 0,7071 0

Deste modo, temos que

P(S=0) 5/25
P(S=0,7071) 8/25
P(S=1,4142) 6/25
P(S=2,1213) 4/25
P(S=2,8284) 2/25

 

 

Para entender como executar essa função do Software Action, você pode consultar o manual do usuário.

 

Definição 2.2: Um estimador T é dito não viciado (não viesado) para algum parâmetro populacional θ se

\[E(T)=\theta,\]

para todo θ. Se a igualdade acima não ocorre, dizemos que T é um estimador viciado (viesado) e a diferença V(T) = E(T) - θ é chamado de vício (viés) de T.

Teorema 2.1: Seja X1, X2, ..., Xn uma amostra aleatória i.i.d. de uma população e seja g(x) uma função tal que E[g(X1)] E Var[g(X1)] existam. Então

\[E\left(\sum_{i=1}^ng(X_i)\right)=n(E(g(X_1))\]

e

\[Var\left(\sum_{i=1}^ng(X_i)\right)=n(Var(g(X_1)).\]

Demonstração: Para provar a primeira equação, notemos que

\[E\left(\sum_{i=1}^ng(X_i)\right)=\sum_{i=1}^nE(g(X_i))=n(E(g(X_1))).\]

Uma vez que os Xi's são identicamente distribuidos, a segunda igualdade é verdadeira pois E(g(Xi))=E(g(X1)) para todo i. Note que aqui, a independência de X1, X2, ..., Xn não é necessária para esta igualdade. Na verdade, a igualdade acima é verdadeira para qualquer coleção de n variáveis aleatórias i.i.d.

Para provar a segunda igualdade, observe que

\[Var\left(\sum_{i=1}^ng(X_i)\right)=E\left[\sum_{i=1}^n g(X_i)-E\left(\sum_{i=1}^n g(X_i)\right)\right]^2=E\left[\sum_{i=1}^n(g(X_i)-E[g(X_i)])\right]^2.\]

Nesta última expressão, existem n2 termos. Primeiramente, existem n termos da forma

\[(g(X_i)-E[g(X_i)])^2, \quad i = 1, \ldots, n\]

e, para cada um deles, temos que

\[E(g(X_i)-E[g(X_i)])^2=Var(g(X_i))=Var(g(X_1))\]

uma vez que as variáveis são identicamente distribuidas. Os n(n-1) termos restantes são todos da forma

\[(g(X_i)-E[g(X_i)])(g(X_j)-E[g(X_j)]) \ \hbox{com} \ i\neq j.\]

Para cada um destes termos temos que

\[E[(g(X_i)-E[g(X_i)])(g(X_j)-E[g(X_j)])=Cov(g(X_i),g(X_j))=0\]

pois as variáveis são independentes. Desta forma, fica claro que

\[Var\left(\sum_{i=1}^ng(X_i)\right)=n(Var(g(X_1)).\]

Teorema 2.2: Seja X1, X2, ..., Xn uma amostra aleatória de uma população com média μ e variância σ2 < ∞. Então

a. $ E(\overline{X})=\mu, $

b. $ E(S^2)=\sigma^2 $.

Demonstração: Para provar (a), basta tomar g(Xi) = Xi/n, deste modo, E(g(Xi)) = μ/n. Então, pelo Teorema 2.1 temos que

\[E(\overline{X})=E\left(\frac{1}{n}\sum_{i=1}^nX_i\right)=\frac{1}{n}E\left(\sum_{i=1}^n X_i\right)=\frac{1}{n}nE(X_1)=\mu.\]

De maneira similar, para a variância amostral, temos que

\[E(S^2)=E\left(\frac{1}{n-1}\left[\sum_{i=1}^nX_i^2-n\overline{X}^2\right]\right)=\frac{1}{n-1}(nE(X_1^2)-nE(\overline{X}^2)\]

ou seja,

\[E(S^2)=\frac{1}{n-1}\left(n(\sigma^2+\mu^2)-n\left(\frac{\sigma^2}{n}+\mu\right)\right)=\sigma^2.\]

Desta forma, podemos concluir que $ \overline{X} $ e S2 são estimadores não viciados da média populacional μ e da variância populacional σ2.