Skip to main content

4 - Intervalos de confiança

Um intervalo de confiança (IC) é um intervalo estimado de um parâmetro de interesse de uma população. Em vez de estimar o parâmetro por um único valor, é dado um intervalo de estimativas prováveis. O quanto estas estimativas são prováveis será determinado pelo coeficiente de confiança (1-α), para α $ \in $ (0, 1).

Intervalos de confiança são usados para indicar a confiabilidade de uma estimativa. Por exemplo, um IC pode ser usado para descrever o quanto os resultados de uma pesquisa são confiáveis. Sendo todas as estimativas iguais, uma pesquisa que resulte num IC pequeno é mais confiável do que uma que resulte num IC maior.

Se U e V são estatísticas (isto é, funções da amostra) cuja distribuição de probabilidade dependa do parâmetro θ, e

\[P(U \ \textless \ \theta \ \textless \ V|\theta) = 1-\alpha\]

então o intervalo aleatório (U,V) é um intervalo de confiança "100(1-α)% para θ". Portanto, podemos interpretar o intervalo de confiança como um intervalo que contém os valores "plausíveis" que o parâmetro pode assumir. Assim, a amplitude do intervalo está associada a incerteza que temos a respeito do parâmetro.

Considere X1,X2,...,Xn uma amostra aleatória retirada de uma população com distribuição $ f_{\theta} $ que depende do parâmetro θ. Por exemplo, tomamos X1,X2,...,Xn uma amostra aleatória com distribuição normal com média μ desconhecida e desvio padrão conhecido σ=1. Para propormos um intervalo de confiança para o parâmetro θ, vamos introduzir o conceito de quantidade pivotal. Uma função Q da amostra (X1,X2,...,Xn) e do parâmetro θ cuja distribuição de probabilidade não depende do parâmetro θ é denominada quantidade pivotal. Desta forma, dado o nível de confiança (1-α), tomamos

\[1-\alpha=P[q_1\leq Q(X_1,X_2,\ldots,X_n;\theta)\leq q_2]\]

Se a quantidade pivotal Q for inversível, podemos resolver a inequação acima em relação a θ e obter um intervalo de confiança.

Motivação

Suponha que queiramos estimar a média μ de uma população normal com variância $ \sigma^2 $ conhecida. O estimador de máxima verossimilhança para a média populacional $ \mu $ é dado pela média amostral  $ \overline{X} $ de uma amostra de tamanho n. Assim, temos a seguinte quantidade pivotal $ e=(\overline{X}-\mu)\sim N(0,\sigma^2/n) $.

\[P[|e| \ \textless \ 1,96\sigma^2/n]=0,95\]

\[P[|\overline{X}-\mu| \ \textless \ 1,96\sigma^2/n]=0,95\]

\[P[\overline{X}-1,96\sigma^2/n \ \textless \ \mu \ \textless \ \overline{X}+1,96\sigma^2/n]=0,95.\]

Para interpretar o intervalo de confiança da média, assumimos que os valores foram amostrados de forma independente e aleatória de um população normal com média $ \mu $ e variância $ \sigma^2 $. Dado que estas suposições são válidas, temos 95% de "chance" do intervalo conter o verdadeiro valor da média populacional. Em outras palavras, se produzirmos diversos intervalos de confiança provenientes de diferentes amostras independentes de mesmo tamanho, podemos esperar que aproximadamente 95% destes intervalos devem conter o verdadeiro valor da média populacional.