Skip to main content

4 - Intervalo de confiança

Um intervalo de confiança (IC) é um intervalo estimado de um parâmetro de interesse de uma população. Em vez de estimar o parâmetro por um único valor, é dado um intervalo de estimativas prováveis. O quanto estas estimativas são prováveis será determinado pelo coeficiente de confiança $ (1-\alpha) $, para $ \alpha \in (0, 1) $.

Intervalos de confiança são usados para indicar a confiabilidade de uma estimativa. Por exemplo, um IC pode ser usado para descrever o quanto os resultados de uma pesquisa são confiáveis. Sendo todas as estimativas iguais, uma pesquisa que resulte num IC pequeno é mais confiável do que uma que resulte num IC maior.

Se $ U $ e $ V $ são estatísticas (isto é, funções da amostra) cuja distribuição de probabilidade dependa do parâmetro $ \theta $, e

\[\mathbb{P}(U \ \textless \ \theta \ \textless \ V|\theta) = 1-\alpha\]

então o intervalo aleatório $ (U,V) $ é um intervalo de confiança com nível $ 100(1-\alpha)\% $ para $ \theta $. Portanto, podemos interpretar o intervalo de confiança como um intervalo que contém os valores "plausíveis" que o parâmetro $ \theta $ pode assumir. Assim, a amplitude do intervalo está associada a incerteza que temos a respeito do parâmetro.

Considere $ X_1,X_2,\ldots,X_n $ uma amostra aleatória retirada de uma população com distribuição $ f_{\theta} $ que depende do parâmetro $ \theta $. Por exemplo, tomamos $ X_1,X_2,\ldots,X_n $ uma amostra aleatória com distribuição normal com média $ \mu $ desconhecida e desvio padrão conhecido $ \sigma = 1 $. Para propormos um intervalo de confiança para o parâmetro $ \theta $, vamos introduzir o conceito de quantidade pivotal. Uma função $ Q $ da amostra $ (X_1,X_2,\ldots,X_n) $ e do parâmetro $ \theta $ cuja distribuição de probabilidade não depende do parâmetro $ \theta $ é denominada quantidade pivotal. Desta forma, dado o nível de confiança $ 1-\alpha $, tomamos

\[1-\alpha=\mathbb{P}\left(q_1\leq Q(X_1,X_2,\ldots,X_n;\theta)\leq q_2\right)\]

Se a quantidade pivotal $ Q $ for inversível, podemos resolver a inequação acima em relação a $ \theta $ e obter um intervalo de confiança.

Motivação

Suponha que queiramos estimar a média $ \mu $ de uma população com distribuição normal com variância $ \sigma^2 $ conhecida. O estimador de máxima verossimilhança para a média populacional $ \mu $ é dado pela média amostral $ \overline{X} $ de uma amostra de tamanho $ n $. Assim, temos a seguinte quantidade pivotal $ e=(\overline{X}-\mu)\sim N(0,\sigma^2/n) $.

\[\mathbb{P}\left(|e| \ \textless \ 1,96\sigma^2/n\right)=0,95\]

\[\mathbb{P}\left(|\overline{X}-\mu| \ \textless \ 1,96\sigma^2/n\right)=0,95\]

\[\mathbb{P}\left(\overline{X}-1,96\sigma^2/n \ \textless \ \mu \ \textless \ \overline{X}+1,96\sigma^2/n\right)=0,95.\]

Para interpretar o intervalo de confiança da média, assumimos que os valores foram amostrados de forma independente e aleatória de um população com distribuição normal com média $ \mu $ e variância $ \sigma^2 $. Dado que estas suposições são válidas, temos 95% de "chance" do intervalo conter o verdadeiro valor da média populacional. Em outras palavras, se produzirmos diversos intervalos de confiança provenientes de diferentes amostras independentes de mesmo tamanho, podemos esperar que aproximadamente 95% destes intervalos devem conter o verdadeiro valor da média populacional.