Skip to main content

5.1.2 - Cálculo e interpretação do p-valor

P-valor

O p-valor, também denominado nível descritivo do teste, é a probabilidade de que a estatística do teste (como variável aleatória) tenha valor extremo em relação ao valor observado (estatística) quando a hipótese $ H_0 $ é verdadeira.

Para exemplificar a definição de p-valor, considere um teste de hipóteses para a média no qual o valor da estatística é dado por $ Z_{\text{obs}} $, ver exemplo 5.1.1.1.  As figuras a seguir representam, respectivamente, o p-valor nos casos em que temos um teste de hipóteses bilateral com rejeição da hipótese nula e sem rejeição da hipótese nula.

 

A seguir, temos a figura de um teste de hipóteses unilateral para média. Na primeira das figuras, rejeitamos a hipótese nula e na segunda não rejeitamos.


Observe que se o p-valor é menor que o nível de significância proposto ($ \alpha $), então $ Z_{\text{obs}} $ está na região crítica e portanto, rejeitamos a hipótese nula $ H_0 $ . Por outro lado, se o p-valor é maior que o nível de significância, não rejteitamos a hipótese nula (ver figura acima). Além disso, quanto menor for o p-valor, mais "distante" estamos da hipótese nula $ H_0 $. Portanto, o p-valor tem mais informações sobre a evidência contra $ H_0 $ e assim o experimentador tem mais informações para decidir sobre $ H_0 $ com o nível de significância apropriado.

Também podemos interpretar o p-valor como o menor valor do nível de significância para o qual rejeitamos $ H_0 $. Desta forma, se o nível de significância $ (\alpha) $ proposto para o teste for menor que o p-valor não rejeitamos a hipótese $ H_0 $.

Em muitas situações,  a região de rejeição de um teste de hipótese com nível de significância $ \alpha $ apresenta seguinte forma:

Rejeitamos $ H_0 $ se e somente se $ W(X) \geq c_{\alpha} $,

em que $ W(X) $ é a estatística do teste apropriada para o problema, e a constante $ c_\alpha $ é escolhida de modo que o teste tenha nível de significância $ \alpha $. Neste caso, o p-valor para o ponto amostral $ x $ é  definido matematicamente como

\[p(x)=\sup_{\theta \in \Theta_{0}}P_{\theta}[W(X) \geq W(x)],\]

em que $ \theta $ é um parâmetro pertencente ao espaço paramétrico $ \Theta $ sob a hipótese nula $ (H_0) $.

Voltando ao Exemplo 5.1.1.1, vamos calcular o p-valor do teste de médias. No decorrer deste módulo calculamos o p-valor para todos os testes estatísticos clássicos.

Neste caso, como temos um teste bilateral, segue que o p-valor é dado por

\[\text{P-valor}=\mathbb{P}[Z \ \textgreater \ |Z_{\text{obs}}|]+\mathbb{P}[Z \ \textless \ -|Z_{\text{obs}}|]= \mathbb{P}[Z \ \textgreater \ 2,25]+\mathbb{P}[ Z \ \textless -2.25]=0,0122+0,0122=0,0244.\]

 

Portanto, podemos concluir que, para qualquer nível de significância maior que 0,0244, temos evidências para rejeitar a hipótese nula.

Análise do p-valor

Consideremos um teste de hipóteses no qual $ R_{\alpha} $ é a região de rejeição com  nível de significância $ \alpha $. Suponha que, para diferentes valores de $ \alpha $, essas regiões podem ser encaixadas no sentido que 

\[R_{\alpha}\subset R_{\alpha^{,}}, ~~~~ \mbox {para qualquer~~} \alpha \textless \alpha^{,}.~~~~(5.1.2.1)\]

Sob essa situação, além de conseguirmos saber se a hipótese é rejeitada ou não, conseguimos ainda determinar o p-valor, que aqui é definido por

\[p=p(X)=\inf \{\alpha : X \in R_{\alpha}\},\]

no qual $ X $ representa a amostra. 

O p-valor nos fornece uma idéia de quanto os dados contradizem a hipótese nula. Além disso, ele permite que diferentes experimentadores utilizem seus respectivos níveis de significância para avaliar os resultados do teste de hipóteses.

Exemplo 5.1.2.1: Considere uma amostra de tamanho um de uma população $ X $ com distribuição $ N(\mu, \sigma^{2}) $, com $ \sigma^{2} $ conhecido.Consideremos sob $ H_{0} $, $ \mu=0 $ e sob $ H_{1} $, $ \mu=\mu_{1} $, para algum $ \mu_{1}\textgreater0 $. Seja $ \Phi $ a função de distribuição acumulada da normal padrão e $ z_{1-\alpha} $ o quantil $ 1-\alpha $ da distribuição normal padrão. Então, a região de rejeição pode ser denotada como

\[R_{\alpha}=\left\{ X:X \textgreater\sigma z_{1-\alpha} \right\}= \left\{X: \Phi\left(\frac{X}{\sigma}\right)\textgreater 1-\alpha\right\}= \left\{X: 1- \Phi\left(\frac{X}{\sigma}\right)\textless\alpha\right\}.\]

Dessa maneira, para um valor observado de $ X $ dado, o ínfimo sobre todos $ \alpha $ em que a última desigualdade se mantém é

\[p = 1- \Phi(\frac{X}{\sigma}).\]

Alternativamente, podemos escrever que o p-valor é $ \mathbb{P}_0[X \geq x ] $, em que $ x $ é o valor obeservado de $ X $. Notemos ainda que sob a hipótese nula, $ \mu=0 $, a distribuição de $ p $ é dada da seguinte maneira

\[\mathbb{P}_{0}\left[p\leq u \right]= \mathbb{P}_{0}\left[1-\Phi\left(\frac{X}{\sigma}\right)\leq u\right]=\mathbb{P}_{0}\left[\Phi\left(\frac{X}{\sigma}\right)\geq 1-u\right]=u,\]

pois  $ \Phi(X/\sigma) $ é uniformemente distribuído sobre $ (0,1) $, portanto $ p $ é uniformemente distribuído em $ (0,1) $. Esse resultado segue da transformação integral de probabilidade (probability integral transformation), que garante que :

Se $ X $ tem uma função de distribuição contínua $ F $, então $ F(X) $ é uniformemente distribuído sobre $ (0,1) $.

O Lema a seguir traz uma propriedade geral do p-valor.

Lema: Suponhamos que $ X $ tem distribuição de probabilidade $ \mathbb{P}_\theta $, para algum $ \theta \in \Theta $. Consideremos $ \theta \in \Theta_0 $, em que $ \Theta_0 $ representa o espaço paramétrico sob a hipótese nula $ H_0 $. Assumimos ainda que as regiões de rejeição satisfazem $ (5.1.2.1). $

i) Se

$$\sup_{\theta\in \Theta_{0}}\mathbb{P}_{\theta}[X \in R_{\alpha}]\leq \alpha~~~\mbox{para todo~~}0\textless\alpha\textless1,~~~(5.1.2.2)$$

então a distribuição de $ p $ sobre $ \theta\in\Theta_0 $ satisfaz

\[\mathbb{P}_{\theta}[p\leq u]\leq u ~~~\mbox{para todo~~}0\leq u\leq1.\]

Prova: Se $ \theta\in \Theta_0 $, pela definição do p-valor, $ p=p(X)=\inf\{\alpha : X \in R_{\alpha}\} $ e, temos que, para todo $ v\textgreater u $, $ [p\leq u]\subset[X\in R_{v}] $, o que implica em $ \mathbb{P}_{\theta}[p\leq u]\leq \mathbb{P}_{\theta}[X \in R_{v}]. $ Assim, escrevendo

\[\lim_{v\rightarrow u^{+}}\mathbb{P}_{\theta}[p\leq u]\leq \lim_{v\rightarrow u^{+}}\mathbb{P}_{\theta}[X \in R_{v}],\]

como $ (5.1.2.2) $ é válido, segue que $ \mathbb{P}_{\theta}[p\leq u]\leq u. $

ii) Se, para $ \theta\in\Theta_0 $,

\[\mathbb{P}_{\theta}[X\in R_{\alpha}]=\alpha~~~\mbox{para todo~~}0\textless\alpha\textless1,~~~(5.1.2.3)\]

então

\[\mathbb{P}_{\theta}[p\leq u]=u~~~\mbox{para todo~~}0\leq u\leq1,\]

ou seja, $ p $ é uniformemente distribuído sobre $ (0,1) $.

Prova: Novamente pela definição do p-valor, temos que se $ [X\in R_u] $ então $ [p\leq u] $. Dessa forma, segue que

\[\mathbb{P}_{\theta}[p\leq u]\geq \mathbb{P}_{\theta}[X\in R_{u}].\]

Assim, por $ (5.1.2.3) $ temos que $ \mathbb{P}_{\theta}[p\leq u]\geq u $. Do resultado obtido em (i), concluímos que $ \mathbb{P}_{\theta}[p\leq u]=u, $ ou seja, $ p $ tem distribuição uniforme em $ (0,1) $.

 

Passos para realização do teste de hipóteses

  1. Estabelecer as hipóteses;
  2. Determinar o nível de significância do teste (α);
  3. Determinar a região de rejeição;
  4. Calcular o p-valor

A seguir, vamos aplicar os conceitos discutidos acima para tratar diversos exemplos de testes de hipóteses.