Skip to main content

5.1.2 - Cálculo e interpretação do p-valor

P-valor

O p-valor, também denotado como nível descritivo do teste, é a probabilidade de que a estatística do teste (como variável aleatória) tenha valor extremo em relação ao valor observado (estatística) quando a hipótese H0 é verdadeira.

Para exemplificar a definição de p-valor, considere um teste de hipóteses para a média no qual o valor da estatística é dado por $ Z_{obs} $, ver exemplo 5.1.1.1.  As figuras a seguir representam, respectivamente, o p-valor nos casos em que temos um teste de hipóteses bilateral (com rejeição da hipótese nula e sem rejeição da hipótese nula).

 

A seguir, temos a figura de um teste de hipóteses unilateral para média. Na primeira das figuras, rejeitamos a hipótese nula e na segunda não rejeitamos.


Observe que se o p-valor é menor que o nível de significância proposto ($ \alpha $), o $ Z_{obs} $ está na região crítica e portanto, rejeitamos a hipótese nula H0. Por outro lado, se o p-valor é maior que o nível de significância, não rejteitamos a hipótese nula (ver figura acima). Além disso, quanto menor for o p-valor, mais "distante" estamos da hipótese nula H0. Portanto, o p-valor tem mais informações sobre a evidência contra H0 e assim o experimentador tem mais informações para decidir sobre H0 com o nível de significância apropriado.

Também podemos interpretar o p-valor como o menor valor do nível de significância para o qual rejeitamos H0. Desta forma, se o nível de significância ($ \alpha $) proposto para o teste for menor que o p-valor não rejeitamos a hipótese H0.

Em muitas situações,  a região de rejeição de um teste de hipótese com nível de significância $ \alpha $ apresenta seguinte forma:

Rejeitamos $ H_0 $ se e somente se $ W(X) \geq c_{\alpha} $,

em que W(X) é a estatística do teste apropriada para o problema, e a constante $ c_\alpha $ é escolhida de modo que o teste tenha nível de significância $ \alpha $. Neste caso, o p-valor para o ponto amostral $ x $ é  definido matematicamente como

$$p(x)=\sup_{\theta \in \Theta_{0}}P_{\theta}[W(X) \geq W(x)],$$

em que $ \theta $ é um parâmetro pertencente ao espaço paramétrico $ \Theta $ sob a hipótese nula (H0).

Voltando ao Exemplo 5.1.1.1, vamos calcular o p-valor do teste de médias. No decorrer deste módulo calculamos o p-valor para todos os testes estatísticos clássicos.

Neste caso, como temos um teste bilateral, segue que o p-valor é dado por

\[P-valor=P[Z \ \textgreater \ |Z_{obs}|]+P[Z \ \textless \ -|Z_{obs}|]= P[Z \ \textgreater \ 2,25]+P[ Z \ \textless -2.25]=0,0122+0,0122=0,0244.\]

 

Portanto, podemos concluir que, para qualquer nível de significância maior que 0,0244, temos evidências para rejeitar a hipótese nula.

Detalhes do p-valor

Consideremos $ R_{\alpha} $ uma região de rejeição com  nível de significância $ \alpha $. Para diferentes valores de $ \alpha $, essas regiões podem ser encaixadas no sentido que 

$$R_{\alpha}\subset R_{\alpha^{,}}, ~~~~ \mbox {para qualquer~~} \alpha \textless \alpha^{,}.~~~~(5.1.2.1)$$

 Sob essa situação, além de conseguirmos saber se a hipótese é rejeitada ou não, conseguimos ainda determinar o p-valor, que aqui é definido matematicamente por

$$p=p(X)=\inf \{\alpha : X \in R_{\alpha}\}.$$

Exemplo: Suponhamos que $ X $ é uma variável aleatória com distribuição $ N(\mu, \sigma^{2}) $, com $ \sigma^{2} $ conhecido.Consideremos sob $ H_{0} $, $ \mu=0 $ e sob $ H_{1} $, $ \mu=\mu_{1} $,para algum $ \mu_{1}\textgreater0 $. Seja $ \Phi $ denotado a função densidade de probabilidade da normal padrão e $ z_{1-\alpha} $ o quantil $ 1-\alpha $ da distribuição normal padrão. Então, a região de rejeição pode ser denotada como

$$R_{\alpha}=\left\{ X:X \textgreater\sigma z_{1-\alpha} \right\}= \{X: \Phi(\frac{X}{\sigma})\textgreater 1-\alpha\}= \{X: 1- \Phi(\frac{X}{\sigma})\textless\alpha\}.$$

Dessa maneira, para um valor observado de $ X $ dado, o ínfimo sobre todos $ \alpha $ em que a última desigualdade se mantém é

$$p = 1- \Phi(\frac{X}{\sigma}).$$

Alternativamente, podemos escrever que o p-valor é $ P_0[X \geq x ] $, em que $ x $ é o valor obeservado de $ X $. Notemos ainda que sob a hipótese nula, $ \mu=0 $, a distribuição de $ p $ é dada da seguinte maneira:

$$P_{0}[p\leq u ]= P_{0}[1-\Phi(\frac{X}{\sigma})\leq u]=P_{0}[\Phi(\frac{X}{\sigma})\geq 1-u]=u,$$

pois  $ \Phi(X/\sigma) $ é uniformemente distribuído sobre $ (0,1) $, portanto $ p $ é uniformemente distribuído em $ (0,1) $. Esse resulatado segue da transformação integral de probabilidade (probability integral transformation), que garante que :

Se $ X $ tem uma função de distribuição contínua $ F $, então $ F(X) $ é uniformemente distribuído sobre $ (0,1) $.

O Lema a seguir traz uma propriedade geral do p-valor.

Lema: Suponhamos que $ X $ tem distribuição de probabilidade $ P_\theta $, para algum $ \theta \subset \Theta $. Consideremos $ \theta \in \Theta_0 $, em que $ \Theta_0 $ representa o espaço paramétrico sob a hipótese nula $ H_0 $. Assumimos ainda que as regiões de rejeição satisfazem $ (5.1.2.1). $

i) Se

$$\sup_{\theta\in \Theta_{0}}P_{\theta}[X \in R_{\alpha}]\leq \alpha~~~\mbox{para todo~~}0\textless\alpha\textless1,~~~(5.1.2.2)$$

então a distribuição de $ p $ sobre $ \theta\in\Theta_0 $ satisfaz

$$P_{\theta}[p\leq u]\leq u ~~~\mbox{para todo~~}0\leq u\leq1.$$

Prova: Se $ \theta\in \Theta_0 $, pela definição do p-valor,$ p=p(X)=\inf\{\alpha : X \in R_{\alpha}\} $, temos que para todo $ v\textgreater u $, $ [p\leq u]\subset[X\in R_{v}] $, o que implica em $ P_{\theta}[p\leq u]\leq P_{\theta}[X \in R_{v}]. $ Assim, escrevendo

$$\lim_{v\rightarrow u^{+}}P_{\theta}[p\leq u]\leq \lim_{v\rightarrow u^{+}}P_{\theta}[X \in R_{v}],$$

como $ (5.1.2.2) $ é válido, segue que $ P_{\theta}[p\leq u]\leq u. $

ii) Se, para $ \theta\in\Theta_0 $,

$$P_{\theta}[X\in R_{\alpha}]=\alpha~~~\mbox{para todo~~}0\textless\alpha\textless1,~~~(5.1.2.3)$$

então

$$P_{\theta}[p\leq u]=u~~~\mbox{para todo~~}0\leq u\leq1,$$

ou seja, $ p $ é uniformemente distribuído sobre $ (0,1) $.

Prova: Novamente pela definição do p-valor, temos que se $ [X\in R_u] $ então $ [p\leq u] $. Dessa forma, segue que

$$P_{\theta}[p\leq u]\geq P_{\theta}[X\in R_{u}].$$

Assim, por $ (5.1.2.3) $ temos que $ P_{\theta}[p\leq u]\geq u $. Do resultado obtido em (i), concluímos que $ P_{\theta}[p\leq u]=u, $ ou seja, $ p $ tem distribuição uniforme $ (0,1) $.

 

Passos para realização do teste de hipóteses

  1. Estabelecer as hipóteses;
  2. Determinar o nível de significância do teste (α);
  3. Determinar a região de rejeição;
  4. Calcular o p-valor

A seguir, vamos aplicar os conceitos discutidos acima para tratar diversos exemplos de testes de hipóteses.