5.1.2 - Cálculo e interpretação do p-valor

Você está aqui

P-valor

O p-valor, também denominado nível descritivo do teste, é a probabilidade de que a estatística do teste (como variável aleatória) tenha valor extremo em relação ao valor observado (estatística) quando a hipótese $H_0$ é verdadeira.

Para exemplificar a definição de p-valor, considere um teste de hipóteses para a média no qual o valor da estatística é dado por $Z_{\text{obs}}$, ver exemplo 5.1.1.1.  As figuras a seguir representam, respectivamente, o p-valor nos casos em que temos um teste de hipóteses bilateral com rejeição da hipótese nula e sem rejeição da hipótese nula.

 

A seguir, temos a figura de um teste de hipóteses unilateral para média. Na primeira das figuras, rejeitamos a hipótese nula e na segunda não rejeitamos.

Observe que se o p-valor é menor que o nível de significância proposto ($\alpha$), então $Z_{\text{obs}}$ está na região crítica e portanto, rejeitamos a hipótese nula $H_0$ . Por outro lado, se o p-valor é maior que o nível de significância, não rejeitamos a hipótese nula (ver figura acima). Além disso, quanto menor for o p-valor, mais "distante" estamos da hipótese nula $H_0$. Portanto, o p-valor tem mais informações sobre a evidência contra $H_0$ e assim o experimentador tem mais informações para decidir sobre $H_0$ com o nível de significância apropriado.

Também podemos interpretar o p-valor como o menor valor do nível de significância para o qual rejeitamos $H_0$. Desta forma, se o nível de significância $(\alpha)$ proposto para o teste for menor que o p-valor não rejeitamos a hipótese $H_0$.

Em muitas situações,  a região de rejeição de um teste de hipótese com nível de significância $\alpha$ apresenta seguinte forma:

Rejeitamos $H_0$ se e somente se $W(X) \geq c_{\alpha}$,

em que $W(X)$ é a estatística do teste apropriada para o problema, e a constante $c_\alpha$ é escolhida de modo que o teste tenha nível de significância $\alpha$. Neste caso, o p-valor para o ponto amostral $x$ é  definido matematicamente como \[p(x)=\sup_{\theta \in \Theta_{0}}P_{\theta}[W(X) \geq W(x)],\]

em que $\theta$ é um parâmetro pertencente ao espaço paramétrico $\Theta$ sob a hipótese nula $(H_0)$.

Voltando ao Exemplo 5.1.1.1, vamos calcular o p-valor do teste de médias. No decorrer deste módulo calculamos o p-valor para todos os testes estatísticos clássicos.

Neste caso, como temos um teste bilateral, segue que o p-valor é dado por \[\text{P-valor}=\mathbb{P}[Z \ \textgreater \ |Z_{\text{obs}}|]+\mathbb{P}[Z \ \textless \ -|Z_{\text{obs}}|]= \mathbb{P}[Z \ \textgreater \ 2,25]+\mathbb{P}[ Z \ \textless -2.25]=0,0122+0,0122=0,0244.\]

 

Portanto, podemos concluir que, para qualquer nível de significância maior que 0,0244, temos evidências para rejeitar a hipótese nula.

Análise do p-valor

Consideremos um teste de hipóteses no qual $R_{\alpha}$ é a região de rejeição com  nível de significância $\alpha$. Suponha que, para diferentes valores de $\alpha$, essas regiões podem ser encaixadas no sentido que  \[R_{\alpha}\subset R_{\alpha^{,}}, ~~~~ \mbox {para qualquer~~} \alpha \textless \alpha^{,}.~~~~(5.1.2.1)\]

Sob essa situação, além de conseguirmos saber se a hipótese é rejeitada ou não, conseguimos ainda determinar o p-valor, que aqui é definido por  \[p=p(X)=\inf \{\alpha : X \in R_{\alpha}\},\]

no qual $X$ representa a amostra. 

O p-valor nos fornece uma ideia de quanto os dados contradizem a hipótese nula. Além disso, ele permite que diferentes experimentadores utilizem seus respectivos níveis de significância para avaliar os resultados do teste de hipóteses.

Exemplo 5.1.2.1:

Considere uma amostra de tamanho um de uma população $X$ com distribuição $N(\mu, \sigma^{2})$, com $\sigma^{2}$ conhecido.Consideremos sob $H_{0}$, $\mu=0$ e sob $H_{1}$, $\mu=\mu_{1}$, para algum $\mu_{1}\textgreater0$. Seja $\Phi$ a função de distribuição acumulada da normal padrão e $z_{1-\alpha}$ o quantil $1-\alpha$ da distribuição normal padrão. Então, a região de rejeição pode ser denotada como  \[R_{\alpha}=\left\{ X:X \textgreater\sigma z_{1-\alpha} \right\}= \left\{X: \Phi\left(\frac{X}{\sigma}\right)\textgreater 1-\alpha\right\}= \left\{X: 1- \Phi\left(\frac{X}{\sigma}\right)\textless\alpha\right\}.\]

Dessa maneira, para um valor observado de $X$ dado, o ínfimo sobre todos $\alpha$ em que a última desigualdade se mantém é  \[p = 1- \Phi(\frac{X}{\sigma}).\]

Alternativamente, podemos escrever que o p-valor é $\mathbb{P}_0[X \geq x ]$, em que $x$ é o valor observado de $X$. Notemos ainda que sob a hipótese nula, $\mu=0$, a distribuição de $p$ é dada da seguinte maneira \[\mathbb{P}_{0}\left[p\leq u \right]= \mathbb{P}_{0}\left[1-\Phi\left(\frac{X}{\sigma}\right)\leq u\right]=\mathbb{P}_{0}\left[\Phi\left(\frac{X}{\sigma}\right)\geq 1-u\right]=u,\]

pois  $\Phi(X/\sigma)$ é uniformemente distribuído sobre $(0,1)$, portanto $p$ é uniformemente distribuído em $(0,1)$. Esse resultado segue da transformação integral de probabilidade (probability integral transformation), que garante que :

Se $X$ tem uma função de distribuição contínua $F$, então $F(X)$ é uniformemente distribuído sobre $(0,1)$.

O Lema a seguir traz uma propriedade geral do p-valor.

Lema:

Suponhamos que $X$ tem distribuição de probabilidade $\mathbb{P}_\theta$, para algum $\theta \in \Theta$. Consideremos $\theta \in \Theta_0$, em que $\Theta_0$ representa o espaço paramétrico sob a hipótese nula $H_0$. Assumimos ainda que as regiões de rejeição satisfazem $(5.1.2.1).$

i) Se $$\sup_{\theta\in \Theta_{0}}\mathbb{P}_{\theta}[X \in R_{\alpha}]\leq \alpha~~~\mbox{para todo~~}0\textless\alpha\textless1,~~~(5.1.2.2)$$

então a distribuição de $p$ sobre $\theta\in\Theta_0$ satisfaz  \[\mathbb{P}_{\theta}[p\leq u]\leq u ~~~\mbox{para todo~~}0\leq u\leq1.\]

Prova:

Se $\theta\in \Theta_0$, pela definição do p-valor, $p=p(X)=\inf\{\alpha : X \in R_{\alpha}\}$ e, temos que, para todo $v\textgreater u$, $[p\leq u]\subset[X\in R_{v}]$, o que implica em $\mathbb{P}_{\theta}[p\leq u]\leq \mathbb{P}_{\theta}[X \in R_{v}].$ Assim, escrevendo \[\lim_{v\rightarrow u^{+}}\mathbb{P}_{\theta}[p\leq u]\leq \lim_{v\rightarrow u^{+}}\mathbb{P}_{\theta}[X \in R_{v}],\]

como $(5.1.2.2)$ é válido, segue que $\mathbb{P}_{\theta}[p\leq u]\leq u.$

ii) Se, para $\theta\in\Theta_0$, \[\mathbb{P}_{\theta}[X\in R_{\alpha}]=\alpha~~~\mbox{para todo~~}0\textless\alpha\textless1,~~~(5.1.2.3)\]

então  \[\mathbb{P}_{\theta}[p\leq u]=u~~~\mbox{para todo~~}0\leq u\leq1,\]

ou seja, $p$ é uniformemente distribuído sobre $(0,1)$.

Prova:

Novamente pela definição do p-valor, temos que se $[X\in R_u]$ então $[p\leq u]$. Dessa forma, segue que \[\mathbb{P}_{\theta}[p\leq u]\geq \mathbb{P}_{\theta}[X\in R_{u}].\]

Assim, por $(5.1.2.3)$ temos que $\mathbb{P}_{\theta}[p\leq u]\geq u$. Do resultado obtido em (i), concluímos que $\mathbb{P}_{\theta}[p\leq u]=u,$ ou seja, $p$ tem distribuição uniforme em $(0,1)$.

Passos para realização do teste de hipóteses

  1. Estabelecer as hipóteses;
  2. Determinar o nível de significância do teste (α);
  3. Determinar a região de rejeição;
  4. Calcular o p-valor

A seguir, vamos aplicar os conceitos discutidos acima para tratar diversos exemplos de testes de hipóteses.

Inferência

Sobre o Portal Action

O Portal Action é mantido pela Estatcamp - Consultoria Estatística e Qualidade, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.

Facebook

CONTATO

  •  Maestro Joao Seppe, 900, São Carlos - SP | CEP 13561-180
  • Telefone: (16) 3376-2047
  • E-Mail: [email protected]