- (16) 3376-2047
- [email protected]
- Portfólio de Serviços
- AT
O p-valor, também denominado nível descritivo do teste, é a probabilidade de que a estatística do teste (como variável aleatória) tenha valor extremo em relação ao valor observado (estatística) quando a hipótese $H_0$ é verdadeira.
Para exemplificar a definição de p-valor, considere um teste de hipóteses para a média no qual o valor da estatística é dado por $Z_{\text{obs}}$, ver exemplo 5.1.1.1. As figuras a seguir representam, respectivamente, o p-valor nos casos em que temos um teste de hipóteses bilateral com rejeição da hipótese nula e sem rejeição da hipótese nula.
A seguir, temos a figura de um teste de hipóteses unilateral para média. Na primeira das figuras, rejeitamos a hipótese nula e na segunda não rejeitamos.
Observe que se o p-valor é menor que o nível de significância proposto ($\alpha$), então $Z_{\text{obs}}$ está na região crítica e portanto, rejeitamos a hipótese nula $H_0$ . Por outro lado, se o p-valor é maior que o nível de significância, não rejeitamos a hipótese nula (ver figura acima). Além disso, quanto menor for o p-valor, mais "distante" estamos da hipótese nula $H_0$. Portanto, o p-valor tem mais informações sobre a evidência contra $H_0$ e assim o experimentador tem mais informações para decidir sobre $H_0$ com o nível de significância apropriado.
Também podemos interpretar o p-valor como o menor valor do nível de significância para o qual rejeitamos $H_0$. Desta forma, se o nível de significância $(\alpha)$ proposto para o teste for menor que o p-valor não rejeitamos a hipótese $H_0$.
Em muitas situações, a região de rejeição de um teste de hipótese com nível de significância $\alpha$ apresenta seguinte forma:
Rejeitamos $H_0$ se e somente se $W(X) \geq c_{\alpha}$,
em que $W(X)$ é a estatística do teste apropriada para o problema, e a constante $c_\alpha$ é escolhida de modo que o teste tenha nível de significância $\alpha$. Neste caso, o p-valor para o ponto amostral $x$ é definido matematicamente como \[p(x)=\sup_{\theta \in \Theta_{0}}P_{\theta}[W(X) \geq W(x)],\]
em que $\theta$ é um parâmetro pertencente ao espaço paramétrico $\Theta$ sob a hipótese nula $(H_0)$.
Voltando ao Exemplo 5.1.1.1, vamos calcular o p-valor do teste de médias. No decorrer deste módulo calculamos o p-valor para todos os testes estatísticos clássicos.
Neste caso, como temos um teste bilateral, segue que o p-valor é dado por \[\text{P-valor}=\mathbb{P}[Z \ \textgreater \ |Z_{\text{obs}}|]+\mathbb{P}[Z \ \textless \ -|Z_{\text{obs}}|]= \mathbb{P}[Z \ \textgreater \ 2,25]+\mathbb{P}[ Z \ \textless -2.25]=0,0122+0,0122=0,0244.\]
Portanto, podemos concluir que, para qualquer nível de significância maior que 0,0244, temos evidências para rejeitar a hipótese nula.
Consideremos um teste de hipóteses no qual $R_{\alpha}$ é a região de rejeição com nível de significância $\alpha$. Suponha que, para diferentes valores de $\alpha$, essas regiões podem ser encaixadas no sentido que \[R_{\alpha}\subset R_{\alpha^{,}}, ~~~~ \mbox {para qualquer~~} \alpha \textless \alpha^{,}.~~~~(5.1.2.1)\]
Sob essa situação, além de conseguirmos saber se a hipótese é rejeitada ou não, conseguimos ainda determinar o p-valor, que aqui é definido por \[p=p(X)=\inf \{\alpha : X \in R_{\alpha}\},\]
no qual $X$ representa a amostra.
O p-valor nos fornece uma ideia de quanto os dados contradizem a hipótese nula. Além disso, ele permite que diferentes experimentadores utilizem seus respectivos níveis de significância para avaliar os resultados do teste de hipóteses.
Considere uma amostra de tamanho um de uma população $X$ com distribuição $N(\mu, \sigma^{2})$, com $\sigma^{2}$ conhecido.Consideremos sob $H_{0}$, $\mu=0$ e sob $H_{1}$, $\mu=\mu_{1}$, para algum $\mu_{1}\textgreater0$. Seja $\Phi$ a função de distribuição acumulada da normal padrão e $z_{1-\alpha}$ o quantil $1-\alpha$ da distribuição normal padrão. Então, a região de rejeição pode ser denotada como \[R_{\alpha}=\left\{ X:X \textgreater\sigma z_{1-\alpha} \right\}= \left\{X: \Phi\left(\frac{X}{\sigma}\right)\textgreater 1-\alpha\right\}= \left\{X: 1- \Phi\left(\frac{X}{\sigma}\right)\textless\alpha\right\}.\]
Dessa maneira, para um valor observado de $X$ dado, o ínfimo sobre todos $\alpha$ em que a última desigualdade se mantém é \[p = 1- \Phi(\frac{X}{\sigma}).\]
Alternativamente, podemos escrever que o p-valor é $\mathbb{P}_0[X \geq x ]$, em que $x$ é o valor observado de $X$. Notemos ainda que sob a hipótese nula, $\mu=0$, a distribuição de $p$ é dada da seguinte maneira \[\mathbb{P}_{0}\left[p\leq u \right]= \mathbb{P}_{0}\left[1-\Phi\left(\frac{X}{\sigma}\right)\leq u\right]=\mathbb{P}_{0}\left[\Phi\left(\frac{X}{\sigma}\right)\geq 1-u\right]=u,\]
pois $\Phi(X/\sigma)$ é uniformemente distribuído sobre $(0,1)$, portanto $p$ é uniformemente distribuído em $(0,1)$. Esse resultado segue da transformação integral de probabilidade (probability integral transformation), que garante que :
Se $X$ tem uma função de distribuição contínua $F$, então $F(X)$ é uniformemente distribuído sobre $(0,1)$.
O Lema a seguir traz uma propriedade geral do p-valor.
Suponhamos que $X$ tem distribuição de probabilidade $\mathbb{P}_\theta$, para algum $\theta \in \Theta$. Consideremos $\theta \in \Theta_0$, em que $\Theta_0$ representa o espaço paramétrico sob a hipótese nula $H_0$. Assumimos ainda que as regiões de rejeição satisfazem $(5.1.2.1).$
i) Se $$\sup_{\theta\in \Theta_{0}}\mathbb{P}_{\theta}[X \in R_{\alpha}]\leq \alpha~~~\mbox{para todo~~}0\textless\alpha\textless1,~~~(5.1.2.2)$$
então a distribuição de $p$ sobre $\theta\in\Theta_0$ satisfaz \[\mathbb{P}_{\theta}[p\leq u]\leq u ~~~\mbox{para todo~~}0\leq u\leq1.\]
Se $\theta\in \Theta_0$, pela definição do p-valor, $p=p(X)=\inf\{\alpha : X \in R_{\alpha}\}$ e, temos que, para todo $v\textgreater u$, $[p\leq u]\subset[X\in R_{v}]$, o que implica em $\mathbb{P}_{\theta}[p\leq u]\leq \mathbb{P}_{\theta}[X \in R_{v}].$ Assim, escrevendo \[\lim_{v\rightarrow u^{+}}\mathbb{P}_{\theta}[p\leq u]\leq \lim_{v\rightarrow u^{+}}\mathbb{P}_{\theta}[X \in R_{v}],\]
como $(5.1.2.2)$ é válido, segue que $\mathbb{P}_{\theta}[p\leq u]\leq u.$
ii) Se, para $\theta\in\Theta_0$, \[\mathbb{P}_{\theta}[X\in R_{\alpha}]=\alpha~~~\mbox{para todo~~}0\textless\alpha\textless1,~~~(5.1.2.3)\]
então \[\mathbb{P}_{\theta}[p\leq u]=u~~~\mbox{para todo~~}0\leq u\leq1,\]
ou seja, $p$ é uniformemente distribuído sobre $(0,1)$.
Novamente pela definição do p-valor, temos que se $[X\in R_u]$ então $[p\leq u]$. Dessa forma, segue que \[\mathbb{P}_{\theta}[p\leq u]\geq \mathbb{P}_{\theta}[X\in R_{u}].\]
Assim, por $(5.1.2.3)$ temos que $\mathbb{P}_{\theta}[p\leq u]\geq u$. Do resultado obtido em (i), concluímos que $\mathbb{P}_{\theta}[p\leq u]=u,$ ou seja, $p$ tem distribuição uniforme em $(0,1)$.
Passos para realização do teste de hipóteses
A seguir, vamos aplicar os conceitos discutidos acima para tratar diversos exemplos de testes de hipóteses.
O Portal Action é mantido pela Estatcamp - Consultoria Estatística e Qualidade, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.