6.1 - Técnica gráfica

Você está aqui

Papel de Probabilidade e QQ-plot

Método gráfico é uma técnica utilizada para verificar a adequação de um determinado modelo estatístico aos dados. A técnica que iremos descrever é simples de utilizar e pode ser aplicada a inúmeros tipos de modelos estatísticos. Vamos considerar o modelo Normal com média $\mu$ e variância $\sigma^2$. Para maiores informações sobre a distribuição normal consultar o capítulo 6.2 - Distribuição normal. Se $X\sim N(\mu,\sigma^2)$, a transformação \[Z=\frac{X-\mu}{\sigma}\]

tem distribuição normal padrão (média zero e variância 1). Vamos denotar a distribuição acumulada de $Z$ por $\Phi$. Se $F$ é a função distribuição acumulada da distribuição normal com média $\mu$ e variância $\sigma^2$, temos que \[F(x)=\mathbb{P}[X \leq x ]=\mathbb{P}\left[Z\leq \frac{x-\mu}{\sigma}\right]=\Phi\left(\frac{x-\mu}{\sigma}\right).\]

Aplicando a função $\Phi^{-1}$ em ambos os lados, temos \[\Phi^{-1}(F(x))=\frac{x-\mu}{\sigma}\]

de onde obtemos que \[x=\sigma\Phi^{-1}(F(x))+\mu\]

onde $\Phi^{-1}(F(x))$ é o quantil da distribuição Normal padrão, calculado no ponto $F(x)$. Como a expressão acima tem o formato de uma expressão linear, ao fazermos o gráfico entre $x$ e $\Phi^{-1}(F(x))$ devemos esperar um comportamento linear dos pontos, se a distribuição Normal for realmente adequada. Com isso, podemos construir o Papel de Probabilidade ou QQ-Plot a partir das seguintes etapas:

1) Considere uma amostra $x_1,\ldots,x_n$;

2) Ordene os elementos da amostra, ou seja, $x_{(1)}\leq x_{(2)}\leq\ldots\leq x_{(n)}$;

3) Calcule $n$ valores $d_i = \dfrac{i-a}{n+1-2\cdot a}$, com $i = 1,\ldots,n. ~a= \dfrac{3}{8}$, se $n \leq 10; a= \dfrac{1}{2}$, caso contrário. A correção é necessário para que não tenhamos $d_i=1$, pois neste caso, teríamos que $\phi^{-1} (1) = \infty$. Estas constantes não são padrão, dependendo do autor (ou software de estatísticas) elas podem mudar.

4) Calcule os quantis da distribuição Normal padrão para cada um dos valores $d_i$, isto é,  \[\Phi^{-1}(d_{i}),~~i=1, \ldots, n;\]

5.1) (Caso Papel de Probabilidade) Faça um gráfico com os pontos $(x_{(i)}, \Phi^{-1}(d_{i})),~i=1, \ldots, n;$ ou
    
5.2) (Caso QQ-plot) Faça um gráfico com os pontos $(\Phi^{-1}(d_{i}), x_{(i)}),~i=1, \ldots, n;$ e

avalie a normalidade dos dados. Para isto, devemos verificar o comportamento linear dos pontos. Qunato "mais linear" for o gráfico, melhor a normalidade dos dados.

Exemplo 6.1.1:

Avaliar a normalidade dos dados referentes à medição de 10 peças.

1,90642
2,10288
1,52229
2,61826
1,42738
2,22488
1,69742
3,15435
1,98492
1,99568

clique aqui para efetuar o download dos dados utilizados nesse exemplo

Ordenando os elementos da amostra, temos que

$x_{(1)}$ 1,42738
$x_{(2)}$ 1,52229
$x_{(3)}$ 1,69742
$x_{(4)}$ 1,90642
$x_{(5)}$ 1,98492
$x_{(6)}$ 1,99568
$x_{(7)}$ 2,10288
$x_{(8)}$ 2,22488
$x_{(9)}$ 2,61826
$x_{(10)}$ 3,15435

Vamos agora calcular os valores $d_i$'s, para $i = 1,\ldots,10$. Temos que, $n=10, a=\frac{3}{8}=0,375$. Os resultados são os seguintes:

\[d_{1}=\frac{1-0,375}{10+1-2\cdot0,375}=0,060976\]

\[d_{2}=\frac{2-0,375}{10+1-2\cdot0,375}=0,158537\]

\[d_{3}=\frac{3-0,375}{10+1-2\cdot0,375}=0,256098\]

\[d_{4}=\frac{4-0,375}{10+1-2\cdot0,375}=0,353659\]

\[d_{5}=\frac{5-0,375}{10+1-2\cdot0,375}=0,451220\]

\[d_{6}=\frac{6-0,375}{10+1-2\cdot0,375}=0,548780\]

\[d_{7}=\frac{7-0,375}{10+1-2\cdot0,375}=0,646341\]

\[d_{8}=\frac{8-0,375}{10+1-2\cdot0,375}=0,743902\]

\[d_{9}=\frac{9-0,375}{10+1-2\cdot0,375}=0,841463\]

\[d_{10}=\frac{10-0,375}{10+1-2\cdot0,375}=0,939024\]

Desta forma, calculando os quantis $\Phi^{-1}(d_i)$ temos que

$x_{(i)}$ $d_i$ $\Phi^{-1}(d_i)$
1,42738 0,060976 -1,54664
1,52229 0,158537 -1,00049
1,69742 0,256098 -0,65542
1,90642 0,353659 -0,37546
1,98492 0,45122 -0,12258
1,99568 0,54878 0,122581
2,10288 0,646341 0,375462
2,22488 0,743902 0,655424
2,61826 0,841463 1,000491
3,15435 0,939024 1,546635

Plotando os pontos da forma $(x_{(i)},\Phi^{-1}(d_i))$ temos o papel de probabilidade dado por

Também, se plotando os pontos da forma $(\Phi^{-1}(d_i), x_{(i)},)$ temos o QQ-plot dado por

Como demonstrado acima, a normalidade dos dados está relacionada com a linearidade do gráfico, quanto "mais linear" for o gráfico melhor a normalidade dos dados.  No exemplo acima, os pontos estão próximos da reta o que é um bom indicativo da nornalidade dos dados. 

 

Histograma

Podemos comparar a histograma da distribuição dos dados com a função densidade teórica, neste caso, a distribuição normal com média e desvio padrão correspondentes. 

 

Empírica

Comparamos a função da distribuição empírica com a função da distribuição acumulada teórica.

Para entender como executar essa função do Software Action, você pode consultar o manual do usuário.

Inferência

Sobre o Portal Action

O Portal Action é mantido pela Estatcamp - Consultoria Estatística e Qualidade, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.

Facebook

CONTATO

  •  Maestro Joao Seppe, 900, São Carlos - SP | CEP 13561-180
  • Telefone: (16) 3376-2047
  • E-Mail: [email protected]