6.1 - Técnica gráfica

Você está aqui

Papel de Probabilidade e QQ-plot

Método gráfico é uma técnica utilizada para verificar a adequação de um determinado modelo estatístico aos dados. A técnica que iremos descrever é simples de utilizar e pode ser aplicada a inúmeros tipos de modelos estatísticos. Vamos considerar o modelo Normal com média $ \mu $ e variância $ \sigma^2 $. Para maiores informações sobre a distribuição normal consultar o capítulo 6.2 - Distribuição normal. Se $ X\sim N(\mu,\sigma^2) $, a transformação 

\[Z=\frac{X-\mu}{\sigma}\]

tem distribuição normal padrão (média zero e variância 1). Vamos denotar a distribuição acumulada de $ Z $ por $ \Phi $. Se $ F $ é a função distribuição acumulada da distribuição normal com média $ \mu $ e variância $ \sigma^2 $, temos que 

\[F(x)=\mathbb{P}[X \leq x ]=\mathbb{P}\left[Z\leq \frac{x-\mu}{\sigma}\right]=\Phi\left(\frac{x-\mu}{\sigma}\right).\]

Aplicando a função $ \Phi^{-1} $ em ambos os lados, temos 

\[\Phi^{-1}(F(x))=\frac{x-\mu}{\sigma}\]

de onde obtemos que 

\[x=\sigma\Phi^{-1}(F(x))+\mu\]

onde $ \Phi^{-1}(F(x)) $ é o quantil da distribuição Normal padrão, calculado no ponto $ F(x) $. Como a expressão acima tem o formato de uma expressão linear, ao fazermos o gráfico entre $ x $ e $ \Phi^{-1}(F(x)) $ devemos esperar um comportamento linear dos pontos, se a distribuição Normal for realmente adequada. Com isso, podemos construir o Papel de Probabilidade ou QQ-Plot a partir das seguintes etapas:

1) Considere uma amostra $ x_1,\ldots,x_n $;

2) Ordene os elementos da amostra, ou seja, $ x_{(1)}\leq x_{(2)}\leq\ldots\leq x_{(n)} $;

3) Calcule $ n $ valores $ d_i = \dfrac{i-a}{n+1-2\cdot a} $, com $ i = 1,\ldots,n. ~a= \dfrac{3}{8} $, se $ n \leq 10; a= \dfrac{1}{2} $, caso contrário. A correção é necessário para que não tenhamos $ d_i=1 $, pois neste caso, teríamos que $ \phi^{-1} (1) = \infty $. Estas constantes não são padrão, dependendo do autor (ou software de estatísticas) elas podem mudar.

4) Calcule os quantis da distribuição Normal padrão para cada um dos valores $ d_i $, isto é,  

\[\Phi^{-1}(d_{i}),~~i=1, \ldots, n;\]

5.1) (Caso Papel de Probabilidade) Faça um gráfico com os pontos $ (x_{(i)}, \Phi^{-1}(d_{i})),~i=1, \ldots, n; $ ou
    
5.2) (Caso QQ-plot) Faça um gráfico com os pontos $ (\Phi^{-1}(d_{i}), x_{(i)}),~i=1, \ldots, n; $ e

avalie a normalidade dos dados. Para isto, devemos verificar o comportamento linear dos pontos. Qunato "mais linear" for o gráfico, melhor a normalidade dos dados.

Exemplo 6.1.1:

Avaliar a normalidade dos dados referentes à medição de 10 peças.

1,90642
2,10288
1,52229
2,61826
1,42738
2,22488
1,69742
3,15435
1,98492
1,99568

clique aqui para efetuar o download dos dados utilizados nesse exemplo

Ordenando os elementos da amostra, temos que

$ x_{(1)} $ 1,42738
$ x_{(2)} $ 1,52229
$ x_{(3)} $ 1,69742
$ x_{(4)} $ 1,90642
$ x_{(5)} $ 1,98492
$ x_{(6)} $ 1,99568
$ x_{(7)} $ 2,10288
$ x_{(8)} $ 2,22488
$ x_{(9)} $ 2,61826
$ x_{(10)} $ 3,15435

Vamos agora calcular os valores $ d_i $'s, para $ i = 1,\ldots,10 $. Temos que, $ n=10, a=\frac{3}{8}=0,375 $. Os resultados são os seguintes:

\[d_{1}=\frac{1-0,375}{10+1-2\cdot0,375}=0,060976\]

\[d_{2}=\frac{2-0,375}{10+1-2\cdot0,375}=0,158537\]

\[d_{3}=\frac{3-0,375}{10+1-2\cdot0,375}=0,256098\]

\[d_{4}=\frac{4-0,375}{10+1-2\cdot0,375}=0,353659\]

\[d_{5}=\frac{5-0,375}{10+1-2\cdot0,375}=0,451220\]

\[d_{6}=\frac{6-0,375}{10+1-2\cdot0,375}=0,548780\]

\[d_{7}=\frac{7-0,375}{10+1-2\cdot0,375}=0,646341\]

\[d_{8}=\frac{8-0,375}{10+1-2\cdot0,375}=0,743902\]

\[d_{9}=\frac{9-0,375}{10+1-2\cdot0,375}=0,841463\]

\[d_{10}=\frac{10-0,375}{10+1-2\cdot0,375}=0,939024\]

Desta forma, calculando os quantis $ \Phi^{-1}(d_i) $ temos que

$ x_{(i)} $ $ d_i $ $ \Phi^{-1}(d_i) $
1,42738 0,060976 -1,54664
1,52229 0,158537 -1,00049
1,69742 0,256098 -0,65542
1,90642 0,353659 -0,37546
1,98492 0,45122 -0,12258
1,99568 0,54878 0,122581
2,10288 0,646341 0,375462
2,22488 0,743902 0,655424
2,61826 0,841463 1,000491
3,15435 0,939024 1,546635

Plotando os pontos da forma $ (x_{(i)},\Phi^{-1}(d_i)) $ temos o papel de probabilidade dado por

Também, se plotando os pontos da forma $ (\Phi^{-1}(d_i), x_{(i)},) $ temos o QQ-plot dado por

Como demonstrado acima, a normalidade dos dados está relacionada com a linearidade do gráfico, quanto "mais linear" for o gráfico melhor a normalidade dos dados.  No exemplo acima, os pontos estão próximos da reta o que é um bom indicativo da nornalidade dos dados. 

 

Histograma

Podemos comparar a histograma da distribuição dos dados com a função densidade teórica, neste caso, a distribuição normal com média e desvio padrão correspondentes. 

 

Empírica

Comparamos a função da distribuição empírica com a função da distribuição acumulada teórica.

Para entender como executar essa função do Software Action, você pode consultar o manual do usuário.

Inferência

Sobre o Portal Action

O Portal Action é mantido pela Estatcamp - Consultoria Estatística e Qualidade, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.

Facebook

CONTATO

  •  Maestro Joao Seppe, 900, São Carlos - SP | CEP 13561-180
  • Telefone: (16) 3376-2047
  • E-Mail: [email protected]