6.5 - Teste de Ryan-Joiner

Você está aqui

O teste de Ryan-Joiner é utilizado para testar se os dados provém de uma população com distribuição normal. É similar ao teste de Shapiro-Wilk, pois também se baseia na relação linear entre a estatística de ordem da distribuição normal de uma amostra de tamanho $ n $ e a amostra da população em estudo após ser ordenada.

Suponha que $ \mathbf{X}=X_1, X_2, \dots,X_n $ represente o vetor contendo uma amostra de tamanho $ n $ da população de interesse. Denotando por $ \mathbf{Y}=Y_1,Y_2, \dots,Y_n $ o vetor ordenado de forma crescente dos elementos de $ \mathbf{X} $, ou seja, $ Y_1=\min(\mathbf{X}) $ e $ Y_n=\max(\mathbf{X}) $ e analogamente para os termos intermediários, por fim, seja $ \mathbf{Z}=Z_1,Z_2, \dots,Z_n $ um vetor contendo os valores dos quantis teóricos de uma distribuição $ N(0,1) $, dado por 

$$Z_i=\Phi ^{-1} \left(\frac{i-3/8}{n+1/4}\right) \\,\\i=1,2,\dots,n$$

em que $ \left(\dfrac{i-3/8}{n+1/4}\right) $ é conhecido como posição de plotagem.

O teste de Ryan-Joiner se resume em estudar o gráfico normal de probabilidade entre $ \mathbf{Z} $ e $ \mathbf{Y} $ atravéz do método de regressão linear (veja com mais detalhes papel de probabilidade), caso a amostra $ \mathbf{X} $ provenha de uma população normal esperamos que $ \mathbf{Z} $ e $ \mathbf{Y} $ tenha, de fato, uma relação linear. A ideia central do teste está em estudar o quão significativa é essa relação, para isso Ryan-Joiner propôs a estatística de teste baseada no coeficiente de correlação amostral de Pearson, dada por 

$$r=\frac{\displaystyle\sum_{i=1}^{n} \left(Y_i-\bar{Y}\right) \left( Z_i - \bar{Z} \right)}{\displaystyle\sqrt{\sum_{i=1}^{n} \left(Y_i-\bar{Y}\right)^2 } \sqrt{\displaystyle\sum_{i=1}^{n} \left( Z_i - \bar{Z} \right)^2}}$$

O teste de Ryan-Joiner rejeita a hipótese de normalidade dos dados se $  r \ \leq c_{\alpha} $ onde $ c_{\alpha} $ é o valor crítico do teste. Porém, sob $ H_0 $, a distribuição de $ r $ depende de $ n $, ou seja, para tamanhos de amostras diferentes temos distribuições diferentes e consequentemente valores críticos distintos.

Por sua vez, o  $ p-valor $ é calculado sendo a probabilidade de $ r $ ser menor que $ r_{obs} $ considerando que $ H_0 $ é verdadeira, ou seja, $ p-valor=\mathbf{P} [ r \ \textless \ r_{obs} | H_0 ] $, porém, como mencionado a distribuição de $ r $, sob $ H_0 $, depende do tamanho da amostra, portanto necessitamos de apoio computacional para o calculo do p-valor e $ c_{\alpha} $

De maneira prática, o teste de Ryan-Joiner é realizado pelos seguintes passos:

  • Fixar as hipóteses
     \mbox {A amostra não provém de população com distribuição normal}.\end{array} \right. \]

  • Definir o tamanho da amostra $ n $;

  • Ordenar a amostra $ x_1,x_2, \dots ,x_n $ em $ y_1,y_2, \dots, y_n $;

  • Calcular os quantis $ z_1,z_2, \dots ,z_n $;

  • Calcular 

  • $ r=\frac{\displaystyle\sum_{i=1}^{n} \left(Y_i-\bar{Y}\right) \left( Z_i - \bar{Z} \right)}{\sqrt{\displaystyle\sum_{i=1}^{n} \left(Y_i-\bar{Y}\right)^2 } \sqrt{\displaystyle\sum_{i=1}^{n} \left( Z_i - \bar{Z} \right)^2}} $;

  • Fixar o nível de significância $ \alpha $

  • Calcular $ c_\alpha $;

  • Se $ r\ \leq \ c_\alpha $, a um nível de significância $ \alpha $, rejeitar $ H_0 $, caso contrário, não rejeitar $ H_0 $.   

Exemplo 6.5.1: 

Considere novamente o exemplo \textbf{6.1.1} de medidas de 10 peças: 

Dados
1,90642 2,10288 1,52229 2,61826 1,42738 2,22488 1,69742 3,15435 1,98492 1,99568

Para o exemplo em questão, temos $ n=10 $. Os dados ordenados e os quantis teóricos para $ i=1,2, \dots,10 $ são dados pelas tabelas a seguir:

y1 1,42738
y2 1,52229
y3 1,69742
y4 1,90642
y5 1,98492
y6 1,99568
y7 2,10288
y8 2,22488
y9 2,61826
y10 3,15435
z1 -1,5466353
z2 -1,0004905
z3 -0,6554235
z4 -0,3754618
z5 -0,1225808
z6 0,1225808
z7 0,3754618
z8 0,6554235
z9 1,0004905
z10 1,5466353

 Clique aqui para efetuar o downloads dos dados utilizados nesse exemplo

O coeficiente de correlação de Pearson é dado por: 

$$r=\frac{\displaystyle\sum_{i=1}^{n} \left(Y_i-\bar{Y}\right)\left( Z_i - \bar{Z} \right)}{\sqrt{\displaystyle\sum_{i=1}^{n} \left(Y_i-\bar{Y}\right)^2 } \sqrt{\displaystyle\sum_{i=1}^{n} \left( Z_i - \bar{Z} \right)^2}}=\frac{4,188292}{\sqrt{2,39237}\sqrt{7,957279}} =\frac{4,188292}{1,546715\times 2,820865}=0,959408$$

Utilizando o nível de confiança $ \alpha=0,05 $, com $ n=10 $, temos que $ c_{0,05}=0,9173243 $.Como $ r=0,9599408 \ \textgreater \ c_{0,05}=0,9173243 $ não rejeitamos $ H_0 $ a um nível de significância de 5%, ou seja, não rejeitamos que a amostra provém de uma população normal. Além disso, $ p-valor=\mathbf{P}[r \ \textless \ r_{obs}]=\mathbf{P}[r \ \textless \ 0,9599408]=0,3244 $, que é maior que o nível de significância $ \alpha=0,05 $ reforçando a conclusão.

Exemplo 6.5.2:

Considere novamente os dados de medição de 10 peças do exemplo 6.4.2:

Medições
8 9 10 10 10 12 12 16 19 24

Para o exemplo em questão, novamente temos $ n=10 $. Os dados ordenados e os quantis teóricos para $ i=1,2, \dots,10 $ são dados pelas tabelas a seguir:

y1 8
y2 9
y3 10
y4 10
y5 10
y6 12
y7 12
y8 16
y9 19
y10 24
z1 -1,5466353
z2 -1,0004905
z3 -0,6554235
z4 -0,3754618
z5 -0,1225808
z6 0,1225808
z7 0,3754618
z8 0,6554235
z9 1,0004905
z10 1,5466353

 Clique aqui para efetuar o download dos dados utilizados nesse exemplo

O coeficiente de correlação de Pearson é dado por: 

$$r=\frac{\displaystyle\sum_{i=1}^{n} \left(Y_i-\bar{Y}\right)\left( Z_i - \bar{Z} \right)}{\sqrt{\displaystyle\sum_{i=1}^{n} \left(Y_i-\bar{Y}\right)^2 } \sqrt{\displaystyle\sum_{i=1}^{n} \left( Z_i - \bar{Z} \right)^2}}=\frac{39,6797}{\sqrt{236}\sqrt{7,957279}} =\frac{39,6797}{15,36229\times2820865}=0,915611$$

Utilizando o nível de confiança $ \alpha=0,05 $, com $ n=10 $, temos que $ c_{0,05}=0,9173243 $.

Como $ r=0,915611\ \textless \ c_{0,05}=0,9173243 $ rejeitamos $ H_0 $ a um nível de significância de 5%, ou seja, rejeitamos que a amostra provém de uma população normal. Além disso, $ p-valor=\mathbf{P}[r \ \textless \ r_{obs}]=\mathbf{P}[r \ \textless \ 0,9599408]= 0,0485 $, que é menor que o nível de significância $ \alpha=0,05 $ reforçando a conclusão.

 

Para entender como executar essa função do Software Action, você pode consultar o manual do usuário.

Inferência

Sobre o Portal Action

O Portal Action é mantido pela Estatcamp - Consultoria Estatística e Qualidade, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.

Facebook

CONTATO

  •  Maestro Joao Seppe, 900, São Carlos - SP | CEP 13561-180
  • Telefone: (16) 3376-2047
  • E-Mail: [email protected]