6.5 - Teste de Ryan-Joiner

Você está aqui

O teste de Ryan-Joiner é utilizado para testar se os dados provém de uma população com distribuição normal. É similar ao teste de Shapiro-Wilk, pois também se baseia na relação linear entre a estatística de ordem da distribuição normal de uma amostra de tamanho $n$ e a amostra da população em estudo após ser ordenada.

Suponha que $\mathbf{X}=X_1, X_2, \dots,X_n$ represente o vetor contendo uma amostra de tamanho $n$ da população de interesse. Denotando por $\mathbf{Y}=Y_1,Y_2, \dots,Y_n$ o vetor ordenado de forma crescente dos elementos de $\mathbf{X}$, ou seja, $Y_1=\min(\mathbf{X})$ e $Y_n=\max(\mathbf{X})$ e analogamente para os termos intermediários, por fim, seja $\mathbf{Z}=Z_1,Z_2, \dots,Z_n$ um vetor contendo os valores dos quantis teóricos de uma distribuição $N(0,1)$, dado por $$Z_i=\Phi ^{-1} \left(\frac{i-3/8}{n+1/4}\right) \\,\\i=1,2,\dots,n$$

em que $\left(\dfrac{i-3/8}{n+1/4}\right)$ é conhecido como posição de plotagem.

O teste de Ryan-Joiner se resume em estudar o gráfico normal de probabilidade entre $\mathbf{Z}$ e $\mathbf{Y}$ atravéz do método de regressão linear (veja com mais detalhes papel de probabilidade), caso a amostra $\mathbf{X}$ provenha de uma população normal esperamos que $\mathbf{Z}$ e $\mathbf{Y}$ tenha, de fato, uma relação linear. A ideia central do teste está em estudar o quão significativa é essa relação, para isso Ryan-Joiner propôs a estatística de teste baseada no coeficiente de correlação amostral de Pearson, dada por $$r=\frac{\displaystyle\sum_{i=1}^{n} \left(Y_i-\bar{Y}\right) \left( Z_i - \bar{Z} \right)}{\displaystyle\sqrt{\sum_{i=1}^{n} \left(Y_i-\bar{Y}\right)^2 } \sqrt{\displaystyle\sum_{i=1}^{n} \left( Z_i - \bar{Z} \right)^2}}$$

O teste de Ryan-Joiner rejeita a hipótese de normalidade dos dados se $ r \ \leq c_{\alpha}$ onde $c_{\alpha}$ é o valor crítico do teste. Porém, sob $H_0$, a distribuição de $r$ depende de $n$, ou seja, para tamanhos de amostras diferentes temos distribuições diferentes e consequentemente valores críticos distintos.

Por sua vez, o  $p-valor$ é calculado sendo a probabilidade de $r$ ser menor que $r_{obs}$ considerando que $H_0$ é verdadeira, ou seja, $p-valor=\mathbf{P} [ r \ \textless \ r_{obs} | H_0 ]$, porém, como mencionado a distribuição de $r$, sob $H_0$, depende do tamanho da amostra, portanto necessitamos de apoio computacional para o calculo do p-valor e $c_{\alpha}$. 

De maneira prática, o teste de Ryan-Joiner é realizado pelos seguintes passos:

  • Fixar as hipóteses \[ \left\{ \begin{array}{ll}H_0: \mbox{A amostra provém de população com distribuição normal};\\ H_1: \mbox {A amostra não provém de população com distribuição normal}.\end{array} \right. \]
  • Definir o tamanho da amostra $n$;

  • Ordenar a amostra $x_1,x_2, \dots ,x_n$ em $y_1,y_2, \dots, y_n$;

  • Calcular os quantis $z_1,z_2, \dots ,z_n$;

  • Calcular 

  • $r=\frac{\displaystyle\sum_{i=1}^{n} \left(Y_i-\bar{Y}\right) \left( Z_i - \bar{Z} \right)}{\sqrt{\displaystyle\sum_{i=1}^{n} \left(Y_i-\bar{Y}\right)^2 } \sqrt{\displaystyle\sum_{i=1}^{n} \left( Z_i - \bar{Z} \right)^2}}$;

  • Fixar o nível de significância $\alpha$; 

  • Calcular $c_\alpha$;

  • Se $r\ \leq \ c_\alpha$, a um nível de significância $\alpha$, rejeitar $H_0$, caso contrário, não rejeitar $H_0$.   

Exemplo 6.5.1: 

Considere novamente o exemplo \textbf{6.1.1} de medidas de 10 peças: 

Dados
1,90642 2,10288 1,52229 2,61826 1,42738 2,22488 1,69742 3,15435 1,98492 1,99568

Para o exemplo em questão, temos $n=10$. Os dados ordenados e os quantis teóricos para $i=1,2, \dots,10$ são dados pelas tabelas a seguir:

y1 1,42738
y2 1,52229
y3 1,69742
y4 1,90642
y5 1,98492
y6 1,99568
y7 2,10288
y8 2,22488
y9 2,61826
y10 3,15435
z1 -1,5466353
z2 -1,0004905
z3 -0,6554235
z4 -0,3754618
z5 -0,1225808
z6 0,1225808
z7 0,3754618
z8 0,6554235
z9 1,0004905
z10 1,5466353

 Clique aqui para efetuar o downloads dos dados utilizados nesse exemplo

O coeficiente de correlação de Pearson é dado por: $$r=\frac{\displaystyle\sum_{i=1}^{n} \left(Y_i-\bar{Y}\right)\left( Z_i - \bar{Z} \right)}{\sqrt{\displaystyle\sum_{i=1}^{n} \left(Y_i-\bar{Y}\right)^2 } \sqrt{\displaystyle\sum_{i=1}^{n} \left( Z_i - \bar{Z} \right)^2}}=\frac{4,188292}{\sqrt{2,39237}\sqrt{7,957279}} =\frac{4,188292}{1,546715\times 2,820865}=0,959408$$

Utilizando o nível de confiança $\alpha=0,05$, com $n=10$, temos que $c_{0,05}=0,9173243$.Como $r=0,9599408 \ \textgreater \ c_{0,05}=0,9173243$ não rejeitamos $H_0$ a um nível de significância de 5%, ou seja, não rejeitamos que a amostra provém de uma população normal. Além disso, $p-valor=\mathbf{P}[r \ \textless \ r_{obs}]=\mathbf{P}[r \ \textless \ 0,9599408]=0,3244$, que é maior que o nível de significância $\alpha=0,05$ reforçando a conclusão.

Exemplo 6.5.2:

Considere novamente os dados de medição de 10 peças do exemplo 6.4.2:

Medições
8 9 10 10 10 12 12 16 19 24

Para o exemplo em questão, novamente temos $n=10$. Os dados ordenados e os quantis teóricos para $i=1,2, \dots,10$ são dados pelas tabelas a seguir:

y1 8
y2 9
y3 10
y4 10
y5 10
y6 12
y7 12
y8 16
y9 19
y10 24
z1 -1,5466353
z2 -1,0004905
z3 -0,6554235
z4 -0,3754618
z5 -0,1225808
z6 0,1225808
z7 0,3754618
z8 0,6554235
z9 1,0004905
z10 1,5466353

 Clique aqui para efetuar o download dos dados utilizados nesse exemplo

O coeficiente de correlação de Pearson é dado por: $$r=\frac{\displaystyle\sum_{i=1}^{n} \left(Y_i-\bar{Y}\right)\left( Z_i - \bar{Z} \right)}{\sqrt{\displaystyle\sum_{i=1}^{n} \left(Y_i-\bar{Y}\right)^2 } \sqrt{\displaystyle\sum_{i=1}^{n} \left( Z_i - \bar{Z} \right)^2}}=\frac{39,6797}{\sqrt{236}\sqrt{7,957279}} =\frac{39,6797}{15,36229\times2820865}=0,915611$$

Utilizando o nível de confiança $\alpha=0,05$, com $n=10$, temos que $c_{0,05}=0,9173243$.

Como $r=0,915611\ \textless \ c_{0,05}=0,9173243$ rejeitamos $H_0$ a um nível de significância de 5%, ou seja, rejeitamos que a amostra provém de uma população normal. Além disso, $p-valor=\mathbf{P}[r \ \textless \ r_{obs}]=\mathbf{P}[r \ \textless \ 0,9599408]= 0,0485$, que é menor que o nível de significância $\alpha=0,05$ reforçando a conclusão.

 

Para entender como executar essa função do Software Action, você pode consultar o manual do usuário.

Inferência

Sobre o Portal Action

O Portal Action é mantido pela Estatcamp - Consultoria Estatística e Qualidade, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.

Facebook

CONTATO

  •  Maestro Joao Seppe, 900, São Carlos - SP | CEP 13561-180
  • Telefone: (16) 3376-2047
  • E-Mail: [email protected]