2.3 - Aproximação Normal

Para valores m e n grandes, geralmente maiores que 50, uma aproximação normal, como veremos a seguir, é utilizada. Consideremos a estatística W como definida anteriormente, isto é, W = Un.

Teorema 2.3.1:

Sob a hipótese nula, ou seja, sob a hipótese de que a diferença entre as posições é Δ = 0, temos que o valor esperado de W, E0(W) e a variância de W, Var0(W) são dados pelas fórmulas abaixo

\[E_0(W)=\frac{mn}{2} \ \hbox{e} \ Var_0(W)=\frac{mn(m+n+1)}{12}\]

Aproximação Normal

Utilizando resultados assintóticos, temos a estatística Z dada por

\[Z = \frac{W-\frac{1}{2}mn}{\sqrt{\frac{mn(m+n+1)}{12}}}~~~(2.3.1)\]

tem distribuição aproximadamente Normal com média 0 e variância 1. Então o teste fica reduzido a um teste normal padrão.

Vejamos com realizar este teste:

1. Estabelecemos uma das seguintes hipóteses:

\[\left\{\begin{array}{l}H_0:\Delta=0\\H_1:\Delta\neq0\end{array}\right. \quad \left\{\begin{array}{l} H_0:\Delta=0\\H_1:\Delta \ \textgreater \ 0\end{array}\right. \quad \left\{\begin{array}{l}H_0: \Delta=0\\H_1:\Delta \ \textless \ 0\end{array}.\]

2. Ordenamos todos os valores (das duas amostras) em ordem crescente e colocamos os postos associados.

3. Em seguida, calculamos o valor de Sn (a soma dos postos associados aos elementos da amostra y).

4. Obtemos o valor W = Un. Em seguida, fixamos o nível de significância α.

5. Calculamos o valor

\[Z_{obs}= \frac{W-\frac{1}{2}mn}{\sqrt{\frac{mn(m+n+1)}{12}}}.\]

6. Encontramos os valores críticos da distribuição Normal padrão segundo o tipo de teste.

  • Se o teste é bilateral, encontramos os valores críticos $Z_{\alpha/2}$ e $-Z_{\alpha/2}$ tais que $P[Z \ \textgreater \ Z_{\alpha/2}]=P[Z \ \textless \ -Z_{\alpha/2}]=\alpha/2.$
  • Se o teste é unilateral à direita, encontramos o valor crítico $Z_{\alpha}$ tal que $P[Z \ \textgreater \ Z_{\alpha}]=\alpha$.
  • Se o teste é unilateral à esquerda, encontramos o valor crítico $-Z_{\alpha}$ tal que $P[Z \ \textless \ -Z_{\alpha}]=\alpha$.

7. Critério:

  • Se o teste é bilateral, rejeitamos a hipótese nula Hse o valor observado $Z_{obs} \ \textgreater \ Z_{\alpha/2}$ ou se $Z_{obs} \ \textless \ -Z_{\alpha/2}$, caso contrário não rejeitamos a hipótese nula.
  • Se o teste é unilateral à direita, rejeitamos a hipótese nula H0 se o valor observado $Z_{obs} \ \textgreater \ Z_{\alpha}$, caso contrário, não rejeitamos a hipótese nula.
  • Se o teste é unilateral à esquerda, rejeitamos a hipótese nula H0 se o valor observado $Z_{obs} \ \textless \ -Z_{\alpha}$, caso contrário, não rejeitamos a hipótese nula.

8. Cálculo do p-valor:

Se o teste é bilateral, o p-valor é dado por

\[P-valor = P(|Z| \ \textgreater \ |Z_{obs}||H_0) = 2P(Z \ \textgreater \ |Z_{obs}||H_0).\]

Se o teste é unilateral à direita, o p-valor é dado por

\[P-valor = P(Z \ \textgreater \ Z_{obs}|H_0)\]

e se o teste é unilateral à esquerda, o p-valor é dado por

\[P-valor = P(Z \ \textless \ Z_{obs}|H_0).\]

onde Z ~ N(0,1).

 

Aproximação Normal com correção de continuidade

Como estamos utilizando uma distribuição contínua, é conveniente utilizar uma correção de continuidade. Assim como foi visto anteriormente, a correção é feita de acordo com o tipo de teste efetuado.

  •  Se o teste é bilateral, calculamos A dado por

\[A = W -\frac{1}{2}nm.\]

Se A ≥ 0, então

\[Z_{cor}= \frac{W - \frac{1}{2}-\frac{1}{2}nm}{\sqrt{\frac{mn(m+n+1)}{12}}}.\]

 Se A < 0, então

 \[Z_{cor}= \frac{W+\frac{1}{2}-\frac{1}{2}nm}{\sqrt{\frac{mn(m+n+1)}{12}}}.\] 

  • Se o teste é unilateral à direita, a estatística é dada por

\[Z_{cor}=\frac{W-\frac{1}{2}-\frac{1}{2}nm}{\sqrt{\frac{mn(m+n+1)}{12}}}.\]

  • Se o teste é unilateral à esquerda, a estatística é dada por

\[Z_{cor}=\frac{W+\frac{1}{2}-\frac{1}{2}nm}{\sqrt{\frac{mn(m+n+1)}{12}}}.\]

Exemplo 2.3.1:

Considere as duas amostras dadas abaixo. A primeira de tamanho m = 60 e a segunda de tamanho n = 50 e vamos testar se existe diferença significativa entre suas medidas de posição.

Amostra 1
0,020783 1,190577 0,254776 0,326478 0,166423 -0,60854
-1,09347 -0,87468 -0,68062 -0,44368 1,107722 0,835386
-0,4732 0,614336 -0,14765 -0,73586 1,103766 0,304864
0,487065 1,437288 -0,01432 -0,39427 -0,0318 -0,55498
-0,92408 -0,09976 0,730077 0,698887 -1,62009 -0,61324
-1,31087 -2,12763 0,445035 0,321711 1,583911 -0,10288
-0,90719 0,390517 -0,95791 -0,13997 1,192579 0,78557
-0,70691 -0,36727 -0,36615 -0,12643 -1,55418 -1,74463
0,102534 0,29614 1,496525 0,037918 1,334108 -2,17951
-1,23783 0,43527 -0,70575 1,53077 0,773895 -0,80207
Amostra 2
0,849954 -0,06994 0,459771 -1,39136 -0,36113
0,130024 -0,57095 0,1313 1,494435 2,012758
0,357575 0,881379 0,343893 2,295901 -0,04778
0,2508 0,767977 0,622242 -0,00538 0,823678
0,310109 -0,45953 -0,26607 -1,60654 -1,49409
-1,05302 -1,62618 0,833893 -1,75903 -0,32571
1,770791 -0,0034 -0,13192 1,438544 -0,30188
-0,00674 0,392139 1,307978 0,065984 -1,32595
-0,85192 0,653739 0,838055 0,406276 -1,11364
0,267735 0,412184 0,10388 -0,71385 -0,3809

clique aqui para efetuar o download dos dados utilizados nesse exemplo

Neste caso, temos que m = 60 e n = 50.

Como queremos testar se existe diferença significativa entre suas medidas de posição, estabelecemos as seguintes hipóteses

\[\left\{\begin{array}{l}H_0:\Delta=0\\H_1:\Delta\neq0\end{array}\right.\]

Ordenando os valores das duas amostras e calculando a soma dos postos associados aos elementos da amostra de tamanho n = 50, temos que Sn = 2931. Deste modo, a estatística W é dada por

\[W = U_n = S_n-\frac{n(n+1)}{2}=2931-\frac{50\times 51}{2}= 1656.\]

A seguir calculamos o valor da estatística Z dada por

\[Z=\frac{W-1/2mn}{\sqrt{[mn(m+n+1)/12]}}=\frac{1656-(0,5\times60\times50)}{\sqrt{(60\times50\times111)/12}}=0,9364684.\]

Fixando o nível de significância α = 0,05 temos que os valores críticos são $Z_{\alpha/2} = 1,96$ e $-Z_{\alpha/2} = -1,96$, uma vez que o teste é bilateral. Como o valor observado foi Zobs = 0,9364684, não rejeitamos a hipótese nula, isto é, concluímos que não existe diferença significativa entre as medidas de posição das duas amostras.

Calculamos o p-valor da seguinte forma:

\[P-valor = P[|Z| \ \textgreater \ |Z_{obs}||H_0]= 2P[Z \ \textgreater \ |Z_{obs}||H_0]=2P[Z \ \textgreater \ 0,9364684]= 0,3490321.\]

Utilizando o software Action temos os seguintes resultados:

Para entender como executar essa função do Software Action, você pode consultar o manual do usuário.

 

Caso quiséssemos realizar o teste com correção de continuidade, calculamos o valor de A dado por

\[A = W - \frac{mn}{2}=1656=\frac{3000}{2}=156.\]

Como A ≥ 0, temos que

\[Z_{cor}=\frac{W - \frac{1}{2}-\frac{1}{2}nm}{\sqrt{\frac{mn(m+n+1)}{12}}}=\frac{155,5}{166,5833}=0,9334669.\]

Como -1,96 = -Zα/2 < Zcor = 0,9334669 < Zα/2 = 1,96, então a um nível de significância de 5% não rejeitamos a hipótese de que os dados tem mesma medida de posição.

E, neste caso, o p-valor é dado por

\[P-valor = 2P(Z \ \textgreater \ 0,9334669 = 0,350579.\]

Utilizando o software Action, temos os seguintes resultados:

Para entender como executar essa função do Software Action, você pode consultar o manual do usuário.

Sobre o Portal Action

O Portal Action é mantido pela Estatcamp - Consultoria Estatística e Qualidade, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.

Facebook

CONTATO

  •  Maestro Joao Seppe, 900, São Carlos - SP | CEP 13561-180
  • Telefone: (16) 3376-2047
  • E-Mail: [email protected]