1.4 - Observações Repetidas

Você está aqui

Agora veremos o caso em que, ao observarmos uma amostra, encontramos valores repetidos.

Consideremos uma amostra de tamanhos n. Os passos para a realização deste teste são análogos ao do caso anterior. O que mudará neste caso são os postos: quando os módulos dos números se repetem, teremos postos iguais para os números. O posto desses números será a média entre os postos que eles assumiriam no caso comum. Os postos dos números que não se repetem continuam sendo os números associados à posição em que o valor se encontra na listagem.

Para um maior esclarecimento consideremos a seguinte sequência de números:

-8 9 -15 15 16 18 32 32 32 -39

Os postos no caso comum seriam:

Valor -8 9 -15 15 16 18 32 32 32 -39
Posto 1 2 3 4 5 6 7 8 9 10

Mas observe que nesta sequência o número 15 aparece 2 vezes e o número 32 aparece 3 vezes. Assim, temos repetições. Portanto, o posto dos dois números 15 será a média dos números que correspondem à suas colocações na listagem, ou seja, (3+4)/2 = 3,5. De maneira análoga, o posto dos três números 32 será (7+8+9)/3 = 8. Os valores que não se repetem continuam com os mesmos postos. Então, temos que os valores observados e seus respectivos postos são

Valor -8 9 -15 15 16 18 32 32 32 -39
Posto 1 2 3,5 3,5 5 6 8 8 8 10

Se tivermos valores 0 na amostra, eliminamos estes valores e realizamos o teste para os valores restantes.

Exemplo 1.4.1: 

Suponha que em um teste de Wilcoxon temos os seguintes desvios:

0 0 3 -7 9 9 -11 11 11 14 16 17 17 18

Como temos dois valores 0 no conjunto de dados, esses valores são eliminados e ficamos com os dados restantes, isto é,

3 -7 9 -9 -11 11 11 14 16 17 17 18

A seguir, calculamos o módulo de cada elemento do conjunto de dados e atribuímos a ele, seu posto correspondente. Desta forma, os postos serão:

Zi 3 -7 9 -9 -11 11 11 14 16 17 17 18
Posto 1 2 3,5 3,5 6 6 6 8 9 10,5 10,5 12

Observação:

Para amostras que possuem valores repetidos ou valores zeros, o p-valor e o intervalo de confiança para um teste de Wilcoxon não são calculados de forma exata e os testes realizados são sempre assintóticos (utilizando aproximação normal).

 

Observações repetidas

Se existem r conjuntos diferentes de repetições, seja di, i = 1, ..., r o número de observações repetidas no conjunto i. Definimos d0 como o número de zeros existente na amostra. Neste caso, a estatística Z, dada por

\[Z = \frac{T^{+}-\frac{n(n+1)}{4}}{\sqrt{\frac{n(n+1)(2n+1)-d_{0}(d_{0}+1)(2d_{0}+1)}{24} - \frac{\sum_{i=1}^{r}(d_{i}^3-d_{i})}{48}}}.~~~(1.4.1)\]

tem uma distribuição aproximadamente normal, para valores grandes de n.

Vejamos os passos para aplicar o Teste de Wilcoxon para observações repetidas.

1. Estabeleça uma hipóteses:

\[\left\{\begin{array}{l}H_0:\theta=\theta_{0}\\H_1:\theta\neq\theta_{0}\end{array}\right.\quad \left\{\begin{array}{l}H_0:\theta=\theta_0\\H_1:\theta \ \textgreater \ \theta_0\end{array}\right.\quad \left\{\begin{array}{l}H_0:\theta=\theta_0\\H_1:\theta \ \textless \ \theta_0\end{array}\right.\]

2. Primeiramente, subtraímos θ0 de cada valor Xi, i = 1, ..., n da amostra e assim obtemos um novo conjunto de dados, (X1 - θ0, ..., Xn - θ0).

3. Ordenamos de forma crescente os módulos dos valores desse novo conjunto de dados e associamos a cada valor o posto correspondente, sendo esse posto como definido acima.

4. Calculamos o valor da estatística T+, que foi definida como sendo a soma dos postos dos elementos que tem sinal positivo.

5. Seja di, i = 1, ..., r o número de observações repetidas, se existem r conjuntos de diferentes repetições. Calculamos o valor de Z através da equação (1.4.1). Em seguida, fixamos o nível de significância α.

6. Encontramos na Tabela da distribuição Normal os valores críticos.

  • Se o teste é bilateral, encontramos os valores Zα/2 e -Zα/2.
  • Se o teste é unilateral à direita, encontramos o valor crítico Zα  .
  • Se o teste é unilateral à esquerda, encontramos o valor crítico -Zα.

7. Critério:

  • No caso bilateral, rejeitamos a hipótese nula se $Z_{obs} \ \textgreater \ Z_{\alpha/2}$ ou $Z_{obs} \ \textless \ -Z_{\alpha/2}$, caso contrário, não rejeitamos a hipótese nula.
  • No caso unilateral à direita, rejeitamos a hipótese nula se $Z_{obs} \ \textgreater \ Z_{\alpha}$, caso contrário, não rejeitamos a hipótese nula.
  • No caso unilateral à esquerda, rejeitamos a hipótese nula se $Z_{obs} \ \textless \ -Z_{\alpha}$, caso contrário, não rejeitamos a hipótese nula.

8. Cálculo do p-valor

  • Se o teste é bilateral, o p-valor é calculado da seguinte forma

\[P-valor = P[|Z| \ \textgreater \ |Z_{obs}||H_0]=2P[Z \ \textgreater \ |Z_{obs}|].\]

  • Se o teste é unilateral à direita, então o p-valor é dado por

\[P-valor = P[Z \ \textgreater \ Z_{obs}|H_0].\]

  • Se o teste é unilateral à esquerda, então o p-valor é dado por

\[P-valor = P[Z \ \textgreater \ Z_{obs}|H_0].\]

 

Correção de Continuidade

  • Se o teste é bilateral, então calculamos o valor A dado por

\[A = T^+-\frac{n(n+1)}{4}\]

e, se A ≥ 0 segue que a estatística será dada por

\[Z_{cor}=\frac{T^+-\frac{1}{2}-\frac{n(n+1)}{4}}{\sqrt{\frac{n(n+1)(2n+1)-d_0(d_0+1)(2d_0+1)} {24}-\frac{\sum_{i=1}^{r}(d_{i}^3-d_{i})}{48}}}\]

e se A < 0, a estatística será dada por

\[Z_{cor}=\frac{T^++\frac{1}{2}-\frac{n(n+1)}{4}}{\sqrt{\frac{n(n+1)(2n+1)-d_0(d_0+1)(2d_0+1)} {24}-\frac{\sum_{i=1}^{r}(d_{i}^3-d_{i})}{48}}}.\]

  • Se o teste é unilateral à direita, a estatística será dada por

\[Z_{cor}=\frac{T^+-\frac{1}{2}-\frac{n(n+1)}{4}}{\sqrt{\frac{n(n+1)(2n+1)-d_0(d_0+1)(2d_0+1)} {24}-\frac{\sum_{i=1}^{r}(d_{i}^3-d_{i})}{48}}}.\]

  • Se o teste é unilateral à esquerda, a estatística será dada por

\[Z_{cor}=\frac{T^++\frac{1}{2}-\frac{n(n+1)}{4}}{\sqrt{\frac{n(n+1)(2n+1)-d_0(d_0+1)(2d_0+1)} {24}-\frac{\sum_{i=1}^{r}(d_{i}^3-d_{i})}{48}}}.\]

 

Exemplo 1.4.2:

 Consideremos a amostra:

153 166 181 192 244 248 258 264 296 305 305 312
330 340 356 361 395 427 433 467 544 551 625 783

clique aqui para efetuar o download dos dados utilizados nesse exemplo

Use o teste de Wilcoxon para testar as hipóteses

\[\left\{\begin{array}{cc} H_0:\theta=220\\H_1:\theta \neq 220\\\end{array}\right.\]

Subtraindo 220 de cada valor da amostra e colocando todos os valores obtidos em ordem crescente de magnitude, obtemos:

24 -28 28 38 -39 44 -54 -67 76 85 85 92
110 120 136 141 175 207 213 247 324 331 405 563

A seguinte tabela nos dá os desvios obtidos acima, seus respectivos postos e os valores Riψi.

Valor 24 -28 28 38 -39 44 -54 -67 76 85 85 92
Posto 1 -2,5 2,5 4 -5 6 -7 -8 9 10,5 10,5 12
Riψi 1 0 2,5 4 0 6 0 0 9 10,5 10,5 12
Valor 110 120 136 141 175 207 213 247 324 331 405 563
Posto 13 14 15 16 17 18 19 20 21 22 23 24
Riψi 13 14 15 16 17 18 19 20 21 22 23 24

A partir dos valores Riψi, calculamos o valor T+, dado por

\[T^+=\sum_{i=1}^{24}R_i\Psi_i=277,5.\]

Com temos duas repetições envolvendo duas observações, segue que $d_{1}=d_{2}=2$ e $n=24$.

A estatística Z é dada por

\[Z=\frac{277,5-150}{\sqrt{\frac{24(24+1)(48+1)}{24}-\frac{(6+6)}{48}}}=3,643229.\]

Neste caso, o p-valor é dado por

\[P-valor = P[|Z| \ \textgreater \ |Z_{obs}||H_0]=2P[Z \ \textgreater \ 3,643229]=0,000269239.\]

Conclusão:

Rejeitamos H0 se considerarmos qualquer nível de significância maior que 0,0269239%.

Utilizando o software Action temos os seguinte resultados:

Para entender como executar essa função do Software Action, você pode consultar o manual do usuário.

Utilizando a correção de continuidade, como o teste é bilateral, temos que A é dado por

\[A = T^+-\frac{n(n+1)}{4}=277,5-\frac{24\times25}{4}=277,5-150=127,5 \ \textgreater \ 0.\]

Então, utilizando a correção de continuidade, a estatística Zcor é calculada da seguinte forma

\[Z_{cor}=\frac{277,5-0,5-150}{\sqrt{\frac{24(24+1)(48+1)}{24}-\frac{(6+6)}{48}}}=3,628942\]

e, neste caso, o p-valor é dado por

\[P-valor = P[|Z| \ \textgreater \ |Z_{obs}||H_0]=2P[Z \ \textgreater \ 3,628942]=0,000284585\]

Conclusão:

Rejeitamos H0 se considerarmos qualquer nível de significância maior que 0,0284585%.

Para entender como executar essa função do Software Action, você pode consultar o manual do usuário.

Sobre o Portal Action

O Portal Action é mantido pela Estatcamp - Consultoria Estatística e Qualidade, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.

Facebook

CONTATO

  •  Maestro Joao Seppe, 900, São Carlos - SP | CEP 13561-180
  • Telefone: (16) 3376-2047
  • E-Mail: [email protected]