1.3 - Aproximação Normal

Você está aqui

Para amostras de tamanho n > 50, utilizamos uma aproximação normal. Consideremos a estatística T+ como dada anteriormente, ou seja, T+ é a soma de todos os postos positivos.

Teorema 1.3.1:

Sob a hipótese nula, ou seja, sob a hipótese de que os valores Xi estão igualmente distribuídos em torno do valor θ0 temos que o valor esperado de T+, E0(T+), e a variância de T+, Var0(T+), são dados pelas fórmulas abaixo \[E(T^+ \mid \theta=\theta_0)=\frac{n(n+1)}{4} \quad \hbox{e} \quad Var(T^+ \mid \theta=\theta_0)=\frac{n(n+1)(2n+1)}{24}\]

Demonstração:

Para cada i, considere a variável aleatória Vi dada por \[V_i=\left\{\begin{array}{l} R_i, \ \hbox{se} \ X_i-\theta_0 \ \textgreater \ 0\\0, \ \hbox{se} \ X_i-\theta_0 \ \textless \ 0.\]

 Sob a hipótese H0, temos que os valores de Xi estão igualmente distribuídos em torno de  θ0, desta forma as variáveis aleatórias Vi são igualmente distribuídas com a seguinte distribuição de probabilidade \[P(V_i=i) =P(V_i=0)=\frac{1}{2}\]

para i = 1, 2, ..., n. Desta forma, temos que \[E(T^+ \mid \theta=\theta_0)=E\left[\sum_{i=1}^n V_i \mid \theta=\theta_0\right]=\sum_{i=1}^n E [V_i \mid \theta=\theta_0]= \frac{1}{2} \sum_{i=1}^n i=\frac{1}{2}\left[\frac{n(n+1)}{2}\right]=\frac{n(n+1)}{4}\]

e \[Var(T^+\mid\theta=\theta_0)=\sum_{i=1}^n Var(V_i \mid \theta=\theta_0)=\sum_{i=1}^n E(V_i^2 \mid \theta=\theta_0)-[E(V_i \mid \theta=\theta_0)]^2=\]

\[\sum_{i=1}^n \left(\frac{i^2}{2}-\frac{i^2}{4}\right)=\frac{i^2}{4}\]

ou seja, \[Var(T^+ \mid \theta=\theta_0)=\frac{1}{4}\sum_{i=1}^n i^2= \frac{1}{4}\left[\frac{n(n+1)(2n+1)}{6}\right] = \frac{n(n+1) (2n+1)} {24}\]

como queríamos demonstrar.

Aproximação Normal

Utilizando resultados assintóticos, temos que a estatística Z, dada por \[Z = \frac{T^+-E_0(T^+)}{\sqrt{Var_0(T^+)}}=\frac{T^+-\frac{1}{4}n(n+1)}{\sqrt{[n(n+1) (2n+1)/24]}} \qquad (1.3.1)\]

tem distribuição aproximadamente Normal com média 0 e variância 1. Então o teste fica reduzido para um teste normal padrão.

Os passos para a realização deste teste:

1. Estabelecemos as seguintes hipóteses: \[\left\{\begin{array}{l}H_0:\theta=\theta_{0}\\H_1:\theta\neq\theta_{0} \\\end{array}\right. \quad \left\{\begin{array}{l}H_0:\theta=\theta_0\\H_1:\theta \ \textgreater \ \theta_0\end{array}\right. \quad \left\{\begin{array}{l}H_0:\theta=\theta_0\\H_1:\theta \ \textless \ \theta_0\end{array}\right.\]

que são equivalentes as hipóteses \[\left\{\begin{array}{l}H_0:\theta-\theta_0=0\\H_1:\theta-\theta_0\neq0\end{array}\right. \quad \left\{\begin{array}{l}H_0:\theta-\theta_0=0\\H_1:\theta-\theta_0 \ \textgreater \ 0\end{array}\right. \quad \left\{\begin{array}{l}H_0:\theta-\theta_0=0\\H_1:\theta-\theta_0 \ \textless \ 0\end{array}\right.\]

2. Primeiramente devemos subtrair θ0 de cada valor Xi, i = 1, 2, ..., n, da amostra e assim obtemos um novo conjunto de dados, (X10, X20, ..., Xn0).

3. Ordenamos de forma crescente de magnitude os valores desse novo conjunto de dados e associamos a cada valor o posto correspondente, tendo cada posto o mesmo sinal do valor que este representa.

4. Calculamos o valor da estatística T+

5. Calculamos o valor de Zobs através da equação (1.3.1) . Em seguida, fixamos o nível de significância α.

6. Encontramos os valores críticos referentes ao nível de significância α fixado.

  • Se o teste é bilateral, os valores críticos são $-Z_{\alpha/2}$ e $Z_{\alpha/2}$.
  • Se o teste é unilateral à direita, o valor crítico é $Z_{\alpha}$.
  • Se o teste é unilateral à esquerda, o valor crítico é $-Z_{\alpha}$.

7. Critério de rejeição:

  • Se o teste é bilateral, rejeitamos a hipótese nula se $Z_{obs} \ \textgreater \ Z_{\alpha/2}$ ou se $Z_{obs} \ \textless \ -Z_{\alpha/2}$, caso contrário, não rejeitamos a hipótese nula.
  • Se o teste é unilateral à direita, rejeitamos a hipótese nula se $Z_{obs} \ \textgreater \ Z_{\alpha}$, caso contrário, não rejeitamos a hipótese nula.
  • Se o teste é unilateral à esquerda, rejeitamos a hipótese nula se $Z_{obs} \ \textless \ -Z_{\alpha}$, caso contrário, não rejeitamos a hipótese nula.

8. Cálculo do p-valor

  •  Se o teste é bilateral, então o p-valor é dado por \[P-valor = P[|Z| \ \textgreater \ |Z_{obs}||H_0] = 2 P[Z \ \textgreater |Z_{obs}|].\]
  • Se o teste é unilateral à direita, então o p-valor é dado por \[P-valor = P[Z \ \textgreater \ Z_{obs}|H_0].\]
  • Se o teste é unilateral à esquerda, então o p-valor é dado por \[P-valor = P[Z \ \textless \ Z_{obs}|H_0].\]

Aproximação normal com correção de continuidade

Como estamos utilizando uma distribuição contínua, é conveniente utilizar uma correção de continuidade, de acordo com o tipo de teste que está sendo realizado.

  • Se o teste é bilateral, calculamos A dado por \[A = T^+-\frac{n(n+1)}{4}.\]

Se A ≥ 0, a estatística será dada por \[Z_{cor}=\frac{T^+-\frac{1}{2}-\frac{n(n+1)}{4}}{\sqrt{\frac{n(n+1)(2n+1)}{24}}}\]

e se A < 0, a estatística será dada por \[Z_{cor}=\frac{T^++\frac{1}{2}-\frac{n(n+1)}{4}}{\sqrt{\frac{n(n+1)(2n+1)}{24}}}.\]

  • Se o teste é unilateral à direita, a estatística será dada por   \[Z_{cor}=\frac{T^+-\frac{1}{2}-\frac{n(n+1)}{4}}{\sqrt{\frac{n(n+1)(2n+1)}{24}}}.\]
  • Se o teste é unilateral à esquerda, a estatística será dada por \[Z_{cor}=\frac{T^++\frac{1}{2}-\frac{n(n+1)}{4}}{\sqrt{\frac{n(n+1)(2n+1)}{24}}}.\]

Os passos utilizados são análogos aos anteriores, porém utilizamos Zcor ao invés de Zobs.

Exemplo 1.3.1:

Considere a seguinte amostra de 60 elementos

221 106 272 136 353 331
242 335 257 248 312 211
81 321 336 318 186 169
328 355 114 184 264 322
363 284 299 323 228 245
365 268 270 131 138 196
259 293 152 202 300 199
260 263 185 311 240 325
124 162 142 346 163 261
343 123 362 95 132 281

Vamos testar se os elementos estão distribuídos simetricamente em torno de θ0 = 220.

clique aqui para efetuar o download dos dados utilizados nesse exemplo

1. Para realizar este teste, estabelecemos as hipóteses \[\left\{\begin{array}{l}H_0:\theta=220\\H_1:\theta\neq220\end{array}\right.\]

2. Subtraindo θ0 = 220 de cada elemento da amostra e colocando todos os valores em ordem crescente de magnitude, obtemos:

1 8 -9 -18 20 -21
22 -24 25 28 -34 -35
-36 37 39 40 41 43
44 48 50 -51 52 -57
-58 61 64 -68 73 -78
79 80 -82 -84 -88 -89
91 92 -96 -97 98 101
102 103 105 -106 108 111
-114 115 116 123 -125 126
133 135 -139 142 143 145

3. Associando os postos correspondentes destes valores, temos que

Postos
1 2 -3 -4 5 -6
7 -8 9 10 -11 -12
-13 14 15 16 17 18
19 20 21 -22 23 -24
-25 26 27 -28 29 -30
31 32 -33 -34 -35 -36
37 38 -39 -40 41 42
43 44 45 -46 47 48
-49 50 51 52 -53 54
55 56 -57 58 59 60

4. A partir dos valores dos postos acima, calculamos o valor T+ que será dado por \[T^+=1222.\]

5. Calculamos o valor da estatística Z dada na equação (1.3.1) \[Z = \frac{T^+-\frac{1}{4}n(n+1)}{\sqrt{[n(n+1)(2n+1)/24]}}=\frac{1222-915}{135,84}=2,260012.\]

Fixamos o nível de significância α = 0,05.

6. Encontramos os valores críticos da distribuição Normal. Neste caso, como o teste é bilateral, os valores são Zα/2 = 1,96 e -Zα/2 = -1,96.

7. Critério.

Como Zobs = 2.260012 > 1,96, rejeitamos a hipótese nula de que os dados estão simetricamente distribuídos em torno de θ0 = 220.

8. Cálculo do p-valor

Neste caso, com o teste é bilateral, o p-valor é dado por \[P-valor = 2P(Z \ \textgreater \ Z_{obs})=2P(Z \ \textgreater \ 2.260012)=0,0238.\]

Utilizando o software Action, temos os seguintes resultados:

Para entender como executar essa função do Software Action, você pode consultar o manual do usuário.

Caso, quiséssemos realizar o teste com correção de continuidade calculamos o valor A dado por \[A = T^+-\frac{n(n+1)}{4}= 1222-915=307.\]

Como A = 307 ≥ 0, a estatística é dada por \[Z_{cor}=\frac{T^+-\frac{1}{2}-\frac{n(n+1)}{4}}{\sqrt{\frac{n(n+1)(2n+1)}{24}}}=\frac{306,5}{135,84}=2,256331.\]

E, neste caso, o p-valor é dado por \[P-valor = 2P(Z \ \textgreater \ 2.256331)=0,02405.\]

Utilizando o software Action, temos os seguinte resultados:

Para entender como executar essa função do Software Action, você pode consultar o manual do usuário.

Sobre o Portal Action

O Portal Action é mantido pela Estatcamp - Consultoria Estatística e Qualidade, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.

Facebook

CONTATO

  •  Maestro Joao Seppe, 900, São Carlos - SP | CEP 13561-180
  • Telefone: (16) 3376-2047
  • E-Mail: [email protected]