2.4.1 - Teste de Kruskal-Wallis

Supondo uma amostra de uma população, subdividida em k conjuntos de amostras de tamanho $ n_j $ cada, que varia dependendo da série que estamos trabalhando. Por exemplo, se a série for anual e temos observações mensais, isto é, nj = 12 e k representaria o número de anos.

Então, temos as seguintes amostras

$$Y_{ij}, \quad j=1,\dots,k, \ \ i=1, \dots\, n_j, \quad N = \sum^k_{j=1} n_j$$

Substituímos as observações Yij por seus respectivos postos dentre todas as N observações, somamos todos os postos em cada subgrupo j, ou seja

$$R_{.j} = \sum^{n_j}_{i=1} R_{ij}, \quad j=1,\dots,k.$$

Assim, a estatística para o teste é dada por

\[H=\frac{\frac{12}{N(N+1)}\sum_{i=1}^kn_i\left(R_{i\cdot}-\frac{N+1}{2}\right)^2}{1-\frac{ \sum_{j=1}^g t_j^3-t_j}{N^3-N}}=\frac{\left(\frac{12}{N(N+1)}\sum_{i=1}^k \frac{R_i^2}{n_i} \right)-3(N+1)}{1-\frac{\sum_{j=1}^g t_j^3-t_j}{N^3-N}}\]

onde t é o número de observações repetidas no grupo j e g é o número de grupos com observações repetidas.

Sob H0, para nj suficientemente grande, ou k $ \ge $ 4, a distribuição de H pode ser aproximada por uma variável $ \chi^2 $ com k-1 graus de liberdade. Portanto, rejeitamos a hipótese nula de não existência de sazonalidade determinística se $ P_{h_0}(H \ge \chi^2_{(k-1), \alpha}) = \alpha $, tal que $ \alpha $ é o nível de significância do teste.

Exemplo 2.4.1:

Consideramos novamente a série temporal AirPassengers do Exemplo 2.3.2 e aplicamos o teste de Kruskal-Wallis. 

 

Ano/Mes Jan Fev Mar Abr Mai Jun Jul Ago Set out Nov Dez
1949 112 118 132 129 121 135 148 148 136 119 104 118
1950 115 126 141 135 125 149 170 170 158 133 114 140
1951 145 150 178 163 172 178 199 199 184 162 146 166
1952 171 180 193 181 183 218 230 242 209 191 172 194
1953 196 196 236 235 229 243 264 272 237 211 180 201
1954 204 188 235 227 234 264 302 293 259 229 203 229
1955 242 233 267 269 270 315 364 347 312 274 237 278
1956 284 277 317 313 318 374 413 405 355 306 271 306
1957 315 301 356 348 355 422 465 467 404 347 305 336
1958 340 318 362 348 363 435 491 505 404 359 310 337
1959 360 342 406 396 420 472 548 559 463 407 362 405
1960 417 391 419 461 472 535 622 606 508 461 390 432

 

Então, temos

$$n_j = \hbox{número de meses} = 12, \quad j = 1,2,\dots,12$$

$$N = \sum^{12}_{j=1}n_j = 144$$

Os postos de cada observação, são dados pela tabela abaixo

 

Ano/mes Jan Fev Mar Abr Mai Jun Jul Ago Set Out Nov Dez
1949 2,0 5,5 12,0 11,0 8,0 14,5 21,5 21,5 16,0 7,0 1,0 5,5
1950 4,0 10,0 18,0 14,5 9,0 23,0 29,5 29,5 25,0 13,0 3,0 17,0
1951 19,0 24,0 34,5 27,0 32,5 34,5 47,5 47,5 40,0 26,0 20,0 28,0
1952 31,0 36,5 43,0 38,0 39,0 54,0 59,0 67,5 52,0 42,0 32,5 44,0
1953 45,5 45,5 64,0 62,5 57,0 69,0 71,5 77,0 65,5 53,0 36,5 49,0
1954 51,0 41,0 62,5 55,0 61,0 71,5 84,0 82,0 70,0 57,0 50,0 57,0
1955 67,5 60,0 73,0 74,0 75,0 91,5 112,0 100,5 89,0 78,0 65,5 80,0
1956 81,0 79,0 93,0 90,0 94,5 113,0 123,0 119,5 104,5 86,5 76,0 86,5
1957 91,5 83,0 106,0 102,5 104,5 127,0 133,0 134,0 117,5 100,5 85,0 96,0
1958 98,0 94,5 109,5 102,5 111,0 129,0 137,0 138,0 117,5 107,0 88,0 97,0
1959 108,0 99,0 121,0 116,0 126,0 135,5 141,0 142,0 132,0 122,0 109,5 119,5
1960 124,0 115,0 125,0 130,5 135,5 140,0 144,0 143,0 139,0 130,5 114,0 128,0

 

Utilizando o Action para efetuar os cálculos obtemos:

Portanto, sob $ H_0 $ temos $ P(H \ge \chi^2_{11, \alpha}) \approx 0 $ e rejeitamos a hipótese nula de que não existe sazonalidade determinística.

Séries Temporais

Sobre o Portal Action

O Portal Action é mantido pela Estatcamp - Consultoria Estatística e Qualidade, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.

Facebook

CONTATO

  •  Maestro Joao Seppe, 900, São Carlos - SP | CEP 13561-180
  • Telefone: (16) 3376-2047
  • E-Mail: [email protected]