O teste de Kruskal-Wallis (KW) é uma extensão do teste de Wilcoxon-Mann-Whitney. É um teste não paramétrico utilizado para comparar três ou mais amostras. Ele é usado para testar a hipótese nula de que todas as populações possuem funções de distribuição iguais contra a hipótese alternativa de que ao menos duas das populações possuem funções de distribuição diferentes.

Figura 4.1: William Henry Kruskal (1919 - 2005); Wilson Allen Wallis (1912-1998).
O teste de Kruskal-Wallis é o análogo ao teste F utilizado na ANOVA 1 fator. Enquanto a análise de variância dos testes dependem da hipótese de que todas as populações em confronto são independentes e normalmente distribuídas, o teste de Kruskal-Wallis não coloca nenhuma restrição sobre a comparação. Suponha que os dados provenham de k amostras aleatórias independentes com tamanhos amostrais n1, n2, ..., nk sendo N = n1 + n2 + ... + nk o número total de elementos considerados em todas as amostras.
| Amostra 1 | ![]() |
![]() |
![]() |
![]() |
| Amostra 2 | ![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
| Amostra k-1 | ![]() |
![]() |
![]() |
![]() |
| Amostra k | ![]() |
![]() |
![]() |
![]() |
Hipóteses
1) As N variáveis aleatórias
com
são mutuamente independentes.
2) Para cada
as nj variáveis aleatórias
são uma amostra aleatória de uma distribuição contínua com função de distribuição Fj.
3) As funções de distribuição F1, F2, ..., Fk se relacionam através da relação
![]() |
para j = 1, 2, ..., k, onde F é uma função de distribuição para uma distribuição contínua com mediana desconhecida e τj é o tratamento de efeito desconhecido para a população j.
Neste caso, a hipótese nula H0 de interesse é a de que não há diferença entre os tratamentos de efeito τ1, τ2, ..., τk, isto é
![]() |
Esta hipótese nula garante que cada função de distribuição F1, F2, ..., Fk é igual, ou seja, F1 = F2 = ... = Fk.
Para aplicar o método de Kruskal-Wallis, primeiramente ordenamos todas as N observações das k amostras da menor para a maior observação e consideramos rij como sendo o posto de Xij. Tomamos
![]() |
Deste modo, temos por exemplo, que R1 é a soma dos postos dos elementos da amostra 1 e Ri. é o posto médio destas mesmas observações. A estatística de Kruskal-Wallis H, será dada por
![]() |
onde tj é o tamanho do grupo de elementos repetidos j e g é o número de grupos. Uma observação que não se repete é considerada como um grupo de tamanho 1. Esta estatística tem, aproximadamente, uma distribuição qui-quadrado com k-1 graus de liberdade.
Os passos para realização deste teste são dados a seguir:
1. Estabelecemos as hipótese
![]() |
2. Ordenamos de forma crescente de magnitude os valores deste novo conjunto de dados e associamos a cada valor seu posto correspondente, tendo cada posto o mesmo sinal do valor que este representa.
3. Calculamos o valor da estatística H. Em seguida, fixamos o nível de significância α.
4. Encontramos os valores críticos referentes ao nível de significância fixado. Neste caso, calculamos os valores Qα/2 e Q1-α/2 de modo que P[H ≤ Qα/2] = P[H ≥ Q1-α/2] = α/2.
5. Se Hobs < Qα/2 ou se Hobs > Q1-α/2 rejeitamos a hipótese nula de que as amostras provém de populações igualmente distribuídas e se Qα/2 ≤ Hobs ≤ Q1-α/2 não rejeitamos a hipótese de que as amostras provém de populações igualmente distribuídas.
6. O p-valor é calculado da seguinte forma
![]() |
Exemplo 4.1: Os dados a seguir são de uma experiência clássica agrícola para avaliar o rendimento de culturas divididas em quatro grupos diferentes. Para manter a simplicidade, identificamos os tratamentos usando os números inteiros {1,2,3,4}. Queremos avaliar se os dados provém de distribuições igualmente distribuídas.
| Grupos | Resposta |
| 1 | 83 |
| 1 | 91 |
| 1 | 94 |
| 1 | 89 |
| 1 | 89 |
| 1 | 96 |
| 1 | 91 |
| 1 | 92 |
| 1 | 90 |
| 1 | 84 |
| 2 | 91 |
| 2 | 90 |
| 2 | 81 |
| 2 | 83 |
| 2 | 84 |
| 2 | 83 |
| 2 | 88 |
| 2 | 91 |
| 2 | 89 |
| 3 | 101 |
| 3 | 100 |
| 3 | 91 |
| 3 | 93 |
| 3 | 96 |
| 3 | 95 |
| 3 | 94 |
| 3 | 81 |
| 4 | 78 |
| 4 | 82 |
| 4 | 81 |
| 4 | 77 |
| 4 | 79 |
| 4 | 81 |
| 4 | 80 |
clique aqui para efetuar o download dos dados utilizados nesse exemplo
1. Estabelecemos as hipóteses:
![]() |
2. A partir dos dados temos a seguinte tabela, relacionando os postos de cada elemento, os tamanhos amostrais de cada grupo e os valores Ri para cada grupo:
| j | r1j | r2j | r3j | r4j |
| 1 | 11 | 23 | 34 | 2 |
| 2 | 23 | 19,5 | 33 | 9 |
| 3 | 28,5 | 6,5 | 23 | 6,5 |
| 4 | 17 | 11 | 27 | 1 |
| 5 | 17 | 13,5 | 31,5 | 3 |
| 6 | 31,5 | 11 | 30 | 6,5 |
| 7 | 23 | 15 | 28,5 | 4 |
| 8 | 26 | 23 | 6,5 | |
| 9 | 19,5 | 17 | ||
| 10 | 13,5 | |||
| Ri | 210 | 139,5 | 213,5 | 32 |
| N | 34 | 34 | 34 | 34 |
| ni | 10 | 9 | 8 | 7 |
3. Cálculo da estatística H.
![]() |
![]() |
![]() |
4. Cálculo dos valores críticos.
Fixando o nível de significância α = 0,05 e sabendo que k = 4, temos que os valores críticos são os pontos Q0,025 e Q0,975 tais que P[H ≤ Q0,025] = P[H ≥ 0,975] = 0,025.
Neste caso, temos que Q0,025 = 0,2157953 e Q0,975 = 9,348404.
5. Critério de rejeição.
Como Hobs = 20,337 > Q0,975 = 9,340484, rejeitamos a hipótese nula.
6. Neste caso, o p-valor é dado por
![]() |


| Para entender como executar essa função do Software Action, você pode consultar o manual do usuário. | |||
















![\[F_j(t)=F(t-\tau_j),\quad -\infty \ \textless \ \infty,\]](/sites/default/files/tex/d5795fec8835881d9b96fb2dd2222ee5e5b79b34.png)
![\[H_0: \tau_1=\tau_2=\ldots=\tau_k.\]](/sites/default/files/tex/796dcec93491744fe83d3a6649c6b37e231640e0.png)
![\[R_i=\sum_{j=1}^{n_i}r_{ij} \quad \hbox{e} \quad R_{i\cdot}=\frac{R_i}{n_i}, \quad i = 1,\ldots, k.\]](/sites/default/files/tex/436d99223fbd5ebf3d4d038cb68e0cbf0135fdfd.png)
![\[H=\frac{\frac{12}{N(N+1)}\sum_{i=1}^kn_i\left(R_{i\cdot}-\frac{N+1}{2}\right)^2}{1-\frac{ \sum_{j=1}^g t_j^3-t_j}{N^3-N}}=\frac{\left(\frac{12}{N(N+1)}\sum_{i=1}^k \frac{R_i^2}{n_i} \right)-3(N+1)}{1-\frac{\sum_{j=1}^g t_j^3-t_j}{N^3-N}}\]](/sites/default/files/tex/fa6d6471ad056919ab791161c6687d30bddbcedf.png)
![\[\left\{\begin{array}{l}H_0:\tau_1=\tau_2=\ldots=\tau_k\\H_1:\tau_1,\tau_2,\ldots,\tau_n \ \mbox{não são todos iguais}\end{array}\right.\]](/sites/default/files/tex/89678946e1310215c5bdd19b6e04253235d8ee63.png)
![\[P-valor = P[\chi^2_{k-1} \geq H|H_0]\]](/sites/default/files/tex/5848fe20d9611232106dc067e4b1607012a15e49.png)
![\[\left\{\begin{array}{l}H_0:\tau_1=\tau_2=\ldots=\tau_k\\H_1:\tau_1,\tau_2,\ldots,\tau_n \ \mbox{não são todos iguais}\end{array}\right.\]](/sites/default/files/tex/dd182f1f852dbf3fb2e0732ddb699613c51d469e.png)
![\[H=\frac{\left(\frac{12}{N(N+1)}\sum_{i=1}^k \frac{R_i^2}{n_i} \right)-3(N+1)}{1-\frac{\sum_{j=1}^g t_j^3-t_j}{N^3-N}}=\]](/sites/default/files/tex/79aaf45cca553dcb3f799627456b42ec69a2e063.png)
![\[=\frac{0,010084034*(122,5+36+675,28125+1170,035714)}{1-0,006417112}=\]](/sites/default/files/tex/abfaede6b90282f2cb50d576d52b50fd34f299aa.png)
![\[=20,337.\]](/sites/default/files/tex/48a687cd21bcd08349d2a5291e604dd57eebe965.png)
![\[P-valor = P[\chi^2_{k-1}\geq H_{obs}]=P[\chi^2_{3}\geq 20,337]=0,0001445.\]](/sites/default/files/tex/d8077f0fc36fbaf0934f72ddae13b1e87b62b3a9.png)