Skip to main content

5 - Teste de Friedman

O teste de Friedman é uma alternativa não paramétrica para o teste de experimentos em blocos ao acaso (RBD - Randon Blocks Design) na ANOVA regular. Ele substitui o RBD quando os pressupostos de normalidade não estão assegurados, ou quando as variações são possivelmente diferentes de população para população. Este teste utiliza os ranks dos dados ao invés de seus valores brutos para o cálculo da estatística de teste. Como o teste de Friedman não faz suposições sobre a distribuição, ele não é tão poderoso quanto o teste padrão se as populações forem realmente normais.

Milton Friedman publicou os primeiros resultados para este tipo teste. Ele recebeu o Prêmio Nobel de Economia em 1976 e uma das publicações sobre sua descoberta foi o artigo "O Uso de Ranks para evitar a suposição de normalidade implícitos na análise de variância ", publicado em 1937.

Figura 5.1: Milton Friedman (1912-2006).

Lembremos que o projeto RBD exige medidas repetidas para cada bloco em cada nível de tratamento. Suponha que Xij, representa o resultado experimental do fator (ou "bloco") i com o tratamento j, onde i = 1, ..., b e j = 1, ..., k.

 

Tratamentos

Blocos  1 2 ... k
1 X11 X12 ... X1k
2 X21 X22 ... X2k
$ \vdots $ $ \vdots $ $ \vdots $ $ \vdots $ $ \vdots $
b Xb1 Xb2 ... Xbk

Tabela 5.1: Tabela Cruzada dos Dados.

Para calcular a estatística de teste de Friedman, ordenamos as k observações da menor para a maior de forma separada em cada um dos b blocos e atribuimos os ranks {1, 2, ..., k} para cada bloco da tabela de observações. Assim, a posição esperada de qualquer observação sob H0 é (k + 1)/2. Sendo r(Xij) o rank da observação Xij definimos a soma de todos os ranks da coluna j (ou seja, de cada tratamento) por

\[R_j=\sum^b_{i=1}r(X_{ij}), \quad 1\leq j\leq k.\]

Se H0 é verdadeira, o valor esperado de Rj é E(Rj)=b(k+1)/2. Desta forma, a estatística

\[\sum^k_{j=1}\left(R_j-\frac{b(k+1)}{2}\right)^2\]

é uma forma intuitiva para revelar as diferenças entre os tratamentos.

A estatística do teste de Friedman será dada por

\[S=\frac{12b}{k(k+1)}\sum_{j=1}^k\left(\frac{R_j}{b}-\frac{k+1}{2}\right)^2=\left[\frac{12} {bk(k+1)}\sum_{j=1}^k R_j^2\right]-3b(k+1)\]

Se Fj(t) = F(t+τj) é a função de distribuição do tratamento j, com j = 1, 2, ..., k, no teste de Friedman estamos interessados em testar a hipótese H0: τ1 τ2 = ... = τk contra a hipótese alternativa de que τ1, τ2, ..., τk não são todos iguais. Neste caso, ao nível de significância α, rejeitamos a hipótese H0 se S ≥ sα, caso contrário não rejeitamos a hipótese nula, em que a constante sα é escolhida de modo que a probabilidade de erro do tipo I seja igual a α.

 

Aproximação para amostras grandes

Sob H0, a estatística S tem, quando n tende ao infinito, uma distribuição qui-quadrado $ \chi^2 $ com k-1 graus de liberdade. Neste caso, utilizando a aproximação qui-quadrado, rejeitamos H0 se $ S\geq \chi_{k-1,\alpha}^2 $, caso contrário não rejeitamos H0, onde $ \chi_{k-1,\alpha}^2 $ é tal que $ P[\chi^2_{k-1}\geq \chi^2_{k-1,\alpha}]=\alpha $.

 

Observações repetidas

Se existem observações repetidas entre as k observações de um mesmo bloco, uma modificação para a estatística S é necessária. Neste caso substituímos S por

\[S'=\frac{12\sum_{j=1}^k R_j^2-3b^2k(k+1)^2}{bk(k+1)-\left[\frac{1}{k-1}\right]\sum_{i=1}^n \left\{\left(\sum_{j=1}^{g_1}t_{i,j}^3\right)-k\right\}},\]

onde gi denota o número de grupos de observações repetidas no i-ésimo bloco e ti,j é o tamanho do j-ésimo grupo de observações repetidas no i-ésimo bloco. Em particular, se não há observações repetidas entre as observações no i-ésimo bloco, então gi = k e ti,j = 1 para cada j = 1, ..., k. Se em todos os blocos não existem observações repetidas, então S' se reduz a S.

O p-valor é calculado da seguinte forma

\[P-valor = P[\chi^2_{k-1}\geq S'|H_0].\]

Exemplo 5.1: Em uma avaliação de desempenho de veículos, seis motoristas avaliaram três carros (A, B e C) em um estudo aleatório. O objetivo do estudo é estudar o desempenho dos veículos e supostamente, na análise dos motoristas, a marca do veículo não influencia na avaliação. Na tabela abaixo, temos as classificações de cada carro, segundo cada motorista, em uma escala de 1 a 10.

Carro Motorista Resposta
A 1 7
A 2 6
A 3 6
A 4 7
A 5 7
A 6 8
B 1 8
B 2 10
B 3 8
B 4 9
B 5 10
B 6 8
C 1 9
C 2 7
C 3 8
C 4 8
C 5 9
C 6 9

Inicialmente, montamos a tabela dos Ranks

Bloco A B C
1 1 2 3
2 1 3 2
3 1 2,5 2,5
4 1 3 2
5 1 3 2
6 1,5 1,5 3
Total 6,5 15 14,5

Neste caso, temos que os números de grupos de observações repetidas em cada bloco são g= 3, g= 3, g= 2, g= 3, g= 3 e g= 2. Além disso, os tamanhos de cada grupo são dados por t1,1 = t1,2 t1,3 t2,1 t2,2 t2,3 t4,1 t4,2 t4,3 t5,1 t5,2 t5,3 = 1 e, além disso, t3,1 = 1, t3,2 = 2, t6,1 = 2 e t6,2 = 1.

Neste caso, temos que a estatística S' é dada por

\[S'=\frac{12(42,25+225+210,25)-3\times 36\times3(3+1)^2}{6\times 3(3+1)-\frac{1}{2}\left(6+6\right)}=8,272728\]

Neste caso o p-valor é

\[P-valor = P[\chi^2_2\geq 8,272728]=0,01598085.\]