5 - Teste de Friedman

Você está aqui

O teste de Friedman é uma alternativa não paramétrica para o teste de experimentos em blocos ao acaso (RBD - Randon Blocks Design) na ANOVA regular. Ele substitui o RBD quando os pressupostos de normalidade não estão assegurados, ou quando as variações são possivelmente diferentes de população para população. Este teste utiliza os ranks dos dados ao invés de seus valores brutos para o cálculo da estatística de teste. Como o teste de Friedman não faz suposições sobre a distribuição, ele não é tão poderoso quanto o teste padrão se as populações forem realmente normais.

Milton Friedman publicou os primeiros resultados para este tipo teste. Ele recebeu o Prêmio Nobel de Economia em 1976 e uma das publicações sobre sua descoberta foi o artigo "O Uso de Ranks para evitar a suposição de normalidade implícitos na análise de variância ", publicado em 1937.

Figura 5.1: Milton Friedman (1912-2006).

Lembremos que o projeto RBD exige medidas repetidas para cada bloco em cada nível de tratamento. Suponha que Xij, representa o resultado experimental do fator (ou "bloco") i com o tratamento j, onde i = 1, ..., b e j = 1, ..., k.

 

Tratamentos

Blocos  1 2 ... k
1 X11 X12 ... X1k
2 X21 X22 ... X2k
$ \vdots $ $ \vdots $ $ \vdots $ $ \vdots $ $ \vdots $
b Xb1 Xb2 ... Xbk

Tabela 5.1: Tabela Cruzada dos Dados.

Para calcular a estatística de teste de Friedman, ordenamos as k observações da menor para a maior de forma separada em cada um dos b blocos e atribuímos os ranks {1, 2, ..., k} para cada bloco da tabela de observações. Assim, a posição esperada de qualquer observação sob H0 é (k + 1)/2. Sendo r(Xij) o rank da observação Xij definimos a soma de todos os ranks da coluna j (ou seja, de cada tratamento) por

\[R_j=\sum^b_{i=1}r(X_{ij}), \quad 1\leq j\leq k.\quad (5.1)\]

Se H0 é verdadeira, o valor esperado de Rj é E(Rj)=b(k+1)/2. Desta forma, a estatística

\[\sum^k_{j=1}\left(R_j-\frac{b(k+1)}{2}\right)^2\]

é uma forma intuitiva para revelar as diferenças entre os tratamentos.

A estatística do teste de Friedman será dada por

\[S=\frac{12b}{k(k+1)}\sum_{j=1}^k\left(\frac{R_j}{b}-\frac{k+1}{2}\right)^2=\left[\frac{12} {bk(k+1)}\displaystyle\sum_{j=1}^k R_j^2\right]-3b(k+1)\]

Se Fj(t) = F(t+τj) é a função de distribuição do tratamento j, com j = 1, 2, ..., k, no teste de Friedman estamos interessados em testar a hipótese H0: τ1 τ2 = ... = τk contra a hipótese alternativa de que τ1, τ2, ..., τk não são todos iguais. Neste caso, ao nível de significância α, rejeitamos a hipótese H0 se S ≥ sα, caso contrário não rejeitamos a hipótese nula, em que a constante sα é escolhida de modo que a probabilidade de erro do tipo I seja igual a α.

 

Aproximação para amostras grandes

Sob H0, a estatística S tem, quando n tende ao infinito, uma distribuição qui-quadrado $ \chi^2 $ com k-1 graus de liberdade. Neste caso, utilizando a aproximação qui-quadrado, rejeitamos H0 se $ S\geq \chi_{k-1,\alpha}^2 $, caso contrário não rejeitamos H0, onde $ \chi_{k-1,\alpha}^2 $ é tal que $ P[\chi^2_{k-1}\geq \chi^2_{k-1,\alpha}]=\alpha $.

 

Observações repetidas

Se existem observações repetidas entre as k observações de um mesmo bloco, uma modificação para a estatística S é necessária. Neste caso substituímos S por

\[S^{\prime}=\frac{12\displaystyle\sum_{j=1}^k R_j^2-3b^2k(k+1)^2}{bk(k+1)-\left[\frac{1}{k-1}\right]\displaystyle\sum_{i=1}^n \left\{\left(\displaystyle\sum_{j=1}^{g_1}t_{i,j}^3\right)-k\right\}},\]

no qual gi denota o número de grupos de observações repetidas no i-ésimo bloco e ti,j é o tamanho do j-ésimo grupo de observações repetidas no i-ésimo bloco. Em particular, se não há observações repetidas entre as observações no i-ésimo bloco, então gi = k e ti,j = 1 para cada j = 1, ..., k. Se em todos os blocos não existem observações repetidas, então S' se reduz a S.

O p-valor é calculado da seguinte forma

\[P-valor = P[\chi^2_{k-1}\geq S^{\prime}|H_0].\]

Exemplo 5.1

Em uma avaliação de desempenho de veículos, seis motoristas avaliaram três carros (A, B e C) em um estudo aleatório. O objetivo do estudo é estudar o desempenho dos veículos e supostamente, na análise dos motoristas, a marca do veículo não influencia na avaliação. Na tabela abaixo, temos as classificações de cada carro, segundo cada motorista, em uma escala de 1 a 10.

Carro Motorista Resposta
A 1 7
A 2 6
A 3 6
A 4 7
A 5 7
A 6 8
B 1 8
B 2 10
B 3 8
B 4 9
B 5 10
B 6 8
C 1 9
C 2 7
C 3 8
C 4 8
C 5 9
C 6 9

Inicialmente, montamos a tabela dos Ranks

Bloco A B C
1 1 2 3
2 1 3 2
3 1 2,5 2,5
4 1 3 2
5 1 3 2
6 1,5 1,5 3
Total 6,5 15 14,5

Neste caso, temos que os números de grupos de observações repetidas em cada bloco são g= 3, g= 3, g= 2, g= 3, g= 3 e g= 2. Além disso, os tamanhos de cada grupo são dados por t1,1 = t1,2 t1,3 t2,1 t2,2 t2,3 t4,1 t4,2 t4,3 t5,1 t5,2 t5,3 = 1 e, além disso, t3,1 = 1, t3,2 = 2, t6,1 = 2 e t6,2 = 1.

Neste caso, temos que a estatística S' é dada por

\[S^{\prime}=\frac{12(42,25+225+210,25)-3\times 36\times3(3+1)^2}{6\times 3(3+1)-\frac{1}{2}\left(6+6\right)}=8,272728\]

Neste caso o p-valor é

\[P-valor = P[\chi^2_2\geq 8,272728]=0,01598085.\]

 

Comparações Múltiplas

 

No teste de Friedman, assim como no teste de Kruskal-Wallis, podemos realizar comparações múltiplas no teste de Friedman. Quando a hipótese nula $ H_0 $ é rejeitada, temos que, ao menos um dos grupos é diferente dos demais. Porém, não temos a informação de quais grupos são diferentes. Neste sentido, o procedimento de comparações múltiplas nos permite determinar quais grupos são diferentes. Utilizamos um procedimento simples para determinar quais os pares de grupos são diferentes.

Testamos a significância dos pares de diferenças entre os grupos i e j a partir da seguinte desigualdade.

$$|R_{i}-R_{j}|\geq Z_{\left(\frac{\alpha}{k(k-1)}\right)}\sqrt{\frac{N\times k(k+1)}{6}}~~~(5.2)$$

em que

  • $  k  $ é o número de grupos;
  • $  N  $ é o número de blocos;
  • $ R_{i}  $ e $  R_{j}  $ é o soma dos postos (ranks) dos grupos $  i  $ e $  j  $ respectivamente, definidos na equação (5.1);
  • $ |R_{i}-R_{j}|  $ é a diferença observada;
  • $  Z_{\left(\frac{\alpha}{k(k-1)}\right)}\sqrt{\frac{N\times k(k+1)}{6}}  $ é a diferença crítica.

Assim, se (5.2) ocorre podemos rejeitar a hipótese \tau_i=\tau_j $ e concluir que \tau_i\neq\tau_j.  $ Vale lembrar que, neste teste de comparações múltiplas, se temos $  k  $ grupos, então o número de comparações é de $  \frac{k(k-1)}{2}. $ Aplicamos os conceitos no seguinte exemplo.

 

Exemplo 5.2 

Voltando ao exemplo 5.1. Temos o seguinte conjunto de dados.
clique aqui para efetuar o download dos dados utilizados nesse exemplo

Carro Motorista Resposta
A 1 7
A 2 6
A 3 6
A 4 7
A 5 7
A 6 8
B 1 8
B 2 10
B 3 8
B 4 9
B 5 10
B 6 8
C 1 9
C 2 7
C 3 8
C 4 8
C 5 9
C 6 9

No procedimento de comparações múltiplas, vamos seguir os seguintes passos:

1. Montamos a tabela de Ranks.

Bloco A B C
1 1 2 3
2 1 3 2
3 1 2,5 2,5
4 1 3 2
5 1 3 2
6 1,5 1,5 3
Total 6,5 15 14,5

2. Calculamos as diferenças observadas:

 

Comparação $ R_i $ $ R_j $ $ |R_i-R_j| $
A - B 6,5 15 8,5
A - C 6,5 14,5 8
B - C 15 14,5 0,5

3. Consultar na tabela da normal padrão o valor de Z:

$ Z_{\left(\frac{\alpha}{k(k-1)}\right)}=Z_{\left(\frac{0,05}{3(3-1)}\right)}=2,3939 $

 

4. Calcular a diferença crítica:

$  Z_{\left(\frac{\alpha}{k(k-1)}\right)}\sqrt{\frac{N\times k(k+1)}{6}}=2,3939\times \sqrt{\frac{6\times 3(3+1)}{6}}=8,29299 $

Veja a seguir os resultados obtidos pelo software Action para o mesmo exemplo.

Para entender como executar essa função do Software Action, você pode consultar o manual do usuário.

Sobre o Portal Action

O Portal Action é mantido pela Estatcamp - Consultoria Estatística e Qualidade, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.

Facebook

CONTATO

  •  Maestro Joao Seppe, 900, São Carlos - SP | CEP 13561-180
  • Telefone: (16) 3376-2047
  • E-Mail: [email protected]