2.2 - A estatística de Log-rank Modificado

Você está aqui

O teste de Log-rank Ponderado pode não ter um bom comportamento quando há cruzamento das funções de intensidade. Para resolver este problema, propomos uma modificação nas estatísticas de Log-rank Ponderado para tratarmos espaços amostrais finitos $(\ell=1, \cdots , k~(\mbox{Finito})).$ Primeiramente definimos $$MLR^{q}({n^{\star}}, \ell) = \sum_{q_1\neq q} U^{n_q}_{n_{q_1}} (n^{\star}, \ell ) \left[ \hat{h}^{n_q} (\ell) -\hat{h}^{n_{q_1}} (\ell)\right], \ell=1, \cdots , k.\label{MLR}$$

Decorre do Teorema (3.1) (Leão e Ohashi) que, sob $H_0$, $MLR^{q} ({n^{\star}}, \ell )$ tem distribuição assintótica normal com média zero e matriz de covariância $Q(\ell)$, cujo estimador $\hat{Q}(\ell)$ está definido na seção 2.1. Além disso, o martingale $MLR^{q} ({n^{\star}}, \cdot )$ tem incrementos assintóticamente independentes. Nesse caso, se denotarmos $$MLR_0({n^{\star}},\ell)=(MLR^1({n^{\star}}, \ell),MLR^2({n^{\star}}, \ell), \dots , MLR^{J-1}({n^{\star}}, \ell))^T,$$

obtemos a estatística de Log-rank Modificado $$MX^2({n^{\star}}, k-1)=\sum_{\ell=1}^{k-1} MLR_0({n^{\star}}, \ell)^T \hat{Q}_{0}(n^{\star}, \ell)^{-1} MLR_0({n^{\star}}, \ell), \quad \ell \in \{1,2,\dots,k-1\},\label{testeMLR}$$

que tem distribuição assintótica Qui-Quadrado com $(J-1)\times (k-1)$ graus de liberdade, no qual $\hat{Q}_{0}(n^{\star}, \ell)$ é o operador de covariância $\hat{Q} (n^{\star},\ell)$ sem a última linha e a última coluna, assim como argumentado na seção anterior, e denotamos $\hat{Q}_{0}(n^{\star}, \ell)^{-1}$ como a inversa.

Com esse tipo de modificação em relação ao Log-rank Ponderado proposto por Fleming e Harrington (1990) para duas populações (J=2) e estendido por Leão e Ohashi para J populações discretas, resolvemos o problema das diferenças iniciais canceladas em favor da outra população, como dita na seção introdução. Portanto, resolvemos o problema do cruzamento das funções de intensidade para espaços amostrais finitos. Para o caso de espaços amostrais infinitos enumeráveis, usamos a estatística de Cramér-von Mises proposta por Leão e Ohashi.

Ao retirarmos a hipótese $H_0$, chegamos a seguinte equação $$MLR^{q}({n^{\star}},\ell)=\sum_{q_1\neq q}U^{n_q}_{n_{q_1}} (n^{\star}, \ell ) \left[ \hat{h}^{n_q} (\ell) -\hat{h}^{n_{q_1}} (\ell)\right] =$$

$$=\sum_{q_1\neq q} U^{n_q}_{n_{q_1}} (n^{\star}, \ell ) \left[ \frac{ \Delta Y^{n_q}(\ell) 1\!\!1_{\{V^{n_q}(\ell)\textgreater0 \}}}{V^{n_q}(\ell)} -\frac{\Delta Y^{n_{q_1}}(\ell) 1\!\!1_{\{V^{n_{q_1}}(\ell)\textgreater0 \}}}{V^{n_{q_1}}(\ell)} \right] +$$

$$+\sum_{q_1\neq q} U^{n_q}_{n_{q_1}}(n^{\star}, \ell ) \left[ h^{q}(\ell) - h^{q_1}(\ell)\right], ~ \ell \in \mathcal{K}.$$

Assim como na seção Estatística de Log-rank Ponderado, definimos $\{Q_n : n \in \mathbb{N}\}$ uma sequência de testes estatísticos e $\{R_n : n \in \mathbb{N}\}$ as respectivas regiões de rejeição associadas a um nível de significância fixado. Dizemos que uma sequência de estatísticas de teste $Q_n$ é consistente com uma hipótese alternativa $H_1$ se $\displaystyle\lim_n P(Q_n \in R_n \mid H_1)=1.$ Assim, a classe de  hipóteses  alternativas é definida como

Definição 2.2.1: (Hipótese alternativa de intensidades)

Existe pelo menos um par de índices $q,q_1=1,\cdots, J$ com $q\neq q_1$ para os quais $H_1:h^q(\ell) \neq h^{q_1}(\ell)$, para algum $\ell =1, \cdots , k-1.$

Exemplo 2.2.1: (Teste de Homogeneidade em tabelas $2\times2$)

Suponhamos que $n_1 + n_2$ observações de dados estão resumidos em uma tabela $2\times 2,$

  Categoria 1 Categoria 2 Total
Pop1 $\Delta R^{n_1}(1)$ $\Delta R^{n_1}(2)$ $n_1=V^{n_1}(1)$
Pop2 $\Delta R^{n_2}(1)$ $\Delta R^{n_2}(2)$ $n_2=V^{n_2}(2)$
Total $\Delta R^{n^\star}(1)$ $\Delta R^{n^\star}(2)$  $n_1+n_2=V^{n^\star}$

Vamos admitir que cada amostra é uma amostra aleatória, sendo elas independentes entre si e cada observação pode ser classificada na categoria $1$ ou na categoria $2$, mas não em ambas. Seja $\pi^1_1$ a probabilidade de que um elemento da população 1 seja classificado na categoria $1$ e  $\pi^2_1$ o correspondente da população 2. Neste exemplo, queremos testar a hipótese $H_0:\pi^1_1=\pi^2_1,$ ou equivalentemente, $H_0:h^1(1)=h^2(1).$ Então, temos a seguinte estatística de Log-rank $(u(n^\star,1)=1)$ $$MLR(n^\star,1)=\left(\frac{1}{n_1+n_2}\right)^{1/2}\left(\frac{V^{n_1}(1)V^{n_2}(1)}{V^{n^\star}}\right)\left[\hat{h}^{n_2}(1)-\hat{h}^{n_1}(1)\right]=$$

$$=\left(\frac{1}{n_1+n_2}\right)^{1/2}\left(\frac{V^{n_1}(1)V^{n_2}(1)}{V^{n^\star}}\right)\left[\frac{\Delta R^{n_2}(1)}{V^{n_2}(1)}-\frac{\Delta R^{n_1}(1)}{V^{n_1}(1)}\right]\overset{\Delta R^{n_2}=\Delta R^{n^\star}-\Delta R^{n_1}}{=}$$

$$=\left(\frac{1}{n_1+n_2}\right)^{1/2}\left(\Delta R^{n_1}(1)-\frac{V^{n_1}(1)}{V^{n^\star}}\Delta R^{n^\star}(1)\right),~~~~(1.1)$$

que corresponde ao conhecido teste exato de Fisher. Foi provado em (Leão e Ohashi) que $\frac{MLR(1)}{\sqrt{\hat{\phi}^2_{n^\star}(1)}}$ converge em distribuição para $N(0,1)$ quando $n^\star\rightarrow \infty,$ no qual $$\hat{\phi}^2_{n^\star}(1):=\frac{V^{n_2}(1)}{V^{n^\star}(1)}\hat{h}^{n_1}(1)\left[1-\hat{h}^{n_1}(1)\right]+\frac{V^{n_1}(1)}{V^{n^\star}(1)}\hat{h}^{n_2}(1)\left[1-\hat{h}^{n_2}(1)\right]$$

Às vezes é necessário combinar resultados de diversas tabelas de contingência $2\times 2$ em uma análise geral. Esta situação ocorre quando um experimento geral consiste em vários experimentos menores conduzidos em várias situações. Neste caso, os dados são resumidos em diversas tabelas de contingência $2\times 2$ obtidas à partir de experimentos independentes. Seja $k$ o número de tabelas e $\pi^1_{\ell}$ a probabilidade de uma observação na linha 1 ser classificada na coluna 1, na $\ell$-ésima tabela de contingência, e $\pi^2_{\ell}$ a probabilidade correspondente da linha 2. Consideramos a hipótese nula $H_0: \pi^1_{\ell}=\pi^2_{\ell},$ para todo $\ell =1,\dots,k-1.$ Denotamos $MLR(\ell)$ o vetor de Log-rank Modificado para a $\ell$-ésima tabela e $\hat{\phi}^{2,\ell}_{n^\star}(\ell)$ a variância associada. Assim, chegamos à estatística de Mantel-Haenszel para tabelas de contingência $2\times2$ da seguinte forma $$MH(1)=\frac{MLR(n^\star,1)}{\sqrt{\displaystyle\hat{\phi}^{2}(n^\star,1)}}$$

Agora, a estatística de Log-rank Modificada é dada por $$MX^2(n^\star,1)=\frac{(MLR(n^\star,1))^2}{\hat{\phi}^{2}(n^\star,1)}$$

Exemplo 2.2.2: (Teste de Homogeneidade em tabelas $J\times k$)

Esta tabela pode ser utilizada para apresentar dados contidos em várias amostras. Temos $J$ amostras, e em vez de cada amostra fornecer duas categorias, consideramos $k$ categorias. No entanto, estamos sob o modelo de estrutura com censura, no qual os dados observados são dadas por $\{\Delta R^p_m,\Delta R^{C,p}_m(\ell)\}.$ Para cada categoria podemos associar a tabela (2.2.1).

  Categoria 1 $\dots$ Categoria 2 Total
Número de Eventos $\Delta R^{n_1}(\ell)$ $\dots$ $\Delta R^{n_J}(\ell)$ $\Delta R^{n^\star}(\ell)$
Número de Eventos sob Risco $V^{n_1}(\ell)$ $\dots$ $V^{n_J}(\ell)$ $V^{n^\star}(\ell)$

Tabela 2.2.1: Resumo das observações para a $\ell$-ésima categoria.

Agora, vamos generalizar o exemplo (2.2.1) para tabelas de contingência $J\times k.$ temos a equação

Segue de (1) e tomando o peso log-rank, ou seja, $u(n^\star,\ell)=1$ que $$MLR^{q}({n^{\star}}, \ell):=\sum_{q_1\neq q}\left(\frac{1}{n}\right)^{1/2}\left(\frac{V^{n_q}(\ell)V^{n_{q_1}}(\ell)}{V^{n^\star}(\ell)}\right)[\underbrace{\hat{h}^{n_{q_1}}(\ell)}_{\frac{\Delta R^{n_{q_1}}(\ell)}{V{n_{q_1}}}(\ell)}-\underbrace{\hat{h}^{n_q}(\ell)}_{\frac{\Delta R^{n_{q}}(\ell)}{V{n_{q}}(\ell)}}]=$$

$$=\left(\frac{1}{n}\right)^{1/2}\left[\Delta R^{n_{q}}(\ell)-\frac{V^{n_{q}}(\ell)\Delta R^{n^\star}(\ell)}{V^{n^\star}(\ell)}\right]~~~(2.2.1)$$

Assim, obtemos a estatística de Log-rank Modificado $$MX^2({n^{\star}}, k-1)=\sum_{\ell=1}^{k-1} MLR_0({n^{\star}}, \ell)^T \hat{Q}_{0}(n^{\star}, \ell)^{-1} MLR_0({n^{\star}}, \ell),$$

Seja $\pi^p_\ell$ a probabilidade de um elemento selecionado aleatoriamente à partir da variável aleatória de interesse $W^p$ ser classificada na $\ell$-ésima categoria, para $p=1,\dots,J$ e $\ell=1,\dots,k.$ A hipótese $H_0:\pi^1_\ell=\dots=\pi^J_\ell$ para todo $\ell$, afirma que a probabilidade de estar na categoria $\ell$ é o mesmo para todas as variáveis aleatórias de interesse $W^p,$ que é equivalente a hipótese $H_0:h^1(\ell)=\dots=h^J(\ell)$ para todo $\ell=1, \cdots , k-1$. Neste caso, podemos aplicar a estatística de Log-rank Ponderada $X^2(n^{\star},k-1)$ e a estatística de Log-rank Modificada $MX^2(n^{\star},k-1)$ para testarmos a hipótese nula $H_0.$

Sobre o Portal Action

O Portal Action é mantido pela Estatcamp - Consultoria Estatística e Qualidade, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.

Facebook

CONTATO

  •  Maestro Joao Seppe, 900, São Carlos - SP | CEP 13561-180
  • Telefone: (16) 3376-2047
  • E-Mail: [email protected]