5.8 - Teste t pareado

Você está aqui

Para realizarmos os testes de igualdade de variâncias e os testes de médias, precisamos que as duas populações sejam independentes. Porém, na prática, temos algumas situações onde as populações não são independentes. Numa situação de comparação inter laboratorial onde dois laboratórios medem a mesma peça, por exemplo, as medidas entre os laboratórios não são independentes. Neste caso, utilizamos o teste $ t $ pareado.

Consideremos duas amostras dependentes $ X_1,\ldots,X_n $ e $ Y_1,\ldots,Y_n $. Neste caso consideraremos observações pareadas, isto é, podemos considerar que temos na realidade uma amostra de pares $ (X_1,Y_1), \ldots, (X_n,Y_n) $. Vamos definir $ D_i = X_i-Y_i $, para $ i = 1,2,\ldots,n $. Assim obteremos a amostra $ D_1,\ldots,D_n $, resultante das diferenças entre os valores de cada par. Aqui, apesar das amostras serem dependentes, vamos considerar que $ D_i\sim N(\mu_D,\sigma_D^2) $.

Para realizar o teste $ t $ pareado devemos primeiramente estabelecer uma das hipóteses 

\mu_D \ \textless \ 0\end{array}\right.\]

O parâmetro $ \mu_D $ será estimado pela média amostral das diferenças, ou seja, $ \overline{D} $, O parâmetro $ \sigma_D^2 $ será estimado pela variância amostral das diferenças, ou seja, 

\[s_D^2=\frac{\sum_{i=1}^n(D_i-\overline{D})^2}{n-1}.\]

O teste será realizado pela expressão 

\[T=\frac{\overline{D}-\mu_D}{\frac{s_D}{\sqrt{n}}}\]

que sob $ H_0 $ segue uma distribuição $ t $ de Student com $ n - 1 $ graus de liberdade. Tudo o que foi dito para o teste $ t $ comum serve para o teste $ T $ pareado, basta substituir a média por $ \mu_D $ e o desvio padrão amostral por $ s_D $. Com isto, temos que a um nível de significância $ \alpha $:

1. Os pontos críticos são determinados por $ t_{\alpha/2} $ e $ -t_{\alpha/2} $ para o caso bilateral, $ t_{\alpha} $ para o caso unilateral à direita e $ -t_{\alpha} $ para o unilateral à esquerda.

2. Calculamos sob a hipótese nula, o valor 

\[T_{\text{obs}}=\frac{\overline{D}-\mu_D}{\frac{s_D}{\sqrt{n}}}\]

3. Critério:

  • Teste bilateral: se $ T_{\text{obs}} \ \textgreater \ t_{\alpha/2} $ ou $ T_{obs} \ \textless \ -t_{\alpha/2} $ rejeitamos $ H_0 $. Caso contrário, não rejeitamos $ H_0 $
  • Teste unilateral à direita: se $ T_{\text{obs}} \ \textgreater \ t_{\alpha} $ rejeitamos $ H_0 $. Caso contrário, não rejeitamos $ H_0 $
  • Teste unilateral à esquerda: se $ T_{\text{obs}} \ \textless \ -t_{\alpha} $ rejeitamos $ H_0 $. Caso contrário não rejeitamos $ H_0 $.

4. O p-valor no caso bilateral é dado por 

\[\text{p-valor} = \mathbb{P}[|t| \ \textgreater \ |T_{\text{obs}}||H_0] = 2\mathbb{P}[t \ \textgreater \ |T_{\text{obs}}| | H_0].\]

Se o teste é unilateral à direita, o p-valor é dado por 

\[\text{p-valor} = \mathbb{P}[t \ \textgreater \ T_{\text{obs}}|H_0]\]

e se o teste é unilateral à esquerda, o p-valor é dado por 

\[\text{p-valor} = \mathbb{P}[t \ \textless \ T_{\text{obs}}|H_0]\]

5. O intervalo de confiança para o parâmetro $ \mu_D $ é dado por 

\[IC(\mu_D,1-\alpha)=\left(\overline{D}-t_{\alpha/2}\frac{s_D}{\sqrt{n}};\overline{D}+t_{\alpha/2}\frac{s_D}{\sqrt{n}}\right)\]

para o caso bilateral. Se o teste é unilateral à direita, o intervalo de confiança para o parâmetro $ \mu_D $ é dado por 

\[IC(\mu_D,1-\alpha)=\left(\overline{D}-t_{\alpha}\frac{s_D}{\sqrt{n}};\infty\right)\]

e, se o teste é unilateral à esquerda, o intervalo de confiança para o parâmetro $ \mu_D $ é dado por 

\[IC(\mu_D,1-\alpha)=\left(-\infty;\overline{D}+t_{\alpha}\frac{s_D}{\sqrt{n}}\right).\]

6. A probabilidade de erro do tipo II é dada por 

\[\beta=\Psi(t_{\alpha/2})-\Psi(-t_{\alpha/2})\]

para o caso bilateral e, para os casos unilaterial à direita e à esquerda, as probabilidades de erro do tipo II são dadas, respectivamente, por 

\[\beta=\Psi(t_{\alpha})\quad \hbox{e}\quad \beta=1-\Psi(-t_{\alpha})\]

onde $ \Psi $ é a função densidade acumulada da distribuição $ t $ com $ n - 1 $ graus de liberdade e parâmetro de não-centralidade $ \frac{\delta\sqrt{n}}{s_D} $.

7. Para calcular o poder do teste ou o tamanho amostral, utilizamos o software Action da mesma forma que no teste $ T $ comum.

Exemplo 5.8.1:

Consideremos $ X_1,\ldots,X_{20} $ uma amostra de medições do laboratório da Empresa $ A $ e $ Y_1,\ldots,Y_{20} $ uma amostra de medições do laboratório da Empresa $ B $ (tabela a seguir). Os testes dos dois laboratórios são realizados no mesmo padrão, por isso, existe uma correlação entre eles, ou seja, as amostras são dependentes. Avalie a compatibilidade das medições entre o laboratório da empresa $ A $ e do laboratório da empresa $ B $.

Laboratório da Empresa A ($ X_i $) Laboratório da Empresa B ($ Y_i $) Diferença ($ D_i $)
1,00552 0,01942 0,98610
-1,49928 -0,46512 -1,03416
0,21367 0,53218 -0,31851
0,44658 -0,14844 0,59502
0,62766 -0,60021 1,22787
0,31091 0,06495 0,24596
-0,83878 0,33013 -1,16891
-0,29054 0,12116 -0,41170
-0,08487 0,74269 -0,82756
-1,26465 -1,64232 0,37767
-0,06353 0,05497 -0,11850
-1,07632 0,76342 -1,83974
-1,34134 1,74131 -3,08265
-0,55062 -0,06392 -0,48670
1,61848 -1,88146 3,49994
0,50997 -0,76135 1,27132
0,76027 -0,23009 0,99036
0,68061 -1,16800 1,84861
-1,91464 0,88392 -2,79856
-0,20072 0,96512 -1,16584

clique aqui para efetuar o download dos dados utilizados nesse exemplo

Neste caso, para minimizarmos o impacto desta correlação, tomamos a diferença entre as medições dos dois laboratórios e aplicamos um teste $ T $ pareado.

Temos que $ \overline{D} = -0,110499 $ e $ s_D = 1,56908 $ então, sob $ H_0 $

\[T_{\text{obs}}=\frac{-0,11}{\frac{1,57}{\sqrt{20}}}=-0,31\]

Considerando $ \alpha = 0,05 $, encontramos na tabela $ t $ de Student com $ 19 $ graus de liberdade os valores críticos $ -t_{0,025} = -2,093 $ e $ t_{0,025} = 2,093 $. Assim, como $ -2,093 \ \textless \ T_{\text{obs}} \ \textless \ 2,093 $, podemos dizer que não temos evidências para rejeitar a hipótese de que as médias são iguais.

O p-valor é dado por 

\[\text{p-valor}=\mathbb{P}[|t| \ \textgreater \ |T_{\text{obs}}||H_0]= 2\mathbb{P}[t \ \textgreater \ |T_{\text{obs}}| | H_0]=0,7562.\]

O intervalo de confiança é dado por 

\[IC(\mu_D,0,95)=\left(-0,1105-2,093\frac{1,569}{\sqrt{20}};-0,1105+2,093\frac{1,569}{\sqrt{20}}\right)=(-0,8449;0,6239).\]

Veja a seguir os resultados obtidos pelo software Action.

Para entender como executar essa função do Software Action, você pode consultar o manual do usuário.

Vamos utilizar o Action para calcular o poder do teste em detectar uma diferença $ \delta = 1,2 $ entre o valor real e o hipotético. Então lançando os valores $ n = 20 $, $ \delta = 1,2 $, $ \sigma = 1,56908 $ e $ \alpha = 0,05 $ temos como resultado $ P = 0,90024 $.

A probabilidade de erro do tipo II é dada por 

\[\beta=\Psi(t_{0,025})-\Psi(-t_{-0,025})=0,099762\]

de onde concluímos que o poder do teste em detectar esta diferença é 

\[P=1-\beta=1-0,99762=0,90024.\]

Veja a seguir os resultados obtidos pelo software Action.

Para entender como executar essa função do Software Action, você pode consultar o manual do usuário.

Exemplo 5.8.2:

A fim de determinar a eficiência de um medicamento antitérmico, a temperatura corporal (em graus Celsius) de 20 indivíduos foi medida. Em seguida, foi administrado o medicamento e após uma hora a temperatura foi medida novamente. Os resultados podem ser encontrados na tabela abaixo.

  Temperatura    Temperatura
Indivíduo Antes Depois Indivíduo Antes Depois
1 37,5 37,8 11 39,3 38
2 36 36,4 12 37,5 37,1
3 39 37,6 13 38,5 36,6
4 38 37,2 14 39 37,5
5 37,8 36,9 15 36,9 37
6 38,5 37,7 16 37 36,2
7 36,9 36,8 17 38,5 37,6
8 39,4 38,1 18 39 36,8
9 37,2 36,7 19 36,2 36,4
10 38,1 37,3 20 36,8 36,8

clique aqui para efetuar o download dos dados utilizados nesse exemplo

Como estamos querendo avaliar se houve ou não diminuição da temperatura dos indivíduos e como existe uma dependência clara entre as amostras de antes e após a administração do medicamento, já que as amostras estão relacionadas aos mesmos indivíduos, devemos utilizar o teste T pareado.

Já que queremos avaliar a eficiência do medicamento, queremos testar as seguintes hipóteses 

\mu_D \ \textgreater \ 0\end{array}\right.\]

pois as diferenças $ D_i $'s são calculadas entre os elementos da primeira amostra e da segunda amostra e, com a hipótese alternativa $ H_1 $, estamos testando se a média das diferenças da população antes da aplicação do medicamento é maior do que a média após a aplicação, isto é, a aplicação do medicamento diminui a média populacional das temperaturas?

A seguir, calculamos as diferenças $ D_i = X_i - Y_i $.

Tabela das diferenças  
Indivíduo Diferença Indivíduo Diferença
1 -0,3 11 1,3
2 -0,4 12 0,4
3 1,4 13 1,9
4 0,8 14 1,5
5 0,9 15 -0,1
6 0,8 16 0,8
7 0,1 17 0,9
8 1,3 18 2,2
9 0,5 19 -0,2
10 0,8 20 0

A partir da tabela das diferenças, temos que a média das diferenças é dada por $ \overline{D} = 0,73 $ e o desvio-padrão das diferenças é dado por $ s_D = 0,735634 $. Neste caso, temos que a estatística do teste, sob $ H_0 $ é dada por 

\[T_{\text{obs}} = \frac{0,73}{\frac{0,735634}{\sqrt{20}}} = 4,438.\]

Considerando $ \alph = 0,05 $, temos da distribuição $ t $ de Student com $ 19 $ graus de liberdade que $ t_{0,05} = 1,729 $. Assim, como $ 1,729 = t_{0,05} \ \textless \ 4,438 = T_{\text{obs}} $, podemos dizer que temos evidência para rejeitar a hipótese de que as médias entre as populações são iguais, ou seja, temos evidências de que a média de temperatura antes da administração do medicamento é maior do que a média após. Com isso, podemos assumir que o medicamento é eficiente.

O p-valor é dado por 

\[\text{p-valor} = \mathbb{P}\left[t \ \textgreater \ T_{\text{obs}}|H_0\right] = \mathbb{P}\left[t \ \textgreater \ 4,438|H_0\right] = 1,41 \times 10^{-4}.\]

O intervalo de confiança com nível $ 0,95 $, é dado por 

\[IC(\mu_D,0,95) = \left(0,73 - 1,729\frac{0,735634}{\sqrt{20}};\infty\right) = \left(0,4455;\infty\right).\]

Veja a seguir os resultados obtidos pelo software Action.

Para entender como executar essa função do Software Action, você pode consultar o manual do usuário.
 

Vamos utilizar o Action para calcular o poder do teste em detectar uma diferença média de temperatura $ \delta = 0,6 $ graus entre o valor real e o hipotético. Então, lançando os valores $ n = 20 $, $ \delta = 0,6 $, $ \sigma = 0,735634 $ e $ \alpha = 0,05 $ temos como resultado $ P = 0,96915 $.

A probabilidade de erro do tipo II é dada por 

\[\beta=\Psi(t_{0,05})=0,03085\]

de onde concluímos que o poder do teste em detectar esta diferença é 

\[P=1-\beta=1-0,03085=0,96915.\]

Veja a seguir os resultados obtidos pelo software Action.

Para entender como executar essa função do Software Action, você pode consultar o manual do usuário.
 

Inferência

Sobre o Portal Action

O Portal Action é mantido pela Estatcamp - Consultoria Estatística e Qualidade, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.

Facebook

CONTATO

  •  Maestro Joao Seppe, 900, São Carlos - SP | CEP 13561-180
  • Telefone: (16) 3376-2047
  • E-Mail: [email protected]