5.7.1 - Comparação de Médias: Variâncias iguais

Você está aqui

Consideraremos agora, que as variâncias das populações são iguais, porém, desconhecidas, ou seja, $ \sigma_1^2 = \sigma_2^2 = \sigma^2 $. Denotamos $ S^2_i $ a variância  amostral da amostra $ i=1,2 $. Como as amostras são independentes, obtemos que

$$\frac{(n_1-1)s^2_1}{\sigma^2} \quad \text{e} \quad \frac{(n_2-1)s^2_2}{\sigma^2}$$

são variáveis aleatórias independentes com distribuição qui-quadrado com $ n_1-1 $ e $ n_2-1 $ graus de liberdade, respectivamente. Como a soma de distribuições qui-quadrado independentes também tem distribuição qui-quadrado com os graus de liberdade dado pela soma, obtemos que

$$\frac{(n_1-1)s^2_1}{\sigma^2} + \frac{(n_2-1)s^2_2}{\sigma^2}=\frac{(n_1-1)s^2_1 + (n_2-1)s^2_2}{\sigma^2}$$

  tem distribuição qui-quadrado com $ n_1 + n_2 -2 $ graus de liberdade. Por outro lado, dado que as variância são iguais, temos que

$$\frac{\bar{X} - \bar{Y} - (\mu_1 - \mu_2)}{\sigma \sqrt{\frac{1}{n_1} + \frac{1}{n_2}} } $$

tem distribuição normal com média zero e variância $ 1 $

A partir de propriedades da distribuição amostral da média e da distribuição amostral da variância para populações normais, sabemos que a média amostral e a variância amostral são variáveis aleatórias independentes. Desta forma, podemos aplicar a definição de distribuição t-Student para obtemos que a  variável aleatória

\[T = \frac{(\overline{X}-\overline{Y})-(\mu_1-\mu_2)}{s_p\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}}\]

que tem distribuição t-Student com $ n_1+n_2-2 $ graus de liberdade. Aqui, $ s_p $ é o desvio padrão agrupado (pooled) que é dado por 

\[s_p=\sqrt{\frac{(n_1-1)s_1^2+(n_2-1)s_2^2}{n_1+n_2-2}}\]

onde

  • $ s_1^2 $: variância da amostra proveniente da população 1.
  • $ s_2^2 $: variância da amostra proveniente da população 2.

Para realizar o teste para igualdade de duas médias com variâncias iguais, porém desconhecidas, devemos realizar os seguintes passos:

1. Estabelecer uma das hipóteses, por exemplo: 

\mu_1 \ \textless \ \mu_2\end{array}\right.\]

2. Fixar o nível de significância $ \alpha $.

3. Determinar a região crítica.

  • Se o teste é bilateral, determinamos os pontos críticos $ -t_{\alpha/2} $ e $ t_{\alpha/2} $ tais que $ \mathbb{P}[T \ \textless \ -t_{\alpha/2}]=\mathbb{P}[T \ \textgreater \ t_{\alpha/2}]=\alpha/2 $.

  • Se o teste é unilateral à direita, determinamos o ponto crítico $ t_{\alpha} $ tal que $ \mathbb{P}[T \ \textgreater \ t_{\alpha}]=\alpha $

  • Se o teste é unilateral à esquerda, determinamos o ponto crítico $ -t_{\alpha} $ tal que $ \mathbb{P}[T \ \textless \ -t_{\alpha}]=\alpha $.

4. Calcular $ T_{\text{obs}} $ que é o valor da variável $ T $ sob a hipótese nula. Como 

\[T=\frac{(\overline{x}-\overline{y})-(\mu_1-\mu_2)}{s_p\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}}\]

temos que $ T_{\text{obs}} $ é dada por 

\[T_{\text{obs}}=\frac{(\overline{x}-\overline{y})}{s_p\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}}.\]

5. Critério:

  • Teste bilateral: Se $ T_{\text{obs}} \ \textless \ -t_{\alpha/2} $ ou $ T_{\text{obs}} \ \textgreater \ t_{\alpha/2} $, rejeitamos $ H_0 $. Caso contrário, não rejeitamos $ H_0 $.
  • Teste unilateral à direita: Se $ T_{\text{obs}} \ \textgreater \ t_{\alpha} $ rejeitamos $ H_0 $. Caso contrário, não rejeitamos $ H_0 $.
  • Teste unilateral à esquerda: Se $ T_{\text{obs}} \ \textless \ -t_{\alpha} $ rejeitamos $ H_0 $. Caso contrário, não rejeitamos $ H_0 $.

6. O p-valor é determinado por 

\[\text{p-valor} = \mathbb{P}[|T| \ \textgreater \ |T_{\text{obs}}| | H_0] = 2\mathbb{P}[T \ \textgreater \ |T_{\text{obs}}| |H_0].\]

se o teste é bilateral. Se o teste é unilateral à direita, o p-valor é dado por 

\[\text{p-valor} = \mathbb{P}[T \ \textgreater \ T_{\text{obs}} | H_0]\]

e se o teste é unilateral à esquerda, o p-valor é dado por 

\[\text{p-valor} = \mathbb{P}[T \ \textless \ T_{\text{obs}} | H_0].\]

7. Como vimos na Seção 4.6.2, se considerarmos b o número de graus de liberdade, ou seja, $ b=n_1+n_2-2 $, o intervalo de confiança para a diferença de duas médias com variâncias desconhecidas, porém iguais, é dado por 

\[IC(\mu_1-\mu_2,1-\alpha)=\left((\overline{X}-\overline{Y})-t_{(b,\alpha/2)}s_p\sqrt{\frac{1}{n_1}+\frac{1}{n_2}};(\overline{X}-\overline{Y})+t_{(b,\alpha/2)}s_p\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}\right)\]

se o teste é bilateral. No caso em que o teste é unilateral à direita, o intervalo de confiança é dado por 

\[IC(\mu_1-\mu_2,1-\alpha)=\left((\overline{X}-\overline{Y})-t_{(b,\alpha)}s_p\sqrt{\frac{1}{n_1}+\frac{1}{n_2};\infty\right)\]

e, se o teste é unilateral à esquerda, o intervalo de confiança será dado por 

\[IC(\mu_1-\mu_2,1-\alpha)=\left(-\infty;(\overline{X}-\overline{Y})+t_{(b,\alpha)}s_p\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}\right).\]

8. O erro do tipo II é calculado ao se aceitar $ H_0 $ quando esta é falsa ($ H_1 $ é verdadeira).

Suponha, por exemplo que a hipótese nula é falsa e que a verdadeira diferença entre as médias seja $ \Delta = \mu_1-\mu_2 $. Então, analogamente ao caso de uma amostra, temos que 

\[\frac{\overline{X_1}-\overline{X_2}}{S_p\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}}\]

tem distribuição $ t $ não central, com $ n_1+n_2-2 $ graus de liberdade e parâmetro de não-centralidade  

\[\frac{\Delta}{\sigma\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}}.\]

Com isso, concluímos que o erro do tipo II é dado por

  • $ \beta = \psi(t_{\alpha/2})-\psi(-t_{\alpha/2}) $ se o teste é bilateral;
  • $ \beta = \psi(t_{\alpha}) $ se o teste é unilateral à direita;
  • $ \beta = 1-\psi(-t_{\alpha}) $ se o teste é unilateral à esquerda.

onde $ \psi $ é a função distribuição acumulada da distribuição $ t $ não central com $ n_1+n_2-2 $ graus de liberdade e parâmetro de não-centralidade $ \frac{\Delta}{\sigma\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}} $.

9. O poder do teste é calculado como 1 menos a probabilidade de erro do tipo II, ou seja, 

\[P = 1-\beta\]

Utilizamos o software Action para o cálculo do poder (dado o tamanho amostral) ou o cálculo do tamanho amostral necessário para o teste detectar certa diferença entre as diferenças entre as médias, com um determinado poder. No Action, temos como parâmetros o tamanho da primeira amostra ($ n_1 $), o tamanho da segunda amostra ($ n_2 $), a diferença a ser detectada ($ \Delta $), o poder ($ P $), o nível de significância ($ \alpha $) e o desvio-padrão ($ \sigma $). Então, para calcular o poder do teste, lançamos os valores de $ n_1,n_2,\Delta,\alpha $ e $ \sigma $ e nos é fornecido o poder do teste. As fórmulas utilizadas para o cálculo do poder são 

\[P=1-\Psi(t_{\alpha/2})+\Psi(-t_{\alpha/2})\]

para o teste bilateral, 

\[P = \Psi(-t_{\alpha})\]

para o teste unilateral à esquerda e 

\[P = 1-\Psi(t_{\alpha})\]

para o teste unilateral à direita. Aqui $ \Psi $ é a função distribuição acumulada da distribuição $ t $ não central com $ n_1+n_2-2 $ graus de liberdade e parâmetro de não-centralidade $ \varphi = \frac{\Delta}{\sigma\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}} $.

Já para o cálculo do tamanho da amostra necessária para que o teste detecte uma diferença pré-determinada entre as hipóteses nula e alternativa, com um determinado poder, basta lançarmos os valores da diferença $ \Delta $, do desvio-padrão $ \sigma $, do nível de significância $ \alpha $ e do poder $ P $. Com isso, o Action nos fornece o valor do tamanho das amostras $ n = n_1 = n_2 $. As fórmulas utilizadas para cada teste são as mesmas acima, basta reescrevê-las isolando $ n $.

Exemplo 5.7.1.1:

Para ilustrar a aplicação deste teste de hipótese, considere os dados de duas amostras apresentadas a seguir e, a um nível de significância $ \alpha = 0,05 $, decida se existe diferença significativa entre as médias populacionais $ \mu_1 $ e $ \mu_2 $.

Amostra 1
18,800 17,591 20,835 19,169 18,755
20,504 18,756 17,527 19,290 19,203
18,621 18,977 17,078 22,059 18,419
19,919 20,308 17,620 18,585 20,764
21,117 18,899 21,426 17,890 21,055
Amostra 2     
22,284 22,057 22,629 24,620 21,491 21,198
21,901 22,881 22,860 22,058 22,699 22,909
25,302 17,968 24,515 23,150 24,662 23,327
22,447 23,382 22,426 22,787 21,983 24,534
22,771 21,043 21,203 24,009 21,917 21,152

clique aqui para efetuar o download dos dados utilizados nesse exemplo

Vamos testar se as médias das amostras 1 e 2 são iguais ou diferente, portanto

1. Estabelecemos as hipóteses 

\mu_1\neq\mu_2\end{array}\right.\]

que são equivalentes as hipóteses 

\mu_1-\mu_2\neq0\end{array}\right.\]

Temos a partir dos dados que a média e o desvio padrão da amostra 1 são $ \overline{x} = 19,3267 $ e $ s_1 = 1,36228 $, respectivamente. A média e desvio padrão da amostra 2 são $ \overline{y} = 22,6055 $ e $ s_2 = 1,43822 $, respectivamente. O tamanho de cada amostra é $ n_1 = 25 $ e $ n_2 = 30 $. Com isso, temos que o desvio padrão agrupado (pooled) é dado por 

\[s_p=\sqrt{\frac{(25-1)(1,36228)^2+(30-1)(1,43822)^2}{25+30-2}}=1,40434.\]

2. Para este exemplo, fixamos o nível de significância $ \alpha = 0,05 $.

3. Como o teste é bilateral e sabendo que o número de graus de liberdade é $ b = n_1+n_2-2 = 53 $, encontramos na Tabela da distribuição $ t $ de Student os seguintes valores críticos $ -t_{0,025} = -2,005 $ e $ t_{0,025} = 2,005 $.

4. Calculamos o valor da estatística $ T_{\text{obs}} $

\[T_{\text{obs}}=\frac{(19,3267-22,6055)}{1,40434\sqrt{\left(\frac{1}{25}+\frac{1}{30}\right)}}=-8,62.\]

5. Como $ T_{\text{obs}} \ \textless \ -2,005 $, rejeitamos a hipótese nula, ou seja, rejeitamos a hipótese de que as médias são iguais.

6. Vamos agora calcular o p-valor. Como o teste é bilateral, temos que 

\[\text{p-valor} = \mathbb{P}[|T| \ \textgreater \ |T_{obs}||H_0] = 2\mathbb{P}[T \ \textgreater \ 8,62] = 1,15E - 11.\]

7. Já o intervalo de confiança para a diferença $ \mu_1-\mu_2 $ é dado por 

\[IC(\mu_1-\mu_2,1-\alpha)=\left((\overline{X}-\overline{Y})-t_{(b,\alpha/2)}s_p\sqrt{\frac{1}{n_1}+\frac{1}{n_2}};(\overline{X}-\overline{Y})+t_{(b,\alpha/2)}s_p\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}\right),\]

ou seja, 

\[IC(\mu_1-\mu_2,1-\alpha)=(-4,041;-2,516).\]

Os resultados obtidos no Action são dados na tabela a seguir.

Para entender como executar essa função do Software Action, você pode consultar o manual do usuário.

Vamos calcular o poder do teste ao se aceitar $ H_0 $ quando esta é falsa ($ H_1 $ é verdadeira), para uma diferença $ \Delta = 3,2 $ entre as diferenças das médias. Faremos isso utilizando o software Action. Como $ n_1 = 25 $, $ n_2 = 30 $, $ \alpha = 0,05 $ e $ s_p = 1,40434 $, temos que o cálculo do poder é dado por 

\[P=1-\Psi(z_{0,025})+\Psi(\z_{0,025})=1-0+0=1\]

Para entender como executar essa função do Software Action, você pode consultar o manual do usuário.

Suponha agora que dado o tamanho de uma das amostras $ N = 30 $, queremos calcular o tamanho da outra amostra necessário para detectar uma diferença $ \Delta = 1,2 $ entre as hipóteses nula e alternativa com um poder de, no mínimo, $ 0,9 $, com desvio padrão $ 1,40434 $.

Os resultados obtidos no Action são dados na tabela a seguir.

Temos que ambas as amostras devem conter $ 30 $ elementos na amostra para ter no mínimo $ 0,9 $ de poder, com uma diferença $ \Delta = 1,2 $desvio padrão $ 1,40434 $.

Para entender como executar essa função do Software Action, você pode consultar o manual do usuário.

Inferência

Sobre o Portal Action

O Portal Action é mantido pela Estatcamp - Consultoria Estatística e Qualidade, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.

Facebook

CONTATO

  •  Maestro Joao Seppe, 900, São Carlos - SP | CEP 13561-180
  • Telefone: (16) 3376-2047
  • E-Mail: [email protected]