Skip to main content

4.1.2 - Regressão Linear Múltipla

Manual da ferramenta Action sobre Regressão Linear Múltipla

Para mais detalhes sobre o conteúdo estatístico  Regressão Linear Múltipla, clique aqui   

Se estamos interessados na relação linear de duas ou mais variáveis de entrada com a variável resposta, então temos o caso de Regressão Linear Múltipla.


Exemplo: O ganho de um transistor consiste na diferença entre o emissor e o coletor. A variável Ganho (em hFE) pode ser controlada no processo de deposição de íons por meio das variáveis Tempo de emissão (em minutos) e Dose de íons ($ \times 10^{14} $). Os dados encontram-se na Tabela 1. Nosso objetivo é  avaliar a relação linear entre Ganho dos transistores e as covariáveis Tempo de emissão e Dose de íons.

Observação Tempo (min)
Dose de íons ($ \times 10^{14} $)
Ganho (hFe)
1 195 4 1004
2 255 4 1636
3 195 4,6 852
4 255 4,6 1506
5 225 4,2 1272
6 225 4,1 1270
7 225 4,6 1269
8 195 4,3 903
9 255 4,3 1555
10 225 4 1260
11 225 4,7 1146
12 225 4,3 1276
13 225 4,72 1225
14 230 4,3 1321

Tabela 1: Ganho em um conjunto de pistões à diferentes níveis de emissão e coleta.


clique aqui para efetuar o download dos dados utilizados nesse exemplo

 

Você pode consultar o vídeo demonstrativo para esse exemplo.

Para ajustarmos um  Modelo de Regressão Linear Múltipla, vamos realizar os seguintes passos:

1. Primeiramente vamos acessar o menu como descrito a seguir:

Action $ \blacktriangleright $ Modelos $ \blacktriangleright $  Modelo Linear.

 

2. Após clicarmos em Modelo Linear, será exibida a seguinte tela:


 

3. Com o cursor no campo Conjunto de Dados, selecionamos na planilha de dados as colunas contendo os valores das variáveis incluíndo os nomes das variáveis. Para fazermos esta seleção, utilizamos o mouse, como mostrado na figura abaixo. Caso desejamos ler os dados sem os nomes das variáveis, é preciso desabilitar a opção Colunas com Nome, que fica abaixo do campo Conjunto de Dados.



4. Após selecionarmos o conjunto de dados, clicamos no botão Ler. Consequentemente, os nomes das variáveis lidas aparecerão no campo Montar Fórmula como visto na figura abaixo. 

                                                        

 

5. Devemos indicar para o programa qual é a variável resposta. Para isso, no campo Variável Resposta, selecionamos dentre as variáveis lidas qual é a variável resposta. No nosso exemplo específico selecionaremos Ganho.

 

6. As variáveis explicativa podem ser numéricas ou categóricas.

  • Se a(s) variável(eis) explicativa(s) for(em) categórica(s), o programa reconhece automaticamente essa informação e o(s) nome(s) da(s) variável(eis) categórica(s) é(são) inserido(s) automaticamente no campo Variáveis Categóricas.
  • Se a(s) variável(eis) explicativa(s) for(em) numérica(s) mas quisermos utilizá-la(s) como variável(eis) categórica(s), devemos informar. Para isso, no campo Variáveis Categóricas, digitamos o(s) nome(s) da(s) variável(eis) explicativa(s) que queremos considerar como variável(eis) categórica(s).
  • Se a(s) variável(eis) explicativa(s) for(em) numérica(s) e quisermos utilizá-la(s) como variável(eis) numérica(s), não precisamos fazer nada, deixando o campo Variáveis Categóricas em branco.

 

CUIDADO: É preciso digitar o nome da variável da mesma maneira que está escrito na planilha de dados, incluindo letras maiúscula e minúscula pois o programa não reconhece a variável caso o nome esteja escrito errado. Por exemplo, se quisermos no nosso exemplo considerar a covariável numérica Dose_de_íons como variável categórica, devemos digitar o nome da covariável da maneira que foi lido, como apresentado na figura abaixo.


 

Se por descuido digitarmos o nome da variável de maneira errada, a seguinte mensagem de erro aparecerá quando efetuarmos os demais passos e clicarmos no botão OK.

Neste caso clicamos em Ok para retornar a tela principal e assim corrigir o(s) nome(s) da(s) covariável(eis).


7. Indicado a variável resposta, devemos informar a fórmula do modelo. Para isso, utilizamos os botões auxiliares (operadores) do campo Montar Fórmula, como visto na figura abaixo.

 

7.1. Para indicarmos o modelo de regressão composto por todas as covariáveis podemos simplesmente clicar no botão Todas como visto na figura abaixo. Para o nosso exemplo, ao clicarmos no botão Todas obtemos o modelo Ganho = ß0 + ß1 Tempo + ß2 Dose_de_íons.


7.2. Para indicarmos o modelo de regressão composto por todas as covariáveis e pelas interações entre elas devemos:

  • dar um duplo clique na primeira variável regressora a ser considerada;
  • em seguida, clicar no operador * (ver figura abaixo);
  • dar um duplo clique na segunda variável regressora a ser considerada;
  • se houver uma terceira variável regressora, clicamos novamente no operador * e então um duplo clique na terceita variável regressora a ser considerada;
  • seguir até que todas as variáveis regressoras sejam inseridas na fórmula.

 

Para o nosso exemplo, damos um duplo clique na variável Tempo; em seguida clicamos no operador * e então damos um duplo clique na variável Dose_de_íons, como visto na figura abaixo. Desta forma, obtemos o modelo Ganho = ß0 + ß1 Tempo + ß2 Dose_de_íons + ß3 Tempo Dose_de_íons.

 

7.3. Para inserirmos o termo de interação entre duas ou mais variáveis regressoras devemos:

  • dar um duplo clique na primeira variável a ser considerada;
  • em seguida, clicar no operador : (ver figura abaixo);
  • dar um duplo clique na segunda variável a ser considerada;
  • se houver uma terceira variável, clicamos novamente no operador : e então um duplo clique na terceira variável a ser considerada;
  • seguir até que todas as variáveis regressoras de interesse sejam inseridas na fórmula.

Para o nosso exemplo, damos um duplo clique na variável Tempo; em seguida clicamos no operador : e então damos um duplo clique na variável Dose_de_íons, como visto na figura abaixo. Desta forma, obtemos o modelo Ganho = ß0 + ß1 Tempo Dose_de_íons.


 

7.4. Para excluir algum termo devemos:

  • inserir o modelo desejado;
  • clicar no operador - (ver figura abaixo);
  • inserir o termo a ser excluído.

No nosso exemplo, suponha que queremos o modelo

 Ganho = ß0 + ß1 Dose_de_íons + ß2 Tempo Dose_de_íons, ou seja, o modelo com interação entre as variáveis Tempo e Dose_de_íons mas sem a variável regrressora Tempo. Para isso, devemos:

  • inserir o modelo como em (ii);
  • clicar no operador -;
  • dar um duplo clique na variável Tempo.

 

7.5. Podemos também inserir termos quadráticos. Para isto devemos:

  • clicar no operador ^ como indicado na figura abaixo;


  • digitar o nome da variável no lugar de Variável e o valor da potência no lugar de Potência, que aparecem no campo Fórmula ao clicar no operador ^. Para o nosso exemplo, se quisermos inserir o termo Tempo2, devemos digitar no lugar de Variável o nome Tempo e no lugar de Potência o valor 2, como pode ser visto na figura abaixo.



7.6. O operador / significa que a variável que vem antes do / é mais importante do que a variável que vem depois do /. Por exemplo, se não estamos interessados em avaliar o efeito das Dose_de_íons e sim dos Tempo, devemos:

  • dar um duplo clique na variável regressora Tempo;
  • dar um clique no operador / (ver figura abaixo);
  • dar um duplo clique na variável Dose_de_íons.

Isto é equivalente a digitarmos Tempo + Tempo:Dose_de_íons.


 

Podemos combinar os 6 operadores utilizados acima com o objetivo de obter o modelo desejado. Além disso, podemos digitar a fórmula diretamente ao invés de clicarmos no nome das variáveis e nos operadores. Para isso, basta digitarmos a fórmula diretamente no campo Fórmula, como visto na figura abaixo.


 

8. O modelo de regressão linear múltipla especificado no item 7 pode ou não dependendo da situaçõ. Se queremos o modelo sem o intercepto, devemos habilitar a opção Sem Intercepto no campo Opções, como mostrado na figura abaixo.


 

9. Opcionais.

Além das funções básicas, podemos solicitar outras funções que complementam e auxiliam na interpretação dos resultados.

Análise Gráfica.

Diagnosticar Erros.

 

10. Podemos calcular os valores de predição (opcional) e consequentemente os intervalos de confiança e os desvios padrão desses valores preditos. Para isto, basta habilitarmos no campo Opções a opção Valores de Predição como mostrado na figura abaixo.


 

11. No cálculo do intervalo de confiança é necessário indicarmos qual o nível de confiança adotado. Automaticamente o valor preenchido é 0,95 indicando que estamos considerando um nível de confiança de 95%. Para alterarmos esse nível, basta digitarmos o valor desejado no campo Nível de Confiança como na figura abaixo.


 

12. Para calcularmos o Valor de Previsão de uma nova observação, devemos inicialmente habilitar a opção Valores de Previsão (Novos Dados) como visto na tela abaixo.


 

13. Depois de habilitado, é necessário ler o(s) valor(es) das covariáveis (Tempo e Dose_de_íons) para o qual queremos prever o Ganho. Para isso, clicamos com o mouse na janela localizada abaixo de Valores de Previsão (Novos Dados), como pode ser visto na figura abaixo. 


 

14. Com o mouse, selecionamos o(s) valor(es) das covariáveis incluindo o nome das covariáveis, como mostrado a seguir.



O Nível de Confiança será o mesmo adotado para os cálculos dos Valores de Predição.


15. Após indicarmos os passos a serem executado pelo programa, devemos escolher o local onde os resultados serão mostrados. No campo Mostrar Resultados, escolhemos uma das opções. Sugerimos a opção Nova Planilha, como visto na figura abaixo pois o Action não possui o comando desfazer. Ao escolher a opção Célula Atual, os resultados serão impressos a partir da célula em que se encontra o cursor na janela do Excel. Neste caso, o usuário deve posicionar previamente (antes do passo 1) o cursor em uma posição apropriada.


 

16. Para finalizar e então ver os resultados, devemos clicar em Ok.

 

 

Resultados e Interpretação

Após efetuada a análise, serão exibidos os seguintes resultados:

  • Analisando a primeira tabela (Tabela da Anova) concluímos que as variáveis Tempo e Dose_de_íons são significativas para o modelo uma vez que o p-valor para os dois coeficientes foram menores do que $ \alpha $=5%.   
  • A segunda tabela apresenta uma análise descritiva dos resíduos do modelo, contendo os valores dos quartis, máximos e mínimos, média e mediana.
  • Na terceira tabela (Coeficientes) temos as estimativas do intercepto e dos coeficientes relacionados às variáveis de entrada. Como o coeficiente da variável tempo é positivo, concluímos que no intervalo da análise, um aumento deste provoca aumento também no ganho do transistor. Já com relação à variável dose, como seu coeficiente é negativo, concluímos que no intervalo da análise, um aumento dela provoca diminuição no ganho do transistor. A tabela apresenta também os p-valores para cada coeficiente, em que a hipótese nula é que o coeficiente é não significativo. Como os valores calculados foram menores do que $ \alpha $=5%, rejeitamos a hipótese nula, o que significa que o intercepto e as variáveis de entrada são importantes para o modelo.
  • A quarta tabela apresenta o valor de $ R^2 $ Ajustado em que podemos ter uma idéia da qualidade do ajuste. Dado seu valor, de 0,9762, temos que cerca de $ 97\% $ da variabilidade dos dados é explicada pelo modelo de regressão ajustado, e assim, temos um indício de que o modelo se ajustou bem ao conjunto de dados.

 

  • Na primeira tabela são apresentados os valores preditos (valores ajustados) e os respectivos intervalos de confiança e desvios padrão para cada observação.
  • Na segunda tabela temos o valor previsto, o intervalo de confiança e o desvio padrão para o nível desejado.