![]() |
Manual da ferramenta Action sobre Regressão Linear Múltipla Para mais detalhes sobre o conteúdo estatístico Regressão Linear Múltipla, clique aqui |
Se estamos interessados na relação linear de duas ou mais variáveis de entrada com a variável resposta, então temos o caso de Regressão Linear Múltipla.
Exemplo: O ganho de um transistor consiste na diferença entre o emissor e o coletor. A variável Ganho (em hFE) pode ser controlada no processo de deposição de íons por meio das variáveis Tempo de emissão (em minutos) e Dose de íons (
). Os dados encontram-se na Tabela 1. Nosso objetivo é avaliar a relação linear entre Ganho dos transistores e as covariáveis Tempo de emissão e Dose de íons.
| Observação | Tempo (min) |
Dose de íons ( ) |
Ganho (hFe) |
| 1 | 195 | 4 | 1004 |
| 2 | 255 | 4 | 1636 |
| 3 | 195 | 4,6 | 852 |
| 4 | 255 | 4,6 | 1506 |
| 5 | 225 | 4,2 | 1272 |
| 6 | 225 | 4,1 | 1270 |
| 7 | 225 | 4,6 | 1269 |
| 8 | 195 | 4,3 | 903 |
| 9 | 255 | 4,3 | 1555 |
| 10 | 225 | 4 | 1260 |
| 11 | 225 | 4,7 | 1146 |
| 12 | 225 | 4,3 | 1276 |
| 13 | 225 | 4,72 | 1225 |
| 14 | 230 | 4,3 | 1321 |
Tabela 1: Ganho em um conjunto de pistões à diferentes níveis de emissão e coleta.
clique aqui para efetuar o download dos dados utilizados nesse exemplo
| Você pode consultar o vídeo demonstrativo para esse exemplo. | |||
Para ajustarmos um Modelo de Regressão Linear Múltipla, vamos realizar os seguintes passos:
1. Primeiramente vamos acessar o menu como descrito a seguir:
Action
Modelos
Modelo Linear.

2. Após clicarmos em Modelo Linear, será exibida a seguinte tela:

3. Com o cursor no campo Conjunto de Dados, selecionamos na planilha de dados as colunas contendo os valores das variáveis incluíndo os nomes das variáveis. Para fazermos esta seleção, utilizamos o mouse, como mostrado na figura abaixo. Caso desejamos ler os dados sem os nomes das variáveis, é preciso desabilitar a opção Colunas com Nome, que fica abaixo do campo Conjunto de Dados.

4. Após selecionarmos o conjunto de dados, clicamos no botão Ler. Consequentemente, os nomes das variáveis lidas aparecerão no campo Montar Fórmula como visto na figura abaixo.

5. Devemos indicar para o programa qual é a variável resposta. Para isso, no campo Variável Resposta, selecionamos dentre as variáveis lidas qual é a variável resposta. No nosso exemplo específico selecionaremos Ganho.

6. As variáveis explicativa podem ser numéricas ou categóricas.
- Se a(s) variável(eis) explicativa(s) for(em) categórica(s), o programa reconhece automaticamente essa informação e o(s) nome(s) da(s) variável(eis) categórica(s) é(são) inserido(s) automaticamente no campo Variáveis Categóricas.
- Se a(s) variável(eis) explicativa(s) for(em) numérica(s) mas quisermos utilizá-la(s) como variável(eis) categórica(s), devemos informar. Para isso, no campo Variáveis Categóricas, digitamos o(s) nome(s) da(s) variável(eis) explicativa(s) que queremos considerar como variável(eis) categórica(s).
- Se a(s) variável(eis) explicativa(s) for(em) numérica(s) e quisermos utilizá-la(s) como variável(eis) numérica(s), não precisamos fazer nada, deixando o campo Variáveis Categóricas em branco.
CUIDADO: É preciso digitar o nome da variável da mesma maneira que está escrito na planilha de dados, incluindo letras maiúscula e minúscula pois o programa não reconhece a variável caso o nome esteja escrito errado. Por exemplo, se quisermos no nosso exemplo considerar a covariável numérica Dose_de_íons como variável categórica, devemos digitar o nome da covariável da maneira que foi lido, como apresentado na figura abaixo.

Se por descuido digitarmos o nome da variável de maneira errada, a seguinte mensagem de erro aparecerá quando efetuarmos os demais passos e clicarmos no botão OK.

Neste caso clicamos em Ok para retornar a tela principal e assim corrigir o(s) nome(s) da(s) covariável(eis).
7. Indicado a variável resposta, devemos informar a fórmula do modelo. Para isso, utilizamos os botões auxiliares (operadores) do campo Montar Fórmula, como visto na figura abaixo.

7.1. Para indicarmos o modelo de regressão composto por todas as covariáveis podemos simplesmente clicar no botão Todas como visto na figura abaixo. Para o nosso exemplo, ao clicarmos no botão Todas obtemos o modelo Ganho = ß0 + ß1 Tempo + ß2 Dose_de_íons.

7.2. Para indicarmos o modelo de regressão composto por todas as covariáveis e pelas interações entre elas devemos:
- dar um duplo clique na primeira variável regressora a ser considerada;
- em seguida, clicar no operador * (ver figura abaixo);
- dar um duplo clique na segunda variável regressora a ser considerada;
- se houver uma terceira variável regressora, clicamos novamente no operador * e então um duplo clique na terceita variável regressora a ser considerada;
- seguir até que todas as variáveis regressoras sejam inseridas na fórmula.
Para o nosso exemplo, damos um duplo clique na variável Tempo; em seguida clicamos no operador * e então damos um duplo clique na variável Dose_de_íons, como visto na figura abaixo. Desta forma, obtemos o modelo Ganho = ß0 + ß1 Tempo + ß2 Dose_de_íons + ß3 Tempo Dose_de_íons.

7.3. Para inserirmos o termo de interação entre duas ou mais variáveis regressoras devemos:
- dar um duplo clique na primeira variável a ser considerada;
- em seguida, clicar no operador : (ver figura abaixo);
- dar um duplo clique na segunda variável a ser considerada;
- se houver uma terceira variável, clicamos novamente no operador : e então um duplo clique na terceira variável a ser considerada;
- seguir até que todas as variáveis regressoras de interesse sejam inseridas na fórmula.
Para o nosso exemplo, damos um duplo clique na variável Tempo; em seguida clicamos no operador : e então damos um duplo clique na variável Dose_de_íons, como visto na figura abaixo. Desta forma, obtemos o modelo Ganho = ß0 + ß1 Tempo Dose_de_íons.

7.4. Para excluir algum termo devemos:
- inserir o modelo desejado;
- clicar no operador - (ver figura abaixo);
- inserir o termo a ser excluído.
No nosso exemplo, suponha que queremos o modelo
Ganho = ß0 + ß1 Dose_de_íons + ß2 Tempo Dose_de_íons, ou seja, o modelo com interação entre as variáveis Tempo e Dose_de_íons mas sem a variável regrressora Tempo. Para isso, devemos:
- inserir o modelo como em (ii);
- clicar no operador -;
- dar um duplo clique na variável Tempo.

7.5. Podemos também inserir termos quadráticos. Para isto devemos:
- clicar no operador ^ como indicado na figura abaixo;

- digitar o nome da variável no lugar de Variável e o valor da potência no lugar de Potência, que aparecem no campo Fórmula ao clicar no operador ^. Para o nosso exemplo, se quisermos inserir o termo Tempo2, devemos digitar no lugar de Variável o nome Tempo e no lugar de Potência o valor 2, como pode ser visto na figura abaixo.

7.6. O operador / significa que a variável que vem antes do / é mais importante do que a variável que vem depois do /. Por exemplo, se não estamos interessados em avaliar o efeito das Dose_de_íons e sim dos Tempo, devemos:
- dar um duplo clique na variável regressora Tempo;
- dar um clique no operador / (ver figura abaixo);
- dar um duplo clique na variável Dose_de_íons.
Isto é equivalente a digitarmos Tempo + Tempo:Dose_de_íons.

Podemos combinar os 6 operadores utilizados acima com o objetivo de obter o modelo desejado. Além disso, podemos digitar a fórmula diretamente ao invés de clicarmos no nome das variáveis e nos operadores. Para isso, basta digitarmos a fórmula diretamente no campo Fórmula, como visto na figura abaixo.

8. O modelo de regressão linear múltipla especificado no item 7 pode ou não dependendo da situaçõ. Se queremos o modelo sem o intercepto, devemos habilitar a opção Sem Intercepto no campo Opções, como mostrado na figura abaixo.

9. Opcionais.
Além das funções básicas, podemos solicitar outras funções que complementam e auxiliam na interpretação dos resultados.
10. Podemos calcular os valores de predição (opcional) e consequentemente os intervalos de confiança e os desvios padrão desses valores preditos. Para isto, basta habilitarmos no campo Opções a opção Valores de Predição como mostrado na figura abaixo.

11. No cálculo do intervalo de confiança é necessário indicarmos qual o nível de confiança adotado. Automaticamente o valor preenchido é 0,95 indicando que estamos considerando um nível de confiança de 95%. Para alterarmos esse nível, basta digitarmos o valor desejado no campo Nível de Confiança como na figura abaixo.

12. Para calcularmos o Valor de Previsão de uma nova observação, devemos inicialmente habilitar a opção Valores de Previsão (Novos Dados) como visto na tela abaixo.

13. Depois de habilitado, é necessário ler o(s) valor(es) das covariáveis (Tempo e Dose_de_íons) para o qual queremos prever o Ganho. Para isso, clicamos com o mouse na janela localizada abaixo de Valores de Previsão (Novos Dados), como pode ser visto na figura abaixo.

14. Com o mouse, selecionamos o(s) valor(es) das covariáveis incluindo o nome das covariáveis, como mostrado a seguir.

O Nível de Confiança será o mesmo adotado para os cálculos dos Valores de Predição.
15. Após indicarmos os passos a serem executado pelo programa, devemos escolher o local onde os resultados serão mostrados. No campo Mostrar Resultados, escolhemos uma das opções. Sugerimos a opção Nova Planilha, como visto na figura abaixo pois o Action não possui o comando desfazer. Ao escolher a opção Célula Atual, os resultados serão impressos a partir da célula em que se encontra o cursor na janela do Excel. Neste caso, o usuário deve posicionar previamente (antes do passo 1) o cursor em uma posição apropriada.

16. Para finalizar e então ver os resultados, devemos clicar em Ok.
Resultados e Interpretação
Após efetuada a análise, serão exibidos os seguintes resultados:

- Analisando a primeira tabela (Tabela da Anova) concluímos que as variáveis Tempo e Dose_de_íons são significativas para o modelo uma vez que o p-valor para os dois coeficientes foram menores do que
=5%. - A segunda tabela apresenta uma análise descritiva dos resíduos do modelo, contendo os valores dos quartis, máximos e mínimos, média e mediana.
- Na terceira tabela (Coeficientes) temos as estimativas do intercepto e dos coeficientes relacionados às variáveis de entrada. Como o coeficiente da variável tempo é positivo, concluímos que no intervalo da análise, um aumento deste provoca aumento também no ganho do transistor. Já com relação à variável dose, como seu coeficiente é negativo, concluímos que no intervalo da análise, um aumento dela provoca diminuição no ganho do transistor. A tabela apresenta também os p-valores para cada coeficiente, em que a hipótese nula é que o coeficiente é não significativo. Como os valores calculados foram menores do que
=5%, rejeitamos a hipótese nula, o que significa que o intercepto e as variáveis de entrada são importantes para o modelo. - A quarta tabela apresenta o valor de
Ajustado em que podemos ter uma idéia da qualidade do ajuste. Dado seu valor, de 0,9762, temos que cerca de
da variabilidade dos dados é explicada pelo modelo de regressão ajustado, e assim, temos um indício de que o modelo se ajustou bem ao conjunto de dados.

- Na primeira tabela são apresentados os valores preditos (valores ajustados) e os respectivos intervalos de confiança e desvios padrão para cada observação.
- Na segunda tabela temos o valor previsto, o intervalo de confiança e o desvio padrão para o nível desejado.

