Skip to main content

1.3 - Matriz de Correlação

Um jeito bastante útil de se analisar simultaneamente a associação entre variáveis é obter a matriz de correlação, através dos coeficientes de Pearson, Spearman ou Kendall.

Correlação de Pearson

Exemplo: Uma empresa pretende estudar a relação entre o volume de vendas efetuadas durante um dado período de tempo por seus vendedores, considerando seus anos de experiência e seu score num teste de inteligência. Os dados obtidos são apresentados a seguir

Vendedor Volume de Vendas Anos de experiência Score no teste
1 9 6 3
2 6 5 2
3 4 3 2
4 3 1 1
5 3 4 1
6 5 3 3
7 8 6 3
8 2 2 1
9 7 4 2
10 4 2 2

 

clique aqui para efetuar o download dos dados utilizados nesse exemplo

Você pode consultar o vídeo demonstrativo para esse exemplo.

Para realizarmos o gráfico de Matriz de Correlação, vamos realizar os seguintes passos:


1. Primeiramente vamos acessar o menu como descrito a seguir:

Action $ \blacktriangleright $ Estatística Básica $ \blacktriangleright $   Matriz de Correlação


2. Uma janela como a da figura a seguir será aberta;

3. No campo Conjunto de Dados selecionaremos as colunas que contêm os dados, usaremos o mouse para a seleção. Caso selecionemos os dados com o nome, deixaremos a caixinha coluna com nomes selecionado, caso contrário tiraremos a seleção da caixinha;

Obs: Nesta função, não podemos selecionar apenas uma coluna, pois estamos testando a correlação entre as variáveis.


4. Caso desejamos contruir a matriz scatterplot (em que visualizaremos graficamente a associação existente entre duas ou mais variáveis) selecionemos a opção Matriz de Scatterplots;


 4. Selecionemos a correlação desejada em Tipo de correlação. Neste exemplo, iremos fazer uma matriz de correlação através do coeficiente de correlação de Pearson;

Obs: As correlações de Spearman e Kendall são realizadas de forma análoga: basta selecionar o tipo de correlação desejada no quadro Tipo de correlação. A interpretação dos resultados também será análoga. Porém, faremos aqui uma observação: A correlação de Pearson mede o grau de associação entre duas variáveis de escala métrica (ou intervalar), já a correlação de Spearman pode ser usada para as variáveis medidas no nível ordinal e nas situações em que que a variável é nominal, normalmente usa-se o coeficiente de correlação de Kendall.




6. Em Mostrar Resultados, caso desejarmos que o resultado seja exibido na mesma planilha do conjunto de dados, vamos clicar em (Célula Atual), senão poderemos imprimir os resultados em nova planilha , nesse caso clicaremos em (Nova Planilha).

OBS: Ao escolher a opção Célula Atual, os resultados serão impressos a partir da célula em que se encontra o cursor na janela do Excel. Neste caso, o usuário deve posicionar previamente (antes do passo 1) o cursor em uma posição apropriada.

7. Finalmente, vamos clicar em Ok para concluirmos a análise e obtermos os resultados.


 

Resultados e Interpretação

 

Finalizado o processo, serão exibidos os seguintes resultados:

Vemos, inicialmente, que a correlação positiva (0,846) entre o volume de vendas e os anos de experiência é significativa (comprovada pelo p-valor de 0,002, menor que o nível de significância adotado de 5%. Da mesma forma ocorre associação significativa entre o volume de vendas e o score no teste de inteligência e, entre os anos de experiência e o score.

O p-valor ser menor ou igual ao nível de significância α pré-determinado, significa que há correlação significativa entre as variáveis. Caso contrário, não haverá associação entre elas.


Complementando a tabela acima, através da matriz de Scatterplots vemos que as três variáveis em estudo possuem associação linear entre si, sendo esta ainda, positiva. Assim, exemplificando, conforme os anos de experiência do vendendor aumentam, seu volume de vendas também tende a ser maior. Com relação às demais associações, a interpretação será análoga.