Exemplo: O analista financeiro gostaria de segmentar as empresas analisadas de acordo com os fatores (que impactam na saúde financeira) identificados. O fabricante de bens de consumo, após mapear a estrutura de mercado e determinar os fatores que diferenciam os produtos, gostaria de segmentar os produtos ofertados.
Construiremos uma tabela no Excel como a seguir:
| EMPRESA | LC | GA | ROA | SIT |
| AQUATEC | 0,1159 | 0,2673 | -0,2101 | INSOLV |
| BANCO_CREFISUL | 1,0317 | 0,1721 | 0,0196 | INSOLV |
| CASA ANGLO (MAPPIN) | 2,1758 | 0,0456 | 0,0179 | INSOLV |
| CETENCO | 1,0213 | 0,5076 | 0,0178 | INSOLV |
| CNV CIA VEST | 1,9036 | 1,1809 | -0,0283 | INSOLV |
| COPAS | 0,9484 | 1,3017 | -0,0434 | INSOLV |
| INBRAC | 0,6121 | 0,4972 | -0,3229 | INSOLV |
| MENDES JR. | 0,204 | 0,0667 | 0,0561 | INSOLV |
| MONTREAL | 0,0045 | 0 | -4,1594 | INSOLV |
| PEIXE | 0,2049 | 0 | -0,7039 | INSOLV |
| BRASINCA | 0,1775 | 0,8322 | -0,3944 | INSOLV |
| CIBRAN | 0,4855 | 0,1843 | -0,0048 | INSOLV |
| FERRO LIGAS | 0,6955 | 0,3195 | -0,4052 | INSOLV |
| INDS.VER.ISHIBRA´S | 0,0683 | 0,3828 | -0,0293 | INSOLV |
| LOJAS HERING | 0,6238 | 0,1983 | -0,1372 | INSOLV |
| PARA DEMINAS | 0,2326 | 1,014 | -0,4158 | INSOLV |
| TECTOY | 0,9442 | 0,9431 | -0,5884 | INSOLV |
| AIR LIQUIDE | 3,5053 | 0,6109 | -0,0464 | SOLV |
| ANTARCTICA | 0,6613 | 0,3192 | 0,0379 | SOLV |
| ARACRUZ | 1,5707 | 0,1427 | 0,001 | SOLV |
| ARNO | 2,9656 | 2,0212 | 0,2423 | SOLV |
| ATLAS | 0,9515 | 1,1676 | 0,1214 | SOLV |
| BARDELLA | 2,0071 | 0,2559 | 0,0276 | SOLV |
| BOMPREC¸O | 0,6804 | 1,6503 | -0,2219 | SOLV |
| BRAHMA | 0,7031 | 0,5195 | 0,0797 | SOLV |
| BRASILIT | 1,105 | 0,1958 | 0,2984 | SOLV |
| CACIQUE | 1,1209 | 0,748 | 0,0464 | SOLV |
| CONFAB TUBOS | 2,266 | 0,3392 | 0,098 | SOLV |
| DURATEX | 2,4744 | 0,4178 | 0,0647 | SOLV |
| EBERLE | 0,4188 | 1,1136 | -0,1495 | SOLV |
| EMBRACO | 1,7798 | 0,7221 | 0,0558 | SOLV |
| ENGEMIX | 1,2954 | 1,2006 | 0,0345 | SOLV |
| ERICSSON | 1,6473 | 0,629 | 0,1568 | SOLV |
| FICAP | 2,3485 | 1,4813 | 0,1218 | SOLV |
| GERDAU | 1,2619 | 0,3317 | 0,0381 | SOLV |
| LPC(DANONE) | 1,4377 | 2,3197 | 0,1207 | SOLV |
| MAGNESITA | 1,7495 | 0,7416 | 0,0576 | SOLV |
| MILLENNIUM | 0,9254 | 0,4134 | -0,0289 | SOLV |
| MONARK | 1,9217 | 0,8222 | 0,1926 | SOLV |
| MULTIBRA´S | 1,7066 | 1,2666 | 0,2244 | SOLV |
| NADIR FIGUEIREDO | 1,5415 | 0,826 | 0,0058 | SOLV |
| NITROCARBONO | 0,7424 | 0,9485 | 0,0401 | SOLV |
| PETTENATI | 1,4648 | 0,6864 | 0,2433 | SOLV |
| PIRELLI PNEUS | 1,3069 | 1,452 | 0,1059 | SOLV |
| PRONOR PETROQ. | 0,758 | 0,499 | 0,0472 | SOLV |
| REFINARIA IPIRANGA | 2,5089 | 0,6693 | 0,1258 | SOLV |
| SANTA MARINA | 2,3696 | 0,7963 | 0,1109 | SOLV |
| SP ALPARGATAS | 1,7617 | 1,092 | -0,1962 | SOLV |
| YAKULT | 2,673 | 1,234 | 0,37 | SOLV |
clique aqui para efetuar o download dos dados utilizados nesse exemplo
| Você pode consultar o vídeo demonstrativo para esse exemplo. | |||
Para realizarmos a Análise de Cluster, vamos realizar os seguintes passos:
1. Primeiramente vamos acessar o menu como descrito a seguir:
Action
Análise Multivariada
Análise de Cluster.

2. A seguir aparecerá uma janela como mostrada abaixo;

3. No campo Dados, selecionemos com o mouse as colunas que contém o conjunto de dados (estes podem ser numéricos ou fatores). Os títulos das colunas e os rótulos das linhas também podem ser selecionados. Se forem selecionados apenas os dados, desabilite as opções Colunas com Nome e Linhas com Nome (Rótulos). Em seguida, cliquemos no botão Ler, em seguida aparecerão as variáveis como na fugura a seguir;

4. Devemos selecionar mais de duas (2) colunas, pois trata-se de uma análise multivariada. No campo Variáveis selecionemos as variáveis que deseja analisar. Caso queira selecionar todas as variáveis, cliquemos no botão todas, no nosso exemplo usaremos todas;

5. Em Métodos escolheremos dentre as opções Hierárquicos e K Means. No nosso exemplo escolheremos Hierárquico;

6. No quadro parâmetros, no campo Distância escolheremos dentre as opções euclidean, manhattan e gower. No nosso exemplo escolheremos euclidean;

7. Em Método escolheremos dentre as opções complete, ward, single, average, median e centroid. E no nosso exemplo complete.

8. Em Número de Cluster digitemos o número de clusters. No nosso exemplo 5;

9. No quador Opções selecionemos dentre as opções Padronizar, Dendrograma e Exibir Grupos. No nosso exemplo selecionaremos as 3 opções;

10. Clicando em Opções do Gráfico você poderá escolher o título, subtítulo, rótulos dos eixos x e y, cores, escalas dos eixos, entre outras opções. No nosso exemplo digitaremos o Título e os Rótulos dos eixos x e y;


11. Em Mostrar Resultados, caso desejarmos que o resultado seja exibido na mesma planilha do conjunto de dados, vamos clicar em (Célula Atual), senão poderemos imprimir os resultados em nova planilha , nesse caso clicaremos em (Nova Planilha).
OBS: Ao escolher a opção Célula Atual, os resultados serão impressos a partir da célula em que se encontra o cursor na janela do Excel. Neste caso, o usuário deve posicionar previamente (antes do passo 1) o cursor em uma posição apropriada.
12. Finalmente, vamos clicar em Ok para concluirmos a análise e obtermos os resultados.

Resultados e Interpretação
Após finalizado esse processo, serão exibidos os seguintes resultados:
