
ANÁLISIS DE CONGLOMERADOS
El Análisis de Conglomerados (Clusters en la terminología anglosajona) tiene por objeto el formar grupos, generalmente de observaciones, de forma que los datos de los grupos formados sean lo más similares posible y los grupos sean lo más diferentes posible unos de otros.
De esta manera se obtiene una clasificación de los datos multivariantes y, por tanto, una mejor comprensión de los mismos y de la población de donde proceden.
Habitualmente esta técnica se utiliza para, como hemos dicho, agrupar los individuos cuya observación ha dado lugar a la matriz de datos.
Para ello, partiendo de la matriz de datos, se obtiene la matriz de distancias o similaridades, al considerar una distancia entre los individuos. En algunas ocasiones, especialmente en las ciencias del comportamiento, se parte directamente de la matriz de distancias.
Posteriormente, utilizando como base la matriz de distancias, se realiza el proceso de agrupamiento o aglomeración de individuos, el cual dará origen, finalmente a los clusters.
En este capítulo se estudian las Técnicas Jerárquicas Aglomerativas de formación de conglomerados, así como el Algoritmo k-Medias.