Análisis Discriminante
En el capítulo sobre
Análisis de Conglomerados estudiamos cómo clasificar en
grupos los individuos observados, sin haber especificado previamente estos
grupos (clusters) a los que los individuos iban a ser asignados; habitualmente,
ni siquiera el número de grupos era fijado de antemano. Con el Análisis
Discriminante, que estudiamos en este capítulo, aprenderemos cómo clasificar
n individuos en g grupos previamente especificados.
Las aplicaciones de este método son muchas y diversas. Por citar dos de ellas,
en Biomedicina es de gran interés la clasificación de los individuos, en
los que se han observado p variables, en g=2 grupos, Sanos y Enfermos a una
determinada enfermedad. O en Arqueología, es de suma importancia la
asignación de unos determinados restos arqueológicos a una de las especies de
homínidos conocidas.
La forma general de proceder es
dividir la muestra en dos grupos: La Muestra de Adiestramiento (training
sample) formada por datos para los cuales es conocido sin error el grupo al
que pertenecen, y la Muestra Experimental (test sample) formada
por el resto de observaciones, a asignar a alguno de los grupos con la mayor
precisión posible. Por esta razón, en ocasiones se dice que el Análisis
Discriminante es un Método de Aprendizaje Supervisado, utilizando la
terminología del capítulo de Data Mining.