Análisis Discriminante

En el capítulo sobre Análisis de Conglomerados estudiamos cómo clasificar en grupos los individuos observados, sin haber especificado previamente estos grupos (clusters) a los que los individuos iban a ser asignados; habitualmente, ni siquiera el número de grupos era fijado de antemano. Con el Análisis Discriminante, que estudiamos en este capítulo, aprenderemos cómo clasificar n individuos en g grupos previamente especificados.

Las aplicaciones de este método son muchas y diversas. Por citar dos de ellas, en Biomedicina es de gran interés la clasificación de los individuos, en los que se han observado p variables, en g=2 grupos, Sanos y Enfermos a una determinada enfermedad. O en Arqueología, es de suma importancia la asignación de unos determinados restos arqueológicos a una de las especies de homínidos conocidas.

La forma general de proceder es dividir la muestra en dos grupos: La Muestra de Adiestramiento (training sample) formada por datos para los cuales es conocido sin error el grupo al que pertenecen, y la Muestra Experimental (test sample) formada por el resto de observaciones, a asignar a alguno de los grupos con la mayor precisión posible. Por esta razón, en ocasiones se dice que el Análisis Discriminante es un Método de Aprendizaje Supervisado, utilizando la terminología del capítulo de Data Mining.