Facultad de Ciencias 

Posgrado 2015-2016 

 

Experto Universitario en


Técnicas de Estadística Multivariante

(Fundamentos para un uso científico)

 

  (XVII edición)

 

(Matrícula: Del 7 de Septiembre al 1 de Diciembre de 2015)

 


 

Prof.: Hilario Navarro Veguillas (hnavarro@ccia.uned.es)

 

         

 


 

                                                                                 

 

Presentación y Objetivos

 

La necesidad de extraer conocimiento a partir de la información recogida en una base de datos se ha convertido en un factor común de la investigación científica actual. Sin duda, el elemento desencadenante de esta situación es el gran avance tecnológico que, por un lado, ha facilitado enormemente las tareas de obtención, almacenamiento y transmisión de datos, y por otro, ha proporcionado medios muy potentes para su tratamiento computacional.

Ante este panorama, parece evidente que los investigadores y profesionales de cualquier área, que tengan que enfrentarse con frecuencia a este tipo de análisis, necesitarán una formación que les permita, al menos, una comunicación fluida con los expertos en el análisis de datos. En la percepción de este escenario está la raíz de este curso cuya  actual edición presentamos.

En él se estudian las técnicas estadísticas multivariantes como medio para el aprendizaje a partir de los datos. El objetivo fundamental no es tanto la forma como el fondo de la técnica. Se pretende que el alumno adquiera una "capacidad de maniobra" que le permita desplazarse con cierta soltura por un terreno cada vez más heterogéneo. Pensamos que esto no se consigue con la revisión de una vasta colección de técnicas "sueltas";  por el contrario, puede ser más efectivo el estudio detallado de una serie de técnicas “básicas”, descubriendo el engranaje que conecta los mecanismos de este tipo de metodología.

Con estas premisas, se hace un recorrido acorde con los créditos ECTS que el curso tiene asignados (El crédito europeo mide el volumen o carga total del trabajo de aprendizaje del estudiante para alcanzar los objetivos previstos en el Plan de Estudios, y se corresponde con una carga de trabajo de 25 a 30 horas). El desarrollo se centra en dos focos: los procedimientos basados en modelos  ¾ hasta hace poco tiempo la forma habitual de afrontar el análisis ¾ y la “cultura” algorítmica, que está adquiriendo un gran desarrollo en las últimas décadas, apoyada en la rápida evolución de la tecnología informática. En el primero de los apartados se estudian técnicas para resolver problemas de clasificación, análisis de la varianza, agrupación de objetos y/o variables (clúster), etc., mientras que en el segundo se hace una introducción a los métodos que actualmente se utilizan para resolver los mismos problemas cuando las bases de datos no se ajustan estrictamente a las hipótesis que justifican dichos métodos ¾ predictores cuantitativos y cualitativos, muchas más variables que unidades muestrales, etc. En este último grupo se encuadran los métodos de particionamiento recursivo (CART), las “versiones” RIDGE y LASSO de la regresión, las máquinas de vector soporte (SVM) y los métodos de combinación de predictores/clasificadores como “bagging”, “boosting” y “random forests”. También se dedica un apartado especial a la metodología bayesiana, que proporciona alternativas muy válidas en las aplicaciones a problemas reales y a algunos ejemplos de modelos gráficos probabilísticos (Redes Bayesianas). Todo este conjunto permite al alumno tener una descripción rigurosa de las vías disponibles actualmente para enfrentarse a una amplia gama de problemas en cualquier área de investigación científica.

Para realizar este curso con garantías de éxito se precisa tener conocimientos de estadística univariante, tanto descriptiva como inferencial y un nivel de inglés “técnico” suficiente para la lectura de documentos como el que se presenta en este enlace.

No es necesario justificar el importante papel que los medios informáticos juegan tanto en las aplicaciones reales de la metodología que aquí se describe como en el propio aprendizaje de la misma. Aunque entre nuestros objetivos no figura el adiestramiento en el manejo de ningún paquete de programas, resulta casi imposible pensar en el estudio de esta materia sin una herramienta que nos asista en el aspecto computacional. En el curso no se impone ninguna norma al respecto. La experiencia de ediciones anteriores nos dicta que un porcentaje elevado de alumnos dispone, a nivel profesional, de alguno de los productos de software más usuales ¾ y lo que le falta es, precisamente, conocimiento para hacer un uso científico de los mismos. Sin embargo, aquellos alumnos que no tengan acceso a ningún "paquete estadístico", o simplemente lo prefieran, podrán realizar sus prácticas con R logo, producto de libre distribución con licencia GNU; toda la información y medios para poner en funcionamiento este entorno informático se encuentran en internet.


 

 

 

 

 

 

 

 

 

 

 

Programa  (aquí dispone de una versión más detallada)

 

 1. Preliminares

 2. Preparación de los datos

 

(Elementos de las teorías matemáticas de la Probabilidad y de la Estadística útiles para justificar los procedimientos basados en Modelos)

 3. Distribuciones de probabilidad multivariantes

 4. Muestreo en poblaciones normales multivariantes

 5. Métodos elementales de inferencia: de Hotelling

 

(Técnicas de análisis para extaer información en bases de datos con o sin estructura de grupo predeterminada)

  6. Análisis factorial

  7. Análisis multivariante de la varianza (MANOVA)

  8. Análisis de la correlación canónica

  9. Análisis discriminante y regresión logística

10. Análisis cluster

 

(Nuevas metodologías apoyadas sobre una gran potencia computacional y adecuadas para bases de datos complejas. Especial énfasis en bases con pocas observaciones y muchas variables ,“high-dimensional data”)

11. Nuevas perspectivas en el  análisis de datos

12. Modelos y métodos predictivos

13. Particionamiento recursivo: Árboles de  regresión y clasificación

14. Métodos bayesianos

 

15. Iniciación al software estadístico: R logo

16. Internet en el aprendizaje de la Estadística  Multivariante

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Material Didáctico

Para el estudio de esta materia el alumno deberá adquirir el texto: 

  1. Texto base

        

 

 

Análisis Multivariante (5ª ed.),

Hair ~ Anderson ~ Tatham ~ Black,

Prentice Hall,1999

 

 

Contenido: 1.- Introducción; 2.- Análisis previo de los datos; 3.- Análisis factorial; 4.- Análisis de regresión múltiple; 5.- Análisis discriminante múltiple y regresión logística; 6.- Análisis multivariante de la varianza; 7.- Análisis conjunto; 8.- Análisis de correlación canónica; 9.- Análisis cluster; 10.- Análisis multidimensional; 11.- Modelos de ecuaciones estructurales; 12.- Nuevas técnicas del análisis multivariante: Almacenamiento y extracción de datos; Redes neuronales; Remuestreo.

Además, en la plataforma virtual se proporcionará:

  1. Addenda, elaborada por el equipo docente, conteniendo el desarrollo de algunos temas relacionados con el programa.

  2. Bases de datos que se manejan en el texto.

  3. Documentos complementarios .

 

 

 

 

 

 

 

 

Profesorado y Tutorías

 

Dirección: 

Profesor Titular de Universidad. UNED.

Docencia 2014-15: Métodos de Regresión y Análisis Multivariante (Licenciatura en CC. Matemáticas, UNED); Modelos de Regresión (Grado en CC. Matemáticas, UNED); Análisis Multivariante (Grado en CC. Matemáticas, UNED); Modelos Lineales / Análisis Estadístico Multivariante (Máster EEES de Matemáticas Avanzadas, UNED); Estimación de la Matriz de Covarianzas: Nuevas Perspectivas (Trabajo Final del Máster EEES de Matemáticas Avanzadas, UNED).

Líneas de Investigación: Métodos Estadísticos en la Minería de Datos. Análisis de Datos de Alta Dimensión. Nuevas Perspectivas en el Análisis de Datos Multivariantes. Estadística y Bioinformática. Aprendizaje e Inferencia en Redes Bayesianas.

Colaboradores:

Profesora Titular de Universidad. Univ. Complutense de Madrid.

Docencia 2014-15: Simulación de Sistemas Logísticos (Grado en Ingeniería Matemática, Univ. Complutense de Madrid); Estadística (Grado en Matemáticas y Estadística, Univ. Complutense de Madrid); Redes Bayesianas (Máster EEES en Tratamiento Estadístico-Computacional de la Información; Univ. Complutense de Madrid); R: Software Estadístico (Máster EEES en Tratamiento Estadístico-Computacional de la Información; Univ. Complutense de Madrid).

Líneas de Investigación: Inferencia Bayesiana: Procedimientos y Aspectos Computacionales. Sensibilidad y Robustez en Redes Bayesianas. Robustez de Modelos Multivariantes.

 

Profesor Colaborador. UNED.

Docencia 2014-15: Estadística (Ingeniería Técnica en Informática / Grado en Ingeniería Informática, UNED).

Líneas de Investigación: Técnicas de Minería de Datos. Estadística y Bioinformática. Robustez de Modelos para el Análisis de Datos de Alta Dimensión.


 

La modalidad del curso es "a distancia" y no tiene actividades presenciales obligatorias. La docencia se realiza a través de la plataforma aLF, propia de la UNED. Esto significa que, durante el periodo lectivo, el alumno podrá comunicarse con el profesor y con el resto de compañeros a través de un "curso virtual", en el que, además, dispondrá de una planificación, materiales didácticos complementarios, actividades recomendadas, etc.

 

 

 

 

 

 

Otras Actividades

 

El curso se complementa con una serie de actividades voluntarias que se programan una vez que se conoce el número de alumnos matriculados y su orientación profesional. Hasta  ahora, este apartado  ha consistido en la impartición de dos/cuatro conferencias y la celebración de dos sesiones prácticas dirigidas por los profesores del curso. Algunos de los temas que hemos tratado son:

  •  El Análisis Multivariante en sus Comienzos: R.A. Fisher.

  •  Gráficos para el Análisis de Datos.

  •  Aplicaciones de Técnicas Multivariantes en el Sector Financiero.

  •  Introducción a la Metodología Bayesiana.

  •  Iniciación al Software Estadístico: SPSS, S-PLUS y R.

  •  Análisis Discriminante y Clasificación de Observaciones.

  •  Árboles de Regresión y Clasificación.

  •  Introducción a las Redes Bayesianas.

 

    

Todas estas actividades se realizan en fin de semana ¾ generalmente en sábado, en la sede central de la UNED en Madrid, y se distribuyen adecuadamente a lo largo del curso. El plan previsto para la presente edición tiene dos objetivos:

 

 

 

 

 

 

 

Evaluación

 

La calificación se obtendrá, fundamentalmente, mediante Pruebas de Evaluación a Distancia. Dichas pruebas ¾ el curso consta de tres ¾ consistirán en la resolución de una serie de ejercicios propuestos por el equipo docente, que el alumno recibirá gradualmente a lo largo del curso. La calificación final será Apto/No Apto/No Presentado.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Tasas, Créditos y Titulación

 

El coste del curso asciende a 840 €. La duración del curso es de un año académico ¾ de Diciembre a Septiembre ¾ y está diseñado para una dedicación correspondiente a 30 créditos ECTS. La superación del mismo da derecho a la obtención del título de Experto Universitario en 

TÉCNICAS DE ESTADÍSTICA MULTIVARIANTE

como título propio de la UNED.

 

 

 

 

 

 

 


 









 

 

 

 

Matrícula

El plazo establecido para esta edición es

       Del 7 de Septiembre al 1 de Diciembre de 2015.

El curso está gestionado por la Fundación UNED; aquí encontrará la información necesaria para su matriculación. También podrá obtenerla contactando con:

  • FUNDACIÓN UNED

    C/ Francisco de Rojas, 2; 2º Dcha

    28010 Madrid

    Teléfono: +34 913867275 / 1592

    Fax: +34 913867279

 

Para solicitar cualquier información adicional puede dirigirse al director del curso:

Dpto. de Estadística, I.O. y Cálc. Numérico

Facultad de Ciencias / UNED

Paseo Senda del Rey, 9

28040-Madrid


Fax: 91.398.72.61

Tlfno.: 91.398.72.55

hnavarro@ccia.uned.es