E.T.S. de Ingeniería Informática, Juan del Rosal, 16, 28040-Madrid. 91-398-7209
Teléfono de contacto

Directores: Víctor Fresno y Álvaro Rodrigo.

Descripción breve: El objetivo de esta línea de investigación es la aplicación de sistemas inteligentes dentro del contexto del Procesamiento del Lenguaje Natural en el ámbito de la innovación educativa: soporte a la autoría, recopilación y reutilización de contenidos generados por la UNED, así como su analítica; y gestión de actividades y de procesos de (auto) evaluación, entre otras.

Requisitos: El alumno/a que se presente como candidato para realizar este proyecto debe reunir los siguientes requisitos: buen expediente académico, nivel alto de inglés, conocimientos avanzados de programación, haber cursado las asignaturas de Descubrimiento de Información en textos, Fundamentos del Procesamiento Lingüístico y Minería de Datos. Para esta línea de investigación buscamos ante todo estudiantes a quienes les guste la investigación.

Trabajos de investigación:
Aspectos teóricos y aplicados de la Computación Evolutiva

Director: Enrique J. Carmona Suárez.

Descripción breve: Los proyectos que se proponen en esta página están vinculados a la investigación relacionada con aspectos teóricos y aplicados de la Computación Evolutiva y de sus diferentes algoritmos (algoritmos genéticos, estrategias evolutivas y programaciónn genética), que se lleva a cabo en el Dpto. de Inteligencia Artificial de la UNED.

Requisitos: El alumno que se presente como candidato para realizar este proyecto debe reunir los siguientes requisitos: buen expediente académico, nivel alto de inglés, conocimientos avanzados de programación y haber cursado la asignatura de Computación Evolutiva, impartida en este máster; adicionalmente, se valorará especialmente el haber cursado asignaturas de visión artificial, aprendizaje automático o electrónica. Para esta línea de investigación buscamos, ante todo, alumnos a quienes les guste la investigación y sean, además, buenos programadores.

Directores: Enrique Amigó y Víctor Fresno.

Descripción breve: Estamos viviendo un momento efervescente para el área de investigación en Procesamiento del Lenguaje Natural. Específicamente, en el campo semántico encontramos nuevos enfoques estadísticos y modelos basados en redes neuronales profundas que han mejorado notablemente los sistemas de tratamiento de información textual. La mayoría de estos avances se han planteado desde un enfoque supervisado. Como es bien sabido y discutido en estos últimos años, el principal inconveniente de estas aproximaciones es que no permiten "entender" e "interpretar" la salida del sistema. Por el contrario, el enfoque no supervisado consiste en explotar las redes neuronales y técnicas de pre-entrenamiento para representar palabras u otras unidades lingüísticas en forma de vectores (word embeddings). El segundo paso es definir modelos de composición del lenguaje para representar y operar con unidades lingüísticas más complejas como frases, documentos. Así pues, el principal objetivo en esta línea de investigación es, partiendo de las representaciones vectoriales semánticas de palabras individuales, estudiar modelos de composición que nos permitan extraer el contenido semántico de un fragmento de texto mayor que una palabra.

Requisitos: El alumno/a que se presente como candidato para realizar este proyecto debe reunir los siguientes requisitos: buen expediente académico, nivel alto de inglés, conocimientos avanzados de programación, haber cursado las asignaturas de Descubrimiento de Información en textos, Fundamentos del Procesamiento Lingüístico y Minería de Datos. Para esta línea de investigación buscamos ante todo estudiantes a quienes les guste la investigación.

Directores: Mariano Rincón y Jorge Pérez Martín.

Descripción breve: El aumento y disponibilidad de datos, junto con el aumento de la potencia computacional, nos permiten aprovechar técnicas de inteligencia artificial y de aprendizaje profundo para extraer y aprender características de los datos. Uno de los campos donde estas técnicas están dando buenos resultados es en el análisis de imagen médica. Esta línea de trabajos se orienta al desarrollo de modelos de deep learning para el tratamiento de imágenes médicas en distintos campos de aplicación. Los problemas que se abordarán son, entre otros, los siguientes:

  • caracterización, evaluación y clasificación de imágenes,
  • localización, segmentación y clasificación de objetos de interés,
  • segmentación semántica de imágenes,
  • interpretación de imágenes,
  • integración multimodal,
  • etc.

Requisitos: Buen expediente académico, nivel alto de inglés y conocimientos avanzados de programación.

Asignaturas recomendadas: Aprendizaje Profundo, Minería de datos y Visión artificial.

e-Ciencia en Astronomía

Director: Luis Manuel Sarro Baro.

Descripción breve: Los trabajos Fin de Máster ofertados en esta línea consisten en el diseño, desarrollo y evaluación de sistema expertos que reproduzcan tareas propias de la investigación científica, en particular en el área de la Astrofísica. Por lo general, suelen consistir en problemas de razonamiento aproximado para los cuales se requiere de modelos automáticos de inferencia probabilística, que en ocasiones (aunque no siempre) pueden ser abordados desde la Minería de Datos. Los datos suelen ser muy abundantes en este dominio, bien obtenidos de las bases de datos públicas, bien sintéticos. El estudiante deberá demostrar destreza en las cuestiones de IA involucradas, y de la parte más propiamente astrofísica sólo deberá conocer lo imprescindible para llevar a buen término su proyecto, obviamente con la ayuda y explicaciones del director.

Requisitos: El alumno/a que se presente como candidato para realizar este proyecto debe reunir los siguientes requisitos: buen expediente académico, nivel alto de inglés, conocimientos avanzados de programación, haber cursado la asignatura de Minería de Datos; adicionalmente, se valorará haber cursado asignaturas de estadística, visión artificial o métodos probabilistas. Para esta línea de investigación buscamos, ante todo, alumnos/as a quienes les guste la investigación y sean, además, buenos programadores.

Director: Enrique J. Carmona Suárez 

Descripción: La creciente adopción de modelos de aprendizaje ha puesto de manifiesto la necesidad de dotar a estos sistemas de mecanismos de explicabilidad que permitan comprender sus decisiones. Este trabajo se enmarca en el área de Explainable Artificial Intelligence (XAI) y se centra especialmente en el estudio de técnicas de interpretación de este tipo de modelos, abordando el denominado y conocido problema de “caja negra”. 

Objetivos:  

  • Conocer y analizar las diferentes técnicas de XAI.  

  • Creación de nuevas técnicas de explicabilidad o adaptación de otras ya existentes, especialmente aplicadas a redes neuronales.  

  • Evaluación experimental comparativa de resultados.  

  • Aplicar estas técnicas a un problema concreto.  

Requisitos:  

El alumno que se presente como candidato para realizar este proyecto debe reunir los siguientes requisitos: buen expediente académico, nivel alto de inglés, conocimientos avanzados de programación y haber cursado las asignaturas de “Métodos de Aprendizaje Automático” y “Computación Evolutiva”, impartidas en este máster; adicionalmente, se valorará el haber cursado las asignaturas de “Visión Artificial” y “Aprendizaje Profundo”. Para esta línea de investigación buscamos, ante todo, alumnos a quienes les guste la investigación y sean, además, buenos programadores. 

FusiSens

Director: Rafael Martínez Tomás.

Descripción breve: NAO es un robot humanoide con capacidades de sensorización particularmente limitadas para su labor asistencial y social. Se pretende integrar sus capacidades propias sensoriales con externas procedentes de otro tipo de sensores, por ejemplo, tipo kinect.

Metodología: El objetivo planteado de integración lleva implicito la necesidad de diseñar un sistema de reoconocimiento de determinados movimientos del paciente relevantes en la intervención, desde una kinect. Pero el trabajo debería ir más allá de un mero desarrollo software, conlleva el trabajo con eventos reconocibles, con comunicación con el robot, fusión de la información desde el o los micrófonos, y la integración de todos estos elementos para la toma de decisiones de respuesta de NAO.

Requisitos: Conocimientos de comunicaciones, de desarrollo de software y de representación y modelado del conocimiento. El master debería haber aportado conocimientos de robótica, razonamiento y representación del conocimiento suficientes para empezar pero sin duda requerirá iniciativa para seleccionar herramientas adecuadas y elaborar y diseñar modelos propios.

IdenConcept

Director: Rafael Martínez Tomás.

Descripción breve: Uno de los test más sencillo pero que proporciona una información más rica para la evaluación del estado cognitivo de una persona es el test de producción oral. Al paciente se le pide que enuncie conceptos asociados a características semánticas de determinados objetos u seres animados. Es un test que puede proporcionar mucha información para estudiar las diferentes enfermedades y su afectación a determinados contenidos semánticos. Así como la influencia de los factores medioambientales. Esto lo hace habitualmente una persona experta que transcribe y recuenta esta producción oral, pero es un proceso, que si se pretende extender a una muestra amplia es muy costoso y lento. Pretendemos desarrollar un sistema que pueda automatizar este proceso en basa a la identificación en la voz de términos coherentes. Permitiría entrar a valorar y analizar otro tipo de características que quizá, y para los registros, no se tienen en cuenta, como tiempos, tonalidades, sentimientos, etc.

Metodología: Empezar con librerías y técnicas habituales en reconocimiento de la voz. Trabajar con diccionarios asociados a los contenidos semánticos que se quieren identificar. Evaluación de otros tipos de características que puedan, a juicio de los expertos, ser significativas y por lo tanto interesantes de identificar y registrar.

Requisitos: Conocimientos de procesamiento del lenguaje natural, de desarrollo de software y de representación y modelado del conocimiento. El master debería haber aportado conocimientos NLP, razonamiento y representación del conocimiento suficientes para empezar con librerías y técnicas conocidas pero sin duda requerirá iniciativa para seleccionar herramientas adecuadas y elaborar y diseñar modelos propios.

DirectorJosé Manuel Castillo.

Resumen: Las Redes Neuronales Híbridas (HyNN) se han diseñado para procesar e integrar información de múltiples modalidades o fuentes, aunque estas adolecen de una buena generalización y robustez en determinados ámbitos de datos. Así, las imágenes sintéticas generadas artificialmente en lugar de capturadas del mundo real es una transformación de datos de un formato a otro formato diferente del original. Esta transformación se llama sintética, ya que proviene de una transformación de un dato real a otro sintético, en este caso, a una imagen sintética. Estas imágenes sintéticas adaptadas a los modelos refuerzan el proceso de aprendizaje, añadiendo robustez y generalización al modelo final.

En general, el área de investigación pretende avanzar en la comprensión de cómo las técnicas de refuerzo pueden aplicarse eficazmente a las HyNNs, específicamente cuando se trata de imágenes sintéticas, y explorar las posibles implicaciones y consideraciones prácticas de dicho enfoque.

Líneas de actuación: El área de investigación propuesta tiene las siguientes líneas de actuación (el alumnado interesado en alguna de estas líneas se pondrá en contacto con el docente para definirla en su proyecto):

  • Eficacia de las imágenes sintéticas en HyNNs: Investigar el rendimiento de las HyNNs añadiendo la entrada de imágenes sintéticas en cuanto a la generalización y robustez del modelo.

  • Generalización a escenarios reales: Evaluar la capacidad de HyNNs con el reforzamiento de las imágenes sintéticas en problemas del mundo real, evaluando su rendimiento en situaciones no encontradas durante el entrenamiento.

  • Eficiencia de los datos: Examinar si el aprendizaje con imágenes sintéticas conduce a modelos más eficientes en términos de datos en comparación con los enfoques tradicionales, especialmente cuando la adquisición de grandes cantidades de datos de imágenes es un reto.

  • Robustez y transferibilidad: Evaluar la robustez de los modelos entrenados y su transferibilidad a diferentes tareas o dominios, comprendiendo hasta qué punto el conocimiento obtenido a partir de imágenes sintéticas puede aplicarse en diversos escenarios. Esta subárea incluye el análisis de explicabilidad e interpretabilidad de los modelos híbridos.

  • Aplicaciones y limitaciones: Identificar aplicaciones prácticas en las que el enfoque de las HyNNs con imágenes sintéticas podría ser beneficioso, así como comprender las limitaciones y retos asociados a esta metodología.

Requisitos previos: Los candidatos deberán tener conocimientos de programación en Python y en las siguientes áreas: Reconocimiento de Patrones y Machine/Deep Learning.

Asignaturas recomendadas: Minería de Datos y Visión Artificial.

Contacto: <manuelcastillo@dia.uned.es>

DirectoraÁngeles Manjarrés Riesco.

Descripción breve: Las líneas de investigación para Trabajos Fin de Master que aquí se describen están vinculadas a los contenidos de la asignatura “Aplicaciones de la Inteligencia Artificial para el desarrollo humano y sostenible”. Atañen pues esencialmente a la Inteligencia Artificial (IA) como ingeniería y/o como ciencia, pero también a disciplinas muy conectadas a ella desde su origen - tales como la neurofisiología, la psicología, la filosofía o la sociología - y a disciplinas implicadas en el concepto de “Tecnología para el Desarrollo Humano y Sostenible (TDHS)” - tales como la economía, la política, los estudios CTS (Ciencia, Tecnología y Sociedad), la cooperación para el desarrollo de carácter tecnológico o las ciencias medioambientales-. La investigación se inscribe en la ingeniería para el desarrollo de IA ética, un subcampo de la IA centrado en el diseño de herramientas metodológicas y técnicas que permiten tanto mitigar riesgos éticos - como sesgos, falta de control humano, etc - como promover valores éticos en el desarrollo de sistemas de IA, en coherencia con los principios del desarrollo humano y sostenible. Asimismo, podrá incorporar elementos de áreas como la Representación del Conocimiento (Ontologías y Web semántica), el Modelado de usuario y los Sistemas Recomendadores (aplicados a sistemas de enseñanza-aprendizaje, sistemas psicoterapéuticos o sistemas de gestión de ONGD), e implicar diversas técnicas de aprendizaje computacional o el uso de IA generativa. Se contempla la posibilidad de codirectores que no pertenezcan al departamento de IA de la UNED sino a otros centros de investigación u organizaciones con experiencia en al ámbito de la TDHS y la cooperación para el desarrollo. 

Requisitos: Para la selección de candidatos se valorará el currículum académico en sus aspectos convencionales. Preferentemente se valorará el perfil en Informática, pero también se tendrán en cuenta los méritos relacionados con las diferentes disciplinas científicas, técnicas y humanísticas mencionadas previamente.  

La selección de asignaturas recomendadas se ajustará al perfil académico y a las preferencias del estudiante, en función del enfoque y objetivos del proyecto a abordar. 

Laboratorio de Cibernética

Descripción breve: Dentro de las líneas de trabajo del grupo SIMDA, ofrecemos trabajos de investigación orientados a TFM en robótica autónoma. En particular, nuestra investigación se centra en algoritmos de navegación autónoma basados en propiedades geométricas del espacio, sistemas multi-robot, interacción robot-humano y control de robots mediante el uso de procesadores biológicos (cultivos celulares). Si estás interesado en realizar tu TFM con nosotros, visita nuestra página web donde encontrarás información ampliada sobre los temas y requisitos necesarios.

Descripción 

La proliferación de las redes sociales ha llevado a muchos usuarios a mantener una presencia activa en múltiples plataformas (X/Twitter, Instagram, TikTok, Reddit, foros, etc.) para ampliar el alcance de sus publicaciones. Esto hace que una misma persona pueda gestionar distintos perfiles, incluso dentro de una misma red social, ya sea por motivos personales, profesionales o de anonimato.

La capacidad de relacionar perfiles aparentemente independientes resulta de gran interés en múltiples ámbitos: desde el análisis del impacto real de la comunicación de una organización o colectivo, hasta la detección de campañas coordinadas, cuentas falsas o perfiles que difunden información sesgada, manipuladora o dañina. 

Se trata de una línea flexible en la que la persona que desarrolle el TFM puede proponer variantes o enfoques alternativos dentro del marco general del perfilado y de la atribución de autoría, adaptándolos a sus intereses (tipo de red social, idioma, tipo de texto, técnicas de PLN, objetivos forenses o analíticos, etc.). 

Esta línea se centra en proponer, implementar y evaluar métodos para modelar el estilo de escritura de los usuarios y extraer una huella lingüística que permita: 

  • agrupar mensajes de distintas redes sociales que puedan haber sido escritos por una misma persona, 
  • y, dado un nuevo mensaje, estimar qué usuario conocido es el autor más probable, generando un ranking de candidatos. 

Durante el desarrollo del TFM se podrán explorar diferentes enfoques, como técnicas de estilometría, análisis de rasgos lingüísticos, modelos estadísticos y métodos modernos basados en representaciones semánticas y en modelos de lenguaje (embeddings, transformers, etc.), así como estrategias para combinar varias fuentes de evidencia. 

La línea también está abierta a enfoques multimodales donde los rasgos lingüísticos podrían complementarse con otros extraídos de otro tipo de medios, como imágenes o vídeos, e incluso con el análisis del comportamiento de los usuarios (por ejemplo, la manera en la que publican). 
 

Metodología: 

    Estudio del estado del arte. 
    Análisis y procesamiento de las colecciones. 
    Desarrollo y evaluación de distintos métodos 
    Análisis y conclusiones.

Resumen de los objetivos: 

    Aplicación de diversas técnicas de representación de textos para analizar la autoría de mensajes en redes sociales 
    Análisis de resultados sobre datos reales 

Tecnologías potencialmente utilizables: 

    Procesamiento de texto: librerías nltk, spacy, etc. 
    Aprendizaje automático: sklearn, huggingface 
    Lenguaje de programación: Python. 

Si la persona interesada no ha trabajado previamente con las tecnologías que decida emplear en el trabajo, su aprendizaje puede requerir entre 20 y 40 horas extraordinarias sobre el tiempo establecido para la realización del trabajo. 
 

Profesores 

    Alberto Pérez García-Plaza 
    Alvaro Rodrigo Yuste 

Asignaturas recomendadas 

  • Metodología de Investigación en Sistemas Inteligentes 
  • Fundamentos del Procesamiento Lingüístico 
  • Descubrimiento de Información En Textos 
  • Minería de Datos 
  • Métodos de Aprendizaje Automático 

Directora: Raquel Martínez.

Descripción breve: La mayor parte de la documentación generada por instituciones, empresas y por usuarios particulares (por ejemplo en redes sociales), es información no estructurada: texto libre, cuyo análisis presenta retos no resueltos en el estado del arte. Esta oferta de TFM se centra en la propuesta de técnicas de procesamiento de lenguaje natural supervisadas y no supervisadas para la adquisición de conocimiento y su aplicación en tareas de diversos dominios.

Requisitos: buen expediente académico, nivel alto de inglés, conocimientos avanzados de programación (Java y/o Python).

Asignaturas recomendadas: Fundamentos del Procesamiento Lingüístico, Descubrimiento de Información en Textos y Minería de Datos.

Modelado basado en agentes mediante NetLogo

Director: Severino Fernández Galán.

Descripción breve: El objetivo de la presente línea para la realización del Trabajo Fin de Máster es que el alumno investigue algún problema de inteligencia artificial que pueda ser modelado mediante agentes. Para ello se utilizará el entorno NetLogo, que permite modelar y visualizar sistemas complejos compuestos por un alto número de agentes.

Requisitos: La correcta realización de este trabajo fin de máster requiere alumnos: amantes de la investigación, con habilidades para la programación, con nivel alto de inglés y con buen expediente académico. Este trabajo puede demandar por parte del alumno tanto la capacidad para trabajar en grupo como individualmente. Dado que la asignatura de trabajo fin de máster consta de 27 créditos ECTS (equivalente a cuatro asignaturas y media optativas del máster), la disponibilidad de tiempo y la constancia en el trabajo resultan dos requisitos imprescindibles.

Modelos gráficos probabilistas y sus aplicaciones

Directores: Manuel Arias CallejaFrancisco Javier Díez VegasJorge Pérez Martín.

Descripción breve: Los proyectos que proponemos en esta página están vinculados a la investigación sobre modelos gráficos probabilistas (entre los cuales se encuentran las redes bayesianas, los diagramas de influencia, los procesos de decisión de Markov factorizados, etc.), que se lleva a cabo en el Dpto. de Inteligencia Artificial de la UNED y en el CISIAD. Dentro de este máster, estos modelos se estudian en la asignatura Métodos Probabilistas en IA. Tanto para los trabajos de algoritmia como para los de aplicación se utilizará generalmente el programa OpenMarkov.

Requisitos: buen expediente académico y alto nivel de inglés. Para un trabajo sobre algoritmos es necesario tener conocimientos avanzados de Java. Para realizar una aplicación, por ejemplo en medicina o en alguna rama de la industria, es necesario conocer bien el dominio y/o contar con la ayuda de un experto.

Directora: Olga C. Santos.

Descripción breve: Existen muchas actividades que requieren el aprendizaje de habilidades motoras específicas (como tocar un instrumento musical, practicar deporte o artes marciales, etc.) así como para monitorizar la adquisición de hábitos relacionados con la actividad física (p.e. orientados al envejecimiento activo). Aunque existen sistemas que facilitan el entrenamiento de movimientos específicos, no suelen tener en cuenta las características individuales de cada persona durante su ejecución y por tanto, no adaptan su respuesta a las necesidades concretas del usuario en función de sus habilidades, objetivos, progreso, etc. En este contexto, desde PhyUM se propone la realización de TFM orientados a la personalización del aprendizaje psicomotor que aborden tareas de investigación centradas en la recogida, detección, análisis, interpretación, realimentación, etc. que involucren datos asociados al movimiento humano, considerando como entrada datos capturados por medios ópticos y/o inerciales y como salida diversas opciones de realimentación multisensorial.

Requisitos: Buen expediente académico y nivel alto de inglés. Conocimientos de técnicas de detección de movimientos mediante imágenes y/o medidas inerciales, de aprendizaje automático, y de representación y modelado del conocimiento. Se requerirá iniciativa para seleccionar herramientas adecuadas y elaborar y diseñar propuestas propias. Se buscan, ante todo, estudiantes a quienes les guste la investigación, sean buenos programadores y tengan interés en reportar en foros científicos los resultados que se vayan obteniendo.

Asignaturas recomendadas: Los estudiantes que quieran realizar un TFM en esta temática, deberán cursar obligatoriamente las asignaturas de Minería de Datos y Aprendizaje Profundo. Las otras tres asignaturas optativas de contenidos que deben cursar dependerán del planteamiento concreto del TFM y de los intereses del estudiante.

Director: José Luis Aznarte.

La predicción del futuro ha sido y es una obsesión frecuente en el ser humano, y, desde el punto de vista matemático, ha sido abordada en los últimos dos siglos por un campo de conocimiento llamado análisis de series temporales. La idea es estudiar el pasado de conjuntos de datos ordenados en el tiempo para poder anticipar su comportamiento futuro, y tiene muchas aplicaciones prácticas (no todas relacionadas con asuntos financieros).

Esta línea de trabajos fin de máster plantea el abordaje de este problema desde la inteligencia artificial (IA): se tratará de procesar conjuntos de datos reales y entrenar modelos de IA que sean capaces de capturar el comportamiento intrínseco y las características dinámicas de ciertas series temporales. Algunos ejemplos: predicción de concentraciones de polen aerosuspendido; predicción de la contaminación en el aire por dióxido de nitrógeno, ozono o partículas; predicción de la ubicación de intervenciones policiales; predicción de la producción de electricidad solar o eólica, predicción de terremotos... La lista no es exhaustiva y también es posible considerar series temporales que el propio alumnado proponga en esta línea.

Por ausencia del Prof. Aznarte, esta línea de investigación no está activa en estos momentos.

Contacto:  

elena@dia.uned.es

felixh@dia.uned.es

Resumen:  

El grupo de investigación en Sistemas Adaptativos Inteligentes para Sostenibilidad y Aprendizaje tiene como línea de investigación preferente la aplicación de técnicas de aprendizaje automático en contextos industriales y científicos.  

En esta línea hemos investigado principalmente el uso de aprendizaje por refuerzo en plantas depuradoras de aguas residuales (blogs.uned.es/ml-edar) así como en la optimización de diversos procesos industriales (e.g. columnas de destilación).  

Sin embargo, esta línea no se limita a estos entornos industriales, sino que estamos abiertos a trabajar en otros dominios y problemas que requieran adaptabilidad y autonomía. 

Otra línea que hemos desarrollado en paralelo es el desarrollo de sistemas adaptativos para la educación dirigiendo la investigación de tutores inteligentes (principalmente en física) y sistemas para la estimulación visual en niños con baja visión. 

Se trata, por tanto, de una propuesta con un marcado carácter interdisciplinar, que combina técnicas de aprendizaje automático, modelado del usuario y toma de decisiones inteligente, ofreciendo múltiples oportunidades para el desarrollo de Trabajos Fin de Máster orientados principalmente a la investigación aplicada. 

Más información en: blogs.uned.es/sails 

Asignaturas recomendadas 

  • Metodología de Investigación en Sistemas Inteligentes 
  • Métodos de aprendizaje automático 
  • Aprendizaje profundo 
  • Computación evolutiva 
  • Métodos estadísticos 
  • Minería de datos. 

Director: Manuel Castillo Cara  

Contacto: manuelcastillo@dia.uned.es 

Resumen: La transformación de datos tabulares en representaciones visuales mediante la generación de imágenes sintéticas constituye una línea emergente que permite explotar el potencial de los modelos de visión por computador en dominios tradicionalmente no visuales. Este enfoque facilita el uso de arquitecturas avanzadas como redes convolucionales (CNN) y modelos basados en Transformers (ViT), aprovechando su capacidad para extraer patrones espaciales complejos. 

En este contexto, la generación de imágenes sintéticas no se limita a una simple transformación de formato, sino que implica el diseño de representaciones estructuradas que preserven y potencien la información relevante de los datos originales. Estas representaciones pueden mejorar la generalización, robustez y eficiencia del aprendizaje, especialmente en escenarios con datos limitados, desbalanceados o heterogéneos. 

La línea de investigación propuesta aborda tanto el desarrollo de nuevos métodos de transformación como su evaluación sistemática, incluyendo el análisis de interpretabilidad y explicabilidad de los modelos resultantes. Asimismo, se contempla la integración de estos enfoques en librerías como TINTOlib y su aplicación en distintos dominios reales. 

Líneas de Actuación (Temáticas para TFM): El alumnado podrá desarrollar su TFM en una o varias de las siguientes sublíneas, que se concretarán en coordinación con el director: 

  • Diseño de métodos de transformación: Desarrollo y evaluación de nuevas técnicas para la conversión de datos tabulares en imágenes sintéticas, incluyendo su implementación e integración en TINTOlib. 

  • Evaluación de modelos de visión: Análisis del rendimiento de modelos CNN, Vision Transformers (ViT) y variantes híbridas aplicados a imágenes sintéticas generadas a partir de datos tabulares. 

  • Modelos de gran escala (VLSM): Exploración del uso de modelos visuales de gran escala y su adaptación a imágenes sintéticas, incluyendo estrategias de fine-tuning y transferencia de conocimiento. 

  • Benchmarking y evaluación experimental: Diseño de protocolos experimentales rigurosos que permitan comparar distintos métodos de transformación y modelos, utilizando métricas de rendimiento, robustez y eficiencia. 

  • Eficiencia y aprendizaje con pocos datos: Estudio del impacto de las imágenes sintéticas en escenarios de escasez de datos, evaluando su capacidad para reducir la necesidad de grandes volúmenes de información. 

  • Generalización y transferencia: Análisis de la capacidad de los modelos entrenados con imágenes sintéticas para generalizar a nuevos dominios o tareas. 

  • Explicabilidad e interpretabilidad: Aplicación y desarrollo de técnicas de XAI (e.g., Grad-CAM, saliency maps, attention visualization en ViT) para comprender el comportamiento de los modelos y la relevancia de las representaciones generadas. 

  • Aplicaciones y casos de uso: Validación de los enfoques propuestos en problemas reales, identificando ventajas, limitaciones y posibles mejoras. 

Requisitos previos: 

  • Programación: Nivel avanzado de Python. 

  • IA: Conocimientos en Machine Learning y Deep Learning y sus librerías en Python (PyTorch, Scikit-learn, etc).  

  • Datos: Manejo de preprocesamiento de datos y estructuras tabulares.  

  • Estimación de horas adicionales: Se estima una dedicación de 75 horas de formación autónoma en librerías específicas (e.g., TINTOlib) y arquitecturas de visión si no se cuenta con experiencia previa en estos campos. 

Asignaturas recomendadas: 

  • Visión Artificial, Minería de Datos y Visión Artificial.