NO EXISTEN CAMBIOS
The subject guide has been updated with the changes mentioned here
| SUBJECT NAME |
ACCESO INTELIGENTE A LA INFORMACIÓN |
| CODE |
31101019 |
| SESSION |
2026/2027 |
| DEGREE IN WHICH IT IS OFFERED |
MÁSTER UNIVERSITARIO EN TECNOLOGÍAS DEL LENGUAJE
|
| TYPE |
CONTENIDOS |
| CREDITS NUMBER |
6 |
| HOURS |
150 |
| PERIOD |
ANNUAL
|
| LANGUAGES AVAILABLE |
CASTELLANO |
| Tipo |
Optativa |
| Cuatrimestre |
Anual |
| Créditos/horas totales |
6/150 |
| Horas de estudio teórico |
75 |
| Horas de prácticas |
75 |
| Horas complementarias |
0 |
Esta asignatura tiene por objetivo estudiar la Recuperación de Información y la Búsqueda de Respuestas como dos grandes áreas que tratan sobre el acceso a la información desde dos premisas diferentes. Para cada una de ellas se introduce su problemática y se aborda desde una perspectiva histórica hasta la irrupción de las técnicas basadas en los últimos modelos de IA Generativa.
Reseña del Profesorado:
LÓPEZ OSTENERO, FERNANDO
Fernando López es Doctor en Ingeniería Industrial por la UNED y Profesor Colaborador en el Departamento de Lenguajes y Sistemas Informáticos de la UNED, donde forma parte del grupo de investigación NLP&IR de la UNED.
Su investigación en el ámbito del Procesamiento del Lenguaje Natural se centra en la recuperación de información y ha participado en la organización de varias tareas de evaluación internacional.
BENITO SANTOS, ALEJANDRO
Alejandro Benito-Santos es Doctor en Ingeniería Informática por la Universidad de Salamanca y Profesor Ayudante Doctor en el Departamento de Lenguajes y Sistemas Informáticos de la UNED, donde forma parte del grupo NLP & IR.
Su investigación se centra en el Procesamiento del Lenguaje Natural y la Recuperación de Información, con especial interés en la evaluación de modelos de lenguaje, la similitud semántica y la interpretabilidad. Ha publicado en foros internacionales de referencia como ACL, EMNLP y Knowledge-Based Systems.
Para realizar la asignatura es necesario tener un nivel de lectura fluido del inglés.
Esta asignatura puede ser cursada aisladamente, aunque el estudiante se beneficiaría si hubiera cursado previamente o curse en paralelo la asignatura de Fundamentos del procesamiento lingüístico.
La tutorización de los estudiantes se llevará a cabo a través de la plataforma de enseñanza virtual de posgrado de la UNED.
D. Fernando López Ostenero: Asistencia al estudiante lunes de 10:00 a 14:00 horas.
D. Alejandro Benito Santos: Asistencia al estudiante martes de 16:00 a 20:00 horas.
COMPETENCIAS
- C1: Comunicar sus conclusiones y los conocimientos y razones últimas que las sustentan a públicos especializados y no especializados de un modo claro y sin ambigüedades.
- C2: Abstracción, análisis, síntexis y relación de ideas.
- C3: Capacidad crítica y de decisión.
- C4: Capacidad de estudio y autoaprendizaje.
- C5: Capacidad creativa y de investigación.
- C6: Habilidades sociales para el trabajo en equipo.
- C7: Capacidad de estudio de los sistemas y aproximaciones existentes y para distinguir las aproximaciones más efectivas.
- C8: Capacidad para detectar carencias en el estado actual de la ciencia y la tecnología.
- C9: Capacidad para proponer nuevas aproximaciones que de solución a las carencias detectadas.
CONOCIMIENTOS O CONTENIDOS
- CO1 Poseer y comprender conocimientos que aporten una base u oportunidad de ser originales en el desarrollo y/o aplicación de ideas, a menudo en un contexto de investigación.
- CO2 Capacidad de comprender y manejar de forma básica los aspectos más importantes relacionados con los lenguajes y sistemas informáticos en general, y, de manera especial, en los siguientes ámbitos: Tecnologías del lenguaje y de acceso a la información en web.
HABILIDADES O DESTREZAS
- H1 Capacidad de aplicar los conocimientos adquiridos y su capacidad de resolución de problemas en entornos nuevos o poco conocidos dentro de contextos más amplios relacionados con su área de estudio.
- H2 Capacidad de integrar conocimientos y enfrentarse a la complejidad de formular juicios a partir de una información que, siendo incompleta o limitada, incluya reflexiones sobre las responsabilidades sociales y éticas vinculadas a la aplicación de sus conocimientos y juicios.
- H3 Poseer las habilidades de aprendizaje que les permitan continuar estudiando de un modo que habrá de ser en gran medida autodirigido o autónomo.
- H4 Capacidad de especificar, diseñar, implementar y evaluar tanto cualitativa como cuantitativamente los modelos y sistemas propuestos.
- H5 Capacidad para proponer y llevar a cabo experimentos con la metodología adecuada como para poder extraer conclusiones y determinar nuevas líneas de actuación e investigación.
COMPETENCIAS
- C1: Comunicar sus conclusiones y los conocimientos y razones últimas que las sustentan a públicos especializados y no especializados de un modo claro y sin ambigüedades.
- C2: Abstracción, análisis, síntexis y relación de ideas.
- C3: Capacidad crítica y de decisión.
- C4: Capacidad de estudio y autoaprendizaje.
- C5: Capacidad creativa y de investigación.
- C6: Habilidades sociales para el trabajo en equipo.
- C7: Capacidad de estudio de los sistemas y aproximaciones existentes y para distinguir las aproximaciones más efectivas.
- C8: Capacidad para detectar carencias en el estado actual de la ciencia y la tecnología.
- C9: Capacidad para proponer nuevas aproximaciones que de solución a las carencias detectadas.
Tema 1: Recuperación de Información.
- Definición de la tarea
- Recuperación basada en el léxico
- Sistemas de pesado
- Indexación
- Evaluación
- Métricas de evaluación
- Colecciones
- Recursos dependientes del idioma
- Lematizadores
- Stemmers
- Segmentación de compuestos y palabras
- Recuperación de Información multilingüe
- Recursos para Recuperación de Informacón multilingüe
- Enfoques para la traducción
- Fusión documental
- Evolución de la investigación en el área.
Tema 2: Recuperación de Información Semántica.
- Limitaciones del matching léxico
- Representaciones semánticas
- Representaciones distribuidas
- Embeddings de palabras
- Embeddings de frases y documentos
- Recuperación basada en embeddings
- Recuperación densa
- Búsqueda vectorial
- Indexación semántica
- Combinación de enfoques léxicos y semánticos
- Recuperación híbrida
- Reranking
- Fusión de resultados
- Evolución reciente de la recuperación semántica
Tema 3: Búsqueda de Respuestas.
- Definición de la tarea
- Evaluación de sistemas de Question Answering
- Métricas de evaluación
- Análisis de errores
- Colecciones y foros de evaluación
- Arquitectura de sistemas de Question Answering
- Análisis de preguntas
- Recuperación de documentos
- Extracción o generación de respuestas
- Validación de respuestas
- Clasificación de Sistemas de búsqueda automática de respuestas
- Nivel de utilización de técnicas de PLN
- Taxonomía de Moldovan
- Tipos de preguntas y respuestas
- Clasificación de los diferentes tipos y subtipos de preguntas
- Enfoques anteriores al Deep Learning
- Enfoques basados en Deep Learning
- Modelos tipo encoder para QA: Bert, RoBERTa, etc.
Tema 4: Sistemas de Búsqueda Automática de Respuestas.
- Modelos generativos para acceso a la información
- Modelos seq2seq
- Modelos decoder-only
- Large Language Models como sistemas de acceso a la información
- Capacidades y limitaciones de los modelos generativos
- Fundamentos de Retrieval-Augmented Generation (RAG)
- Motivación y arquitectura general
- Integración de recuperación y generación
- RAG frente a generación sin recuperación
- Casos de uso de los sistemas RAG
- Construcción del contexto en sistemas RAG
- Segmentación documental
- Selección y ordenación de pasajes
- Ventana de contexto
- Query parsing y reformulación de consultas
- Generación condicionada por evidencia
- Diseño de sistemas de acceso generativo
- Prompt augmentation
- Grounding y atribución de evidencia
- Control de la generación
- Limitaciones derivadas del contexto recuperado
- Evaluación de sistemas generativos de acceso a la información
- Limitaciones de las métricas clásicas de Question Answering
- Evaluación automática y evaluación humana
- Faithfulness, factualidad y grounding
- Análisis de errores en sistemas RAG
- Sistemas RAG en entornos reales
- Latencia, coste y escalabilidad
- Actualización de la base de conocimiento
- Monitorización y logging
- Retos de robustez y reproducibilidad
- Evolución reciente del acceso generativo a la información
Los estudiantes realizan dos tipos de actividades en esta asignatura: una tarea para cada uno de los temas que componen la asignatura. Todas ellas estarán disponibles dentro del material de estudio correspondiente a cada tema.
Para finalizar, se realizará una práctica final sobre las líneas de investigación tratadas en la asignatura.
Todo el material de estudio está disponible en el entorno virtual del posgrado, y toda la interacción entre profesores y estudiantes se puede llevar a cabo en este entorno.
First ONSITE TEST
|
| Type of exam |
| Type of exam |
No hay prueba presencial |
Second ONSITE TEST
|
| Type of exam |
| Type of exam |
No hay prueba presencial |
| CHARACTERISTICS OF THE IN-PERSON TEST AND/OR THE WORK |
CHARACTERISTICS OF THE IN-PERSON TEST AND/OR THE WORK
|
| Requires presence |
| Requires presence |
No |
| Description |
| Description |
En esta asignatura no se realiza un examen presencial.
|
| Assessment criteria |
| Assessment criteria |
|
| Weighting of the in-person test and/or the assignments in the final grade |
| Weighting of the in-person test and/or the assignments in the final grade |
|
| Approximate submission date |
| Approximate submission date |
|
| Coments |
| Coments |
|
| CONTINUOUS ASSESSMENT TEST (PEC) |
CONTINUOUS ASSESSMENT TEST (PEC)
|
| PEC? |
| PEC? |
Si,PEC no presencial |
| Description |
| Description |
En cada tema de la asignatura habrá que realizar una tarea sobre los contenidos del tema.
El enunciado de cada tarea será específico para cada curso y estará disponible en el curso virtual.
|
| Assessment criteria |
| Assessment criteria |
Los criterios de evaluación dependerán de cada tarea. Estarán disponibles en el curso virtual de la asignatura.
|
| Weighting of the PEC in the final grade |
| Weighting of the PEC in the final grade |
La tarea de cada tema supondrá un 15% de la calificación final, por lo que la calificación de todas ellas supone un 60% de la calificación de la asignatura. |
| Approximate submission date |
| Approximate submission date |
Las fechas aproximadas de entrega de cada tarea se encuentran indicadas en el plan de trabajo de la asignatura. |
| Coments |
| Coments |
|
OTHER GRADEABLE ACTIVITIES
|
| Are there other evaluable activities? |
| Are there other evaluable activities? |
Si,no presencial |
| Description |
| Description |
Existe una práctica final de la asignatura. El enunciado de esta práctica estará disponible en el curso virtual de la asignatura.
|
| Assessment criteria |
| Assessment criteria |
|
| Weighting in the final grade |
| Weighting in the final grade |
La práctica final supondrá un 40% de la calificación final. |
| Approximate submission date |
| Approximate submission date |
Las fechas aproximadas de entrega se detallarán en el curso virtual |
| Coments |
| Coments |
|
How to obtain the final grade?
|
Para aprobar la asignatura se deberán entregar todas las tareas de los temas, más la práctica final. Los pesos de las tareas de los temas y la práctica final serán los siguientes:
- Tema 1: 15%
- Tema 2: 15%
- Tema 3: 15%
- Tema 4: 15%
- Práctica Final: 40%
|
Dentro del curso virtual se aportarán referencias a lecturas que cubren los objetivos marcados en cada tema.
Dentro del curso virtual se aportarán referencias a lecturas que cubren los objetivos marcados en cada tema.
El campus virtual de posgrados de la UNED, proporcionará interfaz de interacción entre el estudiante y sus profesores. La plataforma de Cursos Virtuales de la UNED permite impartir y recibir formación, gestionar y compartir documentos, crear y participar en comunidades temáticas, así como realizar proyectos online.
Horarios de
ACCESO INTELIGENTE A LA INFORMACIÓN
Loading, this may take a while
Cargando...