NO EXISTEN CAMBIOS
La guía de la asignatura ha sido actualizada con los cambios que aquí se mencionan.
NOMBRE DE LA ASIGNATURA |
MOTORES DE BÚSQUEDA WEB |
CÓDIGO |
31101042 |
CURSO ACADÉMICO |
2024/2025 |
TÍTULOS DE MASTER EN QUE SE IMPARTE |
MÁSTER UNIVERSITARIO EN TECNOLOGÍAS DEL LENGUAJE
|
TIPO |
CONTENIDOS |
Nº ECTS |
6 |
HORAS |
150 |
PERIODO |
ANUAL
|
IDIOMAS EN QUE SE IMPARTE |
CASTELLANO |
Tipo |
Optativa |
|
Cuatrimestre |
Primero |
Créditos/horas totales |
6/150 |
Horas de estudio teórico |
100 |
Horas de prácticas |
50 |
Horas complementarias |
0 |
Esta es la guía de la asignatura "Motores de búsqueda Web" que se imparte dentro del máster en Lenguajes y Sistemas Informáticos de la UNED. En esta guía se contextualiza la asignatura dentro del máster, se especifican los conocimientos previos necesarios para cursarla con éxito, sus objetivos de aprendizaje y contenidos, y la metodología con la que se estudiará.
Esta asignatura se encuadra en el módulo "ESP-LSI-1 Tecnologías del Lenguaje en la Web" dentro de la especialidad con el mismo nombre de la titulación de posgrado "Master en Lenguajes y Sistemas Informáticos". Dentro de esta especialidad, "Motores de búsqueda Web" aporta los fundamentos sobre los que aplicar tecnologías de procesamiento de textos más sofisticadas a gran escala.
EQUIPO DOCENTE
GONZALO ARRAYO, JULIO:
Julio Gonzalo es director del centro de investigación en Procesamiento del Lenguaje Natural y Recuperación de Información de la UNED (nlp.uned.es). Ha investigado en muchos aspectos de la Inteligencia Artificial relacionados con el lenguaje. Algunos de los temas más recientes son: la creatividad de los modelos de lenguaje, el análisis automático de las técnicas de propaganda política en las estrategias narrativas de las potencias mundiales y las métricas de evaluación para aplicaciones de Inteligencia Artificial. Ha sido co-chair de iniciativas internacionales de evaluación competitiva de sistemas inteligentes como CLEF, IberEval e IberLEF.
MARTÍNEZ ROMO, JUAN:
Forma parte del grupo NLP&IR de la UNED. Ha impartido docencia en temáticas como los lenguajes de programación, tecnologías web, motores de búsqueda, programación de dispositivos móviles y procesamiento del lenguaje natural (PLN). Sus intereses principales de investigación son el PLN, recuperación de información con adversario, informática biomédica y tecnologías educativas. Ha dirigido varias tesis doctorales y proyectos de investigación en estos temas.
Lectura fluida del inglés y conexión a Internet, además de los requisitos propios del máster.
Esta asignatura puede ser cursada aisladamente, aunque el estudiante se beneficiaría si hubiera cursado previamente o curse en paralelo la asignatura de Fundamentos del procesamiento lingüístico.
Se realizará mediante la plataforma de posgrados de la UNED.
Julio Gonzalo Arroyo
email: julio@lsi.uned.es
Tfno: 913987922
Horario: Jueves de 16:00 a 20:00 horas
Juan Martínez Romo
email: juaner@lsi.uned.es
Tfno: 913989378
Horario: Jueves de 11:00 a 13:00 horas
COMPETENCIAS
C1 Comunicar sus conclusiones y los conocimientos y razones últimas que las sustentan a públicos especializados y no especializados de un modo claro y sin ambigüedades.
C2 Abstracción, análisis, síntesis y relación de ideas.
C3 Capacidad crítica y de decisión.
C4 Capacidad de estudio y autoaprendizaje
C5 Capacidad creativa y de investigación.
C6 Habilidades sociales para el trabajo en equipo
C7 Capacidad de estudio de los sistemas y aproximaciones existentes y para distinguir las aproximaciones más efectivas.
C8 Capacidad para detectar carencias en el estado actual de la ciencia y la tecnología.
C9 Capacidad para proponer nuevas aproximaciones que de solución a las carencias detectadas.
CONOCIMIENTOS O CONTENIDOS
CO1 Poseer y comprender conocimientos que aporten una base u oportunidad de ser originales en el desarrollo y/o aplicación de ideas, a menudo en un contexto de investigación.
CO2 Capacidad de comprender y manejar de forma básica los aspectos más importantes relacionados con los lenguajes y sistemas informáticos en general, y, de manera especial, en los siguientes ámbitos: Tecnologías del lenguaje y de acceso a la información en web.
HABILIDADES O DESTREZAS
H1 Capacidad de aplicar los conocimientos adquiridos y su capacidad de resolución de problemas en entornos nuevos o poco conocidos dentro de contextos más amplios relacionados con su área de estudio.
H2 Capacidad de integrar conocimientos y enfrentarse a la complejidad de formular juicios a partir de una información que, siendo incompleta o limitada, incluya reflexiones sobre las responsabilidades sociales y éticas vinculadas a la aplicación de sus conocimientos y juicios.
H3 Poseer las habilidades de aprendizaje que les permitan continuar estudiando de un modo que habrá de ser en gran medida autodirigido o autónomo.
H4 Capacidad de especificar, diseñar, implementar y evaluar tanto cualitativa como cuantitativamente los modelos y sistemas propuestos.
H5 Capacidad para proponer y llevar a cabo experimentos con la metodología adecuada como para poder extraer conclusiones y determinar nuevas líneas de actuación e investigación.
COMPETENCIAS
C1 Comunicar sus conclusiones y los conocimientos y razones últimas que las sustentan a públicos especializados y no especializados de un modo claro y sin ambigüedades.
C2 Abstracción, análisis, síntesis y relación de ideas.
C3 Capacidad crítica y de decisión.
C4 Capacidad de estudio y autoaprendizaje.
C5 Capacidad creativa y de investigación.
C6 Habilidades sociales para el trabajo en equipo.
C7 Capacidad de estudio de los sistemas y aproximaciones existentes y para distinguir las aproximaciones más efectivas.
C8 Capacidad para detectar carencias en el estado actual de la ciencia y la tecnología.
C9 Capacidad para proponer nuevas aproximaciones que de solución a las carencias detectadas.
Características de la búsqueda de información en la Web
- Topología de la Web: Hubs, autoridades, islas, internet invisible, etc.
- Necesidades de información y búsquedas web: perfil de usuarios.
- Formas básicas de búsqueda: navegación y consulta. Directorios web versus motores de búsqueda.
Arquitectura básica de un motor de búsqueda
- Crawling, Indexación, Procesado de la consulta, Recuperación,Presentación de resultados.
- Arquitectura hardware/software.
Motores de búsqueda pre-Google: búsqueda basada en contenidos
- Modelos tradicionales de recuperación de información (modelo booleano,modelo de espacio vectorial, modelos probabilísticos).
- Limitaciones de los modelos RI en la web: pertinencia versus autoridad,vulnerabilidad a la manipulación externa (spamdexing).
Motores de búsqueda post-Google
- Autoridad absoluta: Algoritmos PageRank y HITS.
- Autoridad relativa a un tema/consulta: Hilltop, Topic Distillation.- El motor de búsqueda Google: evolución de Pagerank (historia de URLs y enlaces, análisis de patentes de Google, Local Rank, Google Sandbox, etc), sistemas de publicidad contextual (adwords, adsense), señal de usuarios, vulnerabilidad.
- Otros motores de búsqueda generalistas.
La general del programa de posgrado. En particular, el alumno realiza dos tipos de actividades en esta asignatura: las relacionadas con la consulta bibliográfica y las de implementación y experimentación. Las primeras son comunes a todos los alumnos y están fijadas dentro del material de estudio correspondiente a cada tema. En una segunda parte de la asignatura, cada alumno realiza un trabajo individual sobre un tema acordado con el equipo docente. Todo el material de estudio está disponible en el entorno virtual del posgrado, y toda la interacción entre profesores y alumnos se puede llevar a cabo en este entorno.
Las tareas que se asignan en esta asignatura tienen tanto que ver con la asimilación de los conocimientos propios de la materia, como con el desarrollo de la capacidad para investigar.Algunos de los tipos de tareas que se proponen son:
- Lectura y análisis de un artículo de investigación, contestando a preguntas como: ¿Se trata de un artículo de teoría, metodología, experimentación o aplicación? ¿Cuáles son sus aportaciones originales? ¿Cuáles son los argumentos/resultados esenciales que conducen a sus conclusiones?
- Evaluación simulada de un artículo, calificando de forma razonada su originalidad, su impacto potencial en el área, la pertinencia y completitud de las referencias bibliográficas, la calidad del trabajo (argumentos, metodología, diseño experimental, etc., la calidad de la presentación (organización, claridad expositiva, etc.). Discusión en grupo (tres alumnos) para alcanzar una única evaluación consensuada, estableciendo una figura de meta-revisor encargado de coordinar la discusión y redactar la evaluación final.
- Estudio del impacto de un artículo: ¿Cuáles son los aspectos del artículo por los que es referenciado? ¿Coinciden con los aspectos sobre los que los autores habían hecho énfasis, o son aspectos inicialmente marginales? ¿Se ha hecho algún avance sustancial respecto a las conclusiones del artículo? ¿Se han refutado las conclusiones del artículo, se han corroborado, se ha profundizado en ellas, se han propuesto vías alternativas?
- Actualización de un artículo de revisión del estado del arte, sintetizando los avances más significativos posteriores a la publicación de la revisión inicial.
- Propuesta de "lecturas recomendadas" para un tema, consensuando una lista razonada a partir del debate entre todos los alumnos de la asignatura.
- Evaluación comparada de servicios de búsqueda Web alternativos, utilizando tanto la revisión bibliográfica como la experimentación directa.
- Diseño e implementación de un servicio de búsqueda Web con algún componente novedoso, partiendo de herramientas de código abierto (como Lucene) o servicios Web (como las API de Google, Yahoo, etc).
TIPO DE PRIMERA PRUEBA PRESENCIAL
|
Tipo de examen |
Tipo de examen |
No hay prueba presencial |
TIPO DE SEGUNDA PRUEBA PRESENCIAL
|
Tipo de examen |
Tipo de examen |
No hay prueba presencial |
CARACTERÍSTICAS DE LA PRUEBA PRESENCIAL Y/O LOS TRABAJOS |
CARACTERÍSTICAS DE LA PRUEBA PRESENCIAL Y/O LOS TRABAJOS
|
Requiere Presencialidad |
Requiere Presencialidad |
No |
Descripción |
Descripción |
En cada tema se proponen al estudiante varios ejercicios que deben cumplimentar y entregar a través del entorno virtual.
|
Criterios de evaluación |
Criterios de evaluación |
En la evaluación de los ejercicios se tiene en cuenta la exactitud y completitud de las respuestas, el tiempo de dedicación, la originalidad y la iniciativa personal.
|
Ponderación de la prueba presencial y/o los trabajos en la nota final |
Ponderación de la prueba presencial y/o los trabajos en la nota final |
La calificación de los ejercicios representa un 50% de la nota final de la asignatura. |
Fecha aproximada de entrega |
Fecha aproximada de entrega |
23/12/2018 |
Comentarios y observaciones |
Comentarios y observaciones |
|
PRUEBAS DE EVALUACIÓN CONTINUA (PEC) |
PRUEBAS DE EVALUACIÓN CONTINUA (PEC)
|
¿Hay PEC? |
¿Hay PEC? |
Si,PEC no presencial |
Descripción |
Descripción |
En el trabajo final de la asignatura, cada estudiante realiza un trabajo individual sobre el tema genérico propuesto por el equipo docente, o bien sobre un tema acordado entre el estudiante y el equipo docente. En el trabajo final se profundiza en algún aspecto de actualidad de los buscadores Web, realizando un resumen del estado del arte y sugiriendo ideas, preferiblemente originales, para avanzar el conocimiento en ese campo.
|
Criterios de evaluación |
Criterios de evaluación |
El trabajo final se evalúa teniendo en cuenta la capacidad del estudiante para
- localizar, manejar y citar adecuadamente fuentes bibliográficas relevantes
- analizar y sintetizar la información de esas fuentes
- realizar un diagnóstico adecuado del estado del arte en función de las fuentes consultadas
- proponer temas e ideas bien fundamentadas y preferiblemente novedosas
|
Ponderación de la PEC en la nota final |
Ponderación de la PEC en la nota final |
El trabajo final representa un 50% de la calificación de la asignatura. |
Fecha aproximada de entrega |
Fecha aproximada de entrega |
15/02/2019 |
Comentarios y observaciones |
Comentarios y observaciones |
|
OTRAS ACTIVIDADES EVALUABLES
|
¿Hay otra/s actividad/es evaluable/s? |
¿Hay otra/s actividad/es evaluable/s? |
No |
Descripción |
Descripción |
|
Criterios de evaluación |
Criterios de evaluación |
|
Ponderación en la nota final |
Ponderación en la nota final |
|
Fecha aproximada de entrega |
Fecha aproximada de entrega |
|
Comentarios y observaciones |
Comentarios y observaciones |
|
¿Cómo se obtiene la nota final?
|
La nota final se obtiene a partir de la calificación de los ejercicios de cada tema (50% de la nota final) y del trabajo final de la asignatura (50% de la calificación final). Es imprescindible entregar el trabajo final para poder superar la asignatura.
|
Arvind Arasu, Junghoo Cho, Hector García-Molina, Andreas Paepcke and Sriram Raghavan. Searching the Web. ACM Transactions on Internet Technology, vol. 1, n. 1, August 2001, pages 2-43.
Como bibliografía complementaria se aportarán referencias a trabajos de investigación dentro del curso virtual.
La plataforma de enseñanza virtual de posgrados de la UNED será la interfaz de interacción entre el alumno y sus profesores. Esta plataforma permite impartir y recibir formación, gestionar y compartir documentos, crear y participar en comunidades temáticas, así como realizar proyectos online.