Asignaturas - Máster 311001

Asignaturas - Máster universitario en ingeniería y ciencia de datos

MINERÍA DE TEXTOS

Código Asignatura: 31110041

PRESENTACIÓN Y CONTEXTUALIZACIÓN

MINERÍA DE TEXTOS
31110041
2024/2025
TÍTULOS DE MASTER EN QUE SE IMPARTE MÁSTER UNIVERSITARIO EN INGENIERÍA Y CIENCIA DE DATOS
CONTENIDOS
4
100
SEMESTRE 1
CASTELLANO

Esta asignatura tiene por objetivo estudiar técnicas que permiten transformar información textual no estructurada presente en documentos de distintas clases en datos estructurados  fáciles de procesar, que contendrán información relevante y permitirán la extracción de conocimiento. Estos procesos tienen su base en las técnicas de procesamiento de lenguaje natural y aprendizaje automático, que permiten identificar y analizar los elementos informativos de los textos.  

Contribución al perfil profesional: La minería de textos tiene muchas aplicaciones dentro de la ciencia de datos ya que hay que tener en cuenta que buena parte del volumen de datos que se maneja son datos no estructurados, texto libre. Esta asignatura permitirá capacitar a los estudiantes para la extracción de este tipo de información y su análisis en grandes volúmenes de documentos de diferentes dominios y de diferentes tipos, incluyendo páginas web, redes sociales, informes médicos, etc.

Se trata de una asignatura obligatoria que se imparte en el primer semestre el máster.
A la asignatura le corresponde 4 créticos ECTS, que equivalen a una estimación de 100 horas de trabajo.

Está relacionada con las siguientes asignaturas:

  • Programación en entornos de datos
  • Aprendizaje Automático I

En Minería de Textos se presentan librerías y arquitecturas de software específicas para el tratamiento de textos, de ahí su relación con la asignatura Programación en Entornos de Datos. Con respecto a Aprendizaje Automático I,  la asignatura de Minería de Textos se centra en los algoritmos de aprendizaje automático aplicados al tratamiento de los textos.

Reseña del profesorado:
 
DELGADO MUÑOZ, AGUSTÍN DANIEL (coordinador de la asignatura)

Agustín D. Delgado es miembro del grupo de investigación NLP&IR de la UNED. Sus líneas de investigación se enmarcan en el Procesamiento del Lenguaje Natural y la Recuperación de Información. En particular, sus publicaciones han abordado la desambiguación de entidades nombradas mediante técnicas de clustering y métricas de evaluación de sistemas de clasificación. Además, es revisor de varias revistas con factor de impacto y congresos internacionales.

email: agustin.delgado@lsi.uned.es

 
RODRIGO YUSTE, ALVARO:

Alvaro Rodrigo forma parte del grupo de investigación NLP&IR de la UNED.

Investiga dentro del ámbito del Procesamiento del Lenguaje Natural, centrándose en la búsqueda de respuestas, habiendo participado en la organización de diversas tareas de evaluación internacional así como en el desarrollo de este tipo de sistemas. Además, también investiga en diversos métodos para la detección y mitigación de la desinformación.

Ha formado parte del comité de programa de diversos congresos y es revisor de diversas revistas y congresos internacionales.

email: alvarory@lsi.uned.es