GID2017-1 | Estructuras de Datos y Algoritmos (INEDA)
Proyecto 2024
Generación de explicaciones en lenguaje claro para la mejora de la accesibilidad en una herramienta de autoevaluación para asignaturas de Programación
Resumen
El propósito de este proyecto es ampliar y mejorar las funcionalidades de la herramienta personalizada de autoevaluación desarrollada en los proyectos de innovación docente anteriores, de forma que proporcione retroalimentación detallada del proceso de evaluación adaptada a las necesidades de los distintos estudiantes, con énfasis en la mejora de la accesibilidad. En concreto, se persigue explorar las posibilidades de los modelos de IA generativa, especialmente ChatGPT, para traducir a “lenguaje claro” las explicaciones sobre las actividades que la herramienta de evaluación proporciona. Esta traducción implica reescribir y simplificar el texto, evitando, entre otros aspectos, formas gramaticales complejas y vocabulario enrevesado, de forma que se facilite su comprensión por parte de estudiantes con dificultades de aprendizaje, derivadas de trastornos como TDAH o la dislexia, entre otros. Por otro lado, se pretende investigar las posibilidades de uso de ChatGPT para crear automáticamente descripciones textuales a partir de imágenes que permitan mejorar la accesibilidad y la comprensión del contenido visual para estudiantes con problemas de déficit visoespacial o con discapacidad visual.
Nuestra hipótesis es que la integración de modelos de IA generativa, como ChatGPT, para la generación automática de descripciones textuales de las imágenes contenidas en las actividades y para traducir la retroalimentación ofrecida a los estudiantes a lenguaje claro, mejorará la comprensión del contenido visual y facilitará el acceso a la información a estudiantes con diversas dificultades de aprendizaje.
Objetivos
En el presente proyecto se persiguen los siguientes objetivos principales:
[OBJ.1] Desarrollar y mejorar la herramienta de autoevaluación para proporcionar retroalimentación detallada del proceso de evaluación adaptada a las necesidades de los estudiantes, con un énfasis en la mejora de la accesibilidad.
[OBJ.2] Explorar las capacidades de los modelos de IA generativa para traducir a "lenguaje simple" las explicaciones sobre las actividades proporcionadas por la herramienta de evaluación, con el objetivo de simplificar el texto y facilitar su comprensión por parte de estudiantes con dificultades de aprendizaje.
[OBJ.3] Investigar la generación automática de descripciones de imágenes con el fin de mejorar la accesibilidad y la comprensión del contenido visual para una amplia audiencia, incluidos estudiantes con problemas de déficit visoespacial o discapacidad visual.
[OBJ.4] Evaluar la eficacia de las mejoras implementadas en la herramienta de autoevaluación y en la generación de descripciones de imágenes mediante estudios piloto y experimentos controlados para determinar su impacto en el proceso de aprendizaje y evaluación.
[OBJ.5] Contribuir al desarrollo de prácticas educativas inclusivas y accesibles al proporcionar herramientas y metodologías que mejoren la experiencia de aprendizaje y evaluación de estudiantes con diversas dificultades de aprendizaje, promoviendo así la equidad y la igualdad de oportunidades en la educación.
Experiencia de Innovación
De acuerdo con el plan de trabajo inicial, en el proyecto se han llevado a cabo las siguientes tareas principales:
1. Preparación de las colecciones de datos
Para el desarrollo y evaluación de los algoritmos, se emplearon dos colecciones de datos:
-
Colección CLEARS: conjunto de textos proporcionado en el marco de la competición CLEARS (IberLEF 2025), centrada en la adaptación automática de textos al formato Easy-to-Read (E2R) en español. Esta colección permitió disponer de ejemplos anotados conforme a la norma UNE 153101:2018 EX, lo que facilitó la evaluación comparativa de los sistemas desarrollados.
-
Manual de la asignatura Programación y Estructuras de Datos Avanzadas: se extrajo el texto del PDF elaborado por el equipo docente de la asignatura, con el objetivo de aplicar los algoritmos desarrollados sobre material real de aprendizaje.
Ambos conjuntos de datos fueron sometidos a un proceso de preprocesamiento, consistente en la limpieza de ruido (como fórmulas mal convertidas o caracteres no reconocibles), eliminación de urls, etc.
2. Diseño e implementación de un sistema de simplificación textual
Se han desarrollado distintos sistemas de PLN que explotan estrategias basadas en modelos de lenguaje de gran escala (LLM) para la adaptación automática de textos al formato Easy-to-Read (E2R) en español, siguiendo la norma UNE 153101:2018 EX.
Se exploraron tres enfoques de prompting:
-
Zero-shot, en el que el modelo recibe únicamente la definición de la tarea y las directrices E2R.
-
Few-shot aleatorio, donde se añaden ejemplos seleccionados al azar para guiar la generación.
-
Few-shot basado en similitud, en el que los ejemplos incluidos se eligen por su cercanía semántica al texto de entrada.
Estas estrategias se evaluaron en tres modelos instruction-tuned: Dolphin Mistral, especializado en razonamiento estructurado; Starling-LM, entrenado mediante Reinforcement Learning with Human Feedback (RLHF); y LLaMA 3.2–1B–Instruct, un modelo más ligero y eficiente orientado a equilibrar rendimiento y coste computacional.
Asimismo, se realizaron experimentos preliminares aplicando el mejor modelo a la simplificación de fragmentos del temario de la asignatura Programación y Estructuras de Datos Avanzadas. Los resultados iniciales fueron prometedores, aunque se identificaron áreas de mejora: el refinamiento de las estrategias de prompting para lograr adaptaciones más coherentes, la mejora de los procesos de limpieza del texto extraído de los PDF, y la optimización de la generación de descripciones de imágenes para que sean verdaderamente accesibles y autoexplicativas.
3. Diseño e implementación de un algoritmo de generación de descripciones de contenido visual
Se realizaron experimentos preliminares con GPT-5 para la generación automática de descripciones de imágenes. Como conjunto inicial de prueba se seleccionaron imágenes del manual de la asignatura, particularmente aquellas relacionadas con la representación y el recorrido de grafos. Los resultados obtenidos hasta el momento son prometedores aunque es necesario seguir investigando en nuevas estrategias de prompting, nuevos métodos de filtrado y limpieza de contenidos, así como probar con modelos de lenguaje especializados en el tratamiento e interpretación de imágenes para mejorar la precisión técnica de las descripciones y garantizar que las explicaciones se adapten al nivel cognitivo de los estudiantes, especialmente aquellos con dificultades de comprensión lectora o discapacidad visual.
4. Evaluación
Los sistemas desarrollados fueron evaluados mediante su participación en la tarea competitiva CLEARS (IberLEF 2025, Subtarea 2: adaptación de textos al formato E2R). En esta competición, el sistema basado en Dolphin Mistral en configuración zero-shot obtuvo resultados competitivos, alcanzando la cuarta posición tanto en similitud semántica como en legibilidad.
El sistema mostró un buen equilibrio entre mantener el significado original de los textos y hacerlos más fáciles de entender. Sin embargo, los resultados también indicaron que aún es necesario mejorar la simplificación del lenguaje y garantizar un cumplimiento más preciso de las normas UNE. De cara al futuro, se propone combinar diferentes estrategias de prompting, seleccionar de forma más inteligente los ejemplos utilizados para el entrenamiento y ajustar los modelos mediante fine-tuning, con el fin de mejorar la calidad y accesibilidad de los textos generados automáticamente en español.
Resultados obtenidos
Tal como se ha detallado en la sección anterior, los resultados del proyecto se corresponden con los objetivos planteados.
Se han desarrollado y evaluado distintos algoritmos de simplificación textual basados en modelos de lenguaje de gran escala (LLM), aplicando diversas estrategias de prompting y seleccionando finalmente el modelo Dolphin Mistral en modo zero-shot por su mejor equilibrio entre comprensión y legibilidad. Su rendimiento fue evaluado mediante la participación en la competición CLEARS en IberLEF 2025.
Asimismo, se han realizado pruebas preliminares de aplicación del algoritmo al manual de la asignatura Programación y Estructuras de Datos Avanzadas, con resultados prometedores y líneas claras de mejora en la consistencia del lenguaje y la generación de descripciones visuales.
Los algoritmos desarrollados y los resultados obtenidos en la evaluación han sido presentados en el marco del XLI Congreso Internacional de la Sociedad Española para el Procesamiento del Lenguaje Natural (SEPLN 2025). Asimismo, los resultados del proyecto se han difundido a través de una publicación en el congreso IEEE EDUCON.
Difusión y explotación
Como ya se ha mencionado en la sección anterior, los resultados del proyecto han sido difundidos en el marco del XLI Congreso Internacional de la Sociedad Española para el Procesamiento del Lenguaje Natural (SEPLN 2025), dentro de la conferencia IberLEF, donde se presentó la participación del equipo UNED-INEDA en la tarea CLEARS:
Esta comunicación permitió compartir los avances logrados y establecer contactos con otros grupos de investigación interesados en la aplicación de la IA generativa a la accesibilidad textual.
Se han presentado también resultados derivados de este proyecto y de anteriores proyectos del grupo INEDA en la conferencia IEEE EDUCON 2025:
J. Martínez Romo, L. Araujo, L. Plaza, F. López Ostenero
Los resultados obtenidos en este proyecto tienen un alto potencial de transferencia a otros contextos educativos y profesionales. Las técnicas desarrolladas para la adaptación automática de textos a lenguaje claro y formato Easy-to-Read pueden aplicarse en cualquier ámbito que requiera materiales accesibles, como la educación secundaria, la formación profesional o la educación de adultos. Por supuesto, los resultados del proyecto son extrapolables a otras asignaturas de grado cuyos materiales de estudio puedan resultar complejos para estudiantes con dificultades de aprendizaje, contribuyendo así a una docencia más inclusiva y accesible. Estas herramientas también pueden integrarse en plataformas de e-learning o sistemas de autoevaluación para mejorar la comprensión de contenidos técnicos o especializados. Asimismo, y aunque alejado del contexto docente, los algoritmos desarrollados podrían utilizarse en la redacción de documentos administrativos, sanitarios o jurídicos, donde la claridad comunicativa es esencial para garantizar el derecho a la información de todas las personas, incluidas aquellas con dificultades cognitivas o lingüísticas.