EKG + RAG/LLM para retroalimentación de códigoTrabajo de Fin de Máster · UNED
Material · Entregables

Material y entregables

Este es el punto de entrada a todo el material del proyecto. Desde aquí puedes leerlo online sin descargar nada, abrir los documentos o descargar el proyecto completo para ejecutarlo.

1Qué es el proyecto

Este Trabajo de Fin de Máster construye un grafo de conocimiento educativo (EKG-Python) del dominio de la programación en Python y lo integra como contexto en un sistema GraphRAG que genera retroalimentación pedagógica sobre el código de los estudiantes, en español. La calidad de esa retroalimentación se comprueba con un juez automático cuya propia validez también se analiza y se contrasta con anotación humana.

Son tres piezas encadenadas: el grafo que aporta el conocimiento del dominio, el sistema RAG + LLM afinado que produce el feedback, y la validación del juez que mide si ese feedback es bueno. Esta página reúne, en un solo lugar, los entregables de las tres.

Cómo usar esta página

Si solo quieres mirar el trabajo, ve a la sección 2 («Explora online») y abre los enlaces en el navegador. Si quieres leer los documentos formales, ve a la 3. Y si quieres ejecutar el proyecto en tu equipo, ve a la 4 y descarga los paquetes.

2Explora online (sin descargar)

Todo esto se abre directamente en el navegador, sin instalar nada ni descargar ficheros.

Las dos memorias en PDF

Memoria del TFM

La memoria completa del Trabajo de Fin de Máster. Se abre en el visor de PDF del navegador (aprox. 9,6 MB).

Memoria de Web Semántica

La memoria centrada en la parte de Web Semántica y enlazado de datos (aprox. 2,2 MB).

El cuaderno (notebook)

Notebook renderizado

El cuaderno del proyecto ya ejecutado y convertido a página web: se lee de corrido, con código y resultados a la vista, sin necesidad de Jupyter.

El sitio web académico

Estás dentro de él. Estas son las páginas clave del recorrido:

Portada del sitio

El resumen de un vistazo, los accesos al proyecto, los cuatro hallazgos y el mapa completo de las páginas.

El grafo de conocimiento

La Grafoteca interactiva con los tipos de grafo, el Turtle, las consultas SPARQL, la validación SHACL y la inferencia.

Resultados

El benchmark con n=50, la generalización a código real de Dublin y la fidelidad del recuperador.

Validación del juez

La validez del juez automático y por qué el veredicto se apoya en las métricas objetivas y el grounding.

3Documentos

Los documentos formales del trabajo. Las memorias se abren en el navegador; las instrucciones se descargan para abrirlas en un procesador de textos.

Memoria del TFM

El documento principal del Trabajo de Fin de Máster (PDF).

Memoria de Web Semántica

El documento de la asignatura de Web Semántica y enlazado de datos (PDF).

Artículo en español

El artículo del proyecto. Se distribuye como fuente LaTeX (main.tex + references.bib + figuras) y se compila en Overleaf: sube la carpeta material/paper/ a un proyecto de Overleaf y pulsa «Recompilar» para obtener el PDF.

Instrucciones de aplicación

Las instrucciones de aplicación del trabajo en el aula (documento Word, se descarga al pulsar).

4Reproduce el proyecto

Para ejecutar el proyecto en tu propio equipo. Aquí los ficheros se descargan: pulsa para guardarlos y sigue las guías de cada paquete.

Proyecto completo (.zip)

Todo el código: el grafo (EKG-Python) y el sistema RAG con su evaluación (aprox. 12,4 MB). Antes de ejecutarlo, lee la guía paso a paso: EJECUTAR.md.

Adaptadores QLoRA (.zip)

Los pesos del Sistema B afinado, listos para cargar sobre el modelo base (aprox. 347 MB). Cómo usarlos: MODELOS.md.

Notebook (.ipynb)

El cuaderno editable para abrir en Jupyter o VS Code y reejecutar celda a celda (aprox. 111 KB).

Orden recomendado

Descarga primero el proyecto completo y abre EJECUTAR.md. Si además quieres reutilizar el modelo ya afinado sin reentrenarlo, descarga los adaptadores QLoRA y sigue MODELOS.md.

5Testear el sistema en vivo

Una zona interactiva para probar el sistema de verdad: pega un fragmento de código Python, elige los sistemas (A base · B con fine tuning · C GraphRAG) y obtén la retroalimentación generada en el momento, junto al subgrafo del EKG que se recupera. Incluye un panel del equipo en vivo (uso de GPU, memoria de GPU, temperatura y RAM) que sube cuando el modelo procesa el test, para comprobar que el ordenador está trabajando de verdad.

▶ Abrir «Testear sistema»

La interfaz en vivo: entrada de código, comparación de sistemas A/B/C, subgrafo recuperado del grafo y monitor de GPU · memoria · temperatura · RAM.

Requiere el equipo encendido

La generación en vivo se ejecuta en el equipo del autor (GPU + modelos locales). Si el panel está activo, verás la actividad subir al evaluar; si el equipo está ocupado o apagado, el panel lo indicará y se puede probar en otro momento.

Cómo citar

Si este trabajo te resulta útil y quieres referenciarlo, esta es la cita recomendada.

Bueno Junquero, A. (2026). Integración de un grafo de conocimiento educativo con un LLM mediante RAG. Trabajo Fin de Máster, Máster Universitario en Investigación en Inteligencia Artificial, UNED. Director, José Luis Fernández Vindel.