Depuración Inteligente de Datasets para la Automatización de Revisiones de Código

Keywords:
machine learning Code Review software engineering
Prerrequisitos:
IIC2613

Este proyecto busca mejorar la calidad de los datasets utilizados para entrenar modelos de revisión automática de código, mediante el desarrollo de técnicas de limpieza que identifiquen y eliminen datos ruidosos o poco útiles. Para ello, se seleccionará una muestra representativa del dataset y se evaluará su efectividad en el entrenamiento de modelos de revisión automatizada. A partir de los datos descartados, se identificarán patrones comunes que afecten la calidad del dataset. Finalmente, se desarrollará una herramienta que automatice la detección y eliminación de estos patrones, con el objetivo de facilitar la preparación de datasets más limpios y efectivos.

Fecha de Creación 12/07/2025
Vacantes Disponibles 0/1
Créditos 10
Modalidad Nota 1-7
¿Es CMD?
De tener un carácter Interdisciplinario puede ser considerado como OFG
No
Mentores
  • Juan Pablo Sandoval Alcocer (Responsable)
Estudiantes de doctorado que ayudarán mentoreando en esta investigación Leonardo Centellas
¿Es pública?
Las oportunidades públicas son visibles para personas externas a la plataforma
¿Es postulable?
Las oportunidades postulables son visibles para estudiantes y tienen vacantes disponible
No: No quedan vacantes disponibles.
¿Tiene fecha límite?
La oportunidad dejará de ser postulable después de la fecha límite
No