Depuración Inteligente de Datasets para la Automatización de Revisiones de Código
Keywords:
machine learning
Code Review
software engineering
Prerrequisitos:
IIC2613
Este proyecto busca mejorar la calidad de los datasets utilizados para entrenar modelos de revisión automática de código, mediante el desarrollo de técnicas de limpieza que identifiquen y eliminen datos ruidosos o poco útiles. Para ello, se seleccionará una muestra representativa del dataset y se evaluará su efectividad en el entrenamiento de modelos de revisión automatizada. A partir de los datos descartados, se identificarán patrones comunes que afecten la calidad del dataset. Finalmente, se desarrollará una herramienta que automatice la detección y eliminación de estos patrones, con el objetivo de facilitar la preparación de datasets más limpios y efectivos.
Fecha de Creación | 12/07/2025 |
---|---|
Vacantes Disponibles | 0/1 |
Créditos | 10 |
Modalidad | Nota 1-7 |
¿Es CMD?
De tener un carácter Interdisciplinario puede ser considerado como OFG |
No |
Mentores |
|
Estudiantes de doctorado que ayudarán mentoreando en esta investigación | Leonardo Centellas |
¿Es pública?
Las oportunidades públicas son visibles para personas externas a la plataforma |
Sí |
---|---|
¿Es postulable?
Las oportunidades postulables son visibles para estudiantes y tienen vacantes disponible |
No: No quedan vacantes disponibles. |
¿Tiene fecha límite?
La oportunidad dejará de ser postulable después de la fecha límite |
No |