Modelo predictivo basado en Machine Learning Supervised y la deserción estudiantil en centros de Educación Superior Tecnológicos Públicos de la región la Libertad
Resumen
El presente trabajo de investigación, se inicia con el estudio de la deserción estudiantil
con datos recopilados de estudiantes en 10 periodos académicos del programa
Computación e Informática, comprendidos entre el año 2012 y 2021 del Instituto
Superior Tecnológico Trujillo. La información recopilada está compuesta de 500
registros de estudiantes. Se planteó el siguiente problema de investigación ¿Cómo
obtener un modelo predictivo con mayor porcentaje de confiabilidad que los algoritmos
tradicionales Bayesianos, Regresión, Soporte Vectorial y Bosques Aleatorios, para
estimar la deserción estudiantil de modo más eficiente en los centros de Educación
Superior Tecnológicos Públicos de la región La Libertad a través de máquinas de
aprendizaje supervisados?. Se utilizó una metodología de minería de datos conocida
como Crisp - DM y algoritmos de aprendizaje supervisado de la librería Scikit Learn de
Python. El Tipo investigación es aplicada y diseño descriptivo. Se emplearon cuatro
algoritmos de aprendizaje para ser entrenados en un conjunto de datos correspondiente
al 80% del set de datos original, reservando 20% restante para la etapa de prueba del
modelo final. Se obtuvo cuatro modelos, que luego de ser evaluados, se utilizaron como
entradas para generar un nuevo modelo ensamblado mediante un algoritmo de votación
usado para este propósito, por tener modelos heterogéneos. Se realizó en ensamble y
luego de la evaluación de confiabilidad con el 20% de la data reservada para la prueba,
se evidenció una confiabilidad del 93%, con una tasa de errores de 7/100 (7%), entre
patrones reconocidos y no reconocidos. Se determinó el modelo ensamblado como
propuesta del trabajo de investigación, aun cuando este mismo indicador se presenta en
dos modelos básicos analizados; sin embargo, el modelo ensamblado, por su robustez
que los caracteriza, es el que se elige como propuesta para garantizar la permanencia del
índice de confiabilidad durante todo el ciclo de vida.
Colecciones
- Tesis [10]
UNIVERSIDAD NACIONAL DEL SANTA
Av. Pacífico 508 - Nuevo Chimbote, Ancash - Perú | Telf. (51)-43-310445
Todos los contenidos de repositorio.unp.edu.pe están bajo la Licencia Creative Commons