Curvas de Aprendizaje en la Optimización Bayesiana de Hiperparámetros

Ruiz Sarrias, Oskitz. (2021). Curvas de Aprendizaje en la Optimización Bayesiana de Hiperparámetros Master Thesis, Universidad Nacional de Educación a Distancia (España). Escuela Técnica Superior de Ingeniería Informática. Departamento de Inteligencia Artificial

Ficheros (Some files may be inaccessible until you login with your old.e-spacio credentials)
Nombre Descripción Tipo MIME Size
Ruiz_Sarrias_Oskitz_TFM.pdf Ruiz_Sarrias_Oskitz_TFM.pdf application/pdf 2.36MB

Título Curvas de Aprendizaje en la Optimización Bayesiana de Hiperparámetros
Autor(es) Ruiz Sarrias, Oskitz
Resumen La optimización bayesiana (OB) es uno de los métodos más eficientes para la optimización de hiperparámetros (H) en los algoritmos de aprendizaje automático. Para evaluar el rendimiento de cada conguración de H, la OB utiliza la validación cruzada; lo que en entornos de grandes bases de datos supone un alto coste computacional. Para acelerar la OB en la literatura se han propuesto cuatro estrategias principales: (1) eliminación de combinaciones poco prometedoras, (2) terminación anticipada de evaluaciones innecesarias, (3) paralelización de los cálculos en diferentes unidades, (4) hacer uso de funciones de adquisición más eficientes. Las curvas de aprendizaje (CA) son funciones que enfrentan el número de datos con el que es entrenado un modelo al rendimiento que obtiene tras ser entrenado con dicha cantidad de datos. Poder predecir, partiendo de los puntos iniciales de la CA, el recorrido de la misma, permite estimar el rendimiento del modelo sin necesidad de entrenarlo con todos los datos disponibles. Por lo tanto, el uso de la predicción del rendimiento mediante CA, permitiría reducir el coste computacional de la OB al acelerar las evaluaciones de rendimiento. Y esto último es lo que intenta demostrar este trabajo. En la presente investigación se ha trabajado con problemas de clasicación binaria. Para ello, se han utilizado dos algoritmos de aprendizaje automático: el Support Vector Machine (SVM) y una red neuronal (RN) del tipo perceptrón multicapa. El objetivo final de la fase experimental de este trabajo, ha sido comparar el coste computacional requerido al realizar la OB midiendo el rendimiento con CA o con la validación cruzada. Con esto, se han obtenido resultados que muestran una reducción significativa en el tiempo de cómputo de la OB al usar la predicción por CA.
Notas adicionales Trabajo de Fin de Máster Universitario en Investigación en Inteligencia Artificial. UNED
Materia(s) Ingeniería Informática
Palabra clave optimización de hiperparámetros
optimización Bayesiana
curvas de aprendizaje
Editor(es) Universidad Nacional de Educación a Distancia (España). Escuela Técnica Superior de Ingeniería Informática. Departamento de Inteligencia Artificial
Director/Tutor Hernandez del Olmo, Felix
Gaudioso Vazquez, Elena
Fecha 2021-09-01
Formato application/pdf
Identificador bibliuned:master-ETSInformatica-IIA-Oruiz
http://e-spacio.uned.es/fez/view/bibliuned:master-ETSInformatica-IIA-Oruiz
Idioma spa
Versión de la publicación acceptedVersion
Nivel de acceso y licencia http://creativecommons.org/licenses/by-nc-nd/4.0
info:eu-repo/semantics/openAccess
Tipo de recurso master Thesis
Tipo de acceso Acceso abierto

 
Versiones
Versión Tipo de filtro
Contador de citas: Google Scholar Search Google Scholar
Estadísticas de acceso: 331 Visitas, 198 Descargas  -  Estadísticas en detalle
Creado: Mon, 03 Oct 2022, 20:31:42 CET