AutoRL-TSP: Sistema de Aprendizado por Reforço Automatizado para o Problema do Caixeiro Viajante
Abstract
O AutoML (Aprendizado de Máquina Automatizado) tem como objetivo desenvolver técnicas para automatizar todo o processo de aprendizagem de máquina, de forma a obter um sistema que se adeque as condições do problema. Nesse sentido, um dos aspectos relevantes de sistemas de AutoML é a definição das configurações iniciais da simulação, que podem influenciar consideravelmente no resultado final do aprendizado. No entanto, a literatura carece de trabalhos que apresentem métodos de AutoML para aplicações de Aprendizado por Reforço (AR) em problemas de otimização combinatória. Dessa forma, o objetivo deste trabalho é propor um sistema de AR Automatizado (AutoRL-TSP) para ajuste automático de parâmetros do AR para aplicação no Problema do Caixeiro Viajante. Para isso, são apresentados os módulos do AutoRL-TSP: sistema de AR, base de conhecimento, estruturas de otimização e recomendação. Os resultados apresentam os \textit{rankings} de recomendação de parâmetros de acordo com a instância (TSPLIB) e o método de otimização simulado. Em geral, ao adotar a base de conhecimento e o algoritmo Variable Neighborhood Search, o AutoRL-TSP alcançou os melhores resultados.