Transferência de Aprendizado por Reforço em Problemas de Otimização Combinatória

André Luiz C. Ottoni; Marcos S. de Oliveira; Daniela  C. R. de Oliveira; Erivelton  G. Nepomuceno

doi:10.48011/asba.v2i1.1098

André Luiz C. Ottoni Universidade Federal do Recôncavo da Bahia
Marcos S. de Oliveira Universidade Federal de São João del-Rei
Daniela C. R. de Oliveira Universidade Federal de São João del-Rei
Erivelton G. Nepomuceno Universidade Federal de São João del-Rei

DOI: https://doi.org/10.48011/asba.v2i1.1098

Keywords: Aprendizado por reforço, Transferência de aprendizado, Otimização Combinatória, Problema do caixeiro viajante, Sequential ordering problem

Abstract

O Aprendizado por Reforço (AR) é uma técnica de Machine Learning com importantes aplicações em problemas de otimização combinatória. No entanto, a literatura carece de estudos sobre a transferência de AR entre domínios de otimização. Baseando-se nisso, o objetivo deste trabalho foi aplicar e analisar a transferência de conhecimento do AR entre o Problema do Caixeiro Viajante (TSP) e o Sequential Ordering Problem (SOP). Para isso, foi adotada a biblioteca de instâncias TSPLIB e o algoritmo SARSA. A metodologia proposta compreende: modelagem do sistema de AR, geração da base de conhecimento (QTSP), experimentos para transferência de aprendizado e analise dos resultados. Os resultados obtidos a partir de testes estatísticos, apontam que, em geral, adotar a transferência de conhecimento entre os problemas possibilitou o cáalculo de melhores métricas de desempenho do domínio objetivo (SOP).