Transferência de Aprendizado por Reforço em Problemas de Otimização Combinatória

  • André Luiz C. Ottoni Universidade Federal do Recôncavo da Bahia
  • Marcos S. de Oliveira Universidade Federal de São João del-Rei
  • Daniela C. R. de Oliveira Universidade Federal de São João del-Rei
  • Erivelton G. Nepomuceno Universidade Federal de São João del-Rei
Keywords: Aprendizado por reforço, Transferência de aprendizado, Otimização Combinatória, Problema do caixeiro viajante, Sequential ordering problem

Abstract

O Aprendizado por Reforço (AR) é uma técnica de Machine Learning com importantes aplicações em problemas de otimização combinatória. No entanto, a literatura carece de estudos sobre a transferência de AR entre domínios de otimização. Baseando-se nisso, o objetivo deste trabalho foi aplicar e analisar a transferência de conhecimento do AR entre o Problema do Caixeiro Viajante (TSP) e o Sequential Ordering Problem (SOP). Para isso, foi adotada a biblioteca de instâncias TSPLIB e o algoritmo SARSA. A metodologia proposta compreende: modelagem do sistema de AR, geração da base de conhecimento (QTSP), experimentos para transferência de aprendizado e analise dos resultados. Os resultados obtidos a partir de testes estatísticos, apontam que, em geral, adotar a transferência de conhecimento entre os problemas possibilitou o cáalculo de melhores métricas de desempenho do domínio objetivo (SOP).

Published
2020-12-08
Section
Articles