ON MODEL-FREE AND MODEL-BASED TECHNIQUES FOR THE QUADRATIC CONTROL OF MARKOV JUMP LINEAR SYSTEMS WITH UNKNOWN TRANSITION PROBABILITIES

  • RAFAEL L. BEIRIGO Laboratório Nacional de Computação Científica - LNCC
  • MARCOS G. TODOROV Laboratório Nacional de Computação Científica - LNCC
  • ANDRÉ DA MOTTA SALLES BARRETO Laboratório Nacional de Computação Científica
Keywords: Sistemas com saltos Markovianos, Aprendizado por reforço, Robótica, Controle adaptativo

Abstract

Sistemas lineares com saltos Markovianos compreendem um arcabouço de sólida fundamentação teórica para a busca do controle ótimo em sistemas cuja dinâmica está sujeita a chaveamento. Apesar de possuir larga aplicabilidade, a demanda por conhecimento perfeito do modelo de transição a priori pode tornar a sua aplicação impraticável. Para contornar essa limitação, recentemente foram propostas duas técnicas que prescindem do conhecimento prévio do modelo de transição. Considerando que uma das técnicas é livre de modelo, sendo a segunda baseada em modelo, os resultados promissores apresentados por ambas permitem uma análise comparativa. Neste trabalho apresentamos uma avaliação experimental das referidas técnicas, realizada através de aplicação ao controle em um simulador de braço robótico cujas articulações estão sujeitas a falha. Adicionalmente, apresentamos testes envolvendo duas variações na estratégia de atualização de política para a técnica livre de modelo. Os resultados da avaliação experimental sugerem desempenhos comparáveis para ambas as técnicas avaliadas.

Published
2020-09-13
Section
Articles