Análise de Interrupções de Áudio em Processos de Reconhecimento de Fala Para Aplicações em Sistemas Elétricos de Potência

  • Victor H. Yoshizumi Departamento de Engenharia Elétrica e de Computação, Escola de Engenharia de São Carlos, Universidade de São Paulo (EESC-USP), São Carlos, São Paulo
  • Sofia M. A. Lopes Departamento de Engenharia Elétrica e de Computação, Escola de Engenharia de São Carlos, Universidade de São Paulo (EESC-USP), São Carlos, São Paulo
  • Danilo H. Spatti Departamento de Sistemas de Computação, Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo (ICMC-USP), São Carlos, São Paulo
  • Rogério A. Flauzino Departamento de Engenharia Elétrica e de Computação, Escola de Engenharia de São Carlos, Universidade de São Paulo (EESC-USP), São Carlos, São Paulo
  • Ivan N. da Silva Departamento de Engenharia Elétrica e de Computação, Escola de Engenharia de São Carlos, Universidade de São Paulo (EESC-USP), São Carlos, São Paulo
  • Ivan G. Ricci ARGO Transmissão de Energia S/A, São Paulo, São Paulo
  • Alexandre G. C. Latorre ARGO Transmissão de Energia S/A, São Paulo, São Paulo
Keywords: Fala-Para-Texto, Reconhecimento de Fala, Processamento de Fala, Modelo Whisper, Sistemas de Transmissão

Abstract

O reconhecimento de fala como parte de mecanismos automáticos de auxílio à tomada de decisão tem avançado bastante nos últimos anos, tornando-se uma realidade consistente em vários setores da engenharia. Especialmente em Sistemas Elétricos de Potência, o reconhecimento do tipo Fala-para-texto permite um incremento significativo da qualidade na operação em processos que envolvem comunicação via áudio. Desta forma, torna-se possível a transcrição dos áudios envolvendo a comunicação e também futuras auditorias. Um crescente número de ferramentais vem sendo propostas ultimamente no sentido de se automatizar os processos de reconhecimento de fala, porém estas ainda apresentam limitações de análises, não permitindo uma redundância no processo de transcrição, por exemplo. Propõe-se neste trabalho uma metodologia de análise de áudio em canais separados a partir de gravações de ligações entre os operadores dos sistemas elétricos, visando-se um aumento no grau de robustez da aplicação de processos de reconhecimento fala-para-texto.
Published
2023-10-18