Estimação Inteligente do Grau Geral de Desvio Vocal Utilizando Transformada Wavelet Packet

Andriéli H. Barizão; Victor H. Yoshizumi; Danilo H. Spatti; María E. Dajer; Rogério A. Flauzino

doi:10.48011/asba.v2i1.1028

Andriéli H. Barizão Universidade de São Paulo
Victor H. Yoshizumi Universidade de São Paulo
Danilo H. Spatti Universidade de São Paulo
María E. Dajer Universidade Tecnológica Federal do Paraná
Rogério A. Flauzino Universidade de São Paulo

DOI: https://doi.org/10.48011/asba.v2i1.1028

Keywords: Estimação de parâmetros, Avaliação perceptivo-auditiva, Transformada wavelet packet, Filtros wavelets, Redes neurais artificiais, Perceptron multicamadas

Abstract

O atual modelo de avaliação perceptivo-auditiva da voz está alicerçado em escalas analógicas visuais e buscam melhorias contínuas sob inúmeros aspectos, com destaque para a prescrição de uma boa avaliação referente a qualidade vocal, bem como o seu diagnóstico e monitoramento de tratamentos. Refletindo-se sobre as eventualidades que degradam os aspectos, constata-se a não padronização dos protocolos avaliativos comumente utilizados. Assim sendo, os objetivos principais deste artigo consistiram em desenvolver ferramentas computacionais dedicadas à estimação do parâmetro subjetivo, grau geral do desvio vocal. Mais especificamente, desenvolveu-se a técnica de fragmentação dos arquivos de áudios, a decomposição downsample desses dados para o nível seis dos coeficientes de energia da transformada wavelet packet referentes a seis filtros wavelets distintos, sendo eles: daubechies, symlets, coiflets, fejer-korovkin, biorthogonal e reverse biorthogonal, propondo uma metodologia automatizada para implementação das redes neurais perceptron multicamadas com a finalidade de integrar as variáveis advindas de tal decomposição. Resultados com amostras vocais reais são apresentados para demonstrar a eficiência das técnicas desenvolvidas, expondo taxas de acertos maiores que 98.7% para o método elaborado.