Extração de Entidades de Produtos Utilizando Técnicas de Few-Shot Learning

  • Aleson G. S. Chaves Programa de Pós-graduação o em Engenharia de Sistemas e Automação, Universidade Federal de Lavras, MG
  • Fernanda C. e Silva Programa de Pós-graduação o em Engenharia de Sistemas e Automação, Universidade Federal de Lavras, MG
  • Danton D. Ferreira Departamento de Automática, Universidade Federal de Lavras, MG
  • Bruno H. G. Barbosa Departamento de Automática, Universidade Federal de Lavras, MG
  • Sinval T. Nascimento Omnilogic Inteligência
Keywords: Natural Language Processing, E-commerce, Machine Learning, Few-Shot Learning, Siamese Neural Network, Matching Networks, Artificial Intelligence

Abstract

A interpretação de dados não estruturados no formato textual é uma área de pesquisa que pode ser aplicada para o comércio eletrônico, que tem gerado uma grande quantidade de dados em linguagem natural. Com o crescimento dos marketplaces, novos produtos são adicionados diariamente por diferentes lojistas, e podem existir classes de produtos que tenham poucas amostras nas bases de dados. A obtenção de classificadores que considerem novas classes com poucas amostras é uma tarefa complexa, seja pelo custo computacional de retreinar os modelos existentes para contemplar essas classes, ou pela baixa quantidade de amostras delas. Nesse sentido, técnicas de Few Shot Learning (FSL) são opções promissoras. Isso posto, este trabalho comparou os classificadores FSL Matching Networks e Redes Neurais Siamesas no problema de classificação de produtos de um marketplace, com 34 classes e 394 amostras. Esses classificadores foram comparados com o algoritmo K-Nearest Neighbors (KNN) e foi aplicada a Análise de Componentes Principais para redução de dimensão do banco de dados. Os algoritmos FSL obtiveram desempenho superior ao KNN no teste de validação cruzada leave-one-out, apresentando acurácia de 96,85 %, mesmo considerando classes com baixo número de amostras.
Published
2021-10-20
Section
Articles