Uma Proposta de Correção de Dados Ruidosos via K-Nearest Neighbours

  • Victor M. Magalhães Pinto Programa de Pós-graduação em Engenharia Elétrica, Universidade Federal de Minas Gerais
  • Cristiano L. de Castro Programa de Pós-graduação em Engenharia Elétrica, Universidade Federal de Minas Gerais
Keywords: Knn, Machine learning, Erros de rotulação, Filtro, Classificadores, Ruído

Abstract

Conjuntos de dados ruidosos contribuem para o aumento da complexidade de modelos de classificação resultando em superfícies de decisão com complexidade superior à requerida pelo problema. Tal situação leva a um pior desempenho ao ser aplicado à distribuição real (função geradora) dos dados. Este artigo propõem um método de filtragem de ruído a partir da utilização do algoritmo k-nearest neighbours ponderado, cujos pesos são proporcionais à distância da amostra ruidosa sob análise e seus vizinhos mais próximos. Experimentos conduzidos com dados sintéticos e reais mostram a eficácia do método proposto em problemas binários de classificação.

Published
2020-12-07
Section
Articles