Um dos principais problemas de aquisição de dados em alguns processos da indústria é o ambiente ruidoso que às vezes gera outliers nos dados coletados. Se tais dados forem usados para identificar o processo, a análise e coleta de informações poderiam ser prejudicadas, fazendo com que a modelagem seja ineficiente. O propósito deste trabalho é realizar uma comparação da modelagem dos dados crus, isto é, sem processar (com outliers), e os dados "limpos", mediante alguns índices de desempenho. Para isso, foram simuladas 200 plantas. No final, como forma de validação, os experimentos foram feitos com dados coletados de uma planta real.