🧱 Engenharia de Atributos
A Engenharia de Atributos (também conhecida como Feature Engineering, em inglês) é o processo de criação, seleção e transformação de atributos (variáveis ou características) em um conjunto de dados.
Essa técnica é usada para melhorar a performance dos modelos de aprendizado de máquina, além de tornar os dados mais informativos e relevantes para a análise.
A Engenharia de Atributos envolve várias etapas e técnicas, incluindo:
✅ Seleção de Atributos
Identificar e selecionar os atributos mais importantes e relevantes para o problema em questão.
Isso pode envolver a:
- Remoção de atributos com alta correlação,
- Eliminação de atributos redundantes ou irrelevantes.
🔁 Transformação de Atributos
Modificar ou transformar os atributos existentes para torná-los mais úteis para análise ou criação de modelos de Machine Learning.
Exemplos comuns incluem:
- Normalização
- Padronização
- Discretização
- Aplicação de funções logarítmicas ou exponenciais
🧮 Criação de Novos Atributos
Criar atributos derivados a partir dos existentes, por meio de:
- Combinação de variáveis
- Criação de atributos polinomiais
- Interações entre atributos
- Aplicação de funções matemáticas
🚫 Tratamento de Valores Ausentes
Lidar com valores ausentes (missing values) no conjunto de dados.
Técnicas comuns incluem:
- Substituição por média, mediana ou moda
- Interpolação
- Imputação por modelos de aprendizado de máquina
🏷️ Codificação de Variáveis Categóricas
Converter variáveis categóricas em representações numéricas que possam ser utilizadas pelos modelos.
Técnicas utilizadas:
- One-hot encoding
- Ordinal encoding
- Label encoding
🎯 Importância
A Engenharia de Atributos é uma etapa crucial no processo de construção de modelos de aprendizado de máquina.
A qualidade e a relevância dos atributos têm um impacto direto na performance do modelo.
A escolha e criação de bons atributos podem resultar em modelos:
- Mais precisos
- Mais eficientes
- E mais generalizáveis