Журнал "Программная инженерия"
Теоретический и прикладной научно-технический журнал
ISSN 2220-3397
Номер 06 2025 год
Рассмотрены современные методы автоматического конструирования признаков для задач машинного обучения на табличных данных. Проанализированы различные подходы: от классических алгоритмов, основанных на заранее определенных преобразованиях (DFS, FCTree, ExploreKit, AutoLearn, FICUS, FEADIS, COGNITO), до эволюционных методов (GP-DR, GP-MaL-MO, DIFER). Представлено сравнение методов по их ключевым особенностям и ограничениям применения. Показано, что современные автоматизированные подходы способны эффективно находить нелинейные зависимости и создавать информативные признаки без участия эксперта предметной области, однако при использовании данных подходов возникают проблемы масштабируемости вследствие роста объема данных. В совокупности рассмотренные методы позволяют существенно упростить процесс подготовки данных для машинного обучения и повысить качество получаемых моделей.