Журнал "Программная инженерия"
Теоретический и прикладной научно-технический журнал
ISSN 2220-3397

Номер 06 2025 год

DOI: 10.17587/prin.16.300-310
УДК: 004.93'11
Методы автоматического конструирования признаков в машинном обучении на табличных данных
Н. А. Радеев, аспирант, n.radeev@g.nsu.ru, Новосибирский национальный исследовательский государственный университет

Рассмотрены современные методы автоматического конструирования признаков для задач машинного обучения на табличных данных. Проанализированы различные подходы: от классических алгоритмов, основанных на заранее определенных преобразованиях (DFS, FCTree, ExploreKit, AutoLearn, FICUS, FEADIS, COGNITO), до эволюционных методов (GP-DR, GP-MaL-MO, DIFER). Представлено сравнение методов по их ключевым особенностям и ограничениям применения. Показано, что современные автоматизированные подходы способны эффективно находить нелинейные зависимости и создавать информативные признаки без участия эксперта предметной области, однако при использовании данных подходов возникают проблемы масштабируемости вследствие роста объема данных. В совокупности рассмотренные методы позволяют существенно упростить процесс подготовки данных для машинного обучения и повысить качество получаемых моделей.

Ключевые слова: машинное обучение, конструирование признаков, табличные данные, признаковое пространство, генетические алгоритмы, снижение размерности, эволюционные алгоритмы
Стр. 300—310
Ссылка для цитирования:
Радеев Н. А. Методы автоматического конструирования признаков в машинном обучении на табличных данных // Программная инженерия. 2025. Том 16, № 6. С. 300—310. DOI: 10.17587/prin.16.300-310.