Журнал "Программная инженерия"
Теоретический и прикладной научно-технический журнал
ISSN 2220-3397
Номер 07 2025 год
Рассмотрены вопросы автоматизации процесса извлечения ключевых понятий из рабочих программ учебных дисциплин для повышения междисциплинарной согласованности образовательных программ в области информационных технологий. Подчеркнута необходимость преодоления ограничений традиционных методов, таких как TF-IDF и PageRank, которые не учитывают семантические связи и контекст употребления терминов. В качестве решения предложен гибридный метод ContextualRank, сочетающий анализ семантического сходства на основе предобученных языковых моделей (BERT, T5) и контекстных характеристик (частота совместной встречаемости, расстояние между фразами). Метод использует графовую модель с весами ребер, рассчитанными через комбинацию косинусного сходства векторных представлений и контекстных метрик, а также алгоритм TextRank для ранжирования понятий. Для оценки релевантности ключевых понятий целям дисциплины реализован механизм анализа прямых и транзитивных связей с применением алгоритма Флойда—Уоршелла. Эксперименты на данных Пермского национального исследовательского политехнического университета показали, что ContextualRank превосходит TF-IDF по F-мере на 21 %, обеспечивая точность 0,7 и полноту 0,93. Результаты визуализированы в виде графов, выделяющих ключевые понятия и их связи с целями дисциплин. Исследование демонстрирует потенциал метода для автоматизации анализа учебных программ, улучшения их структурированности и адаптации к динамическим требованиям рынка труда.