Журнал "Программная инженерия"
Теоретический и прикладной научно-технический журнал
ISSN 2220-3397

Номер 07 2025 год

DOI: 10.17587/prin.16.334-346
УДК: 004.02
Алгоритм извлечения ключевых понятий из образовательных программ ИТ-специалистов гибридным методом контекстного ранжирования
Р. А. Файзрахманов, д-р экон. наук, проф., fayzrakhmanov@gmail.com, Е. В. Долгова, д-р экон. наук, проф., shagrata@mail.ru, И. И. Сухих, аспирант, vargostelemax@gmail.com, Федеральное государственное автономное образовательное учреждение высшего образования «Пермский национальный исследовательский политехнический университет» (ФГАОУ ВО «ПНИПУ»)

Рассмотрены вопросы автоматизации процесса извлечения ключевых понятий из рабочих программ учебных дисциплин для повышения междисциплинарной согласованности образовательных программ в области информационных технологий. Подчеркнута необходимость преодоления ограничений традиционных методов, таких как TF-IDF и PageRank, которые не учитывают семантические связи и контекст употребления терминов. В качестве решения предложен гибридный метод ContextualRank, сочетающий анализ семантического сходства на основе предобученных языковых моделей (BERT, T5) и контекстных характеристик (часто­та совместной встречаемости, расстояние между фразами). Метод использует графовую модель с весами ребер, рассчитанными через комбинацию косинусного сходства векторных представлений и контекстных метрик, а также алгоритм TextRank для ранжирования понятий. Для оценки релевантности ключевых понятий целям дисциплины реализован механизм анализа прямых и транзитивных связей с применением алгоритма Флойда—Уоршелла. Эксперименты на данных Пермского национального исследовательского политехнического университета показали, что ContextualRank превосходит TF-IDF по F-мере на 21 %, обеспечивая точность 0,7 и полноту 0,93. Результаты визуализированы в виде графов, выделяющих ключевые понятия и их связи с целями дисциплин. Исследование демонстрирует потенциал метода для автоматизации анализа учебных программ, улучшения их структурированности и адаптации к динамическим требованиям рынка труда.

Ключевые слова: междисциплинарная согласованность, извлечение ключевых понятий, гибридные методы, языковые модели, TextRank, TF-IDF, PageRank, ContextualRank, образовательные программы, ИТ-специалисты, семантическое сходство, контекстный анализ
Стр. 334—346
Ссылка для цитирования:
Файзрахманов Р. А., Долгова Е. В., Сухих И. И. Алгоритм извлечения ключевых понятий из образовательных программ ИТ-специалистов гибридным методом контекстного ранжирования // Программная инженерия. 2025. Том 16, № 7. С. 334—346. DOI: 10.17587/prin.16.334-346.