Журнал "Программная инженерия"
Теоретический и прикладной научно-технический журнал
ISSN 2220-3397

Номер 5 2016 год

DOI: 10.17587/prin.7.195-201
УДК: 004.41
Выделение признаков неделимых частей исходного текста с помощью универсального промежуточного и эквивалентного представлений
А. А. Ковалевский, аспирант, e-mail: morskoyzmey@gmail.com, А. Н. Пустыгин, канд. техн. наук, доц., e-mail: p2008an@rambler.ru, Челябинский государственный университет

Предложен способ выделения признаков исходного текста, основанный на преобразовании его в промежуточное и далее эквивалентное представления, в целях последующей классификации частей текста по разработанной системе признаков. Предложен анализ программных проектов с открытым исходным текстом, основанный на задании признаков искомого текста без привязки к именам идентификаторов. Представлены статистические данные результатов кластеризации по группам признаков четырех проектов с открытым исходным кодом, имеющих попарно функционально схожее назначение..

Ключевые слова: универсальное промежуточное представление, эквивалентное представление, статический анализ, открытый исходный код, классификация исходного текста, признаки исходного текста, поток управления
Стр. 195–201