Журнал "Программная инженерия"
Теоретический и прикладной научно-технический журнал
ISSN 2220-3397

Номер 11 2024 год

DOI: 10.17587/prin.15.555-569
УДК: 004.89, 004.43
Анализ наборов данных и больших языковых моделей для обнаружения уязвимостей в программном коде на императивных языках программирования
В. В. Швыров, канд. физ.-мат. наук, доц., slshj@yandex.ru, Д. А. Капустин, д-р техн. наук, доц., kap-kapchik@mail.ru, Р. Н. Сентяй, ст. преподаватель, sentyayroman@yandex.ru, Т. И. Шулика, асс., shulika-tatyana@mail.ru, Луганский государственный педагогический университет

Большие языковые модели представляют собой модели машинного обучения, которые позволяют классифицировать и генерировать как тексты на естественных языках, так и код на различных языках программирования. Такие модели имеют миллиарды параметров и обучены на огромных массивах данных. В последние годы такие модели успешно используются для решения самых различных задач программной инженерии. В работе представлены данные о публикационной активности по исследуемой тематике, которые получены на основе статистического анализа результатов поиска по релевантным ключевым запросам. Кроме того, проведен обзор последних публикаций в области использования больших языковых моделей для обнаружения уязвимостей в программном коде, а также представлены результаты анализа наборов данных, которые используются при обучении нейросетевых моделей для поиска уязвимостей в программном коде.

Ключевые слова: большие языковые модели, набор данных уязвимостей, обнаружение уязвимостей, статический анализ, языки программирования, CWE
Стр. 555—569
Ссылка для цитирования:
Швыров В. В., Капустин Д. А., Сентяй Р. Н., Шулика Т. И. Анализ наборов данных и больших языковых моделей для обнаружения уязвимостей в программном коде на императивных языках программирования // Программная инженерия. 2024. Том 15, № 11. С. 555—569. DOI: 10.17587/prin.15.555-569.