Журнал "Программная инженерия"
Теоретический и прикладной научно-технический журнал
ISSN 2220-3397
Номер 9 2024 год
В исследовании, результаты которого представлены в статье, изучены вопросы эффективности использования больших языковых моделей для обнаружения распространенных типов уязвимостей в программном коде на языке Python. В частности, с использованием метода низкоранговой адаптации моделей LoRA (Low-Rank Adaptation) выполняется «тонкая» настройка модели CodeBERT-python. Для обучения моделей использован авторский набор данных, который состоит из размеченного программного кода на языке Python. Обученные модели используют для обнаружения и классификации потенциальных уязвимостей. Для оценки эффективности моделей определено число ложноположительных, ложноотрицательных, истинно положительных и истинно отрицательных значений. Вычислены также показатели точности, полноты и F1-меры на тестовой выборке данных для различных конфигураций макропараметров обучения моделей.