Журнал "Программная инженерия"
Теоретический и прикладной научно-технический журнал
ISSN 2220-3397

Номер 08 2025 год

DOI: 10.17587/prin.16.404-411
УДК: 004.89
Разработка ансамбля моделей для нахождения наиболее релевантного вопросу текста
Н. В. Смирнов, канд. техн. наук, доц., nvsmirnov87@mail.ru, В. А. Дзида, студент, dzida.vadim@yandex.ru, Петрозаводский государственный университет

Рассмотрена задача получения ограниченного малого набора текстов из их коллекции, в котором содержится информация, необходимая для генерации ответа на вопрос пользователя. Представлены разработанные для проведения исследования наборы текстов и вопросов на русском языке. Разработан и протестирован на различных текстовых наборах ансамбль моделей, который использует полученное с помощью нейросетевых подходов векторное представ­ление слов и значение ранжирующей функции. Предложены и апробированы различные способы фильтрации текстовых фрагментов. Разработанная двойная фильтрация обеспечила возможность удаления из рассмотрения текстовых фрагментов, не содержащих ответа на вопрос. Полученные метрики точности и скорости работы программного комплекса, реализующего ансамбль моделей и фильтрацию, позволяют использовать его в различных интеллектуальных ассистентах.

Ключевые слова: информационный поиск, RAG, нейронные сети, ранжирующая функция, обработка естественного языка
Стр. 347—357
Ссылка для цитирования:
Смирнов Н. В., Дзида В. А. Разработка ансамбля моделей для нахождения наиболее релевантного вопросу текста // Программная инженерия. 2025. Том 16, № 8. С. 404—411. DOI: 10.17587/prin.16.404-411.