Журнал "Программная инженерия"
Теоретический и прикладной научно-технический журнал
ISSN 2220-3397
Номер 08 2025 год
Рассмотрена задача получения ограниченного малого набора текстов из их коллекции, в котором содержится информация, необходимая для генерации ответа на вопрос пользователя. Представлены разработанные для проведения исследования наборы текстов и вопросов на русском языке. Разработан и протестирован на различных текстовых наборах ансамбль моделей, который использует полученное с помощью нейросетевых подходов векторное представление слов и значение ранжирующей функции. Предложены и апробированы различные способы фильтрации текстовых фрагментов. Разработанная двойная фильтрация обеспечила возможность удаления из рассмотрения текстовых фрагментов, не содержащих ответа на вопрос. Полученные метрики точности и скорости работы программного комплекса, реализующего ансамбль моделей и фильтрацию, позволяют использовать его в различных интеллектуальных ассистентах.