Журнал "Программная инженерия"
Теоретический и прикладной научно-технический журнал
ISSN 2220-3397
Номер 12 2024 год
Представлены результаты исследований, направленных на оценку масштабируемости распределенных отказоустойчивых систем для итерационного выполнения задач. Рассмотрены одноранговые распределенные системы, способные итерационно выполнять задачи по расписанию, узлы которых координируются через хранилище ключ-значение. Функционирование таких систем базируется на основе алгоритмов Recurrent Worker Service (RWS). Основное внимание уделено исследованию зависимости таких показателей, как точность выполнения итераций и утилизация ресурсов, от числа узлов системы, включая как узлы приложения, так и узлы хранилища. Экспериментальная среда состояла из четырех серверов (один низкопроизводительный, три высокопроизводительных), и была развернута в инфраструктуре облака Яндекс. Проведены испытания по трем сценариям: масштабируемость по числу узлов приложения, масштабируемость по числу узлов хранилища и одновременная масштабируемость по числу узлов обеих категорий. В ходе испытаний были проанализированы различия в производительности между двумя режимами алгоритмов RWS. Полученные в работе результаты могут быть использованы при проектировании и оптимизации распределенных систем, требующих высокой производительности и отказоустойчивости.