Журнал "Программная инженерия"
Теоретический и прикладной научно-технический журнал
ISSN 2220-3397

Номер 9 2021 год

DOI: 10.17587/prin.12.459-469
УДК: 004.8, 004.93
Проекция изображений в пространство для монокулярной или мультиракурсной трехмерной детекции объектов различных категорий
Д. Д. Рухович, аспирант, daniel-rukhovich@yandex.ru, Московский государственный университет имени М. В. Ломоносова

Предложен новый метод трехмерной детекции объектов различных категорий. Предложенный метод превосходит все существующие методы трехмерной детекции объектов по монокулярным изображениям на наборах данных SUN RGB-D и ScanNet, собранных в жилых, административных, учебных и производственных помещениях. Впервые задача трехмерной детекции объектов решена на основе мультиракурсных входов на данных, собранных в помещениях. Предложенный метод трехмерной детекции объектов может найти применение в составе систем управления мобильными робототехническими устройствами. Результаты настоящего исследования могут быть использованы при решении различных задач, в частности, для навигации робототехнического устройства в помещениях, для планирования траектории движения, для захвата и манипуляции различными объектами сцены, а также для построения трехмерной реконструкции сцен с нанесенной семантической разметкой объектов.

Ключевые слова: машинное обучение, глубокое обучение, трехмерная детекция объектов
Стр. 459–469