Журнал "Программная инженерия"
Теоретический и прикладной научно-технический журнал
ISSN 2220-3397

Номер 7 2021 год

DOI: 10.17587/prin.12.373-384
УДК: 004.8, 004.93
Проекция изображений в пространство для монокулярной и мультиракурсной трехмерной детекции объектов в уличных сценах
Д. Д. Рухович, аспирант, daniel-rukhovich@yandex.ru, Московский государственный университет имени М. В. Ломоносова

Предложен новый метод трехмерной детекции объектов. В отличие от существующих методов аналогичного назначения, предложенный метод не опосредует задачу трехмерной детекции через задачу детекции объектов на изображении, работая сразу с трехмерными представлениями. Предложенный метод превосходит все существующие методы трехмерной детекции объектов по монокулярным изображениям на наборах данных KITTI и NuScenes, содержащих городские сцены. В настоящей работе впервые представлена мультиракурсная постановка задачи трехмерной детекции, когда задача детекции объектов решается на основе нескольких изображений статичной сцены с различных ракурсов, также предложен способ решения этой задачи. Предложенный метод детекции объектов работает в режиме реального времени, что позволяет использовать его в составе систем навигации автономных мобильных устройств без ограничений. Результаты настоящего исследования могут быть применены при решении различных задач, в частности, при навигации робототехнического устройства на сцене в режиме реального времени, при планировании траектории движения, а также при построении трехмерной реконструкции сцен с нанесенной семантической разметкой объектов.

Ключевые слова: машинное обучение, глубокое обучение, трехмерная детекция объектов
Стр. 373–384