Научный журнал
Научное обозрение. Технические науки
ISSN 2500-0799
ПИ №ФС77-57440

МАРКЕРЫ И ИХ РОЛЬ В ТЕХНОЛОГИИ ДОПОЛНЕННОЙ РЕАЛЬНОСТИ ДЛЯ МОБИЛЬНЫХ УСТРОЙСТВ НА ПРИМЕРЕ ФРЕЙМВОРКА VUFORIA

Маслов А.С. 1 Белов Ю.С. 1
1 Московский государственный технический университет имени Н.Э. Баумана
За последние несколько лет дополненная реальность (AR) стала все более распространенной технологией потребительского уровня. Основными движущими силами его недавнего развития была эволюция мобильных и портативных устройств в сочетании с алгоритмами и методами из таких областей, как компьютерное зрение. В настоящее время доступны различные коммерческие платформы и SDK, которые позволяют разработчикам быстро разрабатывать мобильные AR-приложения, требующие минимального понимания базовой технологии. На сегодняшний день основное внимание как в исследовательской, так и в коммерческой среде уделяется однопользовательским AR-приложениям. Целью данной статьи является дать более углубленное понимание работы точного отслеживания маркеров в реальном мире. Необходимые сведения о понимании геометрии камеры в пространстве относительно маркера. Как именно происходит обработка изображений на мобильном устройстве для каждого кадра, полученного от камеры. Дано понятие доверительного маркера, а также приведены примеры, на что следует обратить внимание для создания хорошо отслеживаемого маркера для работы с SDK Vuforia. Рассказывается об одном из видов алгоритма нахождения доверительных маркеров, основанных на окружностях, посредством обнаружения краёв.
дополненная реальность
особенности маркера
отслеживание маркера
рендеринг
Vuforia
1. Ben Lang. An Introduction to Positional Tracking and Degrees of Freedom (DOF) [Electronic resource]. URL: https://www.roadtovr.com/introduction-positional-tracking-degrees-freedom-dof/ (date of access: 19.02.2021).
2. Шапиро Л., Стокман Д. Компьютерное зрение: учебное пособие / Под ред. С.М. Соколова; перевод с английского А.А. Богуславского. 4-е изд. М.: Лаборатория знаний, 2020. 763 с. [Электронный ресурс]. URL: https://e.lanbook.com/book/135496 (дата обращения: 19.02.2021).
3. Sturm P., Ramalingam S., Tardif JP. Camera Models and Fundamental Concepts Used in Geometric Computer Vision. Foundations and Trends in Computer Graphics and Vision, Now Publishers, 2011. 6 (1-2). Р. 1–183. [Electronic resource]. URL: https://https://hal.inria.fr/inria-00590269/document (date of access: 19.02.2021).
4. Ababsa F., Mallem M. A Robust Circular Fiducial Detection Technique and Real-Time 3D Camera Tracking. Journal of multimedia. 2008. Vol. 3. Nо. 4. P. 34–41.
5. Маслов А.С., Белов Ю.С. Различные виды мишеней и их распознавание в фреймворке дополненной реальности vuforia // Научное обозрение. Технические науки. 2020. № 1. С. 15–19.
6. Wagner D., Schmalstieg D. Experiences with Handheld Augmented Reality. 2007 6th IEEE and ACM International Symposium on Mixed and Augmented Reality, 13–16 Nov. 2007. Р. 1–13.

Существует несколько видов построения дополненной реальности, которые основаны на:

– маркерах;

– координатах местоположения в про- странстве.

Безмаркерные технологии основываются на получении различной информации от следующих датчиков для получения более точной информации о нахождении пользователя в пространстве: GPS-приёмник, акселерометр, гироскоп и т.д.

Маркерные технологии основываются на реальном объекте, называемом маркер. Данный маркер определяется и распознается с помощью специальных приложений. На основе полученной информации от маркера, такой как положение маркера, расстояние до маркера, программа может достаточно точно отобразить на него виртуальный объект, благодаря чему будет достигаться эффект его физического присутствия в реальном мире. При использовании дополнительных приспособлений, таких как графические фильтры и/или е-модели высокого качества, визуализированный объект может стать трудно отличимым от остальных элементов в сцене.

Цель исследования: дать углубленное и всестороннее понимание работы точного отслеживания маркеров дополненной реальности в реальном мире; показать необходимые сведения о понимании геометрии камеры в пространстве относительно маркера; определить, как именно происходит обработка изображений на мобильном устройстве для каждого кадра, полученного от камеры; обозначить понятие доверительного маркера, а также привести примеры, на что следует обратить внимание для создания хорошо отслеживаемого маркера для работы с SDK Vuforia.

Методы исследования. Ориентирование камеры в пространстве

Дополненная реальность на мобильных устройствах требует точного отслеживания поз 6DOF (6 степеней свободы) объектов реального мира [1]. 6DOF (6 степеней свободы) относятся к свободе перемещения твердого объекта в трехмерном пространстве. В частности, тело может свободно двигаться вперед / назад, вверх / вниз, влево / вправо в сочетании с вращением вокруг трех перпендикулярных осей (рис. 1).

Поза слежения, особенно для мобильных устройств, должна не иметь высоких требований и уметь адаптироваться к различным условиям.

Одной камеры, установленной на мобильном устройстве, обычно достаточно для настройки мобильной дополненной реальности. Видеопоток с камеры одновременно используется в качестве видеофона и для отслеживания позы камеры относительно окружающей среды. Это отслеживание позы должно выполняться в режиме реального времени с ограниченными вычислительными ресурсами мобильного устройства.

maslov1.tif

Рис. 1. 6 степеней свободы

Для достижения надежности и производительности обычным подходом является отслеживание прямоугольных доверительных маркеров. Vuforia – это библиотека отслеживания маркеров, которую мы используем в качестве примера в данной статье в качестве AR-движка. Причина, по которой была выбрана Vuforia, заключается в том, что она поддерживает широкий спектр мобильных платформ.

Камеры на устройстве должны быть откалиброваны до начала отслеживания так, что матрица проекции OpenGL может быть возвращена на базе платформы Vuforia.

Калибровка камеры передается в Vuforia API, возвращая матрицу проекции в стиле OpenGL, которая будет использоваться позже для умножения с позой обнаруженного отслеживаемого объекта. Причина, по которой необходима проекционная матрица, заключается в том, что экран смартфона – это 2D-поверхность. 3D-сцена, визуализируемая OpenGL, должна быть спроецирована на экран устройства в виде 2D-изображения.

Для калибровки необходимо настроить параметры ближней и дальней плоскости. Фрустум – это область пространства в моделируемом мире, которая может появиться на экране. Цель отбора видового фрустума состоит в том, чтобы определить, что находится внутри фрустума, а что нет. На экране отображаются только объекты внутри фрустума. Ближний и дальний планы являются границами этого фрустума (рис. 2) [2].

Матрица содержит не только матрицу перспективной проекции, но и фокусное расстояние, и основную точку камеры. Как показано на рис. 3 [3], тремя осями системы координат являются X1, X2 и X3. Ось X3 направлена в направлении обзора камеры и является главной осью. Точка R на пересечении оптической оси и плоскости изображения является главной точкой. Плоскость изображения расположена на расстоянии f от начала координат в отрицательном направлении и называется фокусным расстоянием.

maslov2.tif

Рис. 2. Конус фрустума

maslov3.tif

Рис. 3. Геометрия камеры

После калибровки камеры вышеупомянутый конвейер отслеживания (рис. 4) выполняется для каждого нового кадра камеры и дает оценочную позу, если обнаружен маркер. Несмотря на то что Vuforia частично является библиотекой с открытым исходным кодом, она немного похожа на черный ящик на стороне отслеживания и не очень раскрывает, как работают ее модули отслеживания. Таким образом, показан общий конвейер отслеживания, не специфичный для Vuforia.

maslov4.tif

Рис. 4. Процесс отслеживания

Маркеры и их особенности

Для отслеживания на основе изображений необходимы доверительные маркеры – это объекты реального мира, которые используются системой отслеживания. Следовательно, сначала мы должны обнаружить эти доверительные маркеры (рис. 5). Существуют различные алгоритмы обнаружения, но в принципе все они работают одинаково. Например, Ababsa и Mallem [4] представляют надежную методику кругового обнаружения, основанную на следовании краям. Алгоритм ищет ребра пиксель за пикселем. Чтобы определить край, они используют постоянное пороговое значение, которое означает, что менее яркие пиксели, чем определенный порог, считаются темными, а более яркие – яркими. Если обнаружена последовательность от темного к яркому, эта последовательность является кандидатом на границу. Когда последовательность замыкает цикл, обнаруживаются границы. В противном случае край исключается.

maslov5.tif

Рис. 5. Обнаружение фидуциалов

Результаты исследования и их обсуждение

Несмотря на то что Vuforia вносит важный вклад в плане отслеживания, для того чтобы маркер мог быть обнаружен позже, маркер должен иметь большое количество признаков. Vuforia определяет термин «увеличиваемый рейтинг», который означает, насколько хорошо изображение может быть обнаружено и отслежено с помощью Vuforia SDK.

Например, левое изображение на рис. 6 содержит только два объекта для каждого острого угла, так как мягкие углы не рассматриваются как объекты. Среднее изображение не содержит никаких особенностей, так как оно не содержит сильных углов. Правое изображение содержит четыре элемента.

maslov6.tif

Рис. 6. Особенности маркера

Локальный контраст маркера – это еще одна особенность, которая должна быть достаточно сильной, чтобы быть обнаруженной и отслеженной должным образом (рис. 7).

maslov7.tif

Рис. 7. Локальный контраст маркера

Характеристики должны быть равномерно распределены, как показано на рис. 8. Чем более сбалансировано распределение объектов в изображении, тем лучше изображение может быть обнаружено и отслежено.

maslov8.tif

Рис. 8. Распределение признаков в маркерах

maslov9.tif

Рис. 9. Повторяющиеся объекты в маркерах

Даже если изображение содержит большое количество объектов и сильный контраст, повторяющиеся паттерны, называемые сглаживанием, могут затруднить отслеживание, поскольку повторяющиеся объекты не показывают уникального паттерна для обнаружения (рис. 9).

После шага обнаружения доверительных маркеров мы имеем замкнутые полигоны. Однако они должны быть прямоугольниками, чтобы сформировать маркер. На следующем этапе прямоугольники определяются с помощью контуров. Для этапа проверки паттернов Vuforia предоставляет несколько типов трекеров (Image Tracker и др. [5]), которые расширяются от трекера базового класса.

Для каждого кадра камеры вызывается функция начала класса Renderer, которая возвращает объект состояния. Состояние показывает отслеживаемые объекты, которые в данный момент отслеживаются трекером (например, Image Tracker). Когда обнаруживается паттерн, который необходимо найти, последним шагом перед рендерингом является оценка позы относительно маркера. Подобно доверительному обнаружению и проверке паттернов, существуют различные алгоритмы оценки позы, которые все используют одну и ту же базовую концепцию: сначала создается начальная догадка, которая оценивает приблизительное положение и ориентацию отслеживаемого объекта относительно камеры. Затем эта первая оценка уточняется итеративно до тех пор, пока не будут выполнены конкретные критерии качества или не будет достигнуто максимальное число итераций [6]. Полученное матричное представление затем преобразуется в матрицу OpenGL, чтобы иметь возможность визуализировать модель в представлении пользователя.

Заключение

Был подробно представлен конвейер отслеживания приложений дополненной реальности в Vuforia, калибровка камеры, необходимая для запуска правильной сессии AR, создание доверительных маркеров, идентификация паттернов и оценка поз обнаруженных треков. Отслеживание – это фундаментальный шаг для всех приложений дополненной реальности. Учитывая ограниченную мощность мобильных устройств, Vuforia, таким образом, вносит важный вклад в AR-системы, работающие на мобильных платформах.


Библиографическая ссылка

Маслов А.С., Белов Ю.С. МАРКЕРЫ И ИХ РОЛЬ В ТЕХНОЛОГИИ ДОПОЛНЕННОЙ РЕАЛЬНОСТИ ДЛЯ МОБИЛЬНЫХ УСТРОЙСТВ НА ПРИМЕРЕ ФРЕЙМВОРКА VUFORIA // Научное обозрение. Технические науки. – 2021. – № 2. – С. 16-20;
URL: https://science-engineering.ru/ru/article/view?id=1340 (дата обращения: 23.11.2024).

Предлагаем вашему вниманию журналы, издающиеся в издательстве «Академия Естествознания»
(Высокий импакт-фактор РИНЦ, тематика журналов охватывает все научные направления)

«Фундаментальные исследования» список ВАК ИФ РИНЦ = 1,674