Tracking und Umfelderkennung

Tracking und Umfelderkennung ist eine Kerntechnologie für die Anwendung von Virtuellen Techniken. Sie stellt besondere Anforderungen in Hinblick auf Echtzeitfähigkeit, Datenkompatibilität, Benutzerfreundlichkeit, Robustheit gegenüber Umwelteinflüssen und Effizienz der Algorithmen. Für eine intuitive Interaktion mit z.B. Virtual Reality Anwendungen, Ergonomieuntersuchungen oder Tracking im industriellen Fertigungsumfeld ist ein genaues, markerloses Tracking erforderlich. Ziel des Projektvorhabens ARVIDA ist es, markerlose Trackingsysteme bereitzustellen, die auch in industrieller Umgebung zuverlässig arbeiten. Im Rahmen der Referenzarchitektur entstehen modulare Systeme, die für jede Anwendung eine geeignete Lösung bieten, die ohne Expertenwissen genutzt werden kann. Hierzu werden grundlegende Forschungsarbeiten vorangetrieben, um technologische Sprünge in dieser Kerntechnologie zu erzielen.

Markerloses Outside-In Tracking

Bei markerlosen Outside-In Trackingsystemen sind mehrere Sensoren ortsfest angebracht und beobachten ein dediziertes Messvolumen. In diesem Bereich bewegen sich die Objekte, von denen Position und Orientierung (Pose) gemessen werden soll. Während markerbasierte Trackingsysteme seit langer Zeit Standard im Bereich VR sind, werden im Rahmen von ARVIDA neue markerlose Ansätze für das Tracking von starren Körpern (z.B. Werkzeuge) und artikulierten Körpern (z.B. Finger) erforscht. Im Fokus der Arbeiten stehen dabei skalierbare Ansätze mit intelligenten Sensoren, um eine hohe Genauigkeit bei gleichzeitig hoher Messrate und geringer Latenz zu erreichen.
Auf der ersten ARVIDA Statustagung im April 2015 wurde dazu bereits ein neuartiges System zur Echtzeitverfolgung starrer Körper vorgestellt. Zum Tracken eines Objekts wird dieses zunächst eingelernt, indem es der Nutzer im Sichtbereich der Kameras bewegt. Das System analysiert und speichert dabei wiedererkennbare Merkmale in einem virtuellen Objekt-Modell. Dieses Modell wird beim anschließenden Tracking verwendet, um das Objekt in mehreren Kameras zu verfolgen. Dabei kommen zwei unterschiedliche bildbasierte Methoden zum Einsatz. Für das Tracking von texturierten Objekten werden die markanten Merkmale des Objekts („Features“) detektiert und auf ihre Ähnlichkeit hin untersucht. Die über mehrere Kameras ermittelten Korrespondenzen bilden die Grundlage für die Bestimmung der Pose des Objekts. Im Falle von untexturierten Objekten wird ein Ansatz verwendet, der auffällige Objektkanten, die sich z.B. am Luftspalt einer Autotür bilden, für das Tracking verwendet. Die eingelernte Objektgeometrie wird dann optimal an die in den Kameras beobachteten Kanten angepasst, um die Pose zu bestimmen. Hervorzuheben ist, dass insbesondere industriell relevante Objekte, wie z.B. ein Motorblock, mit dem kantenbasierten Verfahren verfolgt werden können.
Der Schwerpunkt der nun folgenden Entwicklungen liegt auf der Vereinfachung der Nutzbarkeit durch ein intuitives Teaching sowie auf der Verbesserung des Trackings bezüglich Genauigkeit und Robustheit. Wie geplant ist das Tracking per REST-Schnittstelle für die ARVIDA-Projektpartner verfügbar. Für Anwendungen in der Virtual Reality wird in den folgenden Projektabschnitten das Tracking von Kopfpositionen und Eingabegeräten forciert. Über die Referenzarchitektur können die Trackingdienste dann angebunden werden, um z.B. mit Darstellungen auf Projektionswänden zu interagieren. Herausforderungen sind, wie auch schon beim markerlosen Objekttracking, eine hohe Genauigkeit bei gleichzeitig hoher Messrate und geringer Latenz.