Object segmentation and classification using 3-D range camera

Dieser Beitrag schlägt ein Bildverarbeitungssystem vor, das eine 3-D range camera zur Szenensegmentierung und Fußgängerklassifizierung verwendet. Das System erkennt und segmentiert Objekte im Vordergrund, misst ihre Abstände zur Kamera und klassifiziert sie in Fußgänger und Nicht-Fußgänger-Hindernisse. Die Kombination von Entfernungs- und Intensitätsbildern ermöglicht eine schnelle und genaue Segmentierung von Objekten und liefert nützliche Navigationshinweise, wie z. B. die Entfernung und Art von Objekten in der Nähe und die Bodenoberfläche. Bei dem vorgeschlagenen Ansatz wird ein 3D-Entfernungsbild mithilfe von Histogrammverarbeitung und Mean-Shift-Clustering segmentiert. Die Bodenoberfläche wird durch Schätzung ihres Normalvektors im 3-D-Raum erkannt. Fourier- und GIST-Deskriptoren werden dann auf jede erkannte Region angewendet, um Form- und Texturmerkmale zu extrahieren. Schließlich werden Support-Vektor-Maschinen zur Klassifizierung von Objekten verwendet; in dieser Arbeit konzentrieren wir uns auf die Unterscheidung von Fußgänger- und Nicht-Fußgängerregionen. Die Leistung des vorgeschlagenen Systems wird mit zwei Datensätzen bewertet. Ein Datensatz für die Objektsegmentierung und die Klassifizierung von Fußgängern wurde von uns mit einer 3-D-Entfernungskamera erfasst; der andere ist ein öffentlicher RGB-D-Datensatz für die Erkennung von Personen. Die experimentellen Ergebnisse zeigen, dass das vorgeschlagene System im Vergleich zu einigen bestehenden Segmentierungs- und Merkmalsextraktionsansätzen gut abschneidet.

Leave a Reply

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.