Object segmentation and classification using 3-D range camera

This paper proposes a vision system using a 3-D range camera for scene segmentation and pedestrian classification. System wykrywa i segmentuje obiekty na pierwszym planie, mierzy ich odległość od kamery i klasyfikuje je jako pieszych i przeszkody nieprzeznaczone dla pieszych. Połączenie obrazów zasięgu i intensywności umożliwia szybką i dokładną segmentację obiektów, a także dostarcza użytecznych wskazówek nawigacyjnych, takich jak zasięg i typ pobliskich obiektów oraz powierzchnia terenu. W proponowanym podejściu, trójwymiarowy obraz zasięgu jest segmentowany przy użyciu przetwarzania histogramów i klasteryzacji z przesunięciem średniej. Powierzchnia terenu jest wykrywana poprzez estymację jej wektora normalnego w przestrzeni trójwymiarowej. Deskryptory Fouriera i GIST są następnie stosowane do każdego wykrytego regionu w celu ekstrakcji cech kształtu i tekstury. W końcu, maszyny wektorów wspierających są wykorzystywane do klasyfikacji obiektów; w tym artykule skupiamy się na rozróżnianiu regionów pieszych i nie pieszych. Wydajność proponowanego systemu jest oceniana na dwóch zestawach danych. Jeden zbiór danych do segmentacji obiektów i klasyfikacji pieszych został pozyskany przez nas przy użyciu kamery 3-D; drugi to publiczny zbiór danych RGB-D do detekcji ludzi. Wyniki eksperymentalne pokazują, że proponowany system wypada korzystnie w porównaniu z niektórymi istniejącymi metodami segmentacji i ekstrakcji cech.

Leave a Reply

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.