Objektsegmentering och klassificering med hjälp av 3D-kamera

I denna artikel föreslås ett visionssystem som använder en 3D-kamera för segmentering av scener och klassificering av fotgängare. Systemet upptäcker och segmenterar objekt i förgrunden, mäter deras avstånd till kameran och klassificerar dem i fotgängare och hinder som inte är fotgängare. Kombinationen av avstånds- och intensitetsbilder gör det möjligt att snabbt och exakt segmentera objekt och ger användbara navigeringsanvisningar, t.ex. avstånd och typ av närliggande objekt och markytan. I det föreslagna tillvägagångssättet segmenteras en 3D-avståndsbild med hjälp av histogrambehandling och medelförskjutning av kluster. Markytan upptäcks genom att uppskatta dess normalvektor i 3D-rummet. Fourier- och GIST-deskriptorer tillämpas sedan på varje upptäckt område för att extrahera form- och texturegenskaper. Slutligen används stödvektormaskiner för att klassificera objekt. I det här dokumentet fokuserar vi på att särskilja områden för fotgängare från områden som inte är fotgängare. Det föreslagna systemets prestanda utvärderas med två dataset. Det ena datasetet för segmentering av objekt och klassificering av fotgängare har vi förvärvat med hjälp av en 3D-kamera, det andra är ett offentligt RGB-D-dataset för upptäckt av människor. Experimentella resultat visar att det föreslagna systemet presterar bra jämfört med vissa befintliga segmenterings- och funktionsutvinningsmetoder.

Lämna ett svar

Lämna ett svar

Din e-postadress kommer inte publiceras.