Objektsegmentering og -klassificering ved hjælp af 3D-kamera

I denne artikel foreslås et visionssystem, der anvender et 3D-kamera til segmentering af scener og klassificering af fodgængere. Systemet registrerer og segmenterer objekter i forgrunden, måler deres afstand til kameraet og klassificerer dem i fodgængere og forhindringer, der ikke er fodgængere. Kombinationen af afstands- og intensitetsbilleder giver mulighed for hurtig og præcis segmentering af objekter og giver nyttige navigationsanvisninger som f.eks. afstand og type af nærliggende objekter og jordoverfladen. I den foreslåede metode segmenteres et 3D-afstandsbillede ved hjælp af histogrambehandling og mean-shift clustering. Jordoverfladen registreres ved at estimere dens normalvektor i 3D-rummet. Fourier- og GIST-deskriptorer anvendes derefter på hvert detekteret område for at udtrække form- og teksturtræk. Endelig anvendes støttevektormaskiner til at klassificere objekter; i denne artikel fokuserer vi på at skelne mellem områder med og uden fodgængere. Det foreslåede systems ydeevne evalueres med to datasæt. Det ene datasæt til segmentering af objekter og klassificering af fodgængere er erhvervet af os ved hjælp af et 3D-kamera; det andet er et offentligt RGB-D-datasæt til detektering af personer. Eksperimentelle resultater viser, at det foreslåede system klarer sig godt sammenlignet med nogle eksisterende segmenterings- og funktionsekstraktionsmetoder.

Leave a Reply

Skriv et svar

Din e-mailadresse vil ikke blive publiceret.