2D-kuvasegmentoinnista 3D-pistepilvisegmentointiin laaja-alaisten ulkomaisemien ymmärtämiseksi

Väitöstilaisuuden tiedot

Väitöstilaisuuden päivämäärä ja aika

Väitöstilaisuuden paikka

Linnanmaa, Oulun Puhelin -sali (L5)

Väitöksen aihe

2D-kuvasegmentoinnista 3D-pistepilvisegmentointiin laaja-alaisten ulkomaisemien ymmärtämiseksi

Väittelijä

Tekniikan maisteri Bike Chen

Tiedekunta ja yksikkö

Oulun yliopiston tutkijakoulu, Tieto- ja sähkötekniikan tiedekunta, Biomimetiikka ja älykkäät järjestelmät

Oppiaine

Tietotekniikka

Vastaväittäjä

Professori Bastian Leibe, RWTH Aachenin yliopisto

Kustos

Professori Juha Röning, Oulun yliopisto

Vieraile väitöstilaisuudessa

Lisää tapahtuma kalenteriin

2D-kuvasegmentoinnista 3D-pistepilvisegmentointiin laaja-alaisten ulkomaisemien ymmärtämiseksi

Semanttinen kuvan segmentointi (SiS) ja pistepilven segmentointi (PCS) pyrkivät erottamaan kuvan ja pistepilven johdonmukaisiin ja merkityksellisiin osiin. Molemmilla tehtävillä on tärkeä rooli robotiikassa ja autonomisissa ajoneuvoissa.

Olemassa olevilla SiS-malleilla ei pystytä parantamaan segmentoinnin suoritusky- kyä, eikä niillä täten kyetä tuottamaan tarkoituksellisia epävarmuutta kuvaavia arvoja ilman raskasta laskennallista taakkaa. Väitöskirjassa suunnittelemme uuden edistyksellisen häviöfunktion, hyperbolisen epävarmuushäviön (HyperUL), segmentoinnin suorituskyvyn parantamiseksi hyödyntäen hyperbolisen avaruuden ominaisuutta. Lisäksi kehitämme hyperbolisen epävarmuuden arviointimenetelmän, joka tuottaa merkityksellisiä epävarmuusarvoja mitättömillä laskentakustannuksilla. Laajat kokeelliset tulokset Cityscapes-, UAVid- ja ACDC-aineistoilla osoittavat esitellyn HyperUL- ja epävarmuuden arviointimenetelmän tehokkuuden.

PCS:ssä keskitymme etäisyyskuviin perustuviin malleihin laaja-alaisille ulkotilojen pistepilville. Olemassa olevat mallit eivät pysty tarkoituksen mukaisesti ja tehokkaasti käsittelemään laaja-alaisia ulkotilan pistepilviä. Tässä opinnäytetyössä ehdotamme uutta projektiomenetelmää nimeltään scan unfolding++ (SU++), jolla muunnetaan laaja-alainen ulkotilan pistepilvi etäisyyskuvaksi ja vältetään suuri määrä puuttuvia arvoja. Lisäksi esittelemme interpolointimenetelmän, etäisyysriippuvaisen K-lähimmän naapurin interpoloinnin (KNNI), jolla voidaan täydentää luodun etäisyyskuvan puuttuvia arvoja. Suunnittelemme myös uudet etäisyyskuviin perustuvat neuroverkot, jotka ovat filling missing values network (FMVNet) ja Fast FMVNet, huippuluokan suorituskyvyn saavuttamiseksi. Kehitämme myös uuden jälkikäsittelykomponentin nimeltään trainable pointwise decoder module (PDM) lopullisten pistekohtaisten ennusteiden tarkentamiseksi ja suorituskyvyn parantamiseksi entisestään. Esittelemme myös virtuaalisen etäisyyskuvaohjatun kopioi-kierrä-liitä (VRCrop) -strategian, joka korvaa yleisesti käytetyn kopioi-liitä- ja kopioi-kierrä-liitä-operaation instanssien lisäyksessä opetuksen aikana. Lisäksi esittelemme parannetun VRCrop (VRCrop++) -strategian ja globaalin kopioi-kierrä-liitä (GCrop) -tekniikan segmentointimallien suorituskyvyn parantamiseksi entisestään.
Luotu 11.11.2025 | Muokattu 12.11.2025