Kohti tehokkaita syviä neuroverkkoja vankkaa visuaalista tunnistusta varten
Väitöstilaisuuden tiedot
Väitöstilaisuuden päivämäärä ja aika
Väitöstilaisuuden paikka
Verkossa
Väitöksen aihe
Kohti tehokkaita syviä neuroverkkoja vankkaa visuaalista tunnistusta varten
Väittelijä
Luonnontieteiden maisteri Jiehua Zhang
Tiedekunta ja yksikkö
Oulun yliopiston tutkijakoulu, Tieto- ja sähkötekniikan tiedekunta, Konenäön ja signaalianalyysin tutkimuskeskus
Oppiaine
konenäkö, tehokas ominaisuuksien esitys, kaukokartoituskuvien analysointi
Vastaväittäjä
Professori Enrico Magli, Torinon ammattikorkeakoulu
Kustos
Professori Olli Silvén, Oulun yliopisto
Kohti tehokkaita syviä neuroverkkoja vankkaa visuaalista tunnistusta varten
Syvät neuroverkot (DNN) ovat nousseet hallitsevaksi paradigmaksi tietokonenäön tehtävissä, mikä edistää merkittävästi visuaalisen älykkyyden järjestelmien kykyjä. Viimeaikaiset huipputekniset mallit käyttävät yleensä massiivisia parametrien lukuja ja monimutkaisia arkkitehtuurisuunnitelmia saavuttaakseen erittäin yleistetyt esitykset, jotka pystyvät sopeutumaan dynaamisiin reaalimaailman skenaarioihin. Toisaalta DNN- verkkojen laaja käyttöönotto reunalaineissa laitteissa (esim. UAVs, matkapuhelimet ja satelliitit) on luonut tiukat tehokkuusvaatimukset. Toisaalta kuvaanturien melu ja ympäristöhäiriöt voivat heikentää mallin syrjivyyttä, mikä johtaa tunnistustarkkuuden vähenemiseen reaalimaailmassa. Näin ollen kevyiden DNN-verkkojen kehittäminen, jotka säilyttävät korkean suorituskyvyn monimutkaisissa olosuhteissa, on edelleen kriittinen haaste käytännön tekoälysovelluksille.
Tätä tarkoitusta varten tämä opinnäytetyö keskittyy kevyiden DNN-verkkojen tarkkuustehokkuuden kompromissin optimointiin. Toisaalta kehitämme erityisiä kevyitä arkkitehtuurimalleja ominaisuuksien tehokkaaseen esittelyyn ja parempaan erottelukykyyn. Toisaalta tutkimme myös tehokkaita kvantisointistrategioita lieventääksemme äärimmäisen matalabittisten DNN-verkkojen ja täyden tarkkuuden DNN-verkkojen välistä suorituskykyeroa. Lisäksi käytämme Mediaan Robust Extended Local Binary Patternin (MRELBP) ansioita esitelläksemme vankan DNN:n erilaisia meluisia korruptioita vastaan.
Aloitamme tutkimalla tehokasta ominaisuuksien yhdistämistä ja objektin vastauksen hienostamista optisissa etätunnistuskuvissa (ORSI-SOD) esiintyvien esineiden havaitsemiseksi. Mallimme nimenomaisesti paikallisia rajaviitteitä ja lievennämme ylimääräisten taustojen aiheuttamia objektiominaisuuksien tukahduttamista kevyiden DNN-verkkojen suorituskyvyn parantamiseksi monimutkaisessa kohtauksessa. Seuraavaksi ehdotamme ensimmäistä ORSISOD-arkkitehtuuria, joka perustuu kevyeen näkyvyyden perustamalliin, jotta saavutetaan poikkeuksellinen tehokkuuden ja tarkkuuden vaihtoehto. Sitten ehdotamme dynaamista kynnysoppimista ja syvää semanttista ominaisuusohjetta binaaristen hermonverkkojen (BNN) tyytymättömän tarkkuuden parantamiseksi, mikä on DNN-verkkojen äärimmäinen kvantiointitapaus. Lopuksi ehdotamme uutta melua kestävää konvoluutio-operaattoria, joka käsittelee monipuolista todellisen maailman melun häiriötä.
Tätä tarkoitusta varten tämä opinnäytetyö keskittyy kevyiden DNN-verkkojen tarkkuustehokkuuden kompromissin optimointiin. Toisaalta kehitämme erityisiä kevyitä arkkitehtuurimalleja ominaisuuksien tehokkaaseen esittelyyn ja parempaan erottelukykyyn. Toisaalta tutkimme myös tehokkaita kvantisointistrategioita lieventääksemme äärimmäisen matalabittisten DNN-verkkojen ja täyden tarkkuuden DNN-verkkojen välistä suorituskykyeroa. Lisäksi käytämme Mediaan Robust Extended Local Binary Patternin (MRELBP) ansioita esitelläksemme vankan DNN:n erilaisia meluisia korruptioita vastaan.
Aloitamme tutkimalla tehokasta ominaisuuksien yhdistämistä ja objektin vastauksen hienostamista optisissa etätunnistuskuvissa (ORSI-SOD) esiintyvien esineiden havaitsemiseksi. Mallimme nimenomaisesti paikallisia rajaviitteitä ja lievennämme ylimääräisten taustojen aiheuttamia objektiominaisuuksien tukahduttamista kevyiden DNN-verkkojen suorituskyvyn parantamiseksi monimutkaisessa kohtauksessa. Seuraavaksi ehdotamme ensimmäistä ORSISOD-arkkitehtuuria, joka perustuu kevyeen näkyvyyden perustamalliin, jotta saavutetaan poikkeuksellinen tehokkuuden ja tarkkuuden vaihtoehto. Sitten ehdotamme dynaamista kynnysoppimista ja syvää semanttista ominaisuusohjetta binaaristen hermonverkkojen (BNN) tyytymättömän tarkkuuden parantamiseksi, mikä on DNN-verkkojen äärimmäinen kvantiointitapaus. Lopuksi ehdotamme uutta melua kestävää konvoluutio-operaattoria, joka käsittelee monipuolista todellisen maailman melun häiriötä.
Luotu 14.11.2025 | Muokattu 17.11.2025