Kohti tehokkaita syviä neuroverkkoja vankkaa visuaalista tunnistusta varten

Väitöstilaisuuden tiedot

Väitöstilaisuuden päivämäärä ja aika

Väitöstilaisuuden paikka

Verkossa

Väitöksen aihe

Kohti tehokkaita syviä neuroverkkoja vankkaa visuaalista tunnistusta varten

Väittelijä

Luonnontieteiden maisteri Jiehua Zhang

Tiedekunta ja yksikkö

Oulun yliopiston tutkijakoulu, Tieto- ja sähkötekniikan tiedekunta, Konenäön ja signaalianalyysin tutkimuskeskus

Oppiaine

konenäkö, tehokas ominaisuuksien esitys, kaukokartoituskuvien analysointi

Vastaväittäjä

Professori Enrico Magli, Torinon ammattikorkeakoulu

Kustos

Professori Olli Silvén, Oulun yliopisto

Vieraile väitöstilaisuudessa

Lisää tapahtuma kalenteriin

Kohti tehokkaita syviä neuroverkkoja vankkaa visuaalista tunnistusta varten

Syvät neuroverkot (DNN) ovat nousseet hallitsevaksi paradigmaksi tietokonenäön tehtävissä, mikä edistää merkittävästi visuaalisen älykkyyden järjestelmien kykyjä. Viimeaikaiset huipputekniset mallit käyttävät yleensä massiivisia parametrien lukuja ja monimutkaisia arkkitehtuurisuunnitelmia saavuttaakseen erittäin yleistetyt esitykset, jotka pystyvät sopeutumaan dynaamisiin reaalimaailman skenaarioihin. Toisaalta DNN- verkkojen laaja käyttöönotto reunalaineissa laitteissa (esim. UAVs, matkapuhelimet ja satelliitit) on luonut tiukat tehokkuusvaatimukset. Toisaalta kuvaanturien melu ja ympäristöhäiriöt voivat heikentää mallin syrjivyyttä, mikä johtaa tunnistustarkkuuden vähenemiseen reaalimaailmassa. Näin ollen kevyiden DNN-verkkojen kehittäminen, jotka säilyttävät korkean suorituskyvyn monimutkaisissa olosuhteissa, on edelleen kriittinen haaste käytännön tekoälysovelluksille.

Tätä tarkoitusta varten tämä opinnäytetyö keskittyy kevyiden DNN-verkkojen tarkkuustehokkuuden kompromissin optimointiin. Toisaalta kehitämme erityisiä kevyitä arkkitehtuurimalleja ominaisuuksien tehokkaaseen esittelyyn ja parempaan erottelukykyyn. Toisaalta tutkimme myös tehokkaita kvantisointistrategioita lieventääksemme äärimmäisen matalabittisten DNN-verkkojen ja täyden tarkkuuden DNN-verkkojen välistä suorituskykyeroa. Lisäksi käytämme Mediaan Robust Extended Local Binary Patternin (MRELBP) ansioita esitelläksemme vankan DNN:n erilaisia meluisia korruptioita vastaan.

Aloitamme tutkimalla tehokasta ominaisuuksien yhdistämistä ja objektin vastauksen hienostamista optisissa etätunnistuskuvissa (ORSI-SOD) esiintyvien esineiden havaitsemiseksi. Mallimme nimenomaisesti paikallisia rajaviitteitä ja lievennämme ylimääräisten taustojen aiheuttamia objektiominaisuuksien tukahduttamista kevyiden DNN-verkkojen suorituskyvyn parantamiseksi monimutkaisessa kohtauksessa. Seuraavaksi ehdotamme ensimmäistä ORSISOD-arkkitehtuuria, joka perustuu kevyeen näkyvyyden perustamalliin, jotta saavutetaan poikkeuksellinen tehokkuuden ja tarkkuuden vaihtoehto. Sitten ehdotamme dynaamista kynnysoppimista ja syvää semanttista ominaisuusohjetta binaaristen hermonverkkojen (BNN) tyytymättömän tarkkuuden parantamiseksi, mikä on DNN-verkkojen äärimmäinen kvantiointitapaus. Lopuksi ehdotamme uutta melua kestävää konvoluutio-operaattoria, joka käsittelee monipuolista todellisen maailman melun häiriötä.
Luotu 14.11.2025 | Muokattu 17.11.2025