Alueiden välinen harvojen otteiden oppiminen: teoriat, menetelmät ja lähdevapaa paradigma

Väitöstilaisuuden tiedot

Väitöstilaisuuden päivämäärä ja aika

Väitöstilaisuuden paikka

Auditorio 101A Palotiesali

Väitöksen aihe

Alueiden välinen harvojen otteiden oppiminen: teoriat, menetelmät ja lähdevapaa paradigma

Väittelijä

Diplomi-insinööri Huali Xu

Tiedekunta ja yksikkö

Oulun yliopiston tutkijakoulu, Tieto- ja sähkötekniikan tiedekunta, Konenäön ja signaalianalyysin tutkimuskeskus (CMVS)

Oppiaine

Tietojenkäsittelytiede ja tekniikka

Vastaväittäjä

Professori Moncef Gabbouj, Tampereen korkeakouluyhteisö

Kustos

Emeritusprofessori Olli Silvén, Konenäön ja signaalianalyysin tutkimuskeskus (CMVS)

Lisää tapahtuma kalenteriin

Alueiden välinen harvojen otteiden oppiminen: teoriat, menetelmät ja lähdevapaa paradigma

Perinteiset koneoppimismenetelmät heikkenevät, kun tietojakaumat muuttuvat, erityisesti harvojen näytteiden tilanteissa. Harvojen näytteiden oppiminen yli verkkotunnusten rajojen (cross-domain few-shot learning, CDFSL) pyrkii ratkaisemaan tämän mahdollistamalla mallien yleistymisen uusille luokille ennen näkemättömissä verkkotunnuksissa. Tässä väitöskirjassa tutkitaan CDFSL:ää esittämällä yhtenäinen teoreettinen viitekehys ja kehittämällä uusia menetelmiä tunnistustehtäviin.

Aluksi laajennetaan empiirisen riskin minimointi (Empirical Risk Minimization, ERM) kaksivaiheiseksi optimointikehykseksi, joka huomioi sekä verkkotunnusten sisäiset että väliset haasteet. Tämän mallin perusteella nykyiset CDFSL-menetelmät luokitellaan neljään päätyyppiin: D-laajennus (näytetason augmentointi), ∆-sopeutus (jakaumien yhteensovittaminen), H-rajoite (hypoteesitilan rajoittaminen) ja hybridimenetelmät. Luokittelu luo perustan menetelmien systemaattiselle analyysille ja jatkokehitykselle.

D-laajennuksen osalta esitetään Inter-Source Stylization Network (ISSNet), joka parantaa kohdeverkkotunnuksen yleistymistä rikastamalla sen näytteitä eri tyylien avulla. ISSNet hyödyntää useita merkitsemättömiä apuverkkotunnuksia ja osoittaa, että tyylipohjainen augmentointi lieventää tehokkaasti verkkotunnusten eroja.

∆-sopeutuksessa määritellään uusi ongelmanasettelu: lähdedomainista riippumaton harvojen näytteiden oppiminen (source-free CDFSL, SF-CDFSL), jossa lähdedata ei ole saatavilla. Tätä varten kehitetään Information-Maximized Distance-aware Contrastive Learning (IM-DCL), joka yhdistää etäisyysherkän kontrastisen oppimisen informaation maksimointiin ja mahdollistaa tehokkaan verkkotunnusten sovituksen ilman lähdedataa. Lisäksi H-rajoitteeseen perustuva Step-wise Style Prompt Tuning (StepSPT) rajoittaa hypoteesitilaa ja parantaa oppimisen vakautta. Menetelmä säätää syöttödatan tyylejä oppivien prompttien avulla ja hienosäätää mallia vaiheittain, mikä vähentää ylioppimisen riskiä ja mahdollistaa laajojen esikoulutettujen mallien hyödyntämisen harvoissa ja lähdedatasta riippumattomissa tilanteissa.

Väitöskirja edistää merkittävästi CDFSL-tutkimusta tarjoamalla yhtenäisen teoreettisen kehyksen ja uusia menetelmiä, jotka parantavat mallien robustiutta ja yleistämiskykyä datarajoitteisissa olosuhteissa sekä tukevat sovelluksia lääketieteessä, autonomiassa ja kaukokartoituksessa.
Luotu 15.10.2025 | Muokattu 20.10.2025