Korkeaulotteinen kausaalipäättely harvalla ja harhaa korjaavalla estimoinnilla
Väitöstilaisuuden tiedot
Väitöstilaisuuden päivämäärä ja aika
Väitöstilaisuuden paikka
OP-sali (L10), Linnanmaan kampus
Väitöksen aihe
Korkeaulotteinen kausaalipäättely harvalla ja harhaa korjaavalla estimoinnilla
Väittelijä
Filosofian maisteri Zewude Alemayehu Berkessa
Tiedekunta ja yksikkö
Oulun yliopiston tutkijakoulu, Luonnontieteellinen tiedekunta, Matemaattisten tieteiden tutkimusyksikkö
Oppiaine
Matemaattiset tieteet
Vastaväittäjä
Apulaisprofessori Pekka Marttinen, Aalto-yliopisto
Kustos
Professori Mikko Sillanpää, Oulun yliopisto
Uusi sääntelyyn perustuva kehys kausaalipäättelyyn korkeaulotteisessa havaintoaineistossa
Sen ymmärtäminen, aiheuttaako hoito, politiikkatoimi tai muu interventio tietyn lopputuloksen, on keskeinen haaste monilla tieteenaloilla. Satunnaistetut kokeet ovat luotettavin tapa tunnistaa syy-seuraussuhteita, mutta koska ne eivät ole useinkaan toteutettavissa, on tutkijoiden turvauduttava havainnoivalla asetelmalla saatavaan aineistoon, jossa sekoittavat tekijät vaikeuttavat kausaalipäättelyä. Haasteet korostuvat korkeaulotteisissa tilanteissa, joissa muuttujien määrä on suuri suhteessa havaintojen määrään.
Tässä väitöskirjassa esitetään uusi matemaattinen kehys kausaalivaikutusten estimointiin korkeaulotteisessa havaintoaineistossa. Tällaisissa tilanteissa perinteiset menetelmät voivat joko epäonnistua merkityksellisten yhteyksien ja kohinan erottamisesta toisistaan tai jättää huomioimatta tärkeitä sekoittavia tekijöitä.
Ehdotettu kehys yhdistää painotetun L1- ja L0-sääntelyn niiden menetelmien kanssa, joita käytetään kovariaattien tasapainottamiseksi, jotta parannettaisiin muuttujien valintaa ja vähennettäisiin harhaa kausaalivaikutusten estimoinnissa. Yhdistämällä teoreettinen kehitystyö, simulointitutkimukset ja soveltaminen todellisiin aineistoihin menetelmä tarjoaa joustavan ja vakaan lähestymistavan, joka tunnistaa sekä vahvat että heikot sekoittavat tekijät ilman tarvetta kohteena olevan intervention eksplisiittiselle mallinnukselle. Lisäksi kehys tukee tilastollisesti pätevää päättelyä tuottamalla osuvampia luottamusvälejä korkeaulotteisissa asetelmissa.
Menetelmää on arvioitu simulointitutkimusten sekä todellisten aineistojen avulla, mukaan lukien sovellukset terveystieteiden ja genomiikan aloilta. Tulokset osoittavat, että sillä saavutetaan parempi tarkkuus verrattuna laajalti käytettyihin menetelmiin.
Väitöskirja tarjoaa käytännöllisen, avoimeen lähdekoodiin perustuvan kehyksen kausaalianalyysiin monimutkaisissa dataympäristöissä mahdollistaen luotettavamman päätöksenteon.
Tässä väitöskirjassa esitetään uusi matemaattinen kehys kausaalivaikutusten estimointiin korkeaulotteisessa havaintoaineistossa. Tällaisissa tilanteissa perinteiset menetelmät voivat joko epäonnistua merkityksellisten yhteyksien ja kohinan erottamisesta toisistaan tai jättää huomioimatta tärkeitä sekoittavia tekijöitä.
Ehdotettu kehys yhdistää painotetun L1- ja L0-sääntelyn niiden menetelmien kanssa, joita käytetään kovariaattien tasapainottamiseksi, jotta parannettaisiin muuttujien valintaa ja vähennettäisiin harhaa kausaalivaikutusten estimoinnissa. Yhdistämällä teoreettinen kehitystyö, simulointitutkimukset ja soveltaminen todellisiin aineistoihin menetelmä tarjoaa joustavan ja vakaan lähestymistavan, joka tunnistaa sekä vahvat että heikot sekoittavat tekijät ilman tarvetta kohteena olevan intervention eksplisiittiselle mallinnukselle. Lisäksi kehys tukee tilastollisesti pätevää päättelyä tuottamalla osuvampia luottamusvälejä korkeaulotteisissa asetelmissa.
Menetelmää on arvioitu simulointitutkimusten sekä todellisten aineistojen avulla, mukaan lukien sovellukset terveystieteiden ja genomiikan aloilta. Tulokset osoittavat, että sillä saavutetaan parempi tarkkuus verrattuna laajalti käytettyihin menetelmiin.
Väitöskirja tarjoaa käytännöllisen, avoimeen lähdekoodiin perustuvan kehyksen kausaalianalyysiin monimutkaisissa dataympäristöissä mahdollistaen luotettavamman päätöksenteon.
Luotu 24.3.2026 | Muokattu 25.3.2026