Valtteri Skantsi

PhD

Projektitutkija
Kieliteknologi

Biografia

Väitöstyössäni Fennistinen kieliteknologia – aineistot, menetelmät ja mahdollisuudet tutkin, millaisia teknologisia menetelmiä suomen kielen tutkimuksen aineistojen hallinnassa käytetään ja voitaisiin tulevaisuudessa käyttää. Fennistiikka luottaa pitkistä perinteistään huolimatta hyvin perinteiseen tapaan sekä kerätä tutkimusaineistoa että käsitellä sitä. Pyrin väitöskirjan osatutkimuksillani viitoittamaan uusia, teknologia-avusteisia tapoja myös fennistiikkaan sekä samalla syventämään poikkitieteellistä yhteistyötä.

Olen toteuttanut miljoonan saneen kokoisen ICLFI-korpuksen morfologisen annotointiprosessin sekä virhekoodauksen, suunnitellut sähköisen aineistonkeruun ja siirtänyt datan Suomen Kielipankin Korp-palvelimelle. Olen myös työstänyt 1950-luvulta lähtien kerätyn, valtavan kokoisen Oulun Nauhoitearkiston Kielipankin LAT-alustalle sekä luonut aineistoon metatietojen keräyssysteemin. Oulun yliopiston historian oppiaineeseen olen rakentanut mikrokorttien sähköisen selaussysteemin. Olen osa TurkuNLP-kieliteknologiryhmää sekä Northern Sociolinguistic Encounters -tutkimusryhmää, joka taas on osa laajempaa Oulun yliopiston Transcultural Encounters -tutkimuskeskusta.

Tutkimusaiheet

  • korpuslingvistiikka
  • kieliteknologia
  • sähköinen aineistonhallinta

Tutkimusryhmät

  • TurkuNLP (Natural Language Processing)
  • Northern Sociolinguistic Encounters (NSE)