Tutkimusaineistot

Oulun nauhoitearkisto (ONA)

Oulun nauhoitearkisto (ONA) on perustettu 1967. Arkistossa säilytetään opiskelijoiden ja henkilökunnan nauhoittamia tallenteita. Kokoelmissa on yhteensä yli 7 000 tuntia nauhoitteita.

ONA sisältää useita aineistokategorioita, jotka ovat seuraavat:

 • murrenauhoitukset
 • puhekielen ja sosiaalimurteiden nauhoitteet
 • lapsenkielen nauhoitteet
 • itämerensuomalaisten vähemmistökielten nauhoitteet
 • kulttuurihistorialliset nauhoitteet.

Muu arkisto

Suomen kielen arkisto sisältää nauhoitteiden lisäksi seuraavat sanasto- ja nimistökokoelmat:

 • noin 32 500 paikannimilippua suomenkielisiä paikannimiä alueittain järjestettynä
 • noin 10 000 sanalippua paikkakunnittain järjestettynä
 • Karjalan kielen sanakirjan lippuja
 • kopioita Suomen murteiden sanakirjan arkistosta (SNSA); yhteensä 492 mikrofilmirullaa
 • osa Nimiarkiston paikannimilippukokoelmista; yhteensä 210 mikrofilmirullaa
 • Yhdysvaltoihin muuttaneiden kirjeitä yhteensä 25 mikrofilmirullaa
 • useita mikrokorttikokoelmia (mm. Oulun korpus - 70 korttia)
 • noin 1 400 koululaisten kirjoitelmaa.

Kokoelmien lisäksi arkistossa ovat säilytteillä oppiaineen kandidaatintutkielmat (lukuvuoteen 2014 - 2015 asti) ja pro gradu -tutkielmat (vuoteen 2012 asti) sekä lisensiaatintutkielmat ja väitöskirjat.

Koko Oulun nauhoitearkisto on digitoitu, ja osa siitä on siirretty myös Kielipankkiin. Oulun nauhoitearkiston aineistoa on mahdollista saada tutkimustarkoitukseen. Aineistoasioissa voi olla yhteydessä yliopistonlehtori Niina Kunnakseen  (puh. 0294483476 tai etunimi.sukunimi[at]oulu.fi).

Kansainvälinen oppijansuomen korpus (International Corpus of Learner Finnish) ICLFI

Kansainvälinen oppijansuomen korpus, International Corpus of Learner Finnish (ICLFI), sisältää suomi vieraana kielenä -materiaalia, joka on tuotettu pääasiassa harjoituskirjoituksina luokkahuonetilanteissa yli kahdessakymmenessä ulkomaisessa yliopistossa. Aineiston koko on tällä hetkellä noin miljoona sanetta. Aineisto on taitotasoarvioitu (vähintään kahden arvioijan tekemänä, Common European Framework of Reference for Languages -asteikon mukaisesti), lemmatisoitu ja annotoitu kieliopillisesti. Versio on sijoitettu Tekstipankin Kopr-alustalle.

Vuoden 2013 alussa aloitettiin aineiston virhekoodauksen suunnittelu, ja itse koodaukseen päästiin vuonna 2014. Koodausta on jatkettu edelleen vuonna 2015.

Suomen kielen arkistoja muualla Suomessa

Kotimaisten kielten keskuksen arkistot osoitteessa http://www.kotus.fi.

Tietoja Kielipankin aineistoista osoitteessa https://kitwiki.csc.fi/twiki/bin/view/FinCLARIN/KielipankkiKoti.

Hesingin yliopiston Muoto-opin arkisto osoitteessa http://www.helsinki.fi/sup/tutkimus/ma.html.

Viimeksi päivitetty: 22.1.2019