Giellagas-instituutti julkaisee koltansaamen ja pohjoissaamen digitaaliset sanakirjat

Tiistai, elokuu 25, 2020

Oulu universiteeʹtt Giellagas-institutt õlmstâtt nuõrtt- da tâʹvvsääʹmǩiõl digitaalʼlaid sääʹnǩiiʹrjid
Oulu universitehta Giellagas-instituhtta almmuha nuortalašgiela ja davvisámegiela digitála sátnegirjjiid

Julkaisutilaisuus on 25.8.2020 klo 10 osoitteessa https://oulu.zoom.us/j/69319349687

Pohjoissaame-suomi digitaalisen sanakirjan käsikirjoituksen on tehnyt emeritusprofessori Pekka Sammallahti aikaisempien sanakirjojensa (1989 ja 1993) pohjalta. Sanakirja sisältää runsaat 50.000 hakusanaa ja tekijä päivittää sitä jatkuvasti. Sammallahden sanakirja julkaistaan Tromssan yliopiston Divvun-projektin alustalla, osoitteessa http://satni.org/sammallahtismefin (linkki toimii 25.8.20 lähtien).

Uudessa digitaalisessa suomi-koltansaame sanakirjassa suomenkielisten hakusanojen määrä on yli 16.000 ja koltankielisten vastineiden lähes 19.000. Sanakirja julkaistaan Tromssan yliopiston saamen kieliteknologian keskuksen, Giellateknon, alustalla ja se löytyy osoitteesta https://saan.oahpa.no/fin/sms/

Suomi-koltansaamen painettu sanakirja, jossa hakusanat ovat suomeksi, ilmestyy vuoden 2020 lopussa. Sammallahden painetun sanakirjan julkaisusta ei ole vielä päätetty. Molempien sanakirjojen toimitustyö on tehty pääosin Opetus- ja kulttuuriministeriön Oulun yliopiston Giellagas-instituutille myöntämän erityisrahoituksen turvin. Giellagas-instituutilla on valtakunnallinen vastuu järjestää ja edistää saamen kielen ja saamelaisen kulttuurin ylintä opetusta ja tutkimusta Suomessa.

Suomi-koltansaame sanakirjan toimitustyöhön ovat osallistuneet Oulun yliopiston Giellagas-instituutin koltansaamen opettajat Eino Koponen ja Miika Lehtinen ja Saamelaiskäräjien koltansaamen kääntäjä Merja Fofonoff ja oppimateriaalityöntekijä Raija Lehtola, sekä Helsingin yliopistossa toimivat digitaalisanakirjojen ja leksikografisten tietokantojen asiantuntijat Jack Rueter, Khalid Alnajjar ja Mika Hämäläinen. Alkuperäiskäsikirjoituksen tekijänoikeudet kuuluvat Saamelaiskäräjille.

Sanakirjan pohjana on Pekka Sammallahden ja Jouni Moshnikoffin v. 1991 julkaisema teos, jota Jouni ja Satu Moshnikoff ovat täydentäneet erityisesti 2000-luvun alkuvuosina. Sanojen lukumäärä on uudessa sanakirjassa huomattavasti suurempi: aiemmassa oli n. 10.000 suomenkielistä hakusanaa ja niiden noin 11.000 koltankielistä merkitysvastinetta.

Koltansaamen kirjallinen käyttö on viimeisten vuosien aikana laajentunut uusille alueille, joista kaikkia ei 30 vuotta sitten ollut olemassakaan tai joista puhuttaessa oli pakko turvautua suomen kieleen. Tämän kehityksen myötä kielen sanasto on merkittävästi kasvanut. Sanaston uudistuminen on ollut erityisen nopeata viimeisen vuosikymmenen aikana. Nyt ilmestyvän sanakirjan ainekset ovat kuitenkin olleet koossa jo tätä ennen, eikä työhön käytössä olleiden resurssien rajallisuus ole mahdollistanut alkuperäisen käsikirjoituksen perusteellista muokkausta. 

Koltansaameen tulleet uudet sanat ovat osaksi tietoisen kehittelyn tulosta, osaksi erilaisten (virallisten ja joskus kaunokirjallistenkin) tekstien käännöstyön ”sivutuotteena” syntynyttä ainesta. Koltansaamen kirjakielen kehitys näkyy paitsi sanaston kasvussa myös kielen normien uudistumisessa ja täsmentymisessä. 

Kielennormitustyötä on tehty erityisesti Suomen, Norjan ja Ruotsin Saamelaiskäräjien yhteispohjoismaisen kieliyhteistyöelimen Sääʹm Ǩiõllkaʹlddin (Sámi Giellagáldun) koltansaamen kielijaostossa, jonka ohjeet ja päätökset on pyritty ottamaan toimitustyössä huomioon. Koltansaame on kuitenkin vielä kehittyvä kirjakieli, eikä kaikkiin normitusta koskeviin kysymyksiin ole ollut saatavissa valmista vastausta. Näissä kuten muissakin toimitustyön yksityiskohdissa sanakirjan toimittajat ovat tehneet ratkaisunsa parhaan ymmärryksensä mukaisesti. 

Digitaalinen sanakirja hyödyntää pienten kielten sanakirjatyötä varten kehitettyä Veʹrdd-työkalua (koltansaamen veʹrdd tarkoittaa ʼvirtaʼ). Veʹrdd juontaa juurensa pyrkimykseen yhdistää kieliteknologian kehitys, kielendokumentointi ja -tutkimus sekä kieliyhteisön elvytystyö. 

Veʹrdd käyttää sanakirjan toimittamisen apuna tekoälyä, joka mm. taivuttaa sanoja automaattisesti eri muotoihin. Tämä säästää sanakirjatyöhön kuluvaa aikaa, sillä jokaisen sanan kaikkia taivutusmuotoja ei tarvitse kirjoittaa käsin. Toisaalta, käyttäjällä on myös mahdollisuus korjata tekoälyn tuottamia virheellisiä muotoja. Sanakirjan koneluettavuus mahdollistaa sen, että nämä korjaukset voidaan syöttää takaisin tekoälylle, jolloin sen käsitys kielen taivutusmuodoista tarkentuu. Sanakirjan kehitys on vain osa vähemmistökielen kuvausta ja elvytystä. Samaa tekoälyä ja Ve’rddillä tuotettua sanastoa voidaan käyttää suoraan myös oikolukusovelluksissa sekä kielenopetusohjelmissa.

Sanakirjan toimittajat ovat tietoisia siitä, että nyt ilmestyvä teos ei vielä vastaa täydellistä ajantasaista sanakirjaa odottavien toiveita, mutta rohkenevat kuitenkin toivoa, että se olisi yksi askel kohden tätä tärkeää tavoitetta. Digitaalisessa muodossa olevaa sanakirjaa on myös helppo täydentää, laajentaa ja korjailla sitä mukaa kuin tiedot koltansaamen sanavaroista ja kirjakielen normeista täsmentyvät. Rajoittavana tekijänä ovat kuten aina rajalliset resurssit, mitkä koltansaamen kyseessä ollen liittyvät rahan ohella siihen, että kaikkien tähän työhön pystyvien panosta kaipaavat kipeästi myös monet muut koltansaamen parissa tehtävät työt.

 

Oulu universiteeʹtt Giellagas-institutt õlmstâtt nuõrtt- da tâʹvvsääʹmǩiõl digitaalʼlaid sääʹnǩiiʹrjid

Õlmstâʹttempodd lij 25.8.2020 č. 10 čuäjtõõzzâst https://oulu.zoom.us/j/69319349687

Tâʹvvsääʹm-lääʹdd digitaalʼla sääʹnnǩeeʹrj ǩiõttǩeerjtõõzz lij raajjâm emeritusprofessor Pekka Sammallahti suu jiõčč raajjâm preʹnttjum sääʹnnǩiiʹrji (1989 da 1993) vuâđald. Sääʹnnǩeʹrjj âânn seʹst nuʹtt 50 000 ooccâmsääʹnned da raajji peiʹvvad tõn ǩeeʹjjmieʹldd ääiʹj. Sammallahti sääʹnnǩeeʹrj õlmstââʹttet Trooms universiteeʹtt Divvun-joouk vuâlast. Čuäjtõs lij http://satni.org/sammallahtismefin (liŋkk toiʹmmai 25.8.2020 rääʹjest).

Ođđ digitaalʼla lääʹdd-sääʹm -sääʹnnǩeeʹrjest lie pâʹjjel 16 000 lääʹddǩiõllsiʹžžed ooccâmsääʹnned da miâlggâd 19 000 sääʹmǩiõllsiʹžžed vasttjed. Sääʹnnǩeeʹrj õlmstââʹttet Trooms universiteeʹtt sääʹm ǩiõllteknologiakõõskõõzz, Giellatekno, vuâlast. Sääʹnnǩeʹrjj käunnai čuäjtõõzzâst https://saan.oahpa.no/fin/sms/

Priʹnttjum lääʹdd-sääʹm -sääʹnnǩeʹrjj iʹlmmstââvv eeʹjj 2020 looppâst. Sammallahti sääʹnnǩeeʹrj priʹnttjum versio õlmstâʹttmest jeäʹla võl tuʹmmjam. Kuhttui sääʹnnǩiiʹrji tååimtemtuâjj lij tuejjuum jeäʹnmõsân Mättʼtem- da kulttuurministeria Oulu universiteeʹtt Giellagas-instituʹtte uʹvddem spesialteäggtõõzz veäkka. Giellagas-instituuttâst lij väʹlddkååddlaž västtõs riâššâd da oouʹdeed sääʹmǩiõl da -kulttuur pââimõs mättʼtõõzz da tuʹtǩǩummuž Lääʹddjânnmest. 

Lääʹdd-sääʹm -sääʹnnǩeeʹrj tååimtemtuõjju lie vuässõõttâm Oulu universiteeʹtt Giellagas-instituutt sääʹmǩiõl uʹčteeʹl Eino Koponen da Miika Lehtinen, Sääʹmteeʹǧǧ sääʹmǩiõl jåårǥlõʹtti Merja Fofonoff da mättmateriaaltuâjjlaž Raija Lehtola, di Heʹlssen universiteeʹttest tuejjeei leksikograaflai teâttvuâđai äʹšštoobdi Jack Rueter, Khalid Alnajjar da Mika Hämäläinen. Originaalǩiõttǩeerjtõõzz raajjivuõiggâdvuõđ koʹlle Sääʹmtegga. 

Sääʹnnǩeeʹrj vuâđđan lij Pekka Sammallahti da Jouni Moshnikooff eeʹjj 1991 sääʹnnǩeʹrjj, koon Jouni da Satu Moshnikoff lie tiuddääm, jeäʹnmõsân 2000-lååǥǥ alggiiʹjjin. Ođđ sääʹnnǩeeʹrjest lie jiânnai jeäʹnab sääʹn ko ouddâl: oouʹdab ǩeeʹrjest leʹjje nuʹtt 10 000 lääʹddǩiõllsiʹžžed ooccâmsääʹnned da tõõi nuʹtt 11 000 sääʹmǩiõllsiʹžžed miârktõsvasttjed. 

Sääʹmǩiõl ǩeerjlaž âânn lij liâvvnam mââimõs iiʹjji ääiʹj ođđ vuuʹdid, mõõk puk jie ni käunnʼjam 30 eeʹjj mââiårra, leʹbe tõõi pirr mainsteen leäi päkk mainsted lääddas. Tän ouddnummuž mieʹldd sääʹmǩiõl sannõs še lij šorrnam. Ođđ sääʹn lie puättam jåʹttlummsen mââimõs lååi eeʹjj ääiʹj. Tän ođđ sääʹnnǩeeʹrj aunnâz lie kuuitâǥ leämmaž norrum juʹn ouddâl tõn, da resuurs lie tååimtemtuâjast leämmaž tõn veeʹrd occanj, što originaalǩiõttǩeerjtõõzz jie leäkku pâsttam vuâđlânji ooʹđeed. 

Sääʹmǩiõʹlle puättam ođđ sääʹn lie vuäzzas rajjum terminologiatuâjast, vuäzzas tõk lie šõddâm jeeʹresnallšem (veerǥlai da måttmešt mooččâsǩeerjlai) teeʹksti jåårǥlâttmõõžžâst. Sääʹmǩiõl ǩeʹrjjǩiõl ouddnummuž kuâsttai sannõõzz lââʹssen tõʹst, što ǩiõl noorm lie ođsmam da šõddâm tääʹrǩben.

Ǩiõl normmeemtuâjj lij tuejjuum jeäʹnmõsân Lääʹddjânnam, Taar da Ruõcc Sääʹmtiiʹǧǧi õhttsažtâʹvvjânnamla ǩiõllõhttsažtuâjjorgaan Sääʹm Ǩiõllkaʹlddi sääʹmǩiõl ǩiõlljuâǥǥtõõzzâst. Ǩiõlljuâǥǥtõõzz vuäppõõzzid da tuʹmmstõõǥǥid lie põrggâm väʹldded lokku tååimtemtuâjast. Sääʹmǩiõll lij kuuitâǥ õinn ouddneei ǩeʹrjjǩiõll, ij-ǥa juõʹǩǩ normmeemkõõččmõʹšše leäkku käunnʼjam vaalmâš västtõs. Täin da jeeʹres tååimtemtuâj detaaljin sääʹnnǩeeʹrj tååimteei lie tuejjääm tââʹđ mieʹldd, mâiʹd jiijj lie vuäinnam pueʹrmõssân. 

Digitaalʼlaž sääʹnnǩeeʹrj tååimteeʹmest lie âânnam uʹcc ǩiõli sääʹnnǩeʹrjjtuâj vääras rajjum Veʹrdd-tuâjjneävv. Veeʹrd vuâđđjuurdân lij õhtteed ǩiõllteknologia, ǩiõlldokumentâʹsttem da -tuʹtǩǩeem di ǩiõllõhttõõzz jeälltemtuâj. 

Veʹrdd âânn sääʹnnǩeeʹrj tååimtummuž veäʹǩǩen ”mašinajieʹrm”, mii jeäʹrbi mieʹldd soojat saaʹnid automaattlânji jeeʹres ååʹblǩid. Tät šeäštt tååimteeʹji ääiʹj, ǥu juõʹǩǩ sääʹn juõʹǩǩ soojtemååʹbleǩ ij taarbâž ǩeeʹrjted ǩiõđivuiʹm. Nuuʹbb beäʹlnn õõʹnnʼjest lij vuäittmõš teevvad mašinajieʹrm tuejjeem puästååʹblǩid. Mašinalooǥǥtummuš oudd vuäittmõš uʹvdded teevtõõzzid mååust mašinajeärmma, mii mättai teʹl jeäʹnab ǩiõl soojtemååʹblǩin. Sääʹnnǩeeʹrj ooudâsviikkâm lij pâi õhtt pieʹǩǩ uuʹccablååǥǥǩiõl tuʹtǩǩummšest da jeälltummšest. Seämma mašinajieʹrm da Viiʹrdin rajjum sannõõzz vueiʹtet ââʹnned seämmanalla vuõigglookkâm- da ǩiõllmättʼtemprograammin. 

Sääʹnnǩeeʹrj tååimteei kâʹl teäʹtte, što ååʹn iʹlmmštõõvvi ǩeʹrjj ij võl väʹstted sij vuârddmõõžžid, ǩeäk vueʹrdde tiiudla, ääiʹjmeâldla sääʹnnǩeeʹrj, leša tååimteei tuäivva, što sääʹnnǩeʹrjj leʹčči õhtt läuʹǩǩ tän tääʹrǩes meäʹr årra. Digitaalʼla sääʹnnǩeeʹrj lij še hiâlpp tiuddeed, šuureed da teeveed tââʹđ mieʹldd, ko teâđ sääʹmǩiõl sannõõzzâst da ǩeʹrjjǩiõl noormin tärkkâʹvve. Mâʹte ääʹl, tuâj rääʹjat resurssvääʹnn, mii sääʹmǩiõl õhttvuõđâst iʹlla pâi teäʹǧǧ, leša tõt še, što pukin ǩeäk pââstče tän tuâj tuejjeed lij juʹn tiudd håmm jeeʹres tuâjaivuiʹm sääʹmǩiõlin.

 

Oulu universitehta Giellagas-instituhtta almmuha nuortalašgiela ja davvisámegiela digitála sátnegirjjiid

Almmuhandilálašvuohta lea 25.8.2020 dii. 10 čujuhusas https://oulu.zoom.us/j/69319349687

Davvisámegiela-suoma digitála sátnegirjji giehtačállosa lea čállán emeritusprofessor Pekka Sammallahti iežas 1989 ja 1993 prentejuvvon sátnegirjjiid vuođul. Digitála sátnegirji sisdoallá badjel 50.000 ohcansáni ja čálli lasiha sániid ain dađistaga.  Sammallahti sátnegirji almmuhuvvo Romssa universitehta Divvun-projeavtta vuolážis čujuhusas http://satni.org/sammallahtismefin (liŋka doaibmá 25.8.20 rájes)

Ođđa suopma-nuortalašgiella -sátnegirjjis suomagiel ohcansánit leat badjel 16.000 ja nuortalašgiel sátnevástagat lagabui 19.000. Dát sátnegirji fas almmuhuvvo Romssa universitehta giellateknologiija guovddáža, Giellatekno, vuolážis. Sátnegirji gávdno čujuhusas  https://saan.oahpa.no/fin/sms/

Suopma-nuortalašgiella -sátnegirjji deaddiluvvon veršuvdna, mas ohcansánit leat suomagillii, almmuhuvvo jagi 2020 loahpas. Sammallahti davvisámegiel sátnegirjji prentemis ii leat vel dahkkon mearrádus. Goappáge sátnegirjji doaimmahanbargu lea dahkkojuvvon eanaš dainna sierra ruhtademiin, maid Oahpahus- ja kulturministeriija lea juolludan. Giellagas-instituhtas lea riikkaviidosaš ovddasvástádus ordnet ja ovddidit sámegiela ja sámi kultuvrra alimus dási oahpahusa ja dutkama Suomas.

Suopma-nuortalašgiella -sátnegirjji leat doaimmahan Oulu universitehta Giellagas-instituhta nuortalašgiela oahpaheaddjit Eino Koponen ja Miika Lehtinen, Sámedikki nuortalašgiela jorgaleaddji Merja Fofonoff ja oahppomateriálabargi Raija Lehtola, ja Helssega universitehta digitálasátnegirjjiid ja leksikográfalaš diehtovuođuid áššedovdit Jack Rueter, Khalid Alnajjar ja Mika Hämäläinen. Álgoálgosaš giehtačállosa dahkkivuoigatvuođat gullet Sámediggái.

Sátnegirjji vuođđun lea Pekka Sammallahti ja Jouni Moshnikoffa 1991 almmuhuvvon girji, maid Jouni ja Satu Moshnikoff leaba dievasmahttán erenoamážit 2000-logu álgojagiid. Sánit ođđa sátnegirjjis leat mealgat eambbo: ovddibus ledje sullii 10.000 suomagiel ohcansáni ja sullii 11.000 vástideaddji sáni nuortalašgillii.

Nuortalašgiela girjjálaš atnu lea jagiid mielde viidon ođđa surggiide, main buot eai lean 30 jagi dás ovdal oppanassiige dahje maid birra háladettiin gárttai geavahit suomagiela. Daid áiggiid rájes giela sátnerádju lea viidon sakka. Sátnerádju lea ođasmuvvan hui johtilit maŋimuš logi jagi áigge. Materiála sátnegirjái mii dál almmustuvvá, lea leamaš čoahkis jo ovdal dán, muhto resurssaid vádjitvuođa dihte ii leat leamaš vejolašvuohta bargat vuđolaččat álgoálgosaš giehtačállosiin. 

Nuortalašgiela ođđa sánit leat muhtun muddui diđolaš ovddideami boađus, muhtun muddui earálágan (virggálaš ja muhtumin maid čáppagirjjálašvuođa) teavsttaid jorgaleame boađusin šaddan materiálat. Nuortalašgiela girjegiela ovdáneapmi dihtto sátneráju lassáneame lassin maiddái giela norpmaid ođasmuvvamis ja dárkkálmuvvamis.

Giela norbmerenbargu lea dahkkojuvvon Suoma, Norgga ja Ruoŧa Sámedikkiid oktasaš giellaovttasbargoorgána Sääʹm Ǩiõllkaʹlddin (Sámi Giellagáldu) nuortalašgiela giellajuhkosis. Barggu áigge girjji doaimmaheaddjit leat geahččalan váldit vuhtii Giellagáldu rávvagiid ja mearrádusaid. Nuortalašgiella lea goittot ain ovdáneamen girjegiellan, iige buot norbmeremii guoskevaš gažaldagaide leat leamaš fidnemis gárvves vástádus. Sátnegirjji doaimmaheaddjit leat čoavdán dáid ja earáge ovttaskas čuolmmaid buoremus ipmárdusa mielde. 

Digitála sátnegirji lea ávkin uhca gielaid sátnegirjebarggu várás ráhkaduvvon Veʹrdd-reidui (nuortalašgiela veʹrdd-sátni mearkkaša ʼrávdnjiʼ). Veʹrdd-reaiddu figgamuššan lea ovttastahttit giellateknologiija ovddideami, giela dokumenterema ja dutkama ja giellaservodaga ealáskahttinbarggu. 

Veʹrdd geavaha sátnegirjji doaimmaheame veahkkin mášenjierpmi, mii earret eará sojaha sániid automáhtalaččat iešguđege hápmái. Dat seastá bargoáiggi, dasgo juohke sáni buot sojahanhámiid ii dárbbaš čállit gieđain. Nuppe dáfus geavaheaddjis lea maid vejolašvuohta divvut boasttuhámiid maid mášenjierbmi dahká. Sátnegirjji mášenlogaheapmi addá vejolašvuođa divvut meattáhusaid dađistaga njuolga mášenjierbmái ja dađe mielde dievasmahttit mášenjierpmi sojahanhámiid. Sátnegirjji gárggiideapmi lea dušše oassi vehádatgiela govvádusas ja ealáskahttimis. Seamma mášenjirpmiin ja Veʹrddiin buvttaduvvon sátneráju sáhttá geavahit njuolga maid korrekturlohkanapplikašuvnnain ja giellaoahpahusprográmmain.

Sátnegirjji doaimmaheaddjit dihtet gal, ahte ođđa sátnegirji ii vel ollašuhte doaivaga fidnet dievaslaš ja varraseamos sátnegirjji, muhto jáhkket goittotge, ahte dat lea okta lávki dán dehálaš figgamuša guvlui. Digitála sátnegirjji lea maid álki dievasmahttit, viiddidit ja divodit dađe mielde go dieđut nuortalašgiela sátneráju ja girjegiela norpmaid birra dárkkálmuvvet. Dego álo barggu ráddjejit vátna resurssat, mii nuortalašgiela dáfus lea ruđa lassin maid dat ahte buohkat, geat dán barggu máhttet, dárbbašuvvojit eatnat eará bargguide nuortalašgiela buorrin.

 

Lisää kalenteriin

Takaisin tapahtumiin

Viimeksi päivitetty: 24.8.2020