Oulun yliopisto, ATK-keskus -- Sessio 194 12.9.1997
Pentti Luoma, Informaatiotutkimuksen
ja sosiologian laitos, 6.5.1997
Laadullisten aineistojen analyysin apuvälineiksi tarkoitettuja ohjelmia ilmestyy markkinoille ja olemassaolevista ohjelmista ilmestyy uusia versioita nopeaan tahtiin. Tämä johtuu siitä, että kiinnostus laadulliseen tutkimukseen on yleistynyt useilla eri tieteenaloilla kuten yhteiskunta-, kasvatus-, terveys- ja kauppatieteissä. Tilastollisten kysymyksenasettelujen sijasta tutkijoita kiinnostaa usein nk. luonnollinen kieli. Tällöin kiinnostavammaksi kysymykseksi nähdään se, kuinka ihmiset "omin sanoin" määrittelevät suhtautumistaan tiettyyn asiaan - ei niinkään se, kuinka monta prosenttia ihmisistä on "osittain samaa mieltä" tai "täysin samaa mieltä" jostain tätä asiaa kuvaavasta väitteestä.
Suurin osa näistä ohjelmista on tarkoitettu tekstimuotoisten aineistojen analyysiin, mutta joitain ohjelmia on kehitetty myös ääni- ja kuva- ja videoaineistojen analyysiin. Nykyisin on saatavilla myös eri ohjelmia vertailevaa (esim. Eskola 1995, Kelle 1995 sekä Weitzman ja Miles 1995) sekä eräitä ohjelmia esittelevää (ks. esim. ATLAS/ti:sta Moilanen ja Roponen 1994 sekä NUD*IST:ista Richards 1995, Richards & Richards 1994 ja 1995 sekä Luoma 1994 ja 1996) kirjallisuutta.
Periaatteessa siis kaikki tiedostomuodossa - ja osin muussakin muodossa - olevia aineistoja voidaan hallita, tutkia ja analysoida tämän tyyppisillä ohjelmilla. Tutkijan ei siis enää tarvitse kirjoittaa kortteja tai paperilappusia, ottaa niistä kopioita tai järjestellä ja lajitella niitä manuaalisesti tai alleviivata niiden osia erivärisillä kynillä. Hänen ei myöskään enää tarvitse kantaa mukanaan värikyniä, saksia ja mappeja vaan tiedot voi tallentaa kovalevylle tai levykkeelle halutulla tavalla luokiteltuina.
Esittelin tässä lehdessä kolmisen vuotta sitten NUD*IST-ohjelman versiota 2.3 (Luoma 1994), minkä jälkeen kyseistä ohjelmaa on kehitetty useaan otteeseen. Samana vuonna - lähes välittömästi esittelyni jälkeen - markkinoille ilmestyi ohjelmasta Windows-versio (NUD*IST 3.0.4) sekä lähes identtinen versio Macintosh-ympäristöön. Nämä versiot mahdollistivat työskentelyn useiden eri teksti-ikkunoiden kanssa. Näin tekstiä voitiin kopioida ja siirtää toiseen tiedostoon - kuten alkuperäisistä tiedostoista kirjoitettavana olevaan raporttiin. Ohjelmaa on myyty tällä hetkellä eri puolille maailmaa runsaat 10 000 kappaletta, mikä kertonee jotain tämäntyyppisten ohjelmien käytön yleistymisestä.
Kuluvan vuoden huhtikuussa ohjelmasta ilmestyi jälleen uusi versio NUD*IST 4.0 (sekä PCWindows- että Macintosh-versioina). Niihin sisältyy myös aiemmin ilmestynyt ohjelma QSR Merge. Tämä on tarkoitettu projektien kääntämiseen Macintosh-ympäristöstä Windows-ympäristöön ja päinvastoin sekä eri projektien yhdistelyyn. Koska QSR Mergen hinta on lähes sama kuin ohjelman päivityksen, sen hankkimista erikseen tuskin kannattaa enää harkita.
Mainittua ohjelmaa käytetään Oulun yliopistolla eri laitoksilla ja myös muualla. Siitä syystä uuden version yleiskuvaus lienee paikallaan. Olen betatestannut kyseistä versiota tämän vuoden alkupuolella ja seuraavassa esitetyt huomiot perustuvat pääosin näihin kokemuksiin.
NUD*IST-ohjelmasta keskustelua käyvällä QSR-Forum-listalla kritisoitiin Windows-versiota toistuvasti siitä, että yhteys alkuperäisiin eli ohjelmalle esiteltyihin tiedostoihin oli vähän hankala. Tämä "access to data"-keskustelu johti siihen, että uudessa versiossa sekä ohjelmalle tuotujen (aiemmin "esiteltyjen") tiedostojen teksteihin että eri solmuihin koodattuihin teksteihin pääsee välittömästi käsiksi näyttöruudulta. Tiedostot ja solmut näkyvät suoraan näyttöruudulla. Niinpä esimerkiksi yksittäisen tiedoston tutkiminen ja koodaus on mahdollista suoraan selailukäskyn ("browse") jälkeen.
Mielenkiintoinen uusi piirre ohjelmassa on myös se, että tutkittaessa tiettyä solmua, johon siis on koodattu tekstiä eri tiedostoista, voidaan ruudulla näkyvän paletin kautta hypätä ("Jump to source") siihen tiedostoon, josta teksti on peräisin. Tämä mahdollistaa koodatun tekstipätkän "ympäristön" ja vaikkapa koko tiedoston tutkimisen.
Paljon kritiikkiä esitettiin aiemmin myös ohjelman aiemman version hierarkkisesta puukaavio-näytöstä. Osittain tämä kritiikki oli mielestäni harhaanjohtavaakin, sillä lukuisten solmujen kanssa työskenneltäessä niiden järjestely joidenkin periaatteiden mukaan on perusteltua, jotta ohjelman käyttäjä voisi muistaa tarvitsemiensa solmujen sijainnin.
Joka tapauksessa ohjelman uudessa versiossa puukaavionäyttö on vaihtoehtoista. Sen saa esille tarvittaessa. Solmuihin koodattujen tekstien hakeminen käy uudessa näytössä vähän samaan tapaan kuin tiedostojen avaaminen normaalissa Windows-hakemistossa. Näin solmuihin näiden tekstien selailu ja tutkiminen on helpompaa ja nopeampaa kuin aiemmin.
NUD*IST-ohjelmassa tiedostojen rakenne jakautuu seuraavasti. Ensiksikin käytettävissä ovat kaikki projektille tuodut tiedostot, joista kaikista voidaan esim. etsiä tekstiä ja merkkejä samanaikaisesti ja tämän jälkeen koodata löydetyt tekstipätkät tiettyyn solmuun. Toisen tason muodostavat yksittäiset tiedostot, joita voidaan koodata kokonaisuudessaan. Esimerkiksi eri aikoina kerätyt haastattelutieostot voidaan luokitella ja koodata haastatteluajankohdan mukaan.
Kolmanneksi yksittäisten tiedostojen tekstit voidaan jakaa tekstijaksoihin ("section") alaotsikoiden avulla. Kahden alaotsikon välissä oleva teksti siis muodostaa yhden tekstijakson, joka voidaan tarvittaessa koodata kokonaisuudessaan. Pienin ohjelman tunnistama tekstipätkä on tekstiyksikkö ("text unit"). Tällöin esimerkiksi tekstin etsinnän yhteydessä tulostuu aina koko tekstiyksikkö. Etsinnän tulosta voi kylläkin aina haluttaessa laajentaa "spread"-käskyllä halutun verran löydetyn tekstiyksikön ympäristöön.
Ohjelman nimessä oleva U(nstructured)-termi viittaa siihen, että ohjelmalle voidaan tuoda, minkä tyyppisiä tekstiaineistoja tahansa. Aineiston rakenteeseen eli tiedostojen, tekstijaksojen ja tekstiyksiköiden määrittelyyn kuitenkin syytä kiinnittää huomiota jo litterointivaiheessa. Tämä pätee myös uuteen versioon, joskin siinä tiedostojen muokkaaminen jälkikäteen on jossain määrin helpompaa kuin aiemmin.
Jo aiemmassa versiossa voitiin muuttaa tekstejä tekstiyksiköiden sisällä - näin esimerkiksi silloin, kun haluttiin korjata kirjoitusvirheitä. Uusi versio mahdollistaa tämän lisäksi tekstiyksiköiden lisäämisen ja hävittämisen. Lisätyn tekstiyksikön alkuun jää teksti "Inserted text-unit", joten myöhemmin tiedostoihin lisättyjen tekstiyksiköiden erottaminen alkuperäisistä on mahdollista. Uudella "append"-käskyllä tiettyyn tiedostoon voidaan tuoda enemmänkin tekstiä projektin myöhemmässä vaiheessa.
Aiemmassa versiossa saattoi Windowsin alaisuudessa esitellä vain yhden tiedoston kerrallaan. Uudessa versiossa on mahdollista valita se joukko tiedostoja, jotka tuodaan tietyssä vaiheessa projektin alaisuuteen. Sille joka on käyttänyt komentotiedostoja tiedostojen esittelyyn tämä ei tietysti ole kovinkaan suuri uudistus, joskin uutta versiota käytettäessä säästyy komentotiedoston kirjoittamisen vaivalta.
NUD*IST 4.0 -version suurimpia uudistuksia ovat sen yhteydet muihin ohjelmiin. Tämä helpottaa sekä aineiston koodausta että tulosten esittämistä.
Yhteys tilastollisiin tietojenkäsittelyohjelmiin (esim. SPSS:ään) mahdollistaa yhtäältä kyselyaineistojen avovastausten koodauksen ja analysoinnin NUD*IST-ohjelmalla. Toisaalta se mahdollistaa myös NUD*IST-aineistojen tilastollisen analyysin.
Kyselyjen avovastaukset jäävät monesti kyselyaineistoja analysoitaessa suhteellisen vähälle huomiolle siitäkin huolimatta, että niihin joskus sisältyy kiinnostavaa informaatiota. Perinteisesti avovastausten analyysi tilastollisilla tietojenkäsittelyohjelmilla on jäänyt siihen, että tällaiset vastaukset on luokiteltu aineiston kirjoittamisen yhteydessä. Näin menetellen tietysti aina menetetään kuvailevaa informaatiota vastauksista.
Avovastausten analyysi NUD*IST-ohjelmalla ja jollain tilastollisella tietojenkäsittelyohjelmalla tapahtuu seuraavasti. Tilastolliseen analyysiin kuuluva havaintomatriisi kirjoitetaan normaaliin tapaan. Havaintomatriisiin kirjoitetaan esimerkiksi vastanneita kuvaavia taustatietoja (kuten ikä, sukupuoli, koulutus jne.). Avovastaukset taas kirjoitetaan tekstinkäsittelyohjelmalla ja tuodaan NUD*IST-ohjelman alaisuuteen. Tällöin järkevin menettelytapa on, että NUD*ISTille tuodun tiedoston nimi on sama kuin havaintomatriisin tietueen numero eli lomakkeen ID-tunnus. Näin ohjelma tunnistaa, minkä tietueen tiedot yhdistetään mihinkin NUD*IST-tiedostoon.
Seuraavaksi valitaan ne muuttujat, joiden mukaan halutaan suorittaa NUD*IST-aineistojen koodaus. Tällaisiksi muuttujiksi voi valita esimerkiksi juuri erilaisia kyselyyn vastanneiden taustatietoja kuten sukupuoli, ikä ja koulutus ja tietysti myös muita muuttujia. Tilastollisen tietojenkäsittelyohjelman alaisuudessa poimitaan halutut muuttujat samaan tiedostoon ja tallennetaan ne ".dat"-muodossa. Tämän jälkeen avataan ao. NUD*IST-projekti, annetaan "import"-käsky ja valitaan edellä muodostettu ".dat"-tiedosto. Tällöin ohjelma luokittelee automaattisesti NUD*IST-tiedostot valittujen tausta- jms. muuttujien mukaan. Tämän jälkeen voidaan esimerkiksi kysyä, mitä tietynlaiset ihmiset sanovat tietyistä asioista ja vertailla eri ryhmien avovastauksia.
Samalla tavalla voidaan "export"-käskyllä viedä NUD*IST-ohjelmalla tehtyjä luokituksia tilastolliselle tietojenkäsittelyohjelmalle. Tällöin NUD*IST-tiedostoista voidaan tehdä tilastollista analyysia.
Huomattavaa on myös se, että tiedostojen sijasta voidaan analysoida myös "tapauksia". Tapaukset ("caset") ovat määriteltyjä kohtia NUD*IST-tiedostoissa. Ne voivat sisältää useita kohtia samassa tai useammassa tiedostossa. Tällaisia tapauksia voivat olla vaikkapa erilaiset sosiaaliset tilanteet, joissa ihmiset puhuvat tai kirjoittavat jostain asiasta.
Eräs ongelmakohta NUD*IST-ohjelmassa on ollut muodostetun luokittelujärjestelmän eli puukaavion tietojen esittäminen. Puukaavion ja solmulistan tulostaminen on ollut mahdollista, kun taas eräille muille ohjelmille tyypillisten käsiteverkostojen eli luokkien välisten suhteiden esittäminen ei ole ollut mahdollista.
Tähän ongelmaan on etsitty ratkaisua siten yhteyksistä muihin ohjelmiin. NUD*IST 4.0-versiosta onkin mahdollista viedä puukaavio tai sen osa eräille käsitteellisten verkostojen ("cognitive mapping") analyysiin tarkoitetuille ohjelmille. Kyseiset ohjelmat ovat "Inspiration" (ks. http://www.inspiration.com) ja "Decision Explorer" (ks. http://www.banxia.co.uk/banxia/index.html).
Näiden ohjelmien alla voidaan muokata puukaaviota ja esittää käsitteiden/luokkien välisiä suhteita esim. nuolikaavion avulla. Olen tutustunut paremmin "Inspiration"-ohjelmaan, joka on hinnaltaan edullisempi. "Inspiration"-ohjelma - kuten tietysti myös NUD*IST - käy yleensä kaikenlaiseen ideointityöhön (esim. "mind mapping"). Kiinnostava uusi piirre on myös se, että ohjelman avulla voi suunnitella ja tuottaa mahdollistaa html-tiedostoja.
NUD*IST 4.0 sisältää aiempaan versioon verrattuna uusia ominaisuuksia, joista olen edellä esitellyt vain muutamia. Vanhojen versioiden päivittäminen perusteltua ainakin silloin, kun aikoo käyttää ohjelmaa kyselyjen avovastausten analyysiin. Päivityshinta yksittäiselle oppilaitoslisenssille on 95 puntaa eli huhtikuun 28. päivän valuuttakurssin mukaan noin 800 markkaa. Useamman kappaleen lisenssin päivittäminen tulee maksamaan yhtä "ohjelmaa" kohti 50 puntaa eli hieman yli 400 markkaa.
Euroopan maihin ohjelmaa välittää Kustannusyhtiö SAGE. Lisätietoja hinnoista, ohjelmasta ja sen tilaamisesta löytyy myös verkosta - joko SAGE:n (http://www.sagepub.co.uk/scolari/qsr.html) tai NUD*IST-ohjelmaa valmistavan yhtiön "Qualitative Solutions and Research" (http://www.qsr.com.au) kotisivuilta.
Eräs kiusallinen ja toistuva ongelma uusissa versioissa on tietysti aina se, että yleensä niiden käyttö edellyttää enemmän muistia ja tehokkaampaa konetta. NUD*IST 4-ohjelman kehittäjät toteavat ehdottoman minimin olevan 8 megatavua (aiemmassa versiossa 4 megatavua) keskusmuistia. Minimi on tietysti aina minimi ja järkevää on varautua ainakin 16 megatavuun (kuten aiemmassa versiossa 8 megatavuun) keskusmuistia, jotta ohjelma pyörisi riittävän nopeasti.
Eskola, Jari (Toim.) (1995). Maa kutsuu?: kokemuksia kvalitatiivisten aineistojen mikroavusteisesta analyysistä. Lapin yliopiston kasvatustieteellisiä julkaisuja, C Katsauksia ja puheenvuoroja, 9. Lapin yliopiston kasvatustieteiden tiedekunta, Rovaniemi.
Kelle, Udo (Editor) (1995). Computer-Aided Qualitative Data Analysis. Theory, Methods and Practice. SAGE Publications, London.
Luoma, Pentti (1994). NUD*IST-ohjelma tekstiaineistojen analyysiin. Sessio 1/1994, nro. 182.
Luoma, Pentti (1996). Miten olisi NUD.IST? Sosiologia 33: 3, 227-229.
Moilanen, Timo ja Roponen, Seppo (1994): Kvalitatiivisen aineiston analyysi ATLAS/ti-ohjelman avulla. Kuluttajatutkimuskeskus. Menetelmäraportteja ja käsikirjoja 2/1994, Helsinki.
Richards, Lyn (1995). Transition Work! Reflections on a Three-Year NUD.IST Project. Teoksessa: Computing and Qualitative Research. Editor: Robert C. Burgess. Studies in Qualitative methodology, Volume 5. JAI Press Inc., Greenwich and Middlesex.
Richards, Thomas J. and Richards, Lyn (1994): Using Computers in Qualitative Research. In Denzin, Norman & Lincoln, Yvonna (Editors). Handbook of Qualitative Research, SAGE Publications, Thousand Oaks-London-New Delhi.
Richards, Thomas J. and Richards, Lyn (1995). Using Hierarchical Categories in Qualitative Data Analysis. Teoksessa: Computer-Aided Qualitative Data Analysis. Theory, Methods and Practice. Edited by Udo Kelle. SAGE Publications, London.
Weitzman, Eben A. and Miles, Matthew B. (1995). Computer Programs
for Qualitative Data Analysis. A Software Sourcebook. SAGE Publications,
Thousand Oaks-London-New Delhi.