Suomi edelläkävijänä ratkaisemassa sote-datan toisiokäytön haasteita
Uutinen julkaistu alunperin maaliskuussa 2021.
Hyteairo-ohjelman Analytiikkawebinaarissa 18.3.2021 pureuduttiin tarkemmin toisiolain vaikutuksiin sosiaali- ja terveysdatan hyödyntämiseen tutkimuksessa sekä data-analytiikan sovelluksissa. Webinaarin esitysten ja keskustelujen lähtökohtana oli osana Analytiikkaverkoston toimintaa toteutettu selvitys aiheesta, joka esiteltiin VTT:n Juha Pajulan toimesta (lataa esitysmateriaali). Selvityksestä lisätietoja löydät mm. täältä.
Webinaarin osallistujat näkivät sote-datan toisiokäytössä paljon mahdollisuuksia, mutta myös uhkia. Toisiolaki muun muassa mahdollistaa sote-datan toisiokäytön myös muuhun kuin tutkimuskäyttöön, mikä ei ennen lain voimaantuloa ole ollut mahdollista. Käyttöperusteita voivat olla esimerkiksi opetus, innovaatio- ja kehitystoiminta sekä tietojohtaminen, mikä avaa uusia mahdollisuuksia sosiaali- ja terveysdatan monipuolisempaan, lain puitteissa myös turvalliseen hyödyntämiseen.
Paneelikeskustelussa kuultiin eri sidosryhmien näkemyksiä selvityksen jatkotoimenpidesuosituksista sekä organisaatioiden rooleista ja yhteistyön merkityksestä niiden edistämisessä. Oulun yliopiston työelämäprofessori ja Centre for Health and Technology:n johtaja Maritta Perälä-Heapen moderoimassa paneelissa keskustelemassa olivat:
- Markus Kalliola, Projektijohtaja, Terveysdata 2030, Tehdas, Sitra
- Janne Kanner, Johtaja, datanhallinnan palvelut, CSC
- Juha Pajula, Research Scientist, VTT
- Antti Tuomi-Nikula, tiimipäällikkö, THL
- Antti Vikström, erityisasiantuntija, Findata
Selvityksen jatkotoimenpidesuosituksissa korostuu datan äärelle pääsemisen haasteet, erilaisten toimijoiden ja erilaisten käyttötarkoitusten luomien tarpeiden huomioiminen, yhteistyö datan tuottajien, käyttäjien ja viranomaisen kesken sekä tiedon välittäminen toisiolain puitteissa tehdyn tutkimuksen läpinäkyvyyden parantamisen kautta. Lisäksi kansainvälisen kehityksen mahdollistamiseksi on tärkeää, että suomalaista dataekosysteemiä rakennetaan yhteensopivaksi eurooppalaisen kehyksen kanssa.
Suomi on edelläkävijän asemassa sote-datan hyödyntämisessä, joten meillä on ainutlaatuinen mahdollisuus rakentaa hyviä esimerkkejä käyttötapauksista ja datan hyödyntämisen toimintamalleista, mutta toisaalta myös edelläkävijän vastuu ratkaista siihen liittyviä haasteita. Hieno osoitus Suomen edelläkävijyydestä on se, miten eurooppalaiset toimijat valitsivat joukostaan yksimielisesti Suomen edustajan Sitran koordinoimaan TEHDAS-yhteistoimintahanketta (Joint Action Towards the European Health Data Space). 25 maan yhteistoimintahankkeen tavoitteena on luoda Eurooppaan yhteiset periaatteet ja hallintomalli terveysdatan hyödyntämiseen. Lähtökohtana on, että terveysdatan hyödyntämisen yhteistyö ei voi perustua vain projektipohjaiseen työhön, vaan perusteet sille on saatava lakiin ja asetuksiin, kuten Suomessa on toisiolain merkeissä jo tehty.
Datan äärelle pääseminen ja erilaiset käyttäjät
Datan äärelle pääsemiseen ja erilaisten toimijoiden - esimerkiksi apurahatutkijat ja tutkijalääkärit, jotka eivät hallinnollisesti identifioidu akateemisiin organisaatioihin - huomioimiseen liittyen keskeiseksi nähtiin sujuvien ratkaisujen rakentaminen etäkäyttönä tapahtuvaan data-analytiikkaan. Ilmeisimpänä ratkaisuna tähän nähtiin erilaiset virtuaaliset tutkijavierailut ja tietoturvalliset etäkäyttöympäristöt, mahdollistaen datan tietoturvallisen hyödyntämisen. CSC onkin rakentamassa nykyisen ePouta-pilviympäristön yhteyteen paremmin skaalautuvaa etätyöpöytäratkaisua ja työkaluja datan käsittelyyn ja luvituksiin. Seuraavassa vaiheessa parempia arkaluonteisen datan käsittelymahdollisuuksia laajennetaan varsinaisiin supertietokoneisiin. Findatan käyttöympäristön ja CSC:n yleisempien ratkaisujen kehitystä tehdään rinnakkain tiiviissä yhteistyössä, myös käyttäjien tarpeet ja toiveet huomioiden.
Datan hyödyntämistä voitaisiin helpottaa ja tehostaa myös näköis-datasettien ja parempien aineistojen kuvailu- ja metatietojen avulla. Näiden avulla voitaisiin helpommin tunnistaa tarvittavat aineistot ja muuttujat, ja kehittää analytiikkamenetelmiä jo ennen kuin varsinaiseen dataan liittyvät lupaprosessit on läpäisty. Näin vältettäisiin pitkätkin tutkimus-, kehitys- ja innovaatiotoimintoja hidastavat odottelujaksot.
Omalta koneelta tietoturvallisiin käyttöympäristöihin
Tutkimuksen näkökulmasta toisiolaki merkitsee paradigman muutosta tutkimuksen tekemisessä: data-analytiikkaa ei sosiaali- ja terveysdataa hyödynnettäessä tehdä omilla koneilla, vaan analytiikka tapahtuu tietoturvallisissa käyttöympäristöissä. Kehitystoimenpiteitä on jo käynnissä, jotta näihin käyttöympäristöihin päästään mahdollisimman helposti myös etäyhteyksin analytiikkaa tekemään. Tällä hetkellä käytössä on Findatan tarjoama käyttöympäristö, jota kehitetään jatkuvasti myös käyttäjiltä saadun palautteen ja tarpeiden pohjalta. Findatan määräys tietoturvallisista käyttöympäristöistä mahdollistaa myös muiden toimijoiden käyttöympäristöjen kehittämisen ja auditoimisen, ja näin myös käyttöympäristöjen kehittämisen erilaisiin käyttötarkoituksiin ja käyttöympäristömarkkinan syntymisen. Uusia käyttöympäristöjä auditoiviksi tahoiksi on akkreditoitu KPMG ja Nixu, ja auditoinnit perustuvat Findatan määräykseen tietoturvallisista käyttöympäristöistä. Muita käyttöympäristöjä ei maaliskuussa 2021 vielä ole, mutta panelistit näkivät tarpeelliseksi käyttöympäristöjen rakentamisen ja datan siirtymisen prosessien valmistelun jo ennakoiden, jotta tulevaisuudessa uudet käyttöympäristöt pääsisivät käynnistämään toimintansa sujuvasti.
Keskustelussa nousi esiin myös kysymys siitä, miten esimerkiksi sairaaloiden potilastieto- ja kuvantamisdatan järjestelmät suhteutuvat vaatimuksiin tietoturvallisista käyttöympäristöistä. Tässä kysymyksessä ollaan tiedon toisio- ja ensisijaisen käytön perusperiaatteiden äärellä: sairaalassa tapahtuva potilas- ja kuvantamisdatan hyödyntäminen on yleensä tuon tiedon ensisijaista, potilaan hoitoon ja diagnoosiin tähtäävää käyttöä. Kun tuota dataa käytetään toisiolain puitteissa johonkin muuhun tarkoitukseen, sitä yleensä myös yhdistellään muihin datalähteisiin, jolloin datasta tulee huomattavasti sensitiivisempää. Siksi toisiokäytön käyttöympäristöjen tietoturvavaatimusten on oltava tiukemmat, kuin datan ensisijaisen hyödyntämisen. Lisäksi sairaaloiden omissa järjestelmissä käyttöympäristöjen ympärillä on myös sairaaloiden omat ”seinät” ja tietoturvajärjestelmät.
Toisiolain puitteissa tehdyn tutkimuksen läpinäkyvyys
Toisiolaki luo Suomessa ainutlaatuisen mahdollisuuden hyödyntää sote-dataa TKI-toiminnassa. Jotta näitä mahdollisuuksia voidaan tuoda näkyväksi ja kasvattaa osaamista ja ymmärrystä sote-datan hyödyntämisen mahdollisuuksista, peräänkuulutetaan selvityksessäkin toisiolain puitteissa tehdyn tutkimuksen läpinäkyvyyttä. Suosituksen mukaan Findata voisi ylläpitäisi julkista listausta tutkimuksista, jotka ovat saaneet hyväksynnän datojen käytölle, ilmentäen ainakin tutkimuksen pääaiheen ja tutkimustahon yhteystiedot.
Suosituksen henkeä toteuttaen Findatan päätökset ovat jo julkisia, ja tiedot vuoden 2020 päätöksistä (luvan saaja, projektin nimi, käyttöperuste) on hiljattain julkaistu. Päätösten ollessa julkisia, on Findatalle toimitetut hakemukset liitetietoineen (mm. tutkimussuunnitelmat) kuitenkin salassa pidettäviä. Kattavan kuvan saamiseksi toteutettavista tutkimuksista pohdittiin mahdollisuutta kerätä julkista dokumentaatiota luvan saaneista tutkimusprosesseista niin, että yhdestä paikasta olisi kootusti löydettävissä tutkimus- ja kehittämisprojektien perustiedot. Keskusteluissa vertailtiin myös toisiolain puitteissa tehtävää tutkimusta biopankkitutkimukseen, jossa aineiston saaja on velvollinen toimittamaan julkisen tiivistelmän tutkimuksesta (esimerkiksi THL Biopankin tutkimuskuvaukset) – olisiko toimintamalli sovellettavissa myös tässä tapauksessa?
Omatietovaranto ja näköisdata kiinnostavat
Webinaarissa nousi esiin myös kysymyksiä itse kerätyn datan hyödyntämiseen ja omatietovarantoon liittyen. Analytiikkaverkoston toteuttamasta selvityksestä aihealue rajattiin pois, koska määrittelyt tämän tyyppisen datan suhteesta toisiokäyttöön ovat vielä kesken, ja selvityksiä on meneillään. Ratkaistavana on vielä se, miten omatietovarannon hyödyntäminen tutkimuskäytössä voisi olla mahdollista. Yhtenä vaihtoehtona nousi esiin käyttäjien suostumuksen perusteella tapahtuva toisiokäyttö, jolloin kukin voisi omasta halustaan luvittaa omia tietojaan tukemaan tutkimusta ja uusien hoitomenetelmien kehitystä.
Omatietovarannon hyödyntämiseen liittyen on vielä paljon avoimia kysymyksiä, mm. valmistelussa olevaan asiakastietolakiin ja sen hyvinvointi- ja terveysdatan erotteluun liittyen. Rajanveto hyvinvointi- ja terveysdatan välillä tulee olemaan haastavaa – onko esimerkiksi käyttäjän kotona mittaama verenpainetieto hyvinvointi- vai terveysdataa?
Itse kerätyn datan ja omatietovarannon hyödyntämisen selvitysten lisäksi eri kehityspolkuja suosituksiin liittyen on parhaillaan käynnissä, niin käyttöympäristöjen etäkäyttöön, näköisdatasetteihin kuin sote-datan tiedolla johtamisen sovellutuksiin liittyen. Vuoropuhelua eri toimijoiden ja ohjelmien välillä käydään jatkuvasti, ja toimenpiteitä viedään eteenpäin myös Hyteairo-ohjelman Tekoäly analytiikassa –verkoston, kansallisten tietojohtamisen ohjelmien ja KATI-ohjelman kanssa yhteistyössä.
Rakenteilla olevia hyvinvointialueita haastetaan jo pohtimaan sote-datan toisiokäyttöä ja edistyksellisen analytiikan hyödyntämistä. Tekoäly sote-tiedolla johtamisessa –aihealueen käsittely jatkuukin seuraavassa Analytiikkawebinaarissa 17.5.2021.