Tulostusversio

2/2014

Julkinen tieto ei aina ole avoin

Teksti: Kirsi Castrén
Kuvat: Shutterstock

Värikkäitä arkistolaatikoitaYksityisyydensuojan turvaaminen ei ole läpihuutojuttu, kun julkishallinnon tietovarantoja avataan kansalaisten, viranomaisten ja yritysten käyttöön.

Haluatko tilata alueesi reaaliaikaiset sää- ja liikennetiedot tai seurata eduskunnan toimintaa? Entä vertailla kuvista, miltä Helsinki näytti sata vuotta sitten ja nyt? Se on jo mahdollista virastojen ja laitosten avaamien tietoaineistojen perusteella kehitetyillä sovelluksilla.

Lisää on tulossa. Valtiovarainministeriön Avoimen tiedon ohjelman päämääränä on, että kaikki merkittävät julkiset tietovarannot ovat vuoteen 2020 mennessä verkossa kaikkien saatavilla koneluettavassa muodossa, maksutta ja selkein käyttöehdoin. Ohjelman mukaan aineistojen avaaminen ja niiden hyödyntäminen ei saa heikentää yksityisyydensuojaa. Avoimet tietovarannot eivät sen vuoksi pääsääntöisesti sisällä henkilötietoja. Ovatko yksityisasiamme siten turvassa avoimen tiedon aikakaudellakin?

Anonymisointi ei aina riitä

Täysin riskitöntä ei avoin data ole tietosuojan kannalta silloinkaan, kun se on anonymisoitu eli siitä on poistettu henkilötiedot. Liiketaloudelliset hyödyt syntyvät paljolti vasta yhdisteltäessä tietovarantoja toisiinsa ja sovitettaessa niitä olemassa oleviin palveluihin.

”Jos tilastolliset otokset väestöstä tai asukkaista ovat pieniä ja ne kytketään yhteen pienten maantieteellisten alueiden kanssa, harvaan asutulla alueella yksittäisten henkilöiden tunnistaminen saattaa helpottua”, arvioi neuvotteleva virkamies Mikael Vakkari valtiovarainministeriöstä.

Tietosuojasyistä esimerkiksi HSY-kuntayhtymän tarjoamissa rakennus- ja väestötiedoissa väestötietoja ei ilmoiteta rakennuksista, joissa on alle viisi asukasta eikä väestön ikärakennetta kerrota alle sadan asukkaan alueista.

Pieniä tilastollisia otoksia suurempana riskinä Vakkari näkee kuitenkin suurten tietomassojen avulla tapahtuvan profiloinnin.

”Nykyisillä ja lähitulevaisuuden tiedonlouhinta-algoritmeilla ei välttämättä ole erityisen vaikeaa yhdistellä isoja tietomassoja”, Vakkari sanoo.

Vakkarin mukaan niin sanotuilla ennustavilla algoritmeilla, esimerkiksi Bayes-verkoilla, tietomassasta voidaan poimia jopa yksityisyydensuojaa loukkaavaa tietoa.

Harmaita alueita

Maanmittauslaitoksen maastotiedot ovat esimerkki viranomaisaineistosta, johon ei alun perinkään sisälly lainkaan henkilötietoja. Toista laitaa edustaa saman viraston kiinteistötietojärjestelmä, jossa olevat kiinteistöjen omistajien nimet ovat julkisia asiakirjoja. Siitä huolimatta rekisteriä ei suunnitella avattavaksi edes anonymisoituna.

”Aineiston haltijan on tunnettava lainsäädännön vaatimukset”, toteaa johtava asiantuntija Panu Muhli Maanmittauslaitoksesta.

”Henkilötietoja ei avoimessa aineistossa voi julkaista. Toisaalta lainsäädännössä saattaa olla harmaita alueita, joista ei ole selkeää tulkintaa siitä, mikä tieto voisi olla avattavissa ja mikä ei”, hän toteaa.

”Tapauskohtaisesti saattaa tulla tilanteita, joissa pyydämme tietosuojavaltuutetun ohjausta siitä, onko tietoaineiston näyttäminen mahdollista.”

Somessa suuremmat riskit?

Valtiovarainministeriö pyrkii pitämään yksityisyydensuojaan kohdistuvia riskejä esillä virastojen kanssa käymissään keskusteluissa. Myös tietosuojavaltuutetun toimisto on edustettuna Avoimen tiedon ohjelman ohjausryhmässä.

”Virastojenkin mukaan yksi keskeisistä tunnistetuista ongelmista datan avaamisessa ovat juuri tietosuojariskit”, neuvotteleva virkamies Mikael Vakkari kertoo.

Tietovarantojen avaamisen riskejä yksityisyydensuojalle on Vakkarin mukaan vaikea ennakoida.

”Tällä hetkellä ne arvioidaan yleisesti kuitenkin vähäisiksi.”

Vakkari pitää suurempana ongelmana esimerkiksi sitä, miten paljon tietoa ihmiset itse julkaisevat itsestään sosiaalisessa mediassa.

”Jotkut jakavat itsestään aika häiritsevänkin yksityiskohtaista tietoa esimerkiksi Facebookissa. Kaikki eivät välttämättä ymmärrä, että näin ei ehkä kannattaisi toimia.”

Myös bonusjärjestelmät, joilla yritykset seuraavat kulutustottumuksia, sisältävät valtavia määriä tietoa yksilöistä.

”Kun ruvetaan yhdistelemään tätä dataa muun datan kanssa, meillä alkaa jo olla dystopiaskenaario siitä, miten paljon yksittäisestä ihmisestä voi saada tietää se taho, joka tiedot saa yhdisteltyä”, Vakkari pohtii.

 

Avoimen tiedon ohjelman dataportaali >>

Helsinki Region Infoshare – avoin seudullinen tieto >>

Lue myös

Avoin data: Rekisterinpitäjä tasapainoilee lakien välillä »
Avoin data: Henkilötietojen käsittely vaatii ammattitaitoa »
Gallup: Avoin data ei sisällä henkilötietoja »

Bookmark and Share
Anna palautetta

Kommentit (0 kpl)

Ei kommentteja.

 

Kommentoi
Kyllä


* = Pakollinen tieto

Uutiset

•  = artikkeli on luettavissa vain netissä

 

 

tietosuoja_logo_2013.gif

 

 

 

Vastaava toimittaja
Hanna Tamminen


 


 

 

 

 

Julkaisijat
Tietosuojalautakunta
Tietosuojavaltuutetun toimisto
Viestintävirasto
Patentti- ja rekisterihallitus 

 

 

 

 

 

 

Rekisteriselosteet »

Tietoa evästeistä »

 

 

 

Tietosuoja-verkkojulkaisua julkaistaan Tietosuoja-lehden yhteydessä. Yhdessä lehti ja verkkojulkaisu tutustuttavat tietosuojan normeihin ja käytäntöön, tietoturvaan ja viestinnän luottamuksellisuuteen. Tarkoituksena on ohjata hyvään rekisterinpitoon sekä tietoturvallisuuden ja viestinnän luottamuksellisuuden varmistamiseen.