Julkisesti saatavilla olevien aineistojen lisäksi Kielipankissa voidaan säilyttää ja välittää myös sellaisia aineistoja, joiden käsittely edellyttää suojatoimia esimerkiksi aineiston sisältämien henkilötietojen vuoksi.
Henkilötietoja on yleensä mukana mm. ääntä tai videota sisältävissä puheaineistoissa. Näissä tapauksissa aineisto ei yleensä voi olla täysin avoimesti saatavilla, mutta tietyillä ehdoilla sekin on mahdollista tallettaa Kielipankkiin. Tällä sivulla kuvataan muutamia suojatoimia, joiden avulla henkilötietoja sisältävän aineiston välittäminen voidaan tapauskohtaisesti järjestää.
Henkilötietojen käsittelyyn ja tarvittaviin suojatoimiin liittyvät päätökset ovat viime kädessä kyseisen aineiston rekisterinpitäjän vastuulla. Tarvittavista palveluista voi neuvotella Kielipankin kanssa.
Tutkimusaineiston kerääminen ja järjestäminen tutkimuksen edellyttämään muotoon on aikaavievää, työlästä ja kallista. Mikäli aineistolle on odotettavissa uutta käyttöä, sen säilyttäminen voi olla perusteltua, vaikka aineisto sisältäisikin henkilötietoja ja vaikka osa tiedoista olisi arkaluonteisia. Perusteet henkilötietojen säilyttämiseen on kuitenkin aina huolellisesti dokumentoitava ja niistä on informoitava tutkittavia. Lisäksi henkilötietojen käsittelyssä on käytettävä tarkoituksenmukaisia suojatoimia.
Tieteellisessä tutkimuksessa on tärkeää, että joku toinen tutkija pystyy tarvittaessa toistamaan aiemmin julkaistun tutkimuksen täsmälleen samalla aineistolla varmistaakseen, onko alkuperäinen tutkimus toteutettu oikein. Esimerkiksi tieteellisen tutkimuksen vertaisarviointi saattaa edellyttää arvioijan pääsyä tutkimuksessa käytettyyn aineistoon.
Alkuperäisen tutkimushankkeen päättymisen jälkeen halutaan usein tehdä jatkotutkimus joko samasta tai saman tyyppisestä aiheesta, jolloin aineistoa tarvitaan uudelleen. Tutkimushypoteesi pitää kenties muotoilla toisella tavalla tai halutaan kokeilla uutta analyysimenetelmää. Joskus samasta aihepiiristä kaivataan laajempaa tutkimusta, jota varten on välttämätöntä analysoida joukko aiemmin kerättyjä aineistoja. Uuden, massiivisen aineiston kerääminen alusta asti olisi usein liian kallista tai muuten hankalaa. Silloin aiemmin kerätty, huolellisesti dokumentoitu ja turvallisesti säilytetty aineisto voi osoittautua aarteeksi.
Tieteellisen tutkimuksen ohella myös historiallinen tai tilastollinen tutkimus voivat olla henkilötietojen käsittelyn perusteita. Kieliaineistojen kohdalla esimerkiksi puhetallenteiden säilyttämistä voinee joissakin tapauksissa perustella niiden historiallisella ja kulttuurisella arvolla.
Tietyn tyyppiset tutkimukset edellyttävät eettistä ennakkoarviointia. Silloin tutkija hakee tutkimuseettiseltä toimikunnalta lausuntoa ennen aineiston keräämisen aloittamista. Esimerkiksi lääketieteellisessä tutkimuksessa tutkimuseettinen toimikunta saattaa lähtökohtaisesti edellyttää aineiston tuhoamista tutkimuksen päätyttyä. Lausuntopyynnössä kannattaakin esittää selkeästi perustelut aineiston säilyttämiselle sekä mahdollisimman tarkka suunnitelma aineistoon sovellettavista suojatoimista.
Tutkimuksen yhteydessä tutkittavia on selkeästi informoitava myös henkilötietojen käsittelyssä sovellettavista suojatoimista. Kannattaa huomata myös, että jos tutkittaville on jo alkuperäisen informoinnin yhteydessä kerrottu, että heidän aineistonsa tuhotaan määräajan päätyttyä, tätä lupausta ei yleensä voi jälkikäteen perua (jollei tutkittaviin ole mahdollista ottaa uudelleen yhteyttä, informoida heitä jatkotutkimuksista ja pyytää osallistumaan myös niihin).
Voit lukea tietosuojasta ja tutkittavien informoinnista lisää esim. Tietoarkiston julkaisemasta Aineistonhallinnan käsikirjasta.
Henkilötietojen käsittelyssä käytettävien laitteiden ja järjestelmien tietoturvan on oltava riittävä ja ajan tasalla. Aineiston suojaamisesta on muistettava huolehtia saumattomasti alusta loppuun myös tiedonsiirron aikana.
Aineiston koostaja tai aineistoa Kielipankkiin tallettava taho voi tarvittaessa suojata henkilötietoja sisältävää aineistoa esimerkiksi pseudonymisoimalla sen käsittelytarkoituksen kannalta sopivalla tavalla ja luokittelemalla henkilötietoja siten, että niistä tulee vähemmän yksilöiviä.
Tarvittaessa tunnisteellista aineistoa voidaan säilyttää salaamalla tiedot riittävän vahvalla salausavaimella.
Jos aineisto on pseudonymisoitu ja tutkittaviin henkilöihin liittyvää koodiavainta on tarpeen säilyttää, koodiavain on pidettävä sekä teknisesti että hallinnollisesti erillään varsinaisesta aineistosta. Huomaa, että Kielipankki ei huolehdi aineiston pseudonymisoinnista eikä tutkittaviin liittyviä koodiavaimia oteta Kielipankkiin säilytettäväksi. Aineiston sisällön, tiedostonimien jne. koodaaminen on siis tutkijan omalla vastuulla.
Mikäli aineisto on mahdollista kokonaan anonymisoida ts. voidaan todeta, ettei elossa olevia henkilöitä voida anonymisoidun aineiston perusteella mitenkään tunnistaa (edes yhdistämällä aineiston tietoja jostakin muualta löytyviin tietoihin), aineisto ei enää sisällä henkilötietoja. Täysin anonyymia aineistoa ei tarvitse tietosuojasäädösten perusteella erikseen suojata. Toisin sanoen kokonaan anonyymi aineisto, johon ei liity esimerkiksi tekijänoikeudellisia rajoituksia, voidaan julkaista avoimesti.
Usein aineiston täydellinen anonymisointi on käytännössä mahdotonta joko työmäärän vuoksi tai teknisistä syistä, tai täydellinen anonymisointi tekisi aineiston tutkimuksen kannalta käyttökelvottomaksi. Jos tällainen aineisto on kuitenkin tarpeen säilyttää, siitä tulee mahdollisuuksien mukaan korvata selvästi tarpeettomat tunnisteet. Kielipankissa aineistoon voidaan soveltaa muita suojatoimia, esimerkiksi rajoittamalla pääsy aineistoon vain tietyille käyttäjille (ks. alla).
Voit lukea aineistojen anonymisoinnista ja pseudonymisoinnista lisää esim. Tietoarkiston julkaisemasta Aineistonhallinnan käsikirjasta.
Kun aineisto talletetaan Kielipankkiin, sitä ylläpidetään keskitetysti ja välitetään eteenpäin kyseisen aineiston oikeudenhaltijan kanssa sovituilla ehdoilla. Yhtenäiset, selkeät ja tarkoituksenmukaiset käytännöt helpottavat aineistoja tarvitsevien tutkijoiden työtä. Samalla ne auttavat pienentämään väärinkäytösten riskiä.
Kielipankin palveluiden käyttäjähallinnosta ja muista teknisistä ratkaisuista vastaa CSC – Tieteen tietotekniikan keskus. Sekä suomalaisten että kansainvälisiin luottamusverkostoihin kuuluvien korkeakoulujen opiskelijat ja tutkijat voivat esimerkiksi kirjautua Kielipankkiin turvallisesti oman organisaationsa myöntämällä käyttäjätunnuksella.
Kielipankissa oleviin aineistoihin voidaan tällä hetkellä soveltaa mm. seuraavia aineistokohtaisia suojatoimia:
Kielipankin kanssa voi tarvittaessa neuvotella myös muista yksittäisen aineiston edellyttämistä suojatoimista.
Ohjeet Kielipankissa olevan henkilötietoja sisältävän aineiston käsittelyyn
Kielipankin tietosuojakäytänteet
Viimeksi päivitetty: 8.2.2024