Aineistonhallinta - Hämeen ammattikorkeakoulu
Aineistonhallinta
Hämeen ammattikorkeakoulu
-

Aineistonhallinta

Aineistonhallinta: miksi ja miten TKI-hankkeissa?

Aineiston elinkaari

Kuvalähde: CC BY Yhteiskuntatieteellinen tietoarkisto, Aineistonhallinnan käsikirja

Aineistonhallinnan suunnittelun tarkoituksena on varmistaa, että HAMKin TKI-hankkeissa (Hyvä aineistonhallintatapa HAMKissa) ja opinnäytetöissä (Ammattikorkeakoulujen opinnäytetöiden eettiset suositukset) noudatetaan hyvää tieteellistä käytäntöä ja eettisiä periaatteita ja huolehditaan tietosuojasta ja tietoturvasta (Tutkimuksen tietosuoja).

Aineistonhallinnan suunnittelu koskee koko aineiston elinkaarta: aineistojen luomista, tallentamista, kuvailua ja järjestämistä hankkeen aikana. TKI-aineistoja ovat digitaalisessa muodossa olevat aineistot, jotka voivat olla tutkimuksen aikana tuotettuja mittaustuloksia, laboratoriopäiväkirjoja, lähdekoodeja, ohjelmistoja, tilastoja, kuvia, äänitteitä, haastatteluiden litterointeja, kyselyaineistoja tai kenttätyöhön perustuvia havaintoja. Aineistot voivat olla myös fyysisiä ja biologisia aineistoja. Hyvällä aineistonhallinnan suunnittelulla varmistetaan aineistojen jatkokäyttö ja avoimuus avoimen tieteen periaatteiden mukaisesti: niin avointa kuin mahdollista, niin suljettua kuin tarpeellista.

Kun TKI-hankkeissa huolehditaan aineistonhallinnasta, siitä hyötyvät kaikki. Aineistojen avoimuus lisää TKI-toiminnan vaikuttavuutta, tunnettuutta ja verkostoitumista ja nopeuttaa tutkimusta, mahdollistaa toistettavuuden ja vähentää päällekkäistä työtä. On siis tärkeää tietää, millaisia aineistoja TKI-hankkeissa kerätään ja miten ne ovat saatavissa käyttöön.

Tutkijalle aineiston tuottaminen ja avaaminen ovat ansioluetteloon lisättävä tieteellinen meriitti ja viittaaminen data-arkistoissa avattuihin aineistoon meritoi myös tutkijaa. Lue Tietoarkiston sivuilta lisää jatkokäytön ja avoimen saatavuuden hyödyistä.

Hankkeen suunnitteluvaiheessa

HAMKissa edellytetään aineistonhallintasuunnitelman laatimista jokaisessa TKI-hankkeessa viimeistään positiivisen rahoituspäätöksen tultua voimaan. Aineistonhallintasuunnitelmassa nimetään ne henkilöt, jotka ovat vastuussa aineistonhallintaan liittyvistä tehtävistä hankkeen aikana. TKI-hankkeissa olosuhteet ja tarpeet voivat muuttua ja siksi myös aineistonhallintasuunnitelma tarkentuu ja sitä päivitetään hankkeen edetessä. Rahoittajilla voi lisäksi olla omat vaatimuksensa aineistonhallintasuunnitelman laatimiseen, aiheesta enemmän esimerkiksi SeAMKin Rahoittajien avoimuutta koskevia vaatimuksia -osiossa.

HAMK on sitoutunut noudattamaan Tutkimuseettisen neuvottelukunnan (TENK) ihmistieteellisten tutkimusalojen eettisiä periaatteita, jotka kuvataan TKI-etiikka -sivulla.  Sivulta löytyy tietoa myös HAMKin tutkimuseettisen tukihenkilön tehtävistä. Yhteistyökumppaneiden kanssa käydään läpi tarvittavat tutkimuseettiset ohjeet ja suositukset ja selvitetään osapuolien mahdolliset sidonnaisuudet.

Jos TKI-toiminnan kohteena on ihminen, hankkeessa selvitetään, mitä lupia tai lausuntoja hankkeessa tarvitaan. Jos kohteena on organisaatiossa (esimerkiksi oppilaitos tai yritys) tapahtuva toiminta, tarvitaan lupa organisaatiolta TKI-toiminnan toteuttamiseen. Organisaatioiden lupakäytänteet kerrotaan usein kohdeorganisaation verkkosivuilla. Mikäli TKI-hankkeessa tarvitaan tutkimuslupia tai tutkimus kuuluu eettisen ennakkoarvioinnin piiriin, huolehditaan tutkimusluvat ajoissa kuntoon ja lausunto haetaan eettiseltä toimikunnalta.

TKI-aineistot voivat sisältää sekä tekijänoikeudellisesti suojattuja että suojaamattomia aineistoja, joiden käytöstä on syytä sopia jo hankkeen suunnitteluvaiheessa. Tekijänoikeuksista ja omistusoikeuden siirtymisen sopimisesta sekä tekijyyden merkitsemisjärjestyksestä lisätietoa Tietoarkiston Aineistonhallinnan käsikirjan Sopimukset ja oikeudet -osiossa.

Hankkeesta ja sen toteutuksesta laaditaan tutkimus-, projekti- tai yhteistyösopimus, jossa sovitaan hankkeeseen liittyvistä keskeisistä pelisäännöistä. Sopimuksessa (Hankepalvelut: sopimuspohjat, HAMK intranet) määritellään myös tausta-aineistojen ja tulosaineistojen omistajuus, käyttö-  ja julkaisuoikeudet. Lähtökohtaisesti julkisrahoitteisissa hankkeissa vaaditaan tulosten julkaisemista avoimesti hankkeen päättymisen jälkeen. HAMKin Yritysyhteistyössä tehtävän TKI-hankkeen tutkimuseettinen itsearviointi-ohje on suunniteltu helpottamaan erityisesti yritysten kanssa yhteistyössä toteutettavien hankkeiden suunnittelua.

Aineistonhallinta hankkeen aikana

Aineistonhallintasuunnitelman laatiminen osana hankkeen aloitusta

Aineistonhallintasuunnitelma laaditaan DMPTuuli-työkalulla vastaamalla kysymyksiin, jotka jakaantuvat aineistonhallinnan viiteen osa-alueeseen:

1) aineiston yleiskuvaus: datan kerääminen ja käyttö.

2) eettisten periaatteiden ja lainsäädännön noudattaminen,

3) dokumentointi ja metadata,

4) tallentaminen ja varmuuskopiointi hankkeen aikana ja

5) aineiston avaaminen, julkaiseminen ja arkistointi hankkeen päätyttyä.

DMPTuuliin on laadittu kaksi HAMKin omaa aineistonhallintasuunnitelmapohjaa, toinen tutkimushankkeille ja toinen koulutus- ja kehityshankkeille. Käy katsomassa ohje, mitä aineistolla itse asiassa tarkoitetaan ja kuinka valitset hankkeelle parhaiten sopivan Tuuli-pohjan.

Mikä on aineisto ja minkä Tuuli-pohjan valitsen

Aineistonhallintasuunnitelmassa kuvataan aineistot ja niiden keruutapa, omistus-, hallinta- ja tekijänoikeudet, miten tutkittavia informoidaan ja kuka antaa käyttöoikeudet aineistoihin hankkeen aikana ja sen jälkeen. Aineistonhallintasuunnitelmassa kerrotaan myös, liittykö aineistoon luottamuksellista tai salassa pidettävää tietoa tai asiakirjoja, sisältääkö aineisto henkilötietoja, miten tiedot suojataan ja onko aineistosta laadittu tietosuojailmoitus (Tietosuoja: Tietosuojailmoitus tieteellinen tutkimus, HAMK intranet)

Käy myös katsomassa valtakunnalliset datanhallinnan ohjeet

Aineistonkeruun suunnittelu ja toteutus

Aineistonkeruun suunnittelu on oleellista koko TKI-hankkeen laadun ja onnistumisen kannalta. Aineiston kokoaminen suunnitellaan niin, että aineiston keruussa kunnioitetaan ihmisiin, eläimiin ja ympäristöön liittyviä yhteiskunnallisia perusarvoja ja huolehditaan lakien noudattamisesta.  Toteutusvaiheessa hyvän dokumentaation tuottaminen on tärkeää, koska jälkikäteen tapahtuva kuvailu on aikaa vievää ja joskus jopa mahdotonta.

Kaikkea aineistoa ei tarvitse välttämättä kerätä itse. Joskus sopiva aineisto on jo olemassa valmiina, aikaisemmissa tutkimuksissa kerättyjä tai esimerkiksi viranomaisten ja yritysten julkaisemia datoja löytyy erilaisista data-arkistoista. Avoimuuden työkalut –sivulta on tietoa kansallisista ja kansainvälisistä data-arkistoista ja niiden hakupalveluista. Aineistoihin viittaamisessa pätevät samat tutkimuseettiset periaatteet kuin kirjallisiin tuotoksiin viittaamisessa. Mikäli hankkeessa hyödynnetään jo olemassa olevia aineistoja, niihin viitataan kansallisen dataviittausohjeen mukaisesti.

Jos TKI-toiminnan kohteena on ihminen, aineiston käsittelyä suunniteltaessa otetaan huomioon henkilötietojen tunnisteellisuus ja anonymisointi (Aineistonhallinnan käsikirja, Tietoarkisto) ja erityiset henkilötietoryhmät eli arkaluonteiset henkilötietojen käsittelyn vaatimukset, katso Ohje arkaluonteisia henkilötietoja sisältävän datan hallinnan suunnitteluun ja keskeiset käsitteet (Tuuliprojekti) sekä  Täydentävä ohje arkaluonteisia ja luottamuksellisia tietoja sisältävän datan hallinnan suunnitteluun 2019 (TSV).

Tutkittavien informointi ei koske niinkään tutkimusaihetta ja tutkimuksen tavoitteita, vaan ennen kaikkea sitä, miten hankkeessa käsitellään aineistoja henkilötietojen näkökulmasta. Tietosuojan ensisijainen tarkoitus on suojata tutkittavia. Tietosuoja-asetusta ja tietosuojalakia noudattamalla varmistetaan paitsi tutkittavien oikeuksien toteutuminen, myös oma oikeusturva. Henkilötietojen käsittelylle tulee olla aina käsittelyperuste, myös vaikutuksenarviointi voi tulla tehtäväksi tutkimuksessa, jossa henkilötietojen käsittely aiheuttaa todennäköisesti korkean riskin rekisteröityjen oikeuksille ja vapauksille (Tietosuoja: henkilötietojen käsittelyn periaatteet; vaikutustenarviointi )

Informoinnin perusteella tutkittava ymmärtää, miten häntä koskevia tietoja kerätään, käytetään, siirretään, luovutetaan, säilytetään tai muulla tavoin käsitellään. Tietoarkiston Käsikirjassa Informointi henkilötietojen käsittelystä on ajantasaiset, yksityiskohtaiset ohjeet henkilötietojen käsittelyn vaatimuksista: milloin, mitä ja miten tutkittavia informoidaan.

Tiedostoformaatit ja ohjelmistot

Ennen aineistonkeruuta on mietittävä, mihin ja missä formaatissa data tallennetaan ja miten tiedostot ja niiden eri versiot nimetään. Datan tallentamisessa ja prosessoinnissa kiinnitetään erityistä huomiota ohjelmistojen ja tallennusvälineiden soveltuvuuteen niin, että aineistojen tekninen laatu pystytään varmistamaan koko datan elinkaaren ajan tietosuoja- ja turva-asiat huomioiden.

Tallennusformaatit valitaan siten, että data on siirrettävissä ja käyttökelpoista, myös pitkäaikaissäilyttäminen huomioiden. Käytettävyyden varmistamiseksi tallenna myös kopio tiedostosta sellaiseen muotoon, joka on yleisessä käytössä ja jota useat eri ohjelmat tukevat. Ajantasaiset tiedot soveltuvista tiedostomuodoista: http://digitalpreservation.fi/

Varmuuskopiointi, tietosuoja ja -turva

HAMKin tiedon luokittelu ja käsittelyohjeesta voi tarkistaa, mitkä tallennuspaikat soveltuvat luottamukselliselle ja salassa pidettävälle aineistolle ja milloin käyttäjän on itse huolehdittava varmuuskopioinnista. Aineistojen säilyvyyden varmistamiseksi kaikki hankkeessa kertyvä aineisto kannattaa tallentaa vähintään kahteen paikkaan, työ- ja varmuuskopiot omiin tallennusjärjestelmiinsä.

Tietoturvan varmistamiseen kuuluu aineistojen turvaaminen tuhoutumiselta, muuttumiselta ja luvattomalta käytöltä. Eri käyttäjäryhmien oikeudet tiedostojen lukemiseen ja käsittelyyn on määriteltävä. HAMKissa yksittäinen henkilö voi säilyttää dataa henkilökohtaisella verkkolevyllään (P-asema), tutkimusryhmät tilaavat oman suojatun, myös sensitiiviselle datalle soveltuvan tallennustilan henkilökunnan verkkolevyltä (S-asema) ServiceDesk-palvelun kautta. Sensitiivisen datan siirtämisessä käytetään joko turvapostia tai tiedostojen salaamista. (Tietoturva: Toimintaohje, HAMK intranet). Jos hankkeessa on mukana opiskelijoita, tallennustila pyydetään yhteiseltä verkkolevyltä (U-asema).

TKI-hankkeessa käytetään kansallisia tallennuspaikkoja, jos mukana on myös HAMKin ulkopuolisia tahoja. Tutkimushankkeille on käytössä IDA-palvelu. Kansainväliset tutkimusryhmät voivat jakaa dataa keskenään Eudat-palvelussa. Lisätietoa IDA- ja Eudat-palveluista saa TKI-tuen tiimiltä.

Dokumentointi ja metadata

Aineiston analyysin, käytettyjen menetelmien ja käytettyjen koodien dokumentointi tukevat tutkimuksen toistettavuutta. Aineiston keruuseen ja analyysiin liittyvät käytännöt ovat alakohtaisia ja riippuvaisia aineistotyypistä.

Metadatan tuottaminen kannattaa aloittaa ajoissa. Aineisto ilman metadataa eli kuvailevaa tietoa ei merkitse mitään lukijalleen. Metadatalla mahdollistetaan aineistojen löydettävyys, saavutettavuus, pitkäaikaissäilytys ja aineistojen uudelleenkäyttö. Jokaiselle tutkimusaineistolle kannattaa luoda oma hakemisto, johon tallennetaan tutkimusaineisto ja kuvailutiedot. Aineistonkeruuinstrumentti, kuten esimerkiksi kyselylomake tai Webropolilla toteutettava kysely, tallennetaan tekstitiedostona. Kuvailutietoihin voi kuulua myös esimerkiksi koodikirjat ja README-tiedostot. Aiheesta enemmän esimerkiksi Tietoarkiston Aineistonhallinnan käsikirjassa, jossa ohjeistetaan yksityiskohtaisesti kvantitatiivisten ja kvalitatiivisten datatiedostojen käsittelemiseen.

HAMKissa TKI-hankkeissa kerättyjen aineistojen metadata tallennetaan ensisijaisesti HAMKin Reportronicin Aineistot-tietokantaan. Aineistosta kuvataan ainakin nimi, yleiskuvaus, aineistonkeruun ajankohta, tekijät, muoto, henkilötiedot ja käyttöoikeudet. Katso yksityiskohtainen ohje Aineistojen kuvailu Reportronicissa.

Ennen hankkeen päättymistä

Hyvissä ajoin ennen hankkeen päättymistä on tarkistettava vielä aineistoon liittyvät omistus-, hallinta- ja tekijänoikeudet ja niihin liittyvät asiakirjat, sekä rahoittajan julkaisemista ja arkistointia koskevat ehdot ja suositukset. Loppuvaiheessa arvioidaan myös, mitkä aineistot säilytetään ja määritellään säilytysaikatarve. Tarpeeton ja arkaluonteinen aineisto tuhotaan tietosuoja ja tietoturva huomioiden.

Kun aineistoa ei enää käsitellä aktiivisesti, aineiston metadata tarkistetaan ja täydennetään Reportronicissa. Kuvailutietoja suositellaan tallennettavaksi myös valtakunnalliseen Etsin-palveluun, vaikka aineisto ei olisikaan vapaasti käytettävissä.

Aineisto ja kaikki tarvittava dokumentaatio, mitä tarvitaan aineiston ymmärtämisessä ja jatkokäytössä, kootaan samaan kansioon ja tallennetaan tiedostomuotoihin, jotka soveltuvat pitkäaikaissäilyttämiseen. TKI-hankkeiden tutkimusdata säilytetään ensisijaisesti tutkimusaineistoille tarkoitetuissa data-arkistoissa, mikäli se on mahdollista.

Käy katsomassa ohje TKI-aineistojen säilyttäminen hankkeen päättyessä

TKI-aineistojen säilyttäminen ja avaaminen: Avoimuuden työkalut

 

Aiheesta muualla

Tietoarkiston Aineistonhallinnan käsikirja

Datanhallinnan muistilista (Fairdata.fi)

Aineistonhallinta opinnäytetyössä (Arene)

 

HAMK100-aineistonhallintakoulutusten materiaaleja

Aineistonhallinta, tietosuoja ja tutkimusetiikka HAMK Smart ja HAMK Edu 1.10.2019

HAMK100 011019

Aineistonhallinta, tietosuoja ja tietoturva HAMK Tech ja HAMK Bio 22.10.2019

HAMK100 221019

HÄMEEN AMMATTIKORKEAKOULU