Hyppää sisältöön
Henkilö hymyilee ja istuu ulkona kannettava tietokone sylissään.
Home Tutkimus Aineistonhallinta

Aineistonhallinta

Aineistonhallinta: miksi ja miten TKI-hankkeissa?

Aineistonhallinnan suunnittelun tarkoituksena on varmistaa, että TKI-hankkeissamme noudatetaan hyvää aineistonhallintatapaa (Hyvä aineistonhallintatapa HAMKissa) ja hyvää tieteellistä käytäntöä sekä huolehditaan tietosuojasta ja tietoturvasta (Tutkimuksen tietosuoja).

Aineistonhallinnan suunnittelu koskee koko aineiston elinkaarta: aineistojen luomista, tallentamista, kuvailua ja järjestämistä hankkeen aikana. TKI-aineistoja ovat digitaalisessa muodossa olevat aineistot, jotka voivat olla tutkimuksen aikana tuotettuja mittaustuloksia, laboratoriopäiväkirjoja, lähdekoodeja, ohjelmistoja, tilastoja, kuvia, äänitteitä, haastatteluiden litterointeja, kyselyaineistoja tai kenttätyöhön perustuvia havaintoja. Aineistot voivat olla myös fyysisiä ja biologisia aineistoja. Hyvällä aineistonhallinnan suunnittelulla varmistetaan aineistojen jatkokäyttö ja avoimuus avoimen tieteen periaatteiden mukaisesti: niin avointa kuin mahdollista, niin suljettua kuin tarpeellista.

Kun TKI-hankkeissa huolehditaan aineistonhallinnasta, siitä hyötyvät kaikki. Aineistojen avoimuus lisää TKI-toiminnan vaikuttavuutta, tunnettuutta ja verkostoitumista ja nopeuttaa tutkimusta, mahdollistaa toistettavuuden ja vähentää päällekkäistä työtä. On siis tärkeää tietää, millaisia aineistoja TKI-hankkeissa kerätään ja miten ne ovat saatavissa käyttöön.

Tutkijalle aineiston tuottaminen ja avaaminen ovat ansioluetteloon lisättävä tieteellinen meriitti ja viittaaminen data-arkistoissa avattuihin aineistoon meritoi myös tutkijaa. Lue Tietoarkiston sivuilta lisää jatkokäytön ja avoimen saatavuuden hyödyistä.

Hankkeen suunnitteluvaiheessa

HAMKissa edellytetään aineistonhallintasuunnitelman laatimista TKI-hankkeessa viimeistään positiivisen rahoituspäätöksen tultua voimaan. Aineistonhallintasuunnitelmassa nimetään ne henkilöt, jotka ovat vastuussa aineistonhallintaan liittyvistä tehtävistä hankkeen aikana. TKI-hankkeissa olosuhteet ja tarpeet voivat muuttua ja siksi myös aineistonhallintasuunnitelma tarkentuu ja sitä päivitetään hankkeen edetessä. Rahoittajilla voi lisäksi olla omat vaatimuksensa aineistonhallintasuunnitelman laatimiseen, aiheesta enemmän esimerkiksi SeAMKin Rahoittajien avoimuutta koskevia vaatimuksia -osiossa.

HAMK on sitoutunut noudattamaan Tutkimuseettisen neuvottelukunnan (TENK) ihmistieteellisten tutkimusalojen eettisiä periaatteita, jotka kuvataan HAMKin tietosuoja- ja etiikka -sivulla.  Sivulta löytyy tietoa myös HAMKin tutkimuseettisen tukihenkilön tehtävistä. Yhteistyökumppaneiden kanssa käydään läpi tarvittavat tutkimuseettiset ohjeet ja suositukset ja selvitetään osapuolien mahdolliset sidonnaisuudet.

Jos TKI-toiminnan kohteena on ihminen, hankkeessa selvitetään, mitä lupia tai lausuntoja hankkeessa tarvitaan. Jos kohteena on organisaatiossa (esimerkiksi oppilaitos tai yritys) tapahtuva toiminta, tarvitaan lupa organisaatiolta TKI-toiminnan toteuttamiseen. Organisaatioiden lupakäytänteet kerrotaan usein kohdeorganisaation verkkosivuilla. Mikäli TKI-hankkeessa tarvitaan tutkimuslupia tai tutkimus kuuluu eettisen ennakkoarvioinnin piiriin, huolehditaan tutkimusluvat ajoissa kuntoon ja lausunto haetaan asianmukaiselta eettiseltä toimikunnalta.

TKI-aineistot voivat sisältää sekä tekijänoikeudellisesti suojattuja että suojaamattomia aineistoja, joiden käytöstä on syytä sopia jo hankkeen suunnitteluvaiheessa. Tekijänoikeuksista ja omistusoikeuden siirtymisen sopimisesta sekä tekijyyden merkitsemisjärjestyksestä lisätietoa Tietoarkiston Aineistonhallinnan käsikirjan Sopimukset ja oikeudet -osiossa.

Hankkeesta ja sen toteutuksesta laaditaan tutkimus-, projekti- tai yhteistyösopimus, jossa sovitaan hankkeeseen liittyvistä keskeisistä pelisäännöistä. Sopimuksessa (TKI-hankkeiden valmistelu: Sopimukset, HAMK Intranet) määritellään myös tausta-aineistojen ja tulosaineistojen omistajuus, käyttö-  ja julkaisuoikeudet. Lähtökohtaisesti julkisrahoitteisissa hankkeissa vaaditaan tulosten julkaisemista avoimesti hankkeen päättymisen jälkeen. HAMKin Yritysyhteistyössä tehtävän TKI-hankkeen tutkimuseettinen itsearviointi-ohje on suunniteltu helpottamaan erityisesti yritysten kanssa yhteistyössä toteutettavien hankkeiden suunnittelua.

HAMKin uusille hankkeille on laadittu alkavien hankkeiden yleisohje, jossa opastetaan alkavia hankkeita aineistonhallintaan, tutkimusetiikkaan, tietosuojaan, julkaisusuunnitteluun ja hankeviestintään liittyvissä asioissa. Alkavan hankkeen yleisohje löytyy HAMKin intrasta (vaatii kirjautumisen HAMKin henkilökunnan tunnuksilla).

Aineistonhallinta hankkeen aikana

Aineistonhallintasuunnitelman laatiminen osana hankkeen aloitusta

Aineistonhallintasuunnitelma laaditaan DMPTuuli-työkalulla vastaamalla kysymyksiin, jotka jakaantuvat aineistonhallinnan viiteen osa-alueeseen:

1) aineiston yleiskuvaus: datan kerääminen ja käyttö.

2) eettisten periaatteiden ja lainsäädännön noudattaminen,

3) dokumentointi ja metadata,

4) tallentaminen ja varmuuskopiointi hankkeen aikana ja

5) aineiston avaaminen, julkaiseminen ja arkistointi hankkeen päätyttyä.

DMPTuuliin on laadittu kaksi HAMKin omaa aineistonhallintasuunnitelmapohjaa, toinen tutkimushankkeille ja toinen koulutus- ja kehityshankkeille. Voit valita näistä hankkeellesi parhaiten sopivan pohjan.

Aineistonhallintasuunnitelmassa kuvataan aineistot ja niiden keruutapa, omistus-, hallinta- ja tekijänoikeudet, miten tutkittavia informoidaan ja kuka antaa käyttöoikeudet aineistoihin hankkeen aikana ja sen jälkeen. Aineistonhallintasuunnitelmassa kerrotaan myös, liittykö aineistoon luottamuksellista tai salassa pidettävää tietoa tai asiakirjoja, sisältääkö aineisto henkilötietoja, miten tiedot suojataan ja onko aineistosta laadittu tietosuojailmoitus (Tietosuoja: Tietosuojailmoitus tieteellinen tutkimus, HAMK intranet).

Aineistonkeruun suunnittelu on oleellista koko TKI-hankkeen laadun ja onnistumisen kannalta. Aineiston kokoaminen suunnitellaan niin, että aineiston keruussa kunnioitetaan ihmisiin, eläimiin ja ympäristöön liittyviä yhteiskunnallisia perusarvoja ja huolehditaan lakien noudattamisesta.  Toteutusvaiheessa hyvän dokumentaation tuottaminen on tärkeää, koska jälkikäteen tapahtuva kuvailu on aikaa vievää ja joskus jopa mahdotonta.

Kaikkea aineistoa ei tarvitse välttämättä kerätä itse. Joskus sopiva aineisto on jo olemassa valmiina, aikaisemmissa tutkimuksissa kerättyjä tai esimerkiksi viranomaisten ja yritysten julkaisemia datoja löytyy erilaisista data-arkistoista.  Aineistoihin viittaamisessa pätevät samat tutkimuseettiset periaatteet kuin kirjallisiin tuotoksiin viittaamisessa. Mikäli hankkeessa hyödynnetään jo olemassa olevia aineistoja, niihin viittaamisessa noudatetaan periaatteessa samoja sääntöjä kuin julkaisuihin viittaamisessa: https://datacite.org/cite-your-data.html

Jos TKI-toiminnan kohteena on ihminen, aineiston käsittelyä suunniteltaessa otetaan huomioon henkilötietojen tunnisteellisuus ja anonymisointi (Aineistonhallinnan käsikirja, Tietoarkisto) ja erityiset henkilötietoryhmät eli arkaluonteiset henkilötietojen käsittelyn vaatimukset, katso Ohje arkaluonteisia henkilötietoja sisältävän datan hallinnan suunnitteluun ja keskeiset käsitteet (Tuuliprojekti) sekä  Täydentävä ohje arkaluonteisia ja luottamuksellisia tietoja sisältävän datan hallinnan suunnitteluun 2019 (TSV).

Tutkittavien informointi ei koske niinkään tutkimusaihetta ja tutkimuksen tavoitteita, vaan ennen kaikkea sitä, miten hankkeessa käsitellään aineistoja henkilötietojen näkökulmasta. Tietosuojan ensisijainen tarkoitus on suojata tutkittavia. Tietosuoja-asetusta ja tietosuojalakia noudattamalla varmistetaan paitsi tutkittavien oikeuksien toteutuminen, myös oma oikeusturva. Henkilötietojen käsittelylle tulee olla aina käsittelyperuste, myös vaikutuksenarviointi voi tulla tehtäväksi tutkimuksessa, jossa henkilötietojen käsittely aiheuttaa todennäköisesti korkean riskin rekisteröityjen oikeuksille ja vapauksille (Tietosuoja: henkilötietojen käsittelyn periaatteet; vaikutustenarviointi )

Informoinnin perusteella tutkittava ymmärtää, miten häntä koskevia tietoja kerätään, käytetään, siirretään, luovutetaan, säilytetään tai muulla tavoin käsitellään. Tietoarkiston Käsikirjassa Informointi henkilötietojen käsittelystä on ajantasaiset, yksityiskohtaiset ohjeet henkilötietojen käsittelyn vaatimuksista: milloin, mitä ja miten tutkittavia informoidaan.

Ennen aineistonkeruuta on mietittävä, mihin ja missä formaatissa data tallennetaan ja miten tiedostot ja niiden eri versiot nimetään. Datan tallentamisessa ja prosessoinnissa kiinnitetään erityistä huomiota ohjelmistojen ja tallennusvälineiden soveltuvuuteen niin, että aineistojen tekninen laatu pystytään varmistamaan koko datan elinkaaren ajan tietosuoja- ja turva-asiat huomioiden.

Tallennusformaatit valitaan siten, että data on siirrettävissä ja käyttökelpoista, myös pitkäaikaissäilyttäminen huomioiden. Käytettävyyden varmistamiseksi tallenna myös kopio tiedostosta sellaiseen muotoon, joka on yleisessä käytössä ja jota useat eri ohjelmat tukevat. Ajantasaiset tiedot soveltuvista tiedostomuodoista: http://digitalpreservation.fi/

HAMKin tiedon luokittelu ja käsittelyohjeesta voi tarkistaa, mitkä tallennuspaikat soveltuvat luottamukselliselle ja salassa pidettävälle aineistolle ja milloin käyttäjän on itse huolehdittava varmuuskopioinnista. Aineistojen säilyvyyden varmistamiseksi kaikki hankkeessa kertyvä aineisto kannattaa tallentaa vähintään kahteen paikkaan, työ- ja varmuuskopiot omiin tallennusjärjestelmiinsä.

Tietoturvan varmistamiseen kuuluu aineistojen turvaaminen tuhoutumiselta, muuttumiselta ja luvattomalta käytöltä. Eri käyttäjäryhmien oikeudet tiedostojen lukemiseen ja käsittelyyn on määriteltävä. HAMKissa yksittäinen henkilö voi säilyttää dataa henkilökohtaisella verkkolevyllään (P-asema), tutkimusryhmät tilaavat oman suojatun, myös sensitiiviselle datalle soveltuvan tallennustilan henkilökunnan verkkolevyltä (S-asema) ServiceDesk-palvelun kautta. Sensitiivisen datan siirtämisessä käytetään joko turvapostia tai tiedostojen salaamista. (Tietosuoja, tietoturva ja säännöt, HAMK intranet). Jos hankkeessa on mukana opiskelijoita, tallennustila pyydetään yhteiseltä verkkolevyltä (U-asema).

TKI-hankkeessa käytetään kansallisia tallennuspaikkoja, jos mukana on myös HAMKin ulkopuolisia tahoja. Tutkimushankkeille on käytössä IDA-palvelu. Kansainväliset tutkimusryhmät voivat jakaa dataa keskenään myös Eudat-palvelussa. Lisätietoa palveluista saa TKI-tuen tiimiltä.

Aineiston analyysin, käytettyjen menetelmien ja käytettyjen koodien dokumentointi tukevat tutkimuksen toistettavuutta. Aineiston keruuseen ja analyysiin liittyvät käytännöt ovat alakohtaisia ja riippuvaisia aineistotyypistä.

Metadatan tuottaminen kannattaa aloittaa ajoissa. Aineisto ilman metadataa eli kuvailevaa tietoa ei merkitse mitään lukijalleen. Metadatalla mahdollistetaan aineistojen löydettävyys, saavutettavuus, pitkäaikaissäilytys ja aineistojen uudelleenkäyttö. Jokaiselle tutkimusaineistolle kannattaa luoda oma hakemisto, johon tallennetaan tutkimusaineisto ja kuvailutiedot. Aineistonkeruuinstrumentti, kuten esimerkiksi kyselylomake tai Webropolilla toteutettava kysely, tallennetaan tekstitiedostona. Kuvailutietoihin voi kuulua myös esimerkiksi koodikirjat ja README-tiedostot. Aiheesta enemmän esimerkiksi Tietoarkiston Aineistonhallinnan käsikirjassa, jossa ohjeistetaan yksityiskohtaisesti kvantitatiivisten ja kvalitatiivisten datatiedostojen käsittelemiseen.

HAMKissa TKI-hankkeissa kerättyjen aineistojen metadata tuotetaan joko kansallisessa Qvain-palvelussa tai aineistonhallintasuunitelmaa päivittämällä. HAMKin TKI-tuen tiimi ohjeistaa päättyviä hankkeita aineistojen metadatan tuottamisessa.

Ennen hankkeen päättymistä

Hyvissä ajoin ennen hankkeen päättymistä on tarkistettava vielä aineistoon liittyvät omistus-, hallinta- ja tekijänoikeudet ja niihin liittyvät asiakirjat, sekä rahoittajan julkaisemista ja arkistointia koskevat ehdot ja suositukset. Julkaistavalle tutkimusaineistolle on myös valittava asianmukainen lisenssi. Lisenssin valinnassa auttaa ohje tekijänoikeuksiin liittyvästä avoimesta lisensoinnista.  Loppuvaiheessa arvioidaan myös, mitkä aineistot säilytetään ja määritellään säilytysaikatarve. Tarpeeton ja arkaluonteinen aineisto tuhotaan tietosuoja ja tietoturva huomioiden.

Aineisto ja kaikki tarvittava dokumentaatio, mitä tarvitaan aineiston ymmärtämisessä ja jatkokäytössä, kootaan samaan kansioon ja tallennetaan tiedostomuotoihin, jotka soveltuvat pitkäaikaissäilyttämiseen. TKI-hankkeiden tutkimusdata säilytetään ensisijaisesti tutkimusaineistoille tarkoitetuissa data-arkistoissa, mikäli se on mahdollista.

Päättyville hankkeille on laadittu yleisohje (vaatii kirjautumisen HAMKin henkilökunnan tunnuksilla), jossa ohjeistetaan HAMKin suosittelemat säilytyspaikat TKI-hankkeiden tutkimusaineistolle. Lisäksi ohjeessa kuvataan muun hankemateriaalin säilyttäminen.

Tutkimusaineiston säilyttämiseen hankkeen päättyessä sisältyy myös aineistoa kuvaavan tiedon tuottaminen. Tiedot aineistosta ja sen säilytyksestä päivitetään aineistonhallintasuunnitelmaan. Vaihtoehtoisesti aineiston kuvailutiedot voidaan tuottaa valtakunnallisessa Qvain-palvelussa, jolloin ne ovat löydettävissä kansallisella Tiede ja tutkimus -sivustolla. HAMKin TKI-tuen tiimi opastaa aineiston säilyttämisessä ja kuvailutietojen tuottamisessa tarkemmin.