Aineistonhallinta
Hämeen ammattikorkeakoulu
-

Aineistonhallinta

Aineistonhallinta: miksi ja miten TKI-hankkeissa?

Aineiston elinkaari

Kuvalähde: CC BY Yhteiskuntatieteellinen tietoarkisto, Aineistonhallinnan käsikirja

TKI-aineistojen hallinnalla tarkoitetaan sitä, että aineistot on luotu, tallennettu, kuvailtu ja järjestetty suunnitelmallisesti. Aineistoa hallitaan niin, että tietosuojasta ja tietoturvasta huolehditaan aineiston koko elinkaaren ajan.

Aineistonhallinnan tarkoituksena on varmistaa, että kaikissa HAMKin TKI-hankkeissa ja opinnäytetöissä noudatetaan hyvää tieteellistä käytäntöä ja että aineistonkäsittely eri vaiheissa on suunniteltu sopimuksia ja lainsäädäntöä noudattaen. Hyvällä aineistonhallinnan suunnittelulla varmistetaan aineiston löydettävyys, saavutettavuus, käytettävyys, pitkäaikaissäilytys ja jatkokäyttö.

Kun TKI-hankkeissa huolehditaan aineistonhallinnasta, siitä hyötyvät kaikki. Aineistojen avoimuus lisää TKI-toiminnan vaikuttavuutta, tunnettuutta, verkostoitumista ja nopeuttaa tutkimusta, mahdollistaa toistettavuuden ja vähentää päällekkäistä työtä. Tutkijalle aineiston tuottaminen ja avaaminen ovat ansioluetteloon lisättävä tieteellinen meriitti ja viittaaminen data-arkistoissa avattuihin aineistoihin meritoi myös tutkijaa. Lisää tietoa aineistojen jatkokäytön ja avoimen saatavuuden hyödyistä Tietoarkiston Aineistonhallinnan käsikirjassa.

Hankkeen suunnitteluvaiheessa

Mikäli TKI-hankkeessa tarvitaan tutkimuslupia tai tutkimus kuuluu eettisen ennakkoarvioinnin piiriin, huolehditaan ajoissa tutkimusluvat kuntoon ja lausunnon hakeminen eettiseltä toimikunnalta. Tutkittavien riskit ja niiden minimointi tulee arvioida myös ennen hankkeen aloitusta. Yhteistyökumppaneiden kanssa käydään läpi tarvittavat tutkimuseettiset ohjeet ja suositukset ja selvitetään osapuolien mahdolliset sidonnaisuudet.

Hankkeesta ja sen toteutuksesta laaditaan tutkimus-, projekti- tai yhteistyösopimus, jossa sovitaan hankkeeseen liittyvistä keskeisistä pelisäännöistä. Sopimuksessa määritellään muun muassa tausta-aineistojen ja tulosaineistojen omistajuus, käyttö-  ja julkaisuoikeudet.

HAMK on sitoutunut noudattamaan Tutkimuseettisen neuvottelukunnan (TENK) ihmistieteellisten tutkimusalojen eettisiä periaatteita. Tutkimusetiikasta, hyvästä tieteellisestä käytännöstä ja HAMKin tutkimuseettisen tukihenkilön tehtävistä: Avoimuuden edistäminen

Aineistonhallintasuunnitelman laatiminen osana hankkeen aloitusta

HAMKissa edellytetään aineistonhallintasuunnitelman laatimista jokaisessa TKI-hankkeessa viimeistään positiivisen rahoituspäätöksen tultua voimaan. Aineistonhallintasuunnitelmaan nimetään henkilöt, jotka ovat vastuussa aineistonhallintaan liittyvistä tehtävistä hankkeen aikana. TKI-hankkeissa olosuhteet ja tarpeet voivat muuttua ja siksi aineistonhallintasuunnitelma tarkentuu ja sitä päivitetään hankkeen edetessä.

Suunnitelma laaditaan DMPTuuli-työkalulla vastaamalla kysymyksiin, jotka perustuvat aineistonhallinnan viiteen osa-alueeseen: 1) aineiston yleiskuvaus (datan kerääminen ja käyttö), 2) eettisten periaatteiden ja lainsäädännön noudattaminen, 3) dokumentointi ja metadata, 4) tallentaminen ja varmuuskopiointi hankkeen aikana ja 5) aineiston avaaminen, julkaiseminen ja arkistointi hankkeen päätyttyä. Rahoittajilla voi lisäksi olla omat vaatimuksensa aineistonhallintasuunnitelman laatimiseen: Rahoitus ja rahoittajien aineistonhallintaa koskevia vaatimuksia (SeAMK)

Aineistonhallinta hankkeen aikana

Datan tallentaminen

Datan keräämisen yhteydessä pitää jo miettiä, millaisessa tiedostomuodossa dataa käsitellään ja miten pitkään data pitää säilyttää sekä arvioitava onko data mahdollisesti pitkäaikaissäilytettävää. Data voi vaatia digitalisoinnin ja tiedostomuodoista riippuen pitää ottaa myös ohjelmaversiot huomioon. Arkistointikelpoisista tiedostomuodoista on pitkäaikaissäilytyksen yhteydessä mainittu tiedostomuodot, jotka on siirtokelpoisia ja ne mitkä ovat arkistointikelpoisia. Mikäli data ei ole siirto- ja säilytyskelpoinen, pitää se ennen siirtoa muuntaa säilytyskelpoiseen muotoon. Ajantasaiset tiedot tiedostomuodoista löytyy digitalpreservation.fi/ sivuilta.

Datan säilytys ja varmuuskopioinnista huolehtiminen

Datan käsittelyvaiheessa pitää miettiä kenellä pitää dataan olla oikeudet. Mikäli tutkimusta tekee vain yksi henkilö voi hän säilyttää datan HAMKissa omalla p-asemalla. Tällöinkin on hyvä huomioida se että datasta on olemassa kaksi eri versiota toinen on se versio, jolle ei tehdä mitään tutkimukseen liittyviä toimenpiteitä ja toinen on se jolle tehdään. Näin menetellessä voidaan aina palata alkuperäiseen aineistoon. Data on myös varmuuskopioitu HAMKin käytänteiden mukaisesti.

Dataa voidaan käsitellä myös tutkimusryhmissä. Jos tutkimusryhmä koostuu HAMKin työntekijöistä, data voidaan ensisijaisesti tallentaa HAMKin palvelimelle s-asemalle, kun sille tilataan tallennustila ServiceDesk palvelun kautta. Vaikka tiedostoista otetaan varmuuskopiot on tutkimuksesta vastaavan hyvä määritellä myös aineistolle toinen säilytyspaikka. Toinen on alkuperäisen datan säilyttämiseen ja toinen työversio. HAMKin palvelimella data on siis HAMKin tutkimusryhmille jaettavilla oikeuksilla.  Mikäli tutkimuksessa on mukana opiskelijoita pyydetään tila u-asemalta.

Tutkimusryhmässä voi olla myös  HAMKin ulkopuolisia henkilöitä. Silloin on kansalliset tallennuspaikat käytettävissä. Näistä voi mainita Fairdata kokonaisuuteen kuuluvan IDA-palvelun. IDA-palvelussa ei saa kuitenkaan käsitellä sensitiivistä dataa. Datasta kannatta myös täällä olla työversio ja alkuperäisversio. Sensitiiviselle datalle CSC tarjoaa ePouta palvelua ja siitä on tulossa helppokäyttöisempi käyttöliittymä vuoden 2019 loppupuolella.

Kansainvälisen tutkimusryhmän kesken on data mahdollista jakaa Eudat-palvelun kautta. Kansallisen sopimuksen ko. palvelun käytöstä on tehnyt CSC.

Kansallisten palveluiden osalta tutkijoita neuvoo Avoimen TKI-tuen tiimi ServiceDesk: TKI-tuki

Ennen hankkeen päättymistä

Datan jakaminen

Tutkimuksen jälkeen pitää miettiä mitä tutkimusaineistolle eli datalle tehdään. Data voidaan joko hävittää suunnitelman mukaan tai se voidaan avata muiden tutkijoiden käyttöön. Datan jakamiseen on kansallisia palveluita mm. Fairdata palvelun IDA, jossa se voidaan jäädyttää ja näin siihen saadaan pysyväisosoite, joka viedään Fairdata palvelun ETSIN työkaluun. (Tämä integrointi on vielä työnalla CSC:llä.) Aineisto pitää myös kuvailla Fairdata palvelun Qvain-työkalussa, jotta se on muiden käytettävissä.

Fairdata palvelun Etsin-työkalun kautta voidaan tuoda esille data, jonka todellinen säilytys voi olla esim. omassa korkeakoulussa. Etsin sisältää datan kuvailutiedot eli metadatan, ei varsinaista dataa. Etsimen kautta voi siis löytää myös valmiita tietoaineistoja.

Fairdata palvelukonseptin käyttämisestä lisätietoja osoitteessa https://www.fairdata.fi/

Sensitiivisen datan siirtäminen

Sensitiivisen tutkimusdatan siirtämiseen pitää käyttää joko turvapostia tai salata tiedosto esim. 7-zip työkalulla ja lähettää salausavain eri menetelmällä kuin varsinainen data. Tällöin pitää kuitenkin varmistaa, että vastaanottajalla on mahdollisuus avata tiedosto samalla ohjelmalla. Salatun ZIP-paketin siirtoon voi käyttää mm. Filesender.funet.fi palvelua tai sähköpostia. Mikäli käytetään sähköpostia tulee siis lähettää salausavain vaikka tekstiviestinä.  Turvaposti ja 7-Zip työkalut voi tilata oman työkoneen työpöydällä olevaan Software Centeriin.

Aineistonhallintaan liittyvä koulutuspaketti on valmisteilla HAMKin Moodlessa. Ota yhteyttä, jos haluat jo valmisteluvaiheessa tutustua ko. konseptiin. Kokonaisuuden valmistuttua voit suorittaa ko. aiheeseen liittyvän osaamismerkin. (HAMKin henkilökunnalle)

Lisätietoja: ServiceDesk.hamk.fi

Aineiston kerääminen ja käyttö

Tutkimusaineistossa huomioitavia asioita:

  • Tutkimusaineiston hankinnasta on kirjoitettu jo aineistonhallintasuunnitelmaan sen keräämisessä huomioitavia asioita.
  • Aineistonhallintasuunnitelmaa tulee päivittää tehtyjen toimenpiteiden mukaisesti.

Tutkimusaineistonhankinnassa ja aineistonhallintasuunnitelmassa huomioitavia asioita:

  • Kuka omistaa tutkimusaineiston tai hallinnoi sitä ja miten tutkittavia informoidaan aineiston käytöstä?
  • Mitkä ovat rahoittajan vaatimukset?
  • Onko tekijät määritelty (mahdolliset jatkokäyttäjät viittaavat aineistoihin omissa tutkimuksissaan)?
  • Liittyykö aineistoon tekijänoikeuksia?
  • Liittyykö aineistoon salassa pidettäviä asiakirjoja tai tietoa?
  • Onko henkilötietojen käsittely ja suojaaminen kunnossa?
  • Edellyttääkö aineisto rekisteriselostetta tai tietosuojaselostetta?
  • Onko tutkimusaineiston luvaton käyttö estetty?
  • Onko varmuuskopioinnista huolehdittu?

 

Eettisyys ja oikeudet

Tutkimusaineistoon voi liittyä tekijänoikeuksien piiriin kuuluvaa aineistoa. Tekijänoikeuksista on hyvä sopia jo tutkimusta aloitettaessa tutkimusryhmän kesken. Oletko tutustunut HAMKin käyttämiin sopimuslomakkeisiin? Lisätietoja tekijänoikeuksista, tutkittavien informoinnista ja anonymisoinnista löytyy Tietoarkiston aineistonhallinnan käsikirjasta.

Hamk on liittynyt syyskuussa 2018 osaksi pääkaupunkiseudun ammattikorkeakoulujen ihmistieteiden eettistä toimikuntaa yhdessä Metrpolian, Arcadan, Diakin ja Humakin kanssa . Metropolia-ammattikorkeakoulu tarjoaa kattavan ohjeistuksen tutkimusetiikasta ja hyvästä tieteellisestä käytännöstä ammattikorkeakoulujen tki-toiminnassa. 

Lisätietoa tutkimusetiikasta ja hyvästä tieteellisestä käytännöstä löydtä Avoimuuden edistäminen -sivulta. 

Aineiston säilytys ja varmuuskopiointi hankkeen aikana

Kuinka aineisto säilytetään ja varmuuskopioidaan? Arvioi tarvittavan säilytystilan määrä ja pohdi, kuinka aineistoon pääsy hallitaan.

Mikäli aineisto on todella suuri, useita teratavuja, tarjoaa CSC aktiivisille aineistoille tallennustilaa. Mikäli aineisto on pieni, voi sen aktiivisena aikana tallentaa HAMKissa omalle p-asemalle. Tee aineistostasi itsellesi työkopio ja nimeä tiedostot selvästi.

Aineiston dokumentointi ja laatu

Tutkimusaineistoon liittyy varsinainen data ja siihen liittyvä metadata. Kvantitatiivisen ja kvalitatiivisen datan käsittelyyn ja tallennukseen, nimeämiseen, tiedostomuotoihin sekä aineiston laadun takaamiseen löytyy hyviä ohjeita Tietoarkiston sivuilta. Sivustolta löytyy ohjeet myös, miten data-aineiston anonymisointia voi tehdä ja miten aineiston kuvailu sekä siihen liittyvää metadataa käytetään, jotta aineisto on käytettävissä myös mahdollisissa jatkotutkimuksissa.

Aineiston jakaminen ja pitkäaikaissäilytys

Kun tutkimus on tehty ja tulokset julkaistu, pitää vielä miettiä miten aineistoa pitkäaikaissäilytetään ja kuinka siihen taataan muille tutkijoille pääsy?

Tiedostojen siirtokelpoisuudesta ja soveltuvuudesta pitkäaikaissäilyttämiseen on myös huolehdittava. Esimerkiksi dokumenteille, joiden tulee säilyä muuttumattomina, suositellaan standardoitua PDF/A-tiedostomuotoa. Lisätietoa soveltuvista tiedostomuodoista >>

Myös tutkimusaineiston mahdollinen hävittäminen toteutetaan suunnitelmallisesti. Käyttötarpeen päätyttyä tiedostot väliaikaistiedostoineen poistetaan ja aineistosta riippuen tiedostot tuhotaan lopullisesti.

HÄMEEN AMMATTIKORKEAKOULU