Olet muuttamassa ja mahduttanut koko omaisuutesi neljäänkymmeneen pahvilaatikkoon, kun ystäväsi soittaa sinulle ja pyytää juhliinsa lainaksi sitä vihreää boolimaljaa. Tuijotat samannäköisiä pahvilaatikoitasi ja mietit mistä ihmeestä aloitat etsintätyön. Boolimaljaa etsiessäsi löydät laatikon, jossa on edesmenneen sukulaisesi sinulle jättämiä epämääräisiä tarvikkeita ja työkaluja, joista sinulla ei ole mitään tietoa, mitä ne ovat tai miten niitä kuuluisi käyttää. Roskiin menee.
Seuraavassa muutossa olet viisaampi. Kirjoitat laatikoiden päälle tussilla mitä niissä on yleisellä tarkkuudella, kuten “keittiötarvikkeita”, tai “lastentarvikkeita”. Nyt laatikoiden kantaminen oikeisiin huoneisiin onnistuu, ja boolimaljankin etsiminen nopeutuu. Tällä kertaa ystäväsi kuitenkin pyytää lainaksi lasten muovilautasia. Et ehdi etsiä niitä hänelle, joten ystäväsi joutuu tekemään sen itse. Hän ei kuitenkaan tiedä, missä laatikossa lasten muovilautasten kuuluisi olla. Ovatko ne ehkä keittiötarvikkeita? Vai lastentarvikkeita? Vai jotain muuta?
Kolmannen muuton yhteydessä päätät siirtää osan tavaroistasi varastoon säilytykseen. Teippaat jokaisen pahvilaatikon kanteen listan tavaroista, joita se sisältää, ja kenen perheenjäsenesi ne ovat. Kirjoitat tarvikkeiden yhteyteen myös muita olennaisia tietoja, kuten minä vuonna ne on hankittu, tai mitä kokoa vaatteet ovat. Merkitset myös ylös, jos olet tehnyt tavaroille jotain, esimerkiksi jos tavara on käytetty, tuunattu tai käyttämätön. Liität laatikoihin mukaan myös tarvikkeiden käyttöohjeet. Näin sinun on helppo löytää vuosienkin kuluttua oikeat tarvikkeet laatikoista, ja tiedät kenen ne ovat ja mitä ne ovat. Kun ystäväsi taas haluaa lainata jotain, hän näkee laatikon kannesta heti, mitä se sisältää.
Tätä on metadata. Sen merkityksen ymmärtää usein vasta silloin kun tietoa tarvitsisi, mutta sitä ei ole.
Kuten yhdysvaltalainen arkistonhoitaja ja tekniikan historioitsija Jason Scott on osuvasti todennut, metadata on rakkauskirje tulevaisuuteen.
Metadataa tuotetaan ja hyödynnetään monenlaisissa tilanteissa ja palveluissa, ja erityisen tärkeässä roolissa se on tutkimus-, kehittämis- ja innovaatiotoiminnan (TKI) tutkimusaineistoissa. Aineiston kuvailu ja dokumentointi tekevät siitä ymmärrettävän, saavutettavan ja käytettävän.
Avoimet tutkimusaineistot ja metadata
Viime vuosina on puhuttu paljon avoimista aineistoista TKI-toiminnassa. Se tarkoittaa käytännössä sitä, että TKI-hankkeissa tuotettuja tutkimusaineistoja julkaistaan niin, että niitä olisi mahdollista käyttää muissa projekteissa, opetuksessa tai yritystoiminnassa.
Kyse on siis siitä, että TKI-toiminnan tutkimusaineistojen elinkaari jatkuu hankkeen päättymisen jälkeen. Se on toivottavaa, sillä suuri osa TKI-toiminnasta rahoitetaan yhteisin verovaroin. Kaikki yhteiskunnallinen hyöty kannattaa siis maksimoida.
Suomalaiset ammattikorkeakoulut Metropolia mukaan lukien ovat sitoutuneet edistämään tutkimusaineistojen avoimuutta, mutta itse aineistojen avaaminen etenee kovin hitaasti. Siihen löytyy monia syitä. Silloin kuin aineistoja kuitenkin haluttaisiin avata jatkokäyttöön, saattaa eteen tulla odottamaton este: aineisto on kuvailtu puutteellisesti eikä tarvittavaa metadataa ole, eikä sitä aina ole mahdollista tuottaa jälkikäteen.
Yhtenäiset käytännöt helpottavat tutkimusaineistojen hallintaa
TKI-hankkeen tiimellyksessä metadatan ja dokumentoinnin tärkeys unohtuu helposti, koska tutkimusaineistot ovat yleensä tekijälleen tuttuja – ainakin aineistonkeruun aikana. Kun aikaa kuluu, yksityiskohdat haalistuvat ja tärkeää tietoa voi kadota myös tekijän muistista, mikäli niitä ei kirjaa ylös. Yhtenäiset dokumentointi- ja metadatakäytännöt mahdollistavat sen, että muut hankkeessa työskentelevät ymmärtävät aineistoa ja että eri henkilöt tulkitsevat aineistoa samalla tavalla. Siten metadata parantaa myös tutkimuksen luotettavuutta ja mahdollistaa sen toistamisen.
Aineistonhallinnan tukipalvelujen näkökulmasta tutkimusaineistojen kuvailun yhtenä haasteena on se, että siihen on vaikea antaa kovin tarkkoja yleispäteviä ohjeita. Eri aloilla on käytössä erilaisia metadatastandardeja, joilla pyritään yhteneväisempiin käytäntöihin, mutta sopivan standardin löytäminen voi toisinaan olla haastavaa. Tutkimukset ovat erilaisia, niissä on erilaisia tavoitteita ja niissä tuotetaan hyvin erilaisia aineistoja.
Kuvailu pitäisikin aina suunnitella aineistokohtaisesti, miettiä mitkä metatiedot ovat juuri tämän aineiston kannalta olennaisia. Erityisen paljon kuvailuun kannattaa panostaa silloin kun aineisto on arvokasta ja ainutlaatuista, kyse on pitkittäistutkimuksesta, tai kun aineistoa halutaan jatkokäyttää.
Metropolian metadatamalli tutkimustyön tukena
Metropolialla on käytössä metadatamalli, jota voi käyttää kuvailun apuna omaan tutkimukseen soveltuvin osin. Arvokkaiden ja jatkokäyttöön tarkoitettujen aineistojen osalta kuvailu ja dokumentointi voi olla järkevää suunnitella yhdessä aineistonhallinnan asiantuntijoiden kanssa, koska silloin minimi-metatiedot eivät riitä.
Muita oppaita tutkimusaineistojen dokumentointiin:
- Helsingin yliopiston dokumentointiopas: Siiri Fuchs, & Mari Elisa Kuusniemi. (2018). Making a research project understandable – Guide for data documentation (1.2). Zenodo.
- Yhteiskuntatieteellisen tietoarkiston aineistonhallinnan käsikirja: Aineiston kuvailu ja metadata (tuni.fi).
Avoin tiede ja tutkimus, avoin TKIO:
- Tieteellisten seurain valtuuskunta: Avointiede.fi -sivusto
- Ammattikorkeakoulujen avoin TKIO-verkosto (eduuni.fi)
Portaali kotimaisten avointen tutkimusaineistojen etsimiseen: tiedejatutkimus.fi -sivusto
Kirjoittaja
Joona Koiranen (FM) toimii Metropolia Ammattikorkeakoulussa tietoasiantuntijana ja tarjoaa aineistonhallinnan tukipalveluja. Tutustu ORCID: 0000-0003-1415-5866
2 Kommenttia
Hyvä, ymmärrettävä ja selkeä kuvaus käsiteltävästä aiheesta. Erinomaista!
Kiitos!