FIN-CLARIN -johtoryhmän kokous
Aika: to 23.9.2019 klo 13.35–14.55
Paikka: Skype-videokokous
Osallistujat:
Sirpa Aalto (Oulun yliopisto)
Marja-Liisa Helasvuo (Turun yliopisto) (14.05 asti)
Merja Koskela (Vaasan yliopisto)
Anna-Liisa Kristiansson (Kotus)
Mikko Kurimo (Aalto-yliopisto)
Martin Matthiesen (CSC, kutsuttu asiantuntija)
Mikhail Mikhailov (Tampereen yliopisto)
Krister Lindén, pj.
Hanna Westerlund, siht.
PÖYTÄKIRJA
1. Järjestäytyminen ja tiedotusasiat
2. RDHum 2019
- Todettiin, että kokousjärjestelyt sujuivat mallikkaasti ja konferenssi oli onnistunut. Linkki julkaisuun (pdf) löytyy konferenssin sivulta: https://www.oulu.fi/suomenkieli/node/62808
- Kävijätilastoja: Osallistujia: 72 + 4 opiskelijaa, Työpajoja viisi, sektioita 10 (esityksiä 33 + 3 plenaariesitystä, postereita 5), Osallistujia Suomen lisäksi Virosta, Ruotsista, Espanjasta, Norjasta, Japanista. Rahoitus riitti hyvin. (Sisko Brunni sähköpostitse).
3. Esitys: RDHum 2021 Jyväskylässä
- Hyväksyttiin Jyväskylän yliopiston ehdotus konferenssin Research Data and Humanities 2021, RDHum2021, järjestämisestä Jyväskylän yliopistossa.
4. Kielipankin kiertueet / Roadshow 2019
- Todettiin menneet ja tiedossa olevat kiertuetapahtumat (esityslistassa). Tulevista: Vaasan yliopistossa tutkitaan mahdollisuutta esitellä Kielipankkia peruskurssin yhteydessä ja Merja Koskela mainitsi myös ensi vuoden VAKKI-juhlasymposiumin Vaasassa 6.-7.2.2020, jossa Kielipankin ainakin olisi hyvä olla mukana. Aallon osalta selvitetään mahdollisuuksia yhdistää Kielipankin esittely johonkin säännöllisesti järjestettävään HELDIG-tilaisuuteen, jos molemmilla on yhteinen kohderyhmä. Muutoin suunnitellaan erillistä tilaisuutta.
5. Toimintaympäristö henkilötietoja sisältävän aineiston käsittelyyn
- Martin Matthiesen (CSC) esitteli CSC:n pilottihanketta, joka on meneillään yhteistyössä HY:n (lääketiede) kanssa. Esitys: Developments of Sensitive Data at CSC
Todettiin, että myös Kielipankissa on tarvetta erikoiskategoriaan kuuluvan datan säilyttämiseen, kun anonymisointi ei ole mahdollista, esim. Kotuksen puheentutkimuksen aineistot.
6. Keskusteluasia: FIN-CLARIN-johtoryhmän rooli henkilötietoja sisältävän aineiston julkaisuprosessissa
- Keskusteluasia liittyy tarpeeseen ottaa mm. tietosuoja-asetusta edeltävänä aikana kerättyjä henkilötietoja sisältäviä aineistoja tutkimuskäyttöön hallitusti huomioiden sen keräämiseen liittyvät tiedossa olevat seikat. Tarvitaan Tietoarkiston mallin mukainen hallinnollinen päätös, jolla aineisto voidaan tietoisesti ottaa käsiteltäväksi Kielipankkiin. FIN-CLARIN-johtoryhmä arvioi aineiston tärkeyden tutkimusyhteisölle perustellusti ja tekee päätöksen aineistojen ottamisesta käsittelyyn. Päätös perustuu aineistosta käytettävissä olevaan tietoon, joka on selvitys sen laadusta, keräämisestä, tallennusprosessista ja siihenastisesta käsittelystä. Johtoryhmässä kannatettiin asian edistämistä.
7. Aineistokatsaus: jory priorisoinnit 2018
- Keväällä 2018 johtoryhmä priorisoi tuolloin tulevien aineistojen listalla olevat aineistot. Hanna Westerlund esitteli katsauksen nykytilanteeseen. UHLCS:n (University of Helsinki Corpus Server) sisältämät pienten kielten aineistot eivät ole katsauksessa mukana, mutta toisaalta siihen on lisätty priorisoinnin jälkeen Kielipankkiin tallennettuja ja julkaistuja tai julkaisuprosessissa olevia aineistoja, joilla on erityinen muu prioritetti, esim. aineiston koko (YLE; STT), karttuva aineisto (Suomi24) tai kysyntä tutkimuskentällä (ORACC). Excel on lähetetty johtoryhmälle kokouskutsun liitteenä, siinä on johtoryhmän prioriteetteja laajempi katsaus nykytilanteeseen. Osa johtoryhmän priorisoimista aineistoista on tehty (15), osa on tekeillä (6), osassa on selvitettävä tietosuojaa (9) ja osan julkaisuprosessi ei ole edistynyt (12) tai on kohdannut esteen (7).
5. Kokous päättyi klo 14.53