Kielipankki koostuu kattavasta joukosta aineistoja sekä niiden tutkimiseen soveltuvista ohjelmistoista tehokkaassa laiteympäristössä. Helsingin yliopiston maisterivaiheen opiskelija Emma Sepänaho kertoo, miten hän hyödyntää tutkimuksessaan Kielipankin aineistoa 1990- ja 2000-luvun suomalaisia aikakaus- ja sanomalehtiä -korpus, versio 2 .
Olen Emma Sepänaho, neljännen vuoden suomen kielen opiskelija Helsingin yliopistosta. Teen parhaillaan sanastoaiheista pro gradu -tutkielmaa selkosuomesta.
Tutkin opinnäytetyössäni selkokielisissä mediateksteissä esiintyviä pitkiä sanoja. Ainakin tällä hetkellä on tarkoitus keskittyä 20-merkkisiin ja tätä pidempiin sananmuotoihin. Aion tehdä morfologista analyysiä, tarkastella taivutusta ja sananmuodostusta, monimorfeemisuutta ja morfeemien yleisyyttä sekä sitä, millaisiin semanttisiin aihealueisiin näin pitkät sanat sijoittuvat. Koska selkokielen suosituksissa kehotetaan välttämään pitkien sanojen käyttöä, on mielenkiintoista, että näinkin pitkiä saneita löytyy pelkästään yhdestä selkokielikorpuksesta yli tuhat. Selkokieltä on Suomessa tutkittu toistaiseksi vähän, ja tutkielmani toivottavasti tuottaakin arvokasta perustietoa selkosuomen luonteesta.
Olen kerännyt tutkielmani aineiston Kielipankin Selkosanomat/Selkouutiset-osakorpuksesta, joka sisältyy Kielipankin aineistoon 1990- ja 2000-luvun suomalaisia aikakaus- ja sanomalehtiä -korpus, versio 2 ja joka sisältää Selkosanomissa (ent. Selkouutiset) julkaistuja selkokielisiä mediatekstejä vuosilta 2006–2013. Korpus on tutkimukseni toteutuksen kannalta hyödyllinen, sillä Korp-käyttöliittymän ansiosta voin suoraan keskittyä hakulauseen tuottamiin saneisiin eikä sanoja tarvitse etsiä manuaalisesti selkokielisistä teksteistä. Alun perin olisin halunnut hakea korpuksesta yli kolmitavuisia kompleksisia sanoja, mutta se ei aineiston jäsennysominaisuuksista johtuen tyydyttävästi onnistunut. Onneksi kuitenkin pelkän merkkimäärän määrittelevä lausekekin tuottaa kelpo aineiston tutkimustani varten.
FIN-CLARIN eli suomalaisten yliopistojen, CSC – Tieteen tietotekniikan keskuksen ja Kotimaisten kielten keskuksen muodostama konsortio auttaa humanististen tieteiden tutkijoita käyttämään, jalostamaan, säilyttämään ja jakamaan tutkimusaineistoja. Aineistoja ja työkaluja tarjoaa Kielipankki.
Kaikki toistaiseksi esitellyt Kielipankin käyttäjät löytyvät Kuukauden tutkija -arkistosta. Tämä artikkeli julkaistaan myös Helsingin yliopiston humanistisen tiedekunnan verkkosivuilla.