Kielipankki koostuu kattavasta joukosta aineistoja sekä niiden tutkimiseen soveltuvista ohjelmistoista tehokkaassa laiteympäristössä. Helsingin yliopiston tohtorikoulutettava Tatu Huovilainen kertoo tekemästään tutkimuksesta, jossa hän on hyödyntänyt useita Kielipankin kieliresursseja sekä itse kokoamiaan aineistoja, jotka hän tallettaa Kielipankkiin. Niistä ensimmäinen, Psykolingvistiset tunnusluvut on jo julkaistu Kielipankin latauspalvelussa.
Olen Tatu Huovilainen. Olen valmistunut psykologian maisteriksi Helsingin yliopistolta 2016 ja nykyisin suoritan jatko-opintoja Brain & Mind tohtoriohjelmassa.
Väitöskirjani käsittelee lukemisen hermostollisia mekanismeja luonnollisen lukemisen aikana. Painotan tässä luonnollista lukemista, sillä näitä mekanismeja on menetelmällisistä haasteista johtuen yleensä tutkittu käyttäen kontrolloituja koeasetelmia.
Tutkin lukemisen hermostollisia mekanismeja tarkastelemalla lukemisen aikaisen hermotoiminnan synnyttämiä magneettikenttiä magnetoenkefalografialla (MEG). Lukemisen aikana suoritetaan myös silmänliikerekisteröinti, jonka avulla aivovasteaineisto yhdistetään luettujen sanojen kielellisiin piirteisiin. Näin muodostuu erittäin kattava aineisto, jonka avulla voidaan periaatteessa tarkastella minkä tahansa kvantifioitavissa olevan kielellisen piirteen yhteyttä aivovasteisiin.
Tutkimuksissani tarkastelen lauserakenteiden asteittaista muodostumista aivoissa lukemisen edetessä, sekä dysleksiassa esiintyvien erityisvaikeuksien yhteyksiä lukemisen aivovasteisiin. Myöhemmin tulen tarkastelemaan eri aivoalueiden kausaalisia rooleja lukemisessa transkraniaalista magneettistimulaatiota käyttäen (TMS).
Vähemmän kontrolloitu koeasetelma johtaa vaativampaan kontrolliin aivovasteaineiston analysointivaiheessa. Luetutetut tekstit tulee annotoida mahdollisimman kattavasti ja tarkasti, jotta eri kielellisten piirteiden käsittelyyn liittyvä aivotoiminta voidaan erottaa toisistaan. Kielipankki tarjoaa monipuolisesti aineistoja ja työkaluja näiden tunnuslukujen hankkimiseen. Esimerkiksi, eräs aivovasteisiin merkittävästi vaikuttava ominaisuus on luetun sanan yleisyys. Valmistellessani tutkimusteni lukuaineistoa käytin Kielipankin tarjoamia korpuksia Suomi 24 -korpus, Kansalliskirjaston sanoma- ja aikakauslehtikokoelman suomenkielinen osakorpus, Kielipankki-versio, vuodesta 1980 alkaen ja 1990- ja 2000-luvun suomalaisia aikakaus- ja sanomalehtiä -korpus, versio 2 sekä itse keräämiäni aineistoja suomenkielinen Wikipedia ja suomenkielinen OpenSubtitles sekä reddit.com/r/Suomi muodostamaan erittäin kattavan suomen kielen sanafrekvenssiaineiston.
FIN-CLARIN eli suomalaisten yliopistojen, CSC – Tieteen tietotekniikan keskuksen ja Kotimaisten kielten keskuksen muodostama konsortio auttaa humanististen tieteiden tutkijoita käyttämään, jalostamaan, säilyttämään ja jakamaan tutkimusaineistoja. Aineistoja ja työkaluja tarjoaa Kielipankki.
Kaikki toistaiseksi esitellyt Kielipankin käyttäjät löytyvät Kuukauden tutkija -arkistosta. Tämä artikkeli julkaistaan myös Helsingin yliopiston humanistisen tiedekunnan verkkosivuilla.