Kielipankki koostuu kattavasta joukosta aineistoja sekä niiden tutkimiseen soveltuvista ohjelmistoista tehokkaassa laiteympäristössä. Jyväskylän yliopiston tutkimusavustaja Jenny Tarvainen kertoo, miten hän hyödyntää tutkimuksessaan Kielipankin aineistoa Kansainvälinen oppijansuomen korpus, ICLFI.
Olen Jenny Tarvainen. Valmistuin vuoden 2019 tammikuussa Jyväskylän yliopistosta maisteriksi suomen kieli pääaineenani. Tällä hetkellä teen töitä maahanmuuttajien suomen kielen opettajana, mutta tarkoituksenani on hakeutua jatko-opintoihin lähitulevaisuudessa. Ajauduin korpustutkimuksen maailmaan jo kandidaattivaiheessa, eikä loppua vielä näy. Kielipankki on siis tullut vuosien varrella varsin tutuksi.
Maisterintutkielmani (Tarvainen 2018) oli vertaileva korpustutkimus SAADA-verbin fraseologisista piirteistä natiivi- ja oppijansuomessa. Tavoitteenani oli kontrastiivisen oppijankielen analyysin (CIA) avulla selvittää, kuinka suomenoppijoiden SAADA-verbin käyttö eroaa natiivipuhujien tavasta käyttää kyseistä verbiä. Tarkastelin eroja verbistä käytettyjen muotojen sekä verbiä ympäröivien merkitysten kautta. Tarkastelin myös näiden muotojen ja merkitysten välistä suhdetta tilastollisin menetelmin. Mielenkiintoista oli, että suomea vieraana kielenä opiskelevien käytössä muotojen ja merkitysten välillä oli vahvempi yhteys kuin natiivien kirjoittamissa teksteissä, eli SAADA-verbin tietty muoto esiintyi oppijankielessä kiinteämmin kontekstin tietyn merkityksen kanssa: esimerkiksi verbimuodon saavat ympärillä puhutaan todennäköisesti perheestä tai yleisesti ihmisistä, kun taas perusmuodon saada ympärillä teemoja ovat paikka, suunta ja tila.
Lisäksi opintojen aikana sekä valmistumisen jälkeen olen tehnyt tutkimusavustajan työtä Jyväskylän yliopiston suomen kielen professori Jarmo Jantusen tutkimusprojekteissa. Näissä tutkimuksissa on tarkasteltu muun muassa sitä, kuinka homo- ja heteroseksuaaleista puhutaan mediassa (Jantunen 2018) ja millaisia diskursseja nousee esiin pääkaupunkiseudun eri kaupungeista puhuttaessa (tulossa). Näiden tutkimusprojektien aikana olen tutustunut muun muassa korpusavusteiseen diskurssintutkimukseen (CADS). Parhaillani työstän väitöskirjan tutkimussuunnitelmaa syksyn jatko-opinto-oikeushakua varten. Korpukset pysyvät osana tutkimustani: aion koneoppimisen avulla tarkastella pääkaupunkiseutuun liittyviä diskursseja Suomi24 -korpuksesta.
Maisterintutkielmaani varten keräsin oppijankielen aineiston Kansainvälisestä oppijansuomen korpuksesta, ICLFI:stä. Kyseiseen korpukseen on kerätty suomea vieraana kielenä opiskelevien tekstejä, jotka on luokiteltu taitotasoittain. Itse käytin edistyneiden opiskelijoiden tekstejä, koska vertailuaineistona oli äidinkielisten suomen puhujien tuotoksia. Korpuksen monipuolisten tekstien vuoksi (esseet, referaatit, mielipidekirjoitukset, sähköpostiviestit, työhakemukset…) aineistolla pääsi todella tutkimaan oppijankieltä laajasti siten, ettei tullut tutkineeksi vain tietyn genren piirteitä tai tietyn äidinkielen vaikutusta.
Muissa tutkimuksissa on käytetty Suomi24 -korpusta. Laajasta korpuksesta on ollut mahdollista kerätä pienempiä osakorpuksia hakutulosten perusteella, kuten homo- ja hetero-korpukset ja pääkaupunkiseudun eri kaupunkien osakorpukset. Näistä on ollut mahdollista päästä kiinni osakorpuksissa ilmeneviin diskursseihin.
Tarvainen, Jenny 2018: SAADA-verbin fraseologiaa: vertaileva korpustutkimus oppijan- ja natiivikielestä. Maisterintutkielma. Jyväskylän yliopisto. https://jyx.jyu.fi/handle/123456789/59273?show=full
Jantunen, Jarmo H. 2018: Homot ja heterot Suomi24:ssä: analyysi digitaalisista diskursseista. Puhe ja kieli, 38(1), 3–22. https://doi.org/10.23997/pk.65488
FIN-CLARIN eli suomalaisten yliopistojen, CSC – Tieteen tietotekniikan keskuksen ja Kotimaisten kielten keskuksen muodostama konsortio auttaa humanististen tieteiden tutkijoita käyttämään, jalostamaan, säilyttämään ja jakamaan tutkimusaineistoja. Aineistoja ja työkaluja tarjoaa Kielipankki.
Kaikki toistaiseksi esitellyt Kielipankin käyttäjät löytyvät Kuukauden tutkija -arkistosta. Tämä artikkeli julkaistaan myös Helsingin yliopiston humanistisen tiedekunnan verkkosivuilla.