Kielipankki koostuu kattavasta joukosta aineistoja sekä niiden tutkimiseen soveltuvista ohjelmistoista tehokkaassa laiteympäristössä. Oulun yliopiston yliopistonlehtori Maija Saviniemi kertoo, miten hän hyödyntää tutkimuksessaan Kielipankin aineistoa Iijoki, Oulun yliopiston Päätalo-kokoelma, Kielipankki Korp -versio.
Olen Maija Saviniemi, oululainen yliopistonlehtori ja suomen kielen tutkija. Olen väitellyt kielenhuoltodiskursseista vuonna 2015, ja kiinnostuksenkohteitani ovat erilaiset sosiolingvistiset aiheet.
Ennen aiheen esittelyä täytyy hiukan taustoittaa, miten tähän hetkeen on tultu. Jo väitöskirjaa tehdessäni huomasin miettiväni, miten monenlaisia asioita sähköiset aineistot voisivat mahdollistaa ensinnäkin aineistoon perehtymisessä ja toisaalta erityisesti analyysivaiheessa. Laatiessani oppiaineemme 50-vuotishistoriikkiämme muutama vuosi sitten perehdyin jonkin verran Oulun korpuksen syntyvaiheisiin vuodesta 1967 lähtien ja aloin miettiä, miten voisin omalta osaltani ylläpitää laitoksemme sähköisten aineistojen tutkimusperinteitä. Vuosi sitten Sari Keskimaa väitteli meillä Oulussa Kalle Päätalon Iijoki-sarjasta kielielämäkertana.
Oikeastaan nämä kolme toisistaan alun perin erillistä asiaa ovat jotenkin punoutuneet mielessäni yhteen niin, että havaitsin ehdottavani sekä Kielipankin väelle että Kalle Päätalon tuotannon oikeuksien omistajille, voitaisiinko julkaista koko Iijoki-sarja korpuksena. Kielipankki oli heti mukana ajatuksessa. Myös sekä kirjailijan omaiset että Gummerus Kustannus suhtautuivat myötämielisesti hankkeeseen alusta saakka, ja koska Gummerus oli julkaissut Iijoki-sarjan 26 romaania e-kirjoina, niiden saattaminen sähköiseen muotoon oli jo käytännössä tehty. ”Iijoki, Oulun yliopiston Päätalo-kokoelma” näki päivänvalon kirjailijan 100-vuotissyntymäpäivän kynnyksellä marraskuussa 2019.
Vajaat 2,5 vuotta olen valmistellut ”Kalle Päätalo tutkijoiden silmin” -symposiumia, jonka järjesti marraskuussa 2019 Oulun yliopiston humanistinen tiedekunta yhteistyössä Oulun kaupunginkirjaston kanssa. Tapahtuman alkuperäisidea on professori Harri Mantilan. Symposiumissa esittelimme eri alojen ajankohtaista Päätalo-tutkimusta. Minä esittelin tietysti Kielipankin Päätalo-korpuksen käyttöönottoa ja korpuksen käytöstä esimerkkinä tekeillä olevaa tutkimustani. Olen parhaillaan tekemässä ensimmäistä korpusesimerkein tuettua diskurssianalyyttistä Päätalo-tutkimusta. Minua kiinnostaa Kalle Päätalon mainitsema käänteishuumori, jonka jäljille lähden yhden affektiivisen kielenpiirteen eli kirosanojen kautta.
Tulevaisuudessa minua tietysti kiinnostaa esimerkiksi erilaisten avainsana-analyysien tekeminen, joissa voin verrata Iijoki-sarja-korpusta muihin kaunokirjallisiin korpuksiin. Oikeastaan vain mielikuvitus on rajana erilaisten Päätalo-aiheiden ideoimisessa. Korpuksestahan voidaan tarkastella esimerkiksi kirjailijan kuvaamien Suomen eri murteiden, vienankarjalan tai kolttasaamelaisen puhuman suomen äänne- ja muotopiirteitä tai kielenkäytön tapoja. Fiktiivisten hahmojen idiolektejä on tutkittavana runsaasti: kirjasarjassahan esiintyy päähenkilön lisäksi noin 2 000 sivuhenkilöä. Korpus tarjoaa uusia tutkimusasetelmia kielitieteen lisäksi monille muille aloille. Iijoki-sarja sisältää valtavasti esimerkiksi metakielisiä havaintoja ja murretta. Kielitieteellisten aiheiden lisäksi siitä voidaan tutkia paljon muuta. Päätalo tekee kirjoissaan kansatieteellisiä havaintoja esimerkiksi työtavoista tai kansanlääkinnästä. Folklorististen aiheiden lisäksi sitä voidaan tarkastella myös itsenäisen Suomen historian kuvauksena: Iijoki-sarjahan kuvaa kirjailijan elämänvaiheita 1910-luvulta 1990-luvulle.
Tutkin Loimujen aikaan -teoksessa Hermanni Päätalon repliikeissä esiintyviä kirosanoja ja vertaan niitä teoksen muihin kirosanoihin. Tavoitteenani on tehdä kirosanoista funktionaalista, syntaktista ja etymologista analyysiä. Voin laajentaa yhden teoksen lähilukua vertaamalla havaintojani korpuksen avulla vaikkapa koko Iijoki-sarjaan. Viime päivinä pohdinnoissani ovat olleet kirjan kirosanoista esimerkiksi siivatta ja ketehen.
Noin 17 000 sivun laajuinen kaunokirjallinen teossarja tarjoaa varmasti tutkittavaa vielä pitkäksi aikaa. Toki kielellisten ainesten hakeminen siitä helpottuu nyt, kun aineisto on saatu digitaaliseen muotoon. Iijoki-sarjasta koostuvassa korpuksen versiossa Iijoki, Oulun yliopiston Päätalo-kokoelma, Kielipankki Korp -versio on 5 280 750 sanetta ja 494 614 virkettä. Kyseessä on käsittääkseni poikkeuksellisen laaja yhden kirjoittajan (kaunokirjallisista) teksteistä koottu tekstikorpus. Totta kai aineisto sisältää huomattavan paljon murresanoja, joiden automaattinen jäsentäminen ei ole täysin mutkatonta. Kuitenkin jo tässä vaiheessa korpus mahdollistaa näppärästi esimerkiksi erilaisten diskurssianalyyttisten tutkimusten tekemisen.
Eräs Päätalo-harrastaja povasi minulle vastikään, että Päätaloa luetaan 50 vuoden kuluttua. Ehkä onkin niin, että teokset nousevat uudelleen suosioon, kunhan niiden kuvaamasta elämästä on kulunut jonkin verran aikaa. Joka tapauksessa korpus on jo nyt valmiina.
Kalle Päätalo tutkijoiden silmin -symposiumin esitelmistä on tarkoitus noin vuonna 2021 julkaista tieteellinen, vertaisarvioitu artikkelikokoelma, jonka työnimi on ”Iijoelta akatemiaan”. Tekeillä oleva artikkelini on tulossa kyseiseen julkaisuun.
FIN-CLARIN eli suomalaisten yliopistojen, CSC – Tieteen tietotekniikan keskuksen ja Kotimaisten kielten keskuksen muodostama konsortio auttaa humanististen tieteiden tutkijoita käyttämään, jalostamaan, säilyttämään ja jakamaan tutkimusaineistoja. Aineistoja ja työkaluja tarjoaa Kielipankki.
Kaikki toistaiseksi esitellyt Kielipankin käyttäjät löytyvät Kuukauden tutkija -arkistosta. Tämä artikkeli julkaistaan myös Helsingin yliopiston humanistisen tiedekunnan verkkosivuilla.