Kielipankki koostuu kattavasta joukosta aineistoja sekä niiden tutkimiseen soveltuvista ohjelmistoista tehokkaassa laiteympäristössä. Helsingin yliopiston maisterivaiheen opiskelija ja tutkimusavustaja Viljami Haakana kertoo, miten hän hyödyntää Kielipankin aineistoa Lauseopin arkiston murrekorpusta.
Olen Viljami Haakana, kuudennen vuoden yleisen kielitieteen opiskelija Helsingin yliopistossa ja apulaisprofessori Kaius Sinnemäen tutkimusavustaja projektissa, joka liittyy hänen johtamaansa laajempaan ERC-hankkeeseen Linguistic Adaptation (GramAdapt). Osuuteni projektissa on pääosin aineistojen käsittelyyn liittyvää koodausta.
Projektin tavoitteena on selvittää, esiintyykö monikon kolmannen persoonan –vat/-vät-pääte tai sen murrevastine todennäköisemmin he-pronominin jälkeen kuin ne-pronominin jälkeen. Predikaatin lukukongruenssia subjektin kanssa on fennistiikassa tutkittu vuosikymmeniä, mutta ei meidän tietääksemme siitä näkökulmasta, esiintyykö lukukongruenssia enemmän he– tai ne-pronominin kanssa.
Tutkimus tehdään Lauseopin arkiston murrekorpuksen avulla, alustavasti Korp-versiolla Lauseopin arkiston murrekorpuksen Helsinki-Korp-versio ja sen jälkeen latauspalvelussa olevalla versiollaLauseopin arkiston murrekorpuksen Helsinki ladattava versio, eli etsitään sieltä tapaukset, joissa subjektia he tai ne (tai niiden murrevastinetta esim. hyö, nee jne.) seuraa predikaatti kolmannessa persoonassa, yksikössä tai monikossa. Esiintymät jaetaan neljään luokkaan sen mukaan, kumpi pronomini siellä on ja onko siellä lukukongruenssia vai ei. Olen koodannut Python-skriptin, joka etsii tuollaiset tapaukset latauspalvelun kautta saatavilla olevasta korpuksesta ja kirjoittaa ne tiedostoon. Lisäksi skripti etsii esiintymiin liittyvää sosiolingvististä tietoa esimerkiksi puhujan iästä, murrealueesta ja sukupuolesta. Esiintymiä löytyy aineistosta noin 7000 kappaletta. Yleisellä tasolla tutkimuksen tarkoituksena on selvittää predikaatin lukukongruenssin vaihteluun vaikuttavia kielen rakenteellisia ja sosiolingvistisiä tekijöitä.
Ikola, Osmo, Ulla Palomäki & Anna-Kaisa Koitto 1989. Suomen murteiden lauseoppia ja tekstikielioppia. Suomalaisen Kirjallisuuden Seuran Toimituksia 511. Helsinki: Suomalaisen Kirjallisuuden Seura.
Väänänen, Milja 2016. Subjektin ilmaiseminen yksikön ensimmäisessä persoonassa: Tutkimus suomen vanhoista murteista. Annales Universitatis Turkuensis C 430. Turku: Turun yliopisto. https://www.utupub.fi/bitstream/handle/10024/127269/AnnalesC430Vaananen.pdf?sequence=2&isAllowed=y
FIN-CLARIN eli suomalaisten yliopistojen, CSC – Tieteen tietotekniikan keskuksen ja Kotimaisten kielten keskuksen muodostama konsortio auttaa humanististen tieteiden tutkijoita käyttämään, jalostamaan, säilyttämään ja jakamaan tutkimusaineistoja. Aineistoja ja työkaluja tarjoaa Kielipankki.
Kaikki toistaiseksi esitellyt Kielipankin käyttäjät löytyvät Kuukauden tutkija -arkistosta. Tämä artikkeli julkaistaan myös Helsingin yliopiston humanistisen tiedekunnan verkkosivuilla.