kuva: Inari Niininen
Kielipankki koostuu kattavasta joukosta aineistoja sekä niiden tutkimiseen soveltuvista ohjelmistoista tehokkaassa laiteympäristössä. Jyväskylän yliopiston suomen kielen professori Jarmo Jantunen kertoo Kielipankissa olevaa Suomen kielen tekstikokoelmaa, Kansainvälistä oppijansuomen korpusta (ICLFI) ja Suomi 24 virkkeet –korpusta koskevista tutkimuksistaan.
Olen suomen kielen professori Jyväskylän yliopistosta, ja toimin käännössuomen tutkimuksen dosenttina Tampereen yliopistossa. Aiemmin olen työskennellyt Joensuun (nykyisin Itä-Suomen) ja Oulun yliopistojen suomen kielen oppiaineissa eri tehtävissä. Tutkimusalani on korpustutkimus.
Suurin osa tutkimuksestani kohdistuu kielenkäyttöön ja erityisesti sanastoon. Väitöskirjatutkimuksessani tarkastelin suomennosten sanastoa ja myöhemmin olen tutkinut suomen kielen oppijoiden (S2-oppijoiden) tuottamia tekstejä nimenomaan kielenkäytön, sanaston ja kielenoppimisen näkökulmasta. Uusin tutkimukseni liittyy verkkokeskusteluihin ja queer-lingvistiikkaan, ja tässäkin on sanastolähtöinen ote. Sanastontutkimuksessa minua kiinnostavat erityisesti sanaston tiedostetut ja tiedostamattomat kytkökset tekstikontekstiin, kuten esimerkiksi kollokaatiot eli sanojen yhteisesiintymät sekä myös muut, abstraktimmat leksikaalis-kieliopilliset ja -semanttiset suhteet. Tutkimuksessa näitä ilmiöitä nimitetään usein kielen fraseologisuudeksi.
Olen käyttänyt Kielipankin aineistoja sekä opetuksessa että tutkimuksessa jo hyvin pitkään. Opetuksessa olen hyödyntänyt aineistoja korpuskursseillani ja sanasto- ja leksikografiakursseilla sekä myös S2-opettajien koulutuksessa. Tutkimuksessani olen käyttänyt paljon Suomen kielen tekstikokoelmaa, ja se oli aineistona myös Suurella sydämellä ihan sikana –fraasisanakirjassa. Henkilökohtaisesti tärkeänä pidän Kansainvälistä oppijansuomen korpusta (ICLFI), jonka keräämisen aloitin 2007 ja joka valmistui monikansallisessa projektissani. Tämä aineisto on miljoonan sanan kokoelma suomen kielen oppijoiden kirjoitettuja tekstejä ympäri maailmaa. Aineisto on kieliopillisesti annotoitu, ja virheiden koodaus eli virheannotointi jatkuu edelleen. Tätä aineistoa olen käyttänyt monipuolisesti tutkimuksessa ja opetuksessa. Uusimmassa tutkimuksessani – ja myös opetuksessa – queer-lingvistiikan parissa olen hyödyntänyt Suomi24 virkkeet -korpusta.
FIN-CLARIN eli suomalaisten yliopistojen, CSC – Tieteen tietotekniikan keskuksen ja Kotimaisten kielten keskuksen muodostama konsortio auttaa humanististen tieteiden tutkijoita käyttämään, jalostamaan, säilyttämään ja jakamaan tutkimusaineistoja. Aineistoja ja työkaluja tarjoaa Kielipankki.
Kaikki toistaiseksi esitellyt Kielipankin käyttäjät löytyvät Kuukauden tutkija -arkistosta.