Kielipankki koostuu kattavasta joukosta aineistoja sekä niiden tutkimiseen soveltuvista ohjelmistoista tehokkaassa laiteympäristössä. Mikko Laitinen kertoo meille viimeaikaisesta tutkimuksestaan somealustaa seuraavan korpuksen parissa, jonka kautta tutkijoille avautuu myös ikkuna sosiaalisiin verkostoihin.
Olen Mikko Laitinen, englannin kielen ja kulttuurin professori Itä-Suomen yliopiston Humanistisella osastolla ja yksi kansallisen digitaalisten ihmistieteiden infrakonsortion, FIN-CLARIAH, vastuullisista tutkijoista.
Olen sosiolingvisti, eli minua kiinnostaa kielen käyttö eri tilanteissa ja yhteiskunnallisena ilmiönä. Olen tutkijana tehnyt töitä sekä pienten ja strukturoitujen korpusten että isojen ja paljon laskentavoimaa vaativien massadatojen kanssa, mutta aina niin, että mukana on joitain taustamuuttujia, joiden kautta kielenkäyttöä tarkastellaan. Aineistot ovat olleet sekä synkronisia että diakronisia.
Viime aikoina olemme tutkimusryhmässäni tehneet paljon töitä erilaisten Twitter-aineistojen kanssa. Tällä hetkellä rakennamme tällä somealustalla kielenkäyttöä lähes reaaliajassa seuraavaa isoa, edustavaa ja jatkuvasti päivittyvää benchmark-korpusta. Tällaisesta ”digitaalisesta observatoriosta”, jota kautta pystyy seuraamaan kielen käyttöä yhteiskunnassa, on hyötyä muun muassa taustaksi kielipoliittiseen keskusteluun. Kun siihen liitetään vielä isojen aineistojen visualisointi helpommin ymmärrettävään muotoon, saattaa se myös lisätä ihmisten kiinnostusta kielentutkimusta kohtaan yleisesti. Twitter on siitä kiinnostava aineisto, että vaikka sen tekstit ovat aika lyhyitä, niin sen rikasta metadataa hyödyntämällä pääsee tarkastelemaan ihmisten kielenkäyttöä esimerkiksi sosiaalisissa verkostoissa.
Minusta on hienoa, että meillä aineistot ovat yhden luukun alla saatavilla ja vaikkapa yhden käyttöliittymän kautta käytettävissä. Tämä on opiskelijoille ja tutkijoille hieno palvelu! Eniten olen käyttänyt englanninkielen aineistoja, muun muassa COHA– ja COCA‑korpuksia, ja englanti lingua franca ‑korpuksen (ELFA) olen ladannut omalle koneelleni. Myös Suomi24-aineistosta tulee joskus tarkistettua joitakin kiinnostavia ilmiötä.
Laitinen, Mikko. 2020. Empirical perspectives on English as a lingua franca (ELF) grammar. World Englishes 39:3, 1–16. DOI: 10.1111/weng.12482
Laitinen, Mikko, Masoud Fatemi & Jonas Lundberg. 2020. Size matters: Digital social networks and language change. Frontiers in Artificial Intelligence 3:46. DOI: 10.3389/frai.2020.00046
Laitinen, Mikko. 2018. Placing ELF among the varieties of English: Observations from typological profiling. In Sandra Deshors (ed.), Modelling World Englishes in the 21st Century: Assessing the Interplay of Emancipation and Globalization of ESL varieties, 109–131. Amsterdam: John Benjamins. DOI: 10.1075/veaw.g61.05lai
Laitinen, Mikko & Magnus Levin. 2016d. On the globalization of English: Observations of subjective progressives in present-day Englishes. In Elena Seoane & Cristina Suárez-Gómez (eds.), World Englishes: New Theoretical and Methodological Considerations, 229–252. (Varieties of English around the World G57). Amsterdam: John Benjamins. DOI: 10.1075/veaw.g57.10lai
Lundberg, Jonas & Mikko Laitinen. 2020b. Twitter trolls: a linguistic profile of anti-democratic discourse. Language Sciences 79. DOI: 10.1016/j.langsci.2019.101268
FIN-CLARIN eli suomalaisten yliopistojen, CSC – Tieteen tietotekniikan keskuksen ja Kotimaisten kielten keskuksen muodostama konsortio auttaa humanististen tieteiden tutkijoita käyttämään, jalostamaan, säilyttämään ja jakamaan tutkimusaineistoja. Aineistoja ja työkaluja tarjoaa Kielipankki.
Kaikki tähän saakka esitellyt Kielipankin käyttäjät löytyvät Kuukauden tutkija -arkistosta. Tämä artikkeli julkaistaan myös Helsingin yliopiston humanistisen tiedekunnan verkkosivuilla.