Osa 1: Tämä pitäisi kaikkien tietää CSC:n laskentaympäristöstä eräajoja käynnistäessä! – Osa 2: Kuinka käsitellä suuria datasettejä, asentaa omia ohjelmia ja saada omat työvuot skaalautumaan tehokkaasti CSC:n laskentaympäristössä. Huom. Koulutukset ovat englanninkielisiä.
In English Kuukauden tutkija: Harri Uusitalo Kuva: Timo Tuovinen Kielipankki koostuu kattavasta joukosta aineistoja sekä niiden tutkimiseen soveltuvista ohjelmistoista tehokkaassa laiteympäristössä. Harri Uusitalo kertoo meille tutkimuksistaan erilaisten ja eri-ikäisten suomenkielisten […]
Uusi aineisto: DigiTala-tutkimushankkeen (2019-2023) aikana kerätty aineisto DigiTala-tutkimushankkeen (2019-2023) aikana kerätty aineisto on saatavilla neljänä korpuksena Kielipankin latauspalvelussa: DigiTala: lukioissa kerätty S2-aineisto, kevät 2021 DigiTala: lukioissa ja yliopistossa kerätty S2-aineisto, […]
Kiitämme kaikkia lahjoittajia!
Linkit Kielipankin Korpissa olevista Ylen uutisarkisto -korpuksista alkuperäisiin Ylen palvelussa oleviin teksteihin on korjattu.
In English Kuukauden tutkija: Tanja Säily Kuva: Veikko Somerpuro Kielipankki koostuu kattavasta joukosta aineistoja sekä niiden tutkimiseen soveltuvista ohjelmistoista tehokkaassa laiteympäristössä. Tanja Säily kertoo meille englannin kielen tutkimuksestaan, jossa yhdistyvät […]
Uusi aineisto: Lausetasolla kohdistettu suomi–selkosuomi-rinnakkaiskorpus Ylen suomenkielisestä uutisarkistosta 2014-2020, lähdeaineisto Lausetasolla kohdistettu suomi–selkosuomi-rinnakkaiskorpus Ylen suomenkielisestä uutisarkistosta 2014-2020, lähdeaineisto on saatavilla Kielipankin latauspalvelussa. Lisätiedot löytyvät aineistoryhmäsivulta.
Korp siirtyy 7.2.2024 klo 13-14 uudelle palvelimelle. Samalla hakujen tekeminen nopeutuu.
Uusi aineisto: Suomi-selkosuomi-rinnakkaiskorpus Ylen suomenkielisestä uutisarkistosta 2014-2018, lähdeaineisto Suomi-selkosuomi-rinnakkaiskorpus Ylen suomenkielisestä uutisarkistosta 2014-2018, lähdeaineisto on saatavilla Kielipankin latauspalvelussa. Lisätiedot löytyvät aineistoryhmäsivulta.
HeLI-OTS 1.5 – automaattinen kielentunnistin 200 eri kielelle Oletko etsiskellyt työkalua, jolla voisi tunnistaa tekstin virkkeiden kielen? Tutustu HeLI-OTSin uusimpaan versioon 1.5: https://www.kielipankki.fi/tools/heli-ots/
ParlaCLARIN IV -työpaja: Eduskuntatyöskentelyyn ja muuhun poliittiseen keskusteluun liittyvät aineistot (LREC-COLING 2024) Vuoden 2024 ParlaCLARIN-työpaja järjestetään toukokuussa Torinossa, Italiassa osana LREC-COLING 2024 -konferenssia (Joint International Conference on Computational Linguistics, Language […]
Uusi työkalu: finnsurveytext Finnsurveytext on yhteiskuntatieteiden tutkijoille tarkoitettu R-paketti, jonka avulla he voivat analysoida ja ymmärtää kyselytutkimustensa avoimien kysymysten vastauksia. Finnsurveytext on nyt käytettävissä GitHubissa. R on tilastolaskentaan ja datan […]
In English Kuukauden tutkija: Liisa Mustanoja Kuva: Antti Yrjönen Kielipankki koostuu kattavasta joukosta aineistoja sekä niiden tutkimiseen soveltuvista ohjelmistoista tehokkaassa laiteympäristössä. Liisa Mustanoja kertoo meille sosiolingvistiikkaan liittyvästä tutkimuksestaan. Puhekielen muuttumista […]
Kielipankin uutiskirje 2/2023 In English Kuukauden tutkijat vuonna 2023 Therese Lindström Tiedemann – svenska som andraspråk, pseudonymisering av språkliga data Maria Sarhemaa – etunimien appellatiivistuminen suomen kielessä Noora Hoffrén – […]
In English Kuukauden tutkija: Tiina Onikki-Rantajääskö Kuva: Veikko Somerpuro Kielipankki koostuu kattavasta joukosta aineistoja sekä niiden tutkimiseen soveltuvista ohjelmistoista tehokkaassa laiteympäristössä. Tiina Onikki-Rantajääskö kertoo meille Tieteen termipankin toimintaperiaatteista sekä kutsuu […]
Kuvailutietojen päivitys Suomen puupankkiin 3 Suomen puupankki FinnTreeBank 3 sisältää samaa aineistoa, joka on saatavilla myös kahden erillisen korpuksen suomenkielisissä osissa, Helsinki Korp Europarl -aineistokokoelmassa (Europarl) ja Helsinki Korp JRC-Acquis […]
Uusi aineisto (beta): Jouluevankeliumi tekstistä puheeksi neljällä uralilaisella kielellä, Korp Jouluevankeliumi tekstistä puheeksi neljällä uralilaisella kielellä, Korp on nyt käytettävissä beetatestiversiona Korpissa. Huomaa, että korpus on beetatestivaiheessa, joten siihen voi […]
Uusi aineisto: Jouluevankeliumi tekstistä puheeksi neljällä uralilaisella kielellä, lähdemateriaali Jouluevankeliumi tekstistä puheeksi neljällä uralilaisella kielellä, lähdemateriaali on saatavilla Kielipankin latauspalvelussa. Lisätiedot löytyvät aineistoryhmäsivulta.
In English Kuukauden tutkija: Aleksi Sahala Kuva: Marianne Ough Kielipankki koostuu kattavasta joukosta aineistoja sekä niiden tutkimiseen soveltuvista ohjelmistoista tehokkaassa laiteympäristössä. Aleksi Sahala kertoo meille, millä tavoin kieliteknologian menetelmiä voidaan […]
Uusi aineisto: Suomen puupankki FinnTreeBank 1:n ladattava versio Suomen puupankki FinnTreeBank 1:n ladattava versio on saatavilla Kielipankin latauspalvelussa. Lisätiedot löytyvät aineistoryhmäsivulta.
< Aiemmat uutiset | Tuoreemmat uutiset > |