Uutisia


YLEn uutisaineistot

1.4.2021

Ylen uutisarkisto VRT-muodossa latauspalvelussa Lähdemateriaalien lisäksi Ylen uutisaineistot ovat nyt ladattavissa VRT-muodossa Kielipankin latauspalvelusta kahtena versiona, jotka sisältävät samat virkkeet mutta joilla on erilainen saatavuus ja erilaiset ominaisuudet: Kirjautuneiden tutkijoiden […]


FinEst BERT latauspalvelussa

30.3.2021

FinEst BERT latauspalvelussa FinEst BERT,  kolmella kielellä (suomea, eesti ja englantia) harjoitettu monikielinen BERT on saatavilla Kielipankin latauspalvelussa korp.csc.fi/download. FinEst BERT: korpuksen kuvailutiedot, korpus latauspalvelussa


STT:n uutisarkisto 1992-2018, CoNLL-U, lähdemateriaali latauspalvelussa

23.3.2021

STT:n uutisarkisto 1992-2018, CoNLL-U, lähdemateriaali latauspalvelussa Korpus on saatavilla Kielipankin latauspalvelussa korp.csc.fi/download. Tämä on jäsennetty versio STT:n uutisarkisto 1992-2018, lähdemateriaali:sta. Khalid Alnajjar (Helsingin yliopisto) jäsensi korpuksen käyttämällä Turku neural parser […]


Kuukauden tutkija: Heikki Rasilo

11.3.2021

Heikki Rasilo kertoo puheentuottoon liittyvästä tutkimustyöstään, jossa hän on hyödyntänyt Kielipankissa olevaa Aalto-yliopiston DSP-kurssin keskustelukorpusta.


Vielä ehdit ilmoittautua 15.3. alkavalle luonnollisen kielen käsittelyn verkkokurssille!

9.3.2021

Tuomo Hiippala pitää Helsingin yliopistossa verkkokurssin Natural Language Processing for Linguists ajalla 15.3.2021 -10.5.2021. Ilmoittaudu mukaan 16.3.2021 mennessä tai katso itseopiskelumateriaalit.


Uusi aineisto (beta): Kotimaisten kielten keskuksen aikakauslehtikorpus

9.3.2021

Kotimaisten kielten keskuksen aikakauslehtikorpus, tarkistettu ja Kotimaisten kielten keskuksen aikakauslehtikorpus, tarkistamaton ovat nyt käytettävissä beetatestiversioina Korpissa.


Uusi aineisto (beta): Käännössuomen korpus

9.3.2021

Käännössuomen korpus, Korp on nyt käytettävissä beetatestiversiona Korpissa.  


E-thesis-aineistoa päivitetty

9.3.2021

Helsingin yliopiston englanninkielinen E-thesis 1999-2016 on päivitetty versioon 1.1. Gradu- ja väitöskirjakorpuksiin on tehty seuraavia muutoksia: Aineisto on jäsennetty Turku Neural Parser Pipeline (TNPP) -jäsentimellä. Tekstit, joissa on vähemmän kuin […]


Lahjoita puhetta -kampanjassa kerätyn puheaineiston litterointi alkamassa – etsimme yhteistyökumppaneita litterointityön toimittajiksi

25.2.2021

Toimittaako yrityksesi litterointipalveluita? Jätä tarjous Lahjoita puhetta -aineiston litteroinnista Hanki-tarjouspalveluun 15.3.2021 klo 14.00 mennessä.


Kuukauden tutkija: Emmi Lahti

10.2.2021

Emmi Lahti kertoo retoriikkaan ja diskurssintutkimukseen liittyvästä tutkimustyöstään, jossa hän on hyödyntänyt Kielipankissa olevaa Suomi24-korpusta.


Tietoarkisto julkaisi uudistetun Tutkimusmenetelmien verkkokäsikirjan opiskeluun ja opetukseen

22.1.2021

Tietoarkiston julkaisema Tutkimusmenetelmien verkkokäsikirja koostuu Kvantitatiivisen tutkimuksen verkkokäsikirjasta ja Laadullisen tutkimuksen verkkokäsikirjasta. Materiaaleja voi käyttää opiskelussa ja opetuksessa.


Kuukauden tutkija: Mats Fridlund

18.1.2021

Professori Mats Fridlund kertoo digitaaliseen historiaan liittyvästä tutkimustyöstään, jonka tukena ovat työkalut ja aineistot sekä suomalaisessa Kielipankissa että Ruotsin Språkbankenissa.


Kuukauden tutkija: Tommi Jauhiainen

10.12.2020

Parivuotista post doc-kauttaan parhaillaan aloitteleva Kielipankin projektisuunnittelija Tommi Jauhiainen kertoo Kielipankin palveluihin ja aineistoihin liittyvistä tutkimuksistaan.


Korp-palvelin vaihtuu 10.12.2020

8.12.2020

Korp-palvelin vaihtuu 10.12.2020 Korp-palvelu siirretään 10.12.2020 toiselle palvelimelle teknisistä syistä. Korp-palvelun osoitteena säilyy toistaiseksi https://korp.csc.fi. Palvelimen vaihtuminen ei aiheuta käyttökatkoa, ja muutenkin Korpin on tarkoitus toimia uudella palvelimella samoin kuin ennen. Sanakuvaominaisuus toimii […]


Tervetuloa seuraavaan Kielipankki Liveen 14.12. klo 13.00! Ilmoittaudu nyt

7.12.2020

Aiheena tällä kertaa erityisesti puheaineistot ja tietosuojakäytänteet, esiintyjinä asiantuntevia tutkijavieraita. Ilmoittaudu nyt!


FinnSentiment korpus julkaistu

7.12.2020

FinnSentiment – A Finnish Social Media Corpus for Sentiment Polarity Annotation FinnSentiment korpus on nyt ladattavissa Kielipankin latauspalvelusta: kuvailutiedot, aineisto latauspalvelussa. FinnSentiment sisältää 27,000 yksittäistä virkettä Suomi 24 aineistosta sekä […]


Korp palvelun käyttökatko ja tilapäinen palvelun heikkeneminen joulukuun 2020 alussa

3.12.2020

Korp palvelun käyttökatko ja tilapäinen palvelun heikkeneminen joulukuun 2020 alussa Korp-palvelu siirretään joulukuun 2020 alussa toiselle palvelimelle teknisistä syistä. Tällöin Korpissa on luultavasti enintään päivän käyttökatko lyhyellä varoitusajalla. Pyrimme pitämään […]


Yle: Suomelle teknologinen etulyöntiasema puhepankin avulla? Useat suomalaisyritykset ovat jo mukana ainutlaatuisessa puheenkeruussa

22.11.2020

Ylen artikkelissa kerrotaan Lahjoita puhetta -kampanjan merkityksestä Suomelle ja suomen kielelle.


Verkkokurssi Data Clinic (Aineistoklinikka) 2020-21 alkaa perjantaina 13.11. – ilmoittaudu mukaan nyt!

9.11.2020

Data Clinic -verkkokurssi voi auttaa sinua käytännön ongelmissa, jotka liittyvät gradusi tai väitöskirjasi tutkimusaineiston hallintaan.


Kuukauden tutkija: Tommi Kurki

4.11.2020

Suomen kielen dosentti, yliopistonlehtori Tommi Kurki Turun yliopistosta kertoo, miten hän hyödyntää tutkimuksessaan Kielipankin palveluita.


< Aiemmat uutiset Tuoreemmat uutiset >