Kansalliskirjaston sanoma- ja aikakauslehtikokoelman suomenkielisen osakorpuksen versio 2 on nyt käytettävissä beetatestiversiona Korp-palvelun kautta. Aineisto sisältää Kansalliskirjaston lehtikokoelman sanoma- ja aikakauslehtiä vuosilta 1771–2021. Aineistossa on yhteensä yli 22 miljardia sanetta.
In English Kuukauden tutkija: Mikael Varjo Kuva: Emmi Saari Kielipankki koostuu kattavasta joukosta aineistoja sekä niiden tutkimiseen soveltuvista ohjelmistoista tehokkaassa laiteympäristössä. Mikael Varjo kertoo meille tutkimuksestaan, joka käsittelee suomenkielisten arkikeskustelujen […]
Uusi aineisto (beta): Rinnakkaiskorpus L. Uspenskin kirjasta ”Neljä taistelua”; Korp-versio Rinnakkaiskorpus L. Uspenskin kirjasta ”Neljä taistelua”; Korp-versio on nyt käytettävissä beetatestiversiona Korpissa. Huomaa, että korpus on beetatestivaiheessa, joten siihen voi […]
Suomenkielisen pimeän verkon kauppapaikka-aineisto (findarc) on hakemuksesta saatavilla rajoitettuun tutkimuskäyttöön.
Uusi aineisto: The Movie Corpus (Mark Davies, english-corpora.org) – Kielipankin versio, lähdemateriaali The Movie Corpus (Mark Davies, english-corpora.org) – Kielipankin versio, lähdemateriaali on saatavilla Kielipankin latauspalvelussa. Lisätiedot löytyvät aineistoryhmäsivulta.
Uusi aineisto: The Coronavirus Corpus (Mark Davies, english-corpora.org) – Kielipankin versio 2021-05, lähdemateriaali The Coronavirus Corpus (Mark Davies, english-corpora.org) – Kielipankin versio 2021-05, lähdemateriaali on saatavilla Kielipankin latauspalvelussa. Lisätiedot löytyvät […]
In English Kuukauden tutkija: Rosa González Hautamäki Kuva: Ville Hautamäki Kielipankki koostuu kattavasta joukosta aineistoja sekä niiden tutkimiseen soveltuvista ohjelmistoista tehokkaassa laiteympäristössä. Rosa González Hautamäki kertoo meille tutkimuksistaan, jotka liittyvät […]
Harjoittele kielivarojen käsittelyä kaksipäiväisellä etäkurssilla – CSC järjestää koulutuksen kesäkuussa Kiinnostaako sinua oppia käyttämään CSC:n laskennallista ympäristöä kielivarojen käsittelyyn? Haluatko tietää lisää kielivaroista ja mahdollisuuksista käyttää niitä tutkimuksessasi? CSC – […]
Uusi aineisto (beta): STT:n uutisarkisto 1992-2018, Kielipankin Korp-versio STT:n uutisarkisto 1992-2018, Kielipankin Korp-versio on nyt käytettävissä beetatestiversiona Korpissa. Huomaa, että korpus on beetatestivaiheessa, joten siihen voi tulla muutoksia ilman ilmoitusta. […]
In English Kuukauden tutkija: Johanna Vaattovaara Kuva: Antti Yrjönen Kielipankki koostuu kattavasta joukosta aineistoja sekä niiden tutkimiseen soveltuvista ohjelmistoista tehokkaassa laiteympäristössä. Johanna Vaattovaara kertoo meille kielitietoisuuteen ja kieliasenteisiin liittyvistä tutkimuksistaan. […]
Uusi aineisto (beta): ERME Ersän ja mokšan laajennettu korpus versio 2, Korp ERME Ersän ja mokšan laajennettu korpus versio 2, Korp on nyt käytettävissä beetatestiversiona Korpissa. Huomaa, että aineisto on […]
In English Kuukauden tutkija: Noora Hoffrén Kuva: Essi Ekman Kielipankki koostuu kattavasta joukosta aineistoja sekä niiden tutkimiseen soveltuvista ohjelmistoista tehokkaassa laiteympäristössä. Noora Hoffrén kertoo meille väitöskirjatutkimuksestaan, jonka aiheena on konstruoitu […]
Uusia aineistoja: word2vec-menetelmällä harjoitetut sanaupotukset word2vec-menetelmällä harjoitetut sanaupotukset Suomen kielen tekstikokoelmasta: kuvailutiedot, aineisto latauspalvelussa word2vec-menetelmällä harjoitetut sanaupotukset Suomi24-korpuksesta: kuvailutiedot, aineisto latauspalvelussa Lisätiedot löytyvät aineistoryhmäsivulta.
Uusi aineisto: FinnSentiment 1.1, lähdemateriaali FinnSentiment 1.1, lähdemateriaali on saatavilla Kielipankin latauspalvelussa. Lisätiedot löytyvät aineistoryhmäsivulta.
In English Kuukauden tutkija: Maria Sarhemaa Kuva: K-Art Foto Kielipankki koostuu kattavasta joukosta aineistoja sekä niiden tutkimiseen soveltuvista ohjelmistoista tehokkaassa laiteympäristössä. Maria Sarhemaa kertoo meille tutkimuksestaan, jossa hän on selvittänyt […]
Lisämateriaali: Suomen kielen näytteitä, ladattava versio Suomen kielen näytteitä, ladattava versio on ollut saatavilla Kielipankin latauspalvelun kautta sen jälkeen, kun LAT-alusta poistui käytöstä vuonna 2020. Alkuperäisestä aineistosta tehdyistä latauspaketeista jäi […]
In English Månadens forskare: Therese Lindström Tiedemann Foto: Tove Tiedemann Språkbanken i Finland (Kielipankki) är en tjänst för forskare som använder språkresurser. Therese Lindström Tiedemann berättar om sin forskning om […]
Kielipankin uutiskirje 2/2022 In English Kuukauden tutkijat vuonna 2022 Jussi Ylikoski – suomalais-ugrilainen kielentutkimus, kielioppi, etymologia Tuisku Vilenius – saamelaisdiskurssit internetkeskusteluissa Ari Huhta – kielitaidon arviointi, vieraan ja toisen kielen […]
Uusi automaattinen puheentunnistuspalvelu Tekstiks on testikäytössä. Automatisoitu järjestelmä pystyy tunnistamaan puhuttua viroa ja suomea sekä tuottamaan äänitteestä tekstimuotoisen litteraatin. Ohjelmassa on myös käyttöliittymä litteroidun tekstin muokkaamiseen.
Voit nyt seurata Kielipankkia Mastodonissa: @kielipankki@toot.community
< Aiemmat uutiset | Tuoreemmat uutiset > |