Kuukauden tutkija: Mikhail Mikhailov Kuva: Helsingin yliopisto Kielipankki koostuu kattavasta joukosta aineistoja sekä niiden tutkimiseen soveltuvista ohjelmistoista tehokkaassa laiteympäristössä. Tampereen yliopiston käännöstieteen professori Mikhail Mikhailov kertoo, miten hän hyödyntää […]
Suomi24-korpus 2001-2017, VRT-versio 1.1 julkaistu latauspalvelussa Tammikuussa julkaisimme uuden version Suomi24 2017H2 Korp-versiosta nimellä ”Suomi24 virkkeet -korpus 2001-2017, Korp-versio 1.1” ja nyt olemme julkaisseet vastaavan korjatun version myös latauspalvelussa nimellä […]
Beta-merkintä poistettu Wanca 2016 Korp-versiolta ja lähdemateriaali sekä VRT versiot julkaistu latauspalvelussa Wanca 2016 Korp-versio on kokoelma verkkoteksteistä koostettuja virkekorpuksia pienille uralilaisille kielille. Kokoelmassa on 29 virkekorpusta eri kielille. Korpukset […]
Kuukauden tutkija: Markus Mattila Kuva: Markus Mattila Kielipankki koostuu kattavasta joukosta aineistoja sekä niiden tutkimiseen soveltuvista ohjelmistoista tehokkaassa laiteympäristössä. Åbo Akademista valmistunut FM Markus Mattila kertoo, miten hän hyödyntää […]
Suomi24 2001–2017: Korjattu kirjoittajan nimimerkkitietoja Suomi24 2001–2017 -aineistosta on nyt käytössä Korp-versio 1.1, jossa on korjattu kirjoittajan nimimerkkitietoja. Aineistoon on tehty seuraavat muutokset: – Kaikissa viesteissä on kirjoittajan nimimerkki myös […]
Kielipankin aineistojen viittausohjeisiin on nyt lisätty Google Scholar -hakulinkit, joilla voi kätevästi etsiä aiempia samaan aineistoon liittyviä julkaisuja. Viittausohjeiden noudattaminen kannattaa!
Englantilaisen ja amerikkalaisen kirjallisuuden klassikoita Kersti Juvan suomentamina, englanti–suomi-rinnakkaiskorpus, sekoitettu, Korp on nyt käytettävissä beetatestiversiona Korpissa: kuvailutiedot, aineisto Korpissa. Korpus on tarjolla Korpiin kirjautuneille tutkijoille. Kappaleet on sekoitettu kunkin tekstin […]
Kuukauden tutkija: Anita Nuopponen Kuva: Harri Huusko Kielipankki koostuu kattavasta joukosta aineistoja sekä niiden tutkimiseen soveltuvista ohjelmistoista tehokkaassa laiteympäristössä. Vaasan yliopiston teknisen viestinnän professori Anita Nuopponen kertoo, miten hän […]
Mietta Lennes esitteli Kielipankkia NexusLinguarum-nimisen COST-hankkeen kokouksessa Prahassa. Täältä löydät myös Kielipankin posterin.
Vuoden 2020 ParlaCLARIN-työpaja pidetään Marseillessa osana LREC2020-konferenssia (Language Resources and Evaluation Conference). Julkaisukutsu on avoinna 14.2.2020 saakka.
Kuukauden tutkija: Emma Sepänaho Kuva: Sofia Tikanmäki Kielipankki koostuu kattavasta joukosta aineistoja sekä niiden tutkimiseen soveltuvista ohjelmistoista tehokkaassa laiteympäristössä. Helsingin yliopiston maisterivaiheen opiskelija Emma Sepänaho kertoo, miten hän hyödyntää […]
Korpissa on nyt käytettävissä beetatestiversioina aineistot Ylen suomenkielinen uutisarkisto 2011–2018, Korp (Korpin korpusvalikon kansiossa Verkkouutisia) ja Ylen suomenkielisen uutisarkiston selkouutiset 2011–2018, Korp (kansiossa Selkokieli). Kummastakin aineistosta on kaksi versiota, jotka sisältävät […]
Syyskuussa 2019 huomatut Suomi24 2017H2 -aineiston ja suomenkielisen Semfinlex-aineiston dependenssijäsennysten ja -relaatioiden poikkeavuudet on viimein korjattu (Semfinlex-aineiston osalta jo aiemmin syksyllä). Pahoittelemme virheitä.
Latauspalvelusta löytyvät nyt seuraavat sanastot: Sanastokeskus TSK ry Työsuojelusanasto (TSK-35) tarkemmat tiedot, linkki aineistoon ja lisenssi löytyvät kuvailutietueesta http://urn.fi/urn:nbn:fi:lb-2017090407 ja Kelan terminologinen sanasto – Etuuksiin liittyvät käsitteet, 4. laitos (TSK-47) […]
Kielipankin Eduskunnan täysistunnot -korpuksesta on nyt saatavilla päivitetty ladattava versio, johon on lisätty saman aineiston Korp-palvelussa näkyvän version 1.5 mukaiset VRT-muotoiset tekstitiedostot tehokäyttäjiä varten. Samasta aineistosta voi edelleen tehdä hakuja kätevästi suoraan Korp-palvelussa.
Uusi multimodaalinen korpus AI2D-RST (http://urn.fi/urn:nbn:fi:lb-2019120407), joka sisältää 1000 englanninkielistä, peruskoulutason luonnontieteellisiä ilmiöitä kuvaavaa diagrammia, on nyt saatavilla Kielipankin latauspalvelusta: http://urn.fi/urn:nbn:fi:lb-2019120408 Korpus ja sen annotaatio on kuvattu seuraavassa julkaisussa: https://arxiv.org/abs/1912.03879Lisätietoa ja työkaluja korpuksen […]
Aineistoihin viittaaminen on yhtä tärkeää kuin tieteellisiin julkaisuihin viittaaminen! Katso ohjeet: https://www.kielipankki.fi/tuki/viittaa-kielipankkiin-ja-fin-clariniin/
Käännösmuistit Hallituskausi 2007-2011 ja Hallituskausi 2011-2015 saatavilla latauspalvelussa Valtioneuvoston kanslian kieli-ja käännöspalveluyksikön (https://vnk.fi/kaannos-ja-kielipalvelut) avoimina aineistoina julkaisemat käännösmuistit (suomi-englanti) ovat nyt ladattavissa Kielipankin latauspalvelussa korp.csc.fi/download kansiossa hallituskausi. Aineistojen kuvailutiedot: The ”Hallituskausi […]
Suomenkielinen OpenSubtitles 2017 ja Suomenkielinen Wikipedia 2017 (lähdemateriaalit) latauspalvelussa Korpukset Suomenkielinen OpenSubtitles 2017, lähdemateriaali ja Suomenkielinen Wikipedia 2017, lähdemateriaali ovat saatavilla Kielipankin latauspalvelussa korp.csc.fi/download. Suomenkielinen OpenSubtitles 2017 kattaa Opensubtitles.org sivuston […]
Kuukauden tutkija: Katri Leino Kuva: Katri Leino Kielipankki koostuu kattavasta joukosta aineistoja sekä niiden tutkimiseen soveltuvista ohjelmistoista tehokkaassa laiteympäristössä. Aalto-yliopiston tutkijakoulutettava Katri Leino kertoo, miten hän hyödyntää tutkimuksessaan Kielipankin […]
< Aiemmat uutiset | Tuoreemmat uutiset > |