Uutisia Kielipankista 28.9.2015
Yleinen pääsy julkisiin palveluihin yli kielimuurien Digitaalisen Euroopan todelliset rajat Tasan kaksi vuotta sitten Euroopan kielten päivänä 26.9. monikielisen Euroopan teknologialiitto (Multilingual Europe Technology Alliance, META) hallitsi otsikoita julkaisemalla hälyttävän […]
Kielipankki, CSC – Tieteen tietotekniikan keskus Oy:n (CSC) ylläpitämä ja kansallisen FIN-CLARIN-konsortion koordinoima kielentutkimuksen palvelukeskus, on saanut Data Seal of Approval -sertifikaatin (DSA). Sertifikaatti myönnetään luotetulle data-arkistolle, jonka toimintatavat tutkimusdatan käsittelyssä on todettu vakaiksi ja avoimiksi. Suomessa sertifikaatti on myönnetty aikaisemmin Yhteiskuntatieteelliselle tietoarkistolle.
Korp päivitetty Korp-tekstikorpushakupalvelu on päivitetty uuteen versioon 4.0. Lataa selaimessa Korp-sivu uudelleen saadaksesi päivitetyn version käyttöösi. (Tarvittaessa tyhjennä selaimen välimuisti ja käynnistä selain uudelleen.)
Uutisia Kielipankista 30.4.2015
Yli kolmen miljoonan sanan puheaineisto nyt verkossa 31.3.2015 Verkossa on nyt joustavasti katsottavissa ja kuunneltavissa yli kolmen miljoonan sanan puheaineisto. Julkaistavista aineistoista voi tehdä sanojen ja sananmuotojen perusteella hakuja, joiden […]
Uutisia Kielipankista 16.3.2015
Ghost-tietoturva-aukko paikattu Kielipankin palvelimilla Linux-pohjaisissa käyttöjärjestelmissä käytettävästä GNU C -kirjastosta (glibc) on löytynyt turva-aukko, jolle annettiin nimeksi Ghost. Turva-aukkoa pidettiin aluksi hyvin laajana ja vakavana, mutta sen kautta palvelimiin kohdistuvien […]
NooJ-ohjelmaa käsittelevä kirja ilmestyi NooJ on ohjelma, jolla voi rakentaa ja käyttää joko valmiita tai eriasteisia itse rakennettuja kielioppeja tekstiaineiston jäsentämiseen ja annotointiin sekä kieliopillisten rakenteiden etsimiseen tekstin joukosta. Nyt […]
Uutisia Kielipankista 8.12.2014
Suru-uutinen Mukava ja erittäin taitava kollegamme, FIN-CLARINin juridinen neuvonantaja Ville Oksanen menehtyi sunnuntaina 23.11. äkilliseen sairauteen. Oksanen puolusti ansiokkaasti kansalaisten digitaalisia oikeuksia niin Suomessa kuin koko Euroopassa. Hän piti poliittisessa […]
Korpissa 5 miljardia sanaa suomea FIN-CLARINin Kielipankin kautta voit hakea virkkeitä viiden miljardin sanan suomen kielen korpuksesta. Käytössä on ensimmäinen versio korpuksesta, joka perustuu Kansalliskirjaston skannaamiin lehti- ja aikakauslehtiteksteihin 1820-luvulta […]
Suomenkielinen Gutenberg -korpus Korpissa Suomenkielinen Gutenberg-korpus on avattu julkiseen käyttöön Korpissa. Yli 34 miljoonaa sanetta sisältävän korpuksen teosluettelo löytyy osoitteesta http://urn.fi/urn:nbn:fi:lb-2014102102.
Uutisia Kielipankista 20.10.2014
Kansalliskirjaston sanoma- ja aikakauslehtikokoelman ruotsinkieliset n-grammit ladattavissa Kansalliskirjaston sanoma- ja aikakauslehtikokoelman ruotsinkieliset n-grammit 1770-1940 ovat nyt ladattavissa vuosikymmenittäin osoitteesta http://www.helsinki.fi/finclarin/snc1. Korpuksen virkkeitä voi tutkia Korpissa https://korp.csc.fi.
Uutisia Kielipankista 22.8.2014
Suomen kielen näytteitä -murrekorpus julkaistiin LAT-alustalla vapaaseen käyttöön Kotimaisten kielten keskuksen tuottaman Suomen kielen näytteitä -korpuksen ensimmäinen versio Kielipankin LAT-alustalla on avattu julkiseen käyttöön. SKN-korpus sisältää reilut 100 tuntia murrehaastatteluäänitteitä, […]
Hakutulosten lataaminen Korpissa Korpissa (korp.csc.fi) voi nyt ladata hakutuloksia omalle koneelle useassa eri tiedostomuodossa. Latauspainikkeet löytyvät hakutulosten alapuolelta. Aiemman JSON-muodon lisäksi vaihtoehtoina ovat nyt CSV, CSV+, Excel, TSV ja Text. […]
Heartbleed-haavoittuvuus on paikattu Kielipankin palvelimilla Maanantaina 7.4.2014 paljastui poikkeuksellisen laaja, Heartbleed-niminen tietoturva-aukko (ks. http://heartbleed.com/), joka koski myös niitä Kielipankin palvelimia, joilla on käytössä HTTPS-suojaus, eli lat.csc.fi, korp.csc.fi sekä kitwiki.csc.fi (Kielipankin […]
Uutisia Kielipankista 7.4.2014
< Aiemmat uutiset | Tuoreemmat uutiset > |