Keväästä 2016 alkaen Kielipankki on julkaissut verkkosivuillaan säännöllisesti Kuukauden tutkija -sarjaa, jossa eri alojen tutkijat pääsevät esittelemään työtään ja kertomaan käyttämistään Kielipankin aineistoista. Nyt juhlitaan jo sadatta tutkijaesittelyä!
Myös aikaisemmat tutkijaesittelyt löytyvät arkistosta.
Tiedätkö tutkijoita, joka käyttävät Kielipankkia ja sopisivat kuukauden tutkijoiksi? Olisitko ehkä itse yksi heistä? Ehdota meille: https://www.kielipankki.fi/tuki/ota-yhteytta/
Kielipankki ylläpitää kuvailutietueita kaikista välittämistään aineistoista. Jokaisella yksittäisellä aineistoversiolla on oma kuvailutietue, jolla on pysyvä tunniste.
Kielipankissa on käytetty kuvailutietojen tarjoamiseen META-SHARE-nimistä alustaa, mutta sen tuki on loppunut. Kielipankin kaikki nykyiset kuvailutietueet on siirretty norjalaisen CLARIN-keskuksen, CLARINO Bergenin ylläpitämälle COMEDI-alustalle. Kaikkien Kielipankin hoitamien kuvailutietueiden pysyvät tunnisteet on automaattisesti ohjattu uusiin osoitteisiin COMEDIssa.
Huomaathan, että vaikka kuvailutietueet näyttävät nyt vähän erilaisilta, itse aineistojen sisältö tai sijainti eivät ole muuttuneet.
Tehokkuuden parantamiseksi Korp-palvelu siirrettiin uudelle palvelimelle tämän vuoden alussa. Korp-ohjelmistoon on myös tulossa syksyllä laaja päivitys, jota on valmisteltu pitkään. Päivityksen myötä suomalaisessa Kielipankissa tarjottava Korp-alustan versio on jatkossa helpompi pitää yhdenmukaisena Ruotsin Språkbankenissa kehitettävän Korp-alustan kanssa.
Vähäisestä käytöstä johtuen Mylly-palvelu on nyt ajettu alas. Jos sinulla on Myllyssä aineisto, jonka haluat ottaa talteen itsellesi tai jos haluat hyödyntää Myllyn työkaluskriptejä muilla alustoilla, lue toimintaohjeet täältä.
Kielipankki on ryhtynyt ylläpitämään CLARINin Standards Information System -järjestelmässä luetteloa tiedostomuodoista, joita Kielipankki tukee ja suosittelee kielivarojen tallentamiseen. Jos huomaat puutteita, lähetäthän palautetta.
Ilmoita oman uuden aineistosi perustiedot Kielipankille: http://urn.fi/urn:nbn:fi:lb-2021121421
Verkkokurssi Korpuslingvistiikka ja tilastolliset menetelmät (5 op) järjestetään seuraavan kerran 1. periodilla syys-lokakuussa 2024 ja uudelleen taas keväällä 2025. Syksyn 2. periodilla pidetään kurssi Puheen analyysin perusteet, ja marraskuussa käynnistyy gradu- tai väitöskirja-aineistoa suunnitteleville englanninkielinen kurssi Data Clinic. Verkkokurssit ovat avoimia kaikkien yliopistojen opiskelijoille.
FIN-CLARIAH koostuu kahdesta osasta, FIN-CLARINista ja DARIAH-FI:stä. Yhteishankkeen väki kokoontui 10.6.2024 Helsingissä pidettyyn työpajaan, jossa keskusteltiin tekoälyn tuomista mahdollisuuksista ihmistieteiden tutkimiseen. Lisäksi FIN-CLARIAH-hankkeen tavoitteita hahmoteltiin postereihin, jotka ovat esillä Kielipankin verkkosivuilla.
Kielipankin henkilökunta oli valmistellut esitelmiä Torinossa järjestettyyn LREC-COLING 2024 -konferenssin työpajoihin. Jussi Piitulainen piti ParlaCLARIN IV -työpajassa esitelmän ”Investigating Multilinguality in the Plenary Sessions of the Parliament of Finland with Automatic Language Identification” ja Tommi Jauhiainen SIGUL 2024 -työpajassa esitelmän ”Improving Language Coverage on HeLI-OTS”. Esitelmissä kuvatut uudet kielet ja parannetut kielimallit löytyvät osana tänä keväänä julkaistua HeLI-OTS 2.0 kielentunnistinta.
European Language Data Space (LDS) ja Helsingin yliopisto kokosivat yhteen suomalaisen teollisuuden, julkishallinnon ja tutkimuksen asiantuntijoita keskustelemaan kielidatan merkityksestä kieliteknologioiden ja tekoälypohjaisten työkalujen kehittämiselle Suomessa. Työpajan tarkoituksena oli lisätä suomalaisten toimijoiden tietoisuutta niin Euroopan komission tavoitteista kuin uusista liiketoiminnan mahdollisuuksista kielidatan kaupallistamisen suhteen. LDS-työpajan ohjelmaan voit tutustua tapahtumasivulla, jonne lisätään myöhemmin myös linkit tallenteisiin ja esitelmiin.
LDS-työpajaan oli kutsuttu paneelikeskustelijoiksi yritysten ja julkishallinnollisten organisaatioiden edustajia LAREINA-hankkeesta, jossa tavoitteena on kehittää puheentunnistusta ja puhesynteesiä suomen, suomenruotsin sekä saamen kielille.
Tiesitkö, että CLARINilta voi saada rahoitusta esimerkiksi tutkijoiden ja opettajien liikkuvuuteen tai tapahtumien ja koulutusten järjestämiseen? Tarkista rahoitusmuodot ja haut CLARINin sivuilta: https://www.clarin.eu/funding
Kielipankki toivottaa kaikille rentouttavaa kesää!
Mietta Lennes ja Wilhelmina Dyster
projektisuunnittelijat
fin-clarin@helsinki.fi
Tilaa/peruuta Kielipankin uutiskirje: https://www.kielipankki.fi/kielipankki/uutiskirjeen-tilaus/
Katso myös CLARINin uutiskirje: https://www.clarin.eu/content/newsflash