8.7.2014

Suomen kielen näytteitä -murrekorpus julkaistiin LAT-alustalla vapaaseen käyttöön

Kotimaisten kielten keskuksen tuottaman Suomen kielen näytteitä -korpuksen ensimmäinen versio Kielipankin LAT-alustalla on avattu julkiseen käyttöön. SKN-korpus sisältää reilut 100 tuntia murrehaastatteluäänitteitä, joiden litteroinnit on aiemmin julkaistu samannimisenä, 50-osaisena kirjasarjana.

Tässä uudessa SKN-korpuksessa litteroidut tekstit on karkeasti kohdistettu alkuperäisiin, Suomen kielen nauhoitearkistossa säilytettyihin murrenäytteisiin. Annotoituja näytteitä pääsee kuuntelemaan LAT-alustan Annex-työkalulla, jossa litterointia voi samalla seurata. Tekstin perusteella voi LATissa tehdä myös hakuja, ja vastaavaa äänitteen kohtaa pääsee kuuntelemaan hakutulosta klikkaamalla. Jokaiselle sanaesiintymälle on lisäksi pyritty merkitsemään sitä lähinnä vastaava muoto yleiskielisessä puhutussa suomessa. Tekstihakuja voi siis tehdä myös yleiskielen sananmuotojen perusteella.

SKN-korpus on vapaasti käytettävissä ilman kirjautumista Creative Commons Nimeä 4.0 -lisenssillä.