IDA | Aineiston nimi | Name of corpus | URN | Lisenssi URL (jos on) | Lisenssi | LBR/Hae Lupa | Deposition agreement | Tyyppi | IDA | Sijainti: URN | Sijainti: Nimi | Dokumentaatio | Tekijä | Author | First publication date | Kielipankki publication date | Other / Links | ||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
100suom | Sata suomalaista kielellistä elämäkertaa | Hundred Finnish Linguistic Life Stories | MP4,DOCX,XLSX | MP4,DOCX,XLSX | B | Hanna Lappalainen | https://blogs.helsinki.fi/100suomalaista/ | Sata suomalaista kielellistä elämäkertaa | Hundred Finnish Linguistic Life Stories | urn:nbn:fi:lb-2019092003 | RES NC PRIV DEP OTHER | No | P | Yes | {Helsingin yliopisto} | {University of Helsinki} | 2019 | https://blogs.helsinki.fi/100suomalaista/ | |||||||||||||
Akkala | Puhutun ja kirjoitetun akkalansaamen korpus | The Corpus of Spoken and Written Akkala Saami | VRT | Korp | Michael Riessler | Puhutun ja kirjoitetun akkalansaamen korpus | The Corpus of Spoken and Written Akkala Saami | urn:nbn:fi:lb-2015111201 | No | T | Korp | ||||||||||||||||||||
amph-korp | Ajatella, miettiä, pohtia, harkita -korpuksen Helsinki-Korp-versio | amph-Corpus, Helsinki Korp Version | TXT | VRT | Korp | Antti Arppe | Ajatella, miettiä, pohtia, harkita -korpuksen Helsinki-Korp-versio | amph-Corpus, Helsinki Korp Version | urn:nbn:fi:lb-2017022802 | ACA NC | Yes | T | No | Korp | Antti Arppe | Antti Arppe | 2008 | ||||||||||||||
coha-dl-2021 | Corpus of Historical American English - Kielipankin ladattava versio 2021 | Corpus of Historical American English - Kielipankki download version 2021 | FIN-CLARIN | Corpus of Historical American English - Kielipankin ladattava versio 2021 | Corpus of Historical American English - Kielipankki download version 2021 | urn:nbn:fi:lb-2023030601 | http://urn.fi/urn:nbn:fi:lb-2017072507 | RES-fi | T | http://urn.fi/urn:nbn:fi:lb-2017061924 | Mark Davies | Mark Davies | 2023 | ||||||||||||||||||
coronavirus-ecorg-2021-05-src | The Coronavirus Corpus (Mark Davies, english-corpora.org) - Kielipankin versio 2021-05, lähdemateriaali | The Coronavirus Corpus (Mark Davies, english-corpora.org) - Kielipankki version 2021-05, source | B | FIN-CLARIN | The Coronavirus Corpus (Mark Davies, english-corpora.org) - Kielipankin versio 2021-05, lähdemateriaali | The Coronavirus Corpus (Mark Davies, english-corpora.org) - Kielipankki version 2021-05, source | urn:nbn:fi:lb-2022111701 | http://urn.fi/urn:nbn:fi:lb-2022111703 | RES-fi | T | Mark Davies | Mark Davies | 2020 | 2022 | |||||||||||||||||
DIALUKI | DIALUKI - toisen ja vieraan kielen lukemisen ja kirjoittamisen diagnosointi | DIALUKI - Diagnosing reading and writing in a second or foreign language | TXT | VRT | Korp | Ari Huhta | DIALUKI - toisen ja vieraan kielen lukemisen ja kirjoittamisen diagnosointi | DIALUKI - Diagnosing reading and writing in a second or foreign language | urn:nbn:fi:lb-20140730161 | http://urn.fi/urn:nbn:fi:lb-20150304138 | RES NC DEP | Yes | T | Korp | |||||||||||||||||
digitala-autumn2021 | DigiTala: lukioissa ja yliopistossa kerätty S2-aineisto, syksy 2021 | DigiTala: L2 Finnish data from upper secondary schools and university, autumn 2021 | WAV, TXT | WAV, TXT | B | Anna von Zansen | https://zenodo.org/communities/digitala/about/ | DigiTala: lukioissa ja yliopistossa kerätty S2-aineisto, syksy 2021 | DigiTala: L2 Finnish data from upper secondary schools and university, autumn 2021 | urn:nbn:fi:lb-2023012625 | http://urn.fi/urn:nbn:fi:lb-2023012627 | RES NC PRIV NORED DEP OTHER | No | P | http://urn.fi/urn:nbn:fi:lb-2023012626 | Anna von Zansen; Yaroslav Getman; Milla Sneck; Heini Kallio; Ragheb Al-Ghezi; Ekaterina Voskoboinik; Maria Kautonen; Ari Huhta; Mikko Kuronen; Mikko Kurimo; Raili Hildén | Anna von Zansen; Yaroslav Getman; Milla Sneck; Heini Kallio; Ragheb Al-Ghezi; Ekaterina Voskoboinik; Maria Kautonen; Ari Huhta; Mikko Kuronen; Mikko Kurimo; Raili Hildén | https://zenodo.org/communities/digitala/about/ | |||||||||||||
digitala-spring2021 | DigiTala: lukioissa kerätty S2-aineisto, kevät 2021 | DigiTala: L2 Finnish data from upper secondary schools, spring 2021 | WAV, TXT | WAV, TXT | B | Anna von Zansen | https://zenodo.org/communities/digitala/about/ | DigiTala: lukioissa kerätty S2-aineisto, kevät 2021 | DigiTala: L2 Finnish data from upper secondary schools, spring 2021 | urn:nbn:fi:lb-2023012621 | http://urn.fi/urn:nbn:fi:lb-2023012623 | RES NC PRIV NORED DEP OTHER | No | P | http://urn.fi/urn:nbn:fi:lb-2023012622 | Anna von Zansen; Yaroslav Getman; Milla Sneck; Heini Kallio; Ragheb Al-Ghezi; Ekaterina Voskoboinik; Maria Kautonen; Ari Huhta; Mikko Kuronen; Mikko Kurimo; Raili Hildén | Anna von Zansen; Yaroslav Getman; Milla Sneck; Heini Kallio; Ragheb Al-Ghezi; Ekaterina Voskoboinik; Maria Kautonen; Ari Huhta; Mikko Kuronen; Mikko Kurimo; Raili Hildén | https://zenodo.org/communities/digitala/about/ | |||||||||||||
digitala-yki | DigiTalan YKI-aineisto | DigiTala's YKI data | WAV, TXT | WAV, TXT | B | Heini Kallio | https://zenodo.org/communities/digitala/about/ | DigiTalan YKI-aineisto | DigiTala's YKI data | urn:nbn:fi:lb-2023012629 | http://urn.fi/urn:nbn:fi:lb-2023012631 | RES NC PRIV NORED DEP OTHER | No | P | http://urn.fi/urn:nbn:fi:lb-2023012630 | Heini Kallio; Sari Ohranen; Tuija Hirvelä; Ari Huhta; Anna von Zansen; Yaroslav Getman; Ekaterina Voskoboinik; Ragheb Al-Ghezi; Milla Sneck; Mikko Kuronen; Mikko Kurimo; Raili Hildén | Heini Kallio; Sari Ohranen; Tuija Hirvelä; Ari Huhta; Anna von Zansen; Yaroslav Getman; Ekaterina Voskoboinik; Ragheb Al-Ghezi; Milla Sneck; Mikko Kuronen; Mikko Kurimo; Raili Hildén | https://zenodo.org/communities/digitala/about/ | |||||||||||||
dma-v2 | Digitaalinen muoto-opin arkisto, uusi versio | Digital Morphology Archives, new version | VRT | Korp | Digitaalinen muoto-opin arkisto, uusi versio | Digital Morphology Archives, new version | http://creativecommons.org/licenses/by/4.0/ | PUB CC BY | Yes | T | Almost | Korp | {Helsingin yliopisto, suomen kielen, suomalais-ugrilaisten ja pohjoismaisten kielten ja kirjallisuuksien laitos} | {University of Helsinki, The Department of Finnish, Finno-Ugrian and Scandinavian Studies} | 2003 | ||||||||||||||||
dma-wn-fn-src | Muoto-opin arkiston sanaliput sekä keruukertomukset, lähdemateriaali | The Word Notes of the Morphology Archives with field reports, source | Muoto-opin arkiston sanaliput sekä keruukertomukset, lähdemateriaali | The Word Notes of the Morphology Archives with field reports, source | urn:nbn:fi:lb-2021083001 | http://urn.fi/urn:nbn:fi:lb-2016042201 | RES PRIV ND | Yes | T | Yes | http://urn.fi/urn:nbn:fi:lb-2021061101 | {Helsingin yliopisto, suomen kielen, suomalais-ugrilaisten ja pohjoismaisten kielten ja kirjallisuuksien laitos} | {University of Helsinki, The Department of Finnish, Finno-Ugrian and Scandinavian Studies} | ||||||||||||||||||
dma-wn-src | Digitaalisen muoto-opin arkiston sanaliput, lähdemateriaali | The Word Notes of the Digital Morphology Archives, source | Digitaalisen muoto-opin arkiston sanaliput, lähdemateriaali | The Word Notes of the Digital Morphology Archives, source | urn:nbn:fi:lb-202005191 | http://urn.fi/urn:nbn:fi:lb-2016042201 | RES PRIV ND | Yes | T | Yes | http://urn.fi/urn:nbn:fi:lb-2021061101 | {Helsingin yliopisto, suomen kielen, suomalais-ugrilaisten ja pohjoismaisten kielten ja kirjallisuuksien laitos} | {University of Helsinki, The Department of Finnish, Finno-Ugrian and Scandinavian Studies} | 2003 | |||||||||||||||||
DSPCON2013-2015-korp | Aalto-yliopiston DSP-kurssin keskustelukorpus 2013-2015, Helsinki-Korp-version | Aalto University DSP Course Conversation Corpus 2013-2015, Helsinki Korp Version | TXT | VRT | Korp | Mikko Kurimo, Seppo Enarvi | Aalto-yliopiston DSP-kurssin keskustelukorpus 2013-2015, Helsinki-Korp-version | Aalto University DSP Course Conversation Corpus 2013-2015, Helsinki Korp Version | urn:nbn:fi:lb-2017030101 | ACA NC DEP | Yes | T | No | Korp | {Aalto-yliopisto, Signaalinkäsittelyn ja akustiikan laitos} | {Aalto University, Department of Signal Processing and Acoustics} | 2016 | ||||||||||||||
eduskunta-v2-dl | Eduskunnan täysistunnot, ladattava versio 2 | Plenary Sessions of the Parliament of Finland, Downloadable Version 2 | MP4, WAV, TXT | WAV, ELAN, VRT | Eduskunnan täysistunnot, ladattava versio 2 | Plenary Sessions of the Parliament of Finland, Downloadable Version 2 | PUB BY (PRIV ND OTHER) | No | P | No | https://www.kielipankki.fi/aineistot/eduskunta/ | {Eduskunta} | {The Parliament of Finland} | ||||||||||||||||||
eduskunta-v2-korp | Eduskunnan täysistunnot, Kielipankin Korp-versio 2 | Plenary Sessions of the Parliament of Finland, Kielipankki Korp Version 2 | TXT | WAV, ELAN, VRT | Korp | Eduskunnan täysistunnot, Kielipankin Korp-versio 2 | Plenary Sessions of the Parliament of Finland, Kielipankki Korp Version 2 | PUB BY (PRIV ND OTHER) | No | T | No | Korp | https://www.kielipankki.fi/aineistot/eduskunta/ | {Eduskunta} | {The Parliament of Finland} | ||||||||||||||||
enets | Enetsin korpus | Enets Corpus | MP4, WAV, ELAN | MP4, WAV, ELAN | Download, Korp | Olesya Khanina | Enetsin korpus | Enets Corpus | No | P | No | Download, Korp | Olesya Khanina | Olesya Khanina | |||||||||||||||||
english-uhlcs-korp | Englannin korpuksen (UHLCS) Helsinki-Korp-versio | English Corpus (UHLCS), Helsinki Korp Version | TXT | VRT | Korp | Englannin korpuksen (UHLCS) Helsinki-Korp-versio | English Corpus (UHLCS), Helsinki Korp Version | urn:nbn:fi:lb-2017030701 | RES NC LOC ND | Yes | T | No | Korp | Kristiina Jokinen | Kristiina Jokinen | 2007 | |||||||||||||||
erme-dl | ERME Ersän ja mokšan laajennettu korpus, kokotekstit/ladattava versio | ERME Erzya and Moksha Extended Corpora, full text/download version | XML | VRT | Jack Rueter | ERME Ersän ja mokšan laajennettu korpus, kokotekstit/ladattava versio | ERME Erzya and Moksha Extended Corpora, full text/download version | ACA INF NC DEP | Yes | T | Jack Rueter; Olga Yerina | Jack Rueter; Olga Yerina | |||||||||||||||||||
Ersä | Ersän puhekielen korpus | Corpus of Colloquial Erzya | ELAN | Riho Grünthal | Ersän puhekielen korpus | Corpus of Colloquial Erzya | urn:nbn:fi:lb-2014073034 | ACA INF NC DEP | Yes | P | |||||||||||||||||||||
erzya-moksha-komi-uhlcs-korp | Ersän ja mokšan kirjallisuutta ja julkaisuja ja komisyrjäänin kirjallisuutta (UHLCS), Helsinki-Korp-versio | Corpus of Erzya and Moksha Mordvin Literature and Journals and Komi Zyrian Literature (UHLCS), Helsinki Korp Version | TXT | VRT | Korp | Ersän ja mokšan kirjallisuutta ja julkaisuja ja komisyrjäänin kirjallisuutta (UHLCS), Helsinki-Korp-versio | Corpus of Erzya and Moksha Mordvin Literature and Journals and Komi Zyrian Literature (UHLCS), Helsinki Korp Version | urn:nbn:fi:lb-2017022816 | RES NC LOC ND | Yes | T | No | Korp | Jack Rueter | Jack Rueter | 2007 | |||||||||||||||
erzya-moksha-uhlcs-korp | Ersän ja mokšan sanaluettelokorpuksen (UHLCS) Helsinki-Korp-versio | Erzya and Moksha Mordvin Word List Corpus (UHLCS), Helsinki Korp Version | TXT | VRT | Korp | Ersän ja mokšan sanaluettelokorpuksen (UHLCS) Helsinki-Korp-versio | Erzya and Moksha Mordvin Word List Corpus (UHLCS), Helsinki Korp Version | urn:nbn:fi:lb-2017022824 | RES NC LOC ND | Yes | T | No | Korp | Dennis Estill | Dennis Estill | 2007 | |||||||||||||||
estonian1-uhlcs-korp | Viron korpus 1:n (UHLCS) Helsinki-Korp-versio | Estonian Corpus 1 (UHLCS), Helsinki Korp Version | TXT | VRT | Korp | Viron korpus 1:n (UHLCS) Helsinki-Korp-versio | Estonian Corpus 1 (UHLCS), Helsinki Korp Version | urn:nbn:fi:lb-2017022822 | RES NC LOC ND | Yes | T | No | Korp | Kazuto Matsumura | Kazuto Matsumura | 2007 | |||||||||||||||
estonian2-uhlcs-korp | Viron korpus 2:n (UHLCS) Helsinki-Korp-versio | Estonian Corpus 2 (UHLCS), Helsinki Korp Version | TXT | VRT | Korp | Viron korpus 2:n (UHLCS) Helsinki-Korp-versio | Estonian Corpus 2 (UHLCS), Helsinki Korp Version | urn:nbn:fi:lb-2017022823 | RES NC LOC ND | Yes | T | No | Korp | Maria Vilkuna | Maria Vilkuna | 2007 | |||||||||||||||
fcaa | Keskusteluntutkimuksen arkisto | Finnish Conversation Analysis Archive | WAV,MP3,MP4,RTF,PDF | Mari Siiroinen | https://metashare.csc.fi/repository/browse/finnish-conversation-analysis-archive/65669f5eb7e611eb9cdefa163ec5ae3e69c8f5f510064ad999f16144700b1156/ | Keskusteluntutkimuksen arkisto | Finnish Conversation Analysis Archive | RES PRIV | No | P | https://metashare.csc.fi/repository/browse/finnish-conversation-analysis-archive/65669f5eb7e611eb9cdefa163ec5ae3e69c8f5f510064ad999f16144700b1156/ | ||||||||||||||||||||
fedidi | Murteita käsittelevien fennististen väitöskirjojen lähdetietokanta | Citation Database of Fennistic Dialect Dissertations | TXT | TXT | Murteita käsittelevien fennististen väitöskirjojen lähdetietokanta | Citation Database of Fennistic Dialect Dissertations | urn:nbn:fi:lb-2018092801 | No | T | Yes | Lotta Aarikka | Lotta Aarikka | |||||||||||||||||||
findarc | Suomenkielisen pimeän verkon kauppapaikka-aineisto | Finnish Dark Web Marketplace Corpus | JSONLINE | VRT | B | Tuomas Harviainen | Suomenkielisen pimeän verkon kauppapaikka-aineisto | Finnish Dark Web Marketplace Corpus | urn:nbn:fi:lb-2022062221 | http://urn.fi/urn:nbn:fi:lb-2022062222 | RES NC PRIV DEP OTHER | Yes | T | http://urn.fi/urn:nbn:fi:lb-2022062226 | Tuomas Harviainen | Tuomas Harviainen | |||||||||||||||
finears | Suomalaisen elektroakustisen musiikin haastatteluaineisto | Finnish electroacoustic music interviews | WAV,DOCX | WAV,TXT | Mikko Ojanen | https://blogs.helsinki.fi/finnish-electroacoustic-resources/ | Suomalaisen elektroakustisen musiikin haastatteluaineisto | Finnish electroacoustic music interviews | urn:nbn:fi:lb-2020030421 | RES PRIV | No | P | Mikko Ojanen | Mikko Ojanen | https://blogs.helsinki.fi/finnish-electroacoustic-resources/ | ||||||||||||||||
FinIntas | The FinINTAS Corpus of Spontaneous and Read-aloud Finnish Speech | The FinINTAS Corpus of Spontaneous and Read-aloud Finnish Speech | wav + Praat | ELAN | Mietta Lennes | The FinINTAS Corpus of Spontaneous and Read-aloud Finnish Speech | The FinINTAS Corpus of Spontaneous and Read-aloud Finnish Speech | urn:nbn:fi:lb-20140730194 | RES | No | P | ||||||||||||||||||||
finlangus | Amerikansuomalaisten siirtolaisten ja verrokkipuhujien puhuttu suomen kieli ja kielelliset tehtävät | Spoken language and linguistic tasks of Finnish-American immigrants and controls | Nana Lehtinen | Amerikansuomalaisten siirtolaisten ja verrokkipuhujien puhuttu suomen kieli ja kielelliset tehtävät | Spoken language and linguistic tasks of Finnish-American immigrants and controls | No | P | Nana Lehtinen | Nana Lehtinen | ||||||||||||||||||||||
finnish-bibles-uhlcs-korp | Suomen korpus (raamatut) (UHLCS), Helsinki-Korp-versio | Finnish Corpus (Bibles) (UHLCS), Helsinki Korp Version | TXT | VRT | Korp | Suomen korpus (raamatut) (UHLCS), Helsinki-Korp-versio | Finnish Corpus (Bibles) (UHLCS), Helsinki Korp Version | urn:nbn:fi:lb-2017022820 | RES NC LOC ND | Yes | T | No | Korp | Anssi Yli-Jyrä | Anssi Yli-Jyrä | 2007 | |||||||||||||||
finnish-literature-uhlcs-korp | Suomen korpus (kirjallisuutta) (UHLCS), Helsinki-Korp-versio | Finnish Corpus (Literature) (UHLCS), Helsinki Korp Version | TXT | VRT | Korp | Suomen korpus (kirjallisuutta) (UHLCS), Helsinki-Korp-versio | Finnish Corpus (Literature) (UHLCS), Helsinki Korp Version | urn:nbn:fi:lb-2017022821 | RES NC LOC ND | Yes | T | No | Korp | Helsingin yliopisto | University of Helsinki | 2007 | |||||||||||||||
FinnTreeBank1-korp | Suomen puupankki FinnTreeBank 1:n Helsinki-Korp-versio | The Helsinki Korp Version of the Finnish TreeBank 1 | TXT | VRT | Korp | Suomen puupankki FinnTreeBank 1:n Helsinki-Korp-versio | The Helsinki Korp Version of the Finnish TreeBank 1 | urn:nbn:fi:lb-2017030102 | https://creativecommons.org/licenses/by-nc-nd/4.0/legalcode | PUB CC BY | Yes | T | No | Korp | {Helsingin yliopisto} | {University of Helsinki} | 2010 | ||||||||||||||
ha-korp | Ha-kieliaineiston Helsinki-Korp-versio | Ha Language Corpus, Helsinki Korp Version | TXT | VRT | Korp | Lotta Aunio | Ha-kieliaineiston Helsinki-Korp-versio | Ha Language Corpus, Helsinki Korp Version | urn:nbn:fi:lb-2017022101 | http://creativecommons.org/licenses/by/4.0/ | PUB CC BY | Yes | T | No | Korp | Lotta Aunio | Lotta Aunio | ||||||||||||||
hanty-uhlcs-korp | Hantin korpus (pohjoishantin aineistot ja käännökset) (UHLCS), Helsinki-Korp-versio | Khanty Corpus (North Khanty, Corpora and Translations) (UHLCS), Helsinki Korp Version | TXT | VRT | Korp | Hantin korpus (pohjoishantin aineistot ja käännökset) (UHLCS), Helsinki-Korp-versio | Khanty Corpus (North Khanty, Corpora and Translations) (UHLCS), Helsinki Korp Version | urn:nbn:fi:lb-2017022818 | RES NC LOC ND | Yes | T | No | Korp | Merja Salo | Merja Salo | 2007 | |||||||||||||||
helpuhe-2010txt | Helsingin puhekielen pitkittäiskorpus (2010-luvun tekstimuotoinen aineisto) | The Longitudinal Corpus of Finnish Spoken in Helsinki (2010 in text form) | TextGrid | VRT | Korp | Hanna Lappalainen | Helsingin puhekielen pitkittäiskorpus (2010-luvun tekstimuotoinen aineisto) | The Longitudinal Corpus of Finnish Spoken in Helsinki (2010 in text form) | urn:nbn:fi:lb-2014073040 | ACA NC DEP | Yes | T | Almost | Korp | https://www.kielipankki.fi/aineistot/helpuhe/ | Hanna Lappalainen | Hanna Lappalainen | ||||||||||||||
helpuhe-v2-korp | Helsingin puhekielen pitkittäiskorpuksen (1970, 1990, 2010) Helsinki Korp versio 2 | The Longitudinal Corpus of Finnish Spoken in Helsinki (1970s, 1990s and 2010s), Helsinki Korp Version 2 | Hanna Lappalainen | Helsingin puhekielen pitkittäiskorpuksen (1970, 1990, 2010) Helsinki Korp versio 2 | The Longitudinal Corpus of Finnish Spoken in Helsinki (1970s, 1990s and 2010s), Helsinki Korp Version 2 | urn:nbn:fi:lb-2016051602 | http://urn.fi/urn:nbn:fi:lb-2015041303 | RES NC PRIV DEP | Yes | T | https://www.kielipankki.fi/aineistot/helpuhe/ | ||||||||||||||||||||
helpuhe-v2-lat | Helsingin puhekielen pitkittäiskorpuksen (1970, 1990, 2010) Helsinki LAT versio 2 | The Longitudinal Corpus of Finnish Spoken in Helsinki (1970s, 1990s and 2010s), Helsinki LAT Version 2 | TextGrid | ELAN | B | Hanna Lappalainen | Helsingin puhekielen pitkittäiskorpuksen (1970, 1990, 2010) Helsinki LAT versio 2 | The Longitudinal Corpus of Finnish Spoken in Helsinki (1970s, 1990s and 2010s), Helsinki LAT Version 2 | urn:nbn:fi:lb-2016051601 | http://urn.fi/urn:nbn:fi:lb-2015041303 | RES NC PRIV DEP | Yes | T | No | https://www.kielipankki.fi/aineistot/helpuhe/ | ||||||||||||||||
HS | Helsingin Sanomien arkisto -korpus | The Helsingin Sanomat Archive Corpus | VRT | Korp | Jarkko Rahkonen | Helsingin Sanomien arkisto -korpus | The Helsingin Sanomat Archive Corpus | urn:nbn:fi:lb-2014073036 | ACA | Yes | T | Korp | |||||||||||||||||||
ingrian-uhlcs-korp | Inkeroisen korpuksen (UHLCS) Helsinki-Korp-versio | Ingrian Corpus (UHLCS), Helsinki Korp Version | TXT | VRT | Korp | Inkeroisen korpuksen (UHLCS) Helsinki-Korp-versio | Ingrian Corpus (UHLCS), Helsinki Korp Version | urn:nbn:fi:lb-2017022819 | RES NC LOC ND | Yes | T | No | Korp | Manja Lehto | Manja Lehto | 2007 | |||||||||||||||
Inkerin murteet | Inkerin murteiden korpus | The Corpus of Ingrian Finnish | WORD-DOC, MP3, WAV | VRT, ELAN | Marjatta Palander | www, muuta | Inkerin murteiden korpus | The Corpus of Ingrian Finnish | urn:nbn:fi:lb-2014073032 | No | P | www, muuta | |||||||||||||||||||
iweb-ecorg-src | The Intelligent Web Corpus (Mark Davies, english-corpora.org) - Kielipankin versio, lähdemateriaali | The Intelligent Web Corpus (Mark Davies, english-corpora.org) - Kielipankki version, source | B | FIN-CLARIN | The Intelligent Web Corpus (Mark Davies, english-corpora.org) - Kielipankin versio, lähdemateriaali | The Intelligent Web Corpus (Mark Davies, english-corpora.org) - Kielipankki version, source | urn:nbn:fi:lb-2022112306 | RES-fi | T | Mark Davies | Mark Davies | 2018 | 2022 | ||||||||||||||||||
kikosa-haa | Oulun yliopiston Kikosa-kokoelma: Ryhmähaastattelut | University of Oulu Kikosa Collection: Group interviews | WAV, EAF, TXT | WAV, EAF, TXT | Maria Frick | Oulun yliopiston Kikosa-kokoelma: Ryhmähaastattelut | University of Oulu Kikosa Collection: Group interviews | urn:nbn:fi:lb-2022050221 | RES NC PRIV NORED DEP OTHER | No | P | Yes | Oulun yliopisto | University of Oulu | |||||||||||||||||
kikosa-kok | Oulun yliopiston Kikosa-kokoelma:Opiskelijakokoukset | University of Oulu Kikosa Collection: Student meetings | WAV, EAF, TXT | WAV, EAF, TXT | Maria Frick | Oulun yliopiston Kikosa-kokoelma:Opiskelijakokoukset | University of Oulu Kikosa Collection: Student meetings | urn:nbn:fi:lb-2022050222 | RES NC PRIV NORED DEP OTHER | No | P | Yes | Oulun yliopisto; Salla Niemetmaa | University of Oulu; Salla Niemetmaa | |||||||||||||||||
Kiltinänsaame | Kirjoitetun kiltinänsaamen korpus | The Corpus of Written Kildin Saami | VRT | Korp | Mikael Riessler | Kirjoitetun kiltinänsaamen korpus | The Corpus of Written Kildin Saami | urn:nbn:fi:lb-2015102001 | http://creativecommons.org/licenses/by/4.0/ | PUB CC BY | No | T | Korp | ||||||||||||||||||
Kiltinänsaame (UHLCS) | Kiltinänsaamen korpus (UHLCS) | Kildin Saami Corpus (UHLCS) | Pirkko Suihkonen | Kiltinänsaamen korpus (UHLCS) | Kildin Saami Corpus (UHLCS) | urn:nbn:fi:lb-2016012201 | ACA NC | Yes | T | No | |||||||||||||||||||||
klk-fi-v2-korp | Kansalliskirjaston sanoma- ja aikakauslehtikokoelman suomenkielinen osakorpus versio 2, Korp | The Finnish Sub-corpus of the Newspaper and Periodical Corpus of the National Library of Finland version 2, Korp | Korp | FIN-CLARIN | Kansalliskirjaston sanoma- ja aikakauslehtikokoelman suomenkielinen osakorpus versio 2, Korp | The Finnish Sub-corpus of the Newspaper and Periodical Corpus of the National Library of Finland version 2, Korp | urn:nbn:fi:lb-202009152 | PUB CC BY | T | Korp | http://urn.fi/urn:nbn:fi:lb-2021092404 | {Kansalliskirjasto} | {National Library of Finland} | 2023 | |||||||||||||||||
komi-ikdp | Puhutun komin korpus: IKDP | Spoken Komi Corpus: IKDP | MP4, WAV, ELAN | MP4, WAV, ELAN | Niko Partanen | Puhutun komin korpus: IKDP | Spoken Komi Corpus: IKDP | urn:nbn:fi:lb-2019121603 | RES PRIV | No | P | No | Rogier Blokland; Michael Riessler; Niko Partanen | Rogier Blokland; Michael Riessler; Niko Partanen | |||||||||||||||||
komi-uhlcs-korp | Komisyrjäänin korpuksen (UHLCS) Helsinki-Korp-versio | Komi Zyrian Corpus (UHLCS), Helsinki Korp Version | TXT | VRT | Korp | Komisyrjäänin korpuksen (UHLCS) Helsinki-Korp-versio | Komi Zyrian Corpus (UHLCS), Helsinki Korp Version | urn:nbn:fi:lb-2017022817 | RES NC LOC ND | Yes | T | No | Korp | Paula Kokkonen | Paula Kokkonen | 2007 | |||||||||||||||
kra-korp | Keskiranskan korpuksen Helsinki-Korp-versio | Jyväskylä Corpus of Middle French, Helsinki Korp Version | TXT | VRT | Korp | Keskiranskan korpuksen Helsinki-Korp-versio | Jyväskylä Corpus of Middle French, Helsinki Korp Version | urn:nbn:fi:lb-2017022806 | RES NC LOC ND | Yes | T | No | Korp | {Jyväskylän yliopisto, kielten laitos} | {University of Jyväskylä, Department of Languages} | 1999 | |||||||||||||||
latin-uhlcs-korp | Latinan korpuksen (UHLCS) Helsinki-Korp-versio | Latin Corpus (UHLCS), Helsinki Korp Version | TXT | VRT | Korp | Latinan korpuksen (UHLCS) Helsinki-Korp-versio | Latin Corpus (UHLCS), Helsinki Korp Version | urn:nbn:fi:lb-2017022815 | RES NC LOC ND | Yes | T | No | Korp | Martti Nyman | Martti Nyman | 2007 | |||||||||||||||
long-second | Long Second -korpus: Suomen kielen kehittyminen alakoulun valmistavalla luokalla | The Long Second Corpus: LONGitudinal Classroom Data about Children’s Development in Finnish as a SECOND Language | ELAN, MP4 | VRT, ELAN | Download, Korp | Maria Ahlholm | Long Second -korpus: Suomen kielen kehittyminen alakoulun valmistavalla luokalla | The Long Second Corpus: LONGitudinal Classroom Data about Children’s Development in Finnish as a SECOND Language | urn:nbn:fi:lb-2015031801 | RES NC PRIV *Sensitive | Almost | P | No | Download, Korp | Maria Ahlholm | Maria Ahlholm | |||||||||||||||
Lönnrot | Elias Lönnrotin kirjeenvaihto | Elias Lönnrot Letters Online | XML | VRT | Korp | Kirsi Keravuori | www | Elias Lönnrotin kirjeenvaihto | Elias Lönnrot Letters Online | urn:nbn:fi:lb-2017082201 | https://creativecommons.org/licenses/by-sa/4.0/legalcode | PUB CC BY SA | Yes | T | Korp | www | |||||||||||||||
lude-uhlcs-korp | Lyydin korpuksen (UHLCS) Helsinki-Korp-versio | Lude (Ludian) Corpus (UHLCS), Helsinki Korp Version | TXT | VRT | Korp | Lyydin korpuksen (UHLCS) Helsinki-Korp-versio | Lude (Ludian) Corpus (UHLCS), Helsinki Korp Version | urn:nbn:fi:lb-2017022813 | RES NC LOC ND | Yes | T | No | Korp | Miikul Pahomov | Miikul Pahomov | 2007 | |||||||||||||||
medievalturku | Turun keskiaikaisten asiakirjojen maamerkkien korpus, lähdeaineisto | Corpus of landscapes in medieval documents from Turku, source | XML | XML, VRT, TXT | B | Hanna-Mari Kupari | Turun keskiaikaisten asiakirjojen maamerkkien korpus, lähdeaineisto | Corpus of landscapes in medieval documents from Turku, source | urn:nbn:fi:lb-2023032021 | http://urn.fi/urn:nbn:fi:lb-2023032023 | PUB CC BY | No | T | No | http://urn.fi/urn:nbn:fi:lb-2023032022 | Hanna-Mari Kupari; Marko Lamberg | Hanna-Mari Kupari; Marko Lamberg | https://github.com/HannaKoo/landscapes | |||||||||||||
mepu-src | Puhutun meänkielen korpus, lähdeaineisto | Corpus of Spoken Meänkieli, source | WAV, TXT | WAV, TXT | B | Niina Kunnas | Puhutun meänkielen korpus, lähdeaineisto | Corpus of Spoken Meänkieli, source | urn:nbn:fi:lb-2022112921 | http://urn.fi/urn:nbn:fi:lb-2022112923 | RES NC PRIV NORED DEP OTHER | No | P | No | http://urn.fi/urn:nbn:fi:lb-2022112922 | Niina Kunnas; Veikka Ritola; Jenna Vikman | Niina Kunnas; Veikka Ritola; Jenna Vikman | ||||||||||||||
mlcca | MLCCA, Monikielinen sopimustekstien korpus | MLCCA, Multilingual Corpus of Contracts and Agreements | XML, VRT | XML, VRT | A | Mikhail Mikhailov | MLCCA, Monikielinen sopimustekstien korpus | MLCCA, Multilingual Corpus of Contracts and Agreements | urn:nbn:fi:lb-2022101821 | http://urn.fi/urn:nbn:fi:lb-2022101823 | PUB CC BY / RES NC DEP | No | T | http://urn.fi/urn:nbn:fi:lb-2022101822 | Mikhail Mikhailov; Julia Souma | Mikhail Mikhailov; Julia Souma | 2020 | ||||||||||||||
movie-ecorg-src | The Movie Corpus (Mark Davies, english-corpora.org) - Kielipankin versio, lähdemateriaali | The Movie Corpus (Mark Davies, english-corpora.org) - Kielipankki version, source | B | FIN-CLARIN | The Movie Corpus (Mark Davies, english-corpora.org) - Kielipankin versio, lähdemateriaali | The Movie Corpus (Mark Davies, english-corpora.org) - Kielipankki version, source | urn:nbn:fi:lb-2022112301 | RES-fi | T | Mark Davies | Mark Davies | 2019 | 2022 | ||||||||||||||||||
mutable-src | Kuvailutulkkaus sokeiden ja näkevien yhteistyönä | Multimodal Translation with the Blind | MP4, EAF, TXT | MP4, EAF, TXT | B | Maija Hirvonen | https://projects.tuni.fi/mutable/the-mutable-corpus/ | Kuvailutulkkaus sokeiden ja näkevien yhteistyönä | Multimodal Translation with the Blind | urn:nbn:fi:lb-2021042021 | RES NC PRIV NORED DEP OTHER | No | P | No | Maija Hirvonen | Maija Hirvonen | https://projects.tuni.fi/mutable/the-mutable-corpus/ | ||||||||||||||
nenets-uhlcs-korp | Nenetsin korpuksen (UHLCS) Helsinki-Korp-versio | Nenets Corpus (Tundra Nenets) (UHLCS), Helsinki Korp Version | TXT | VRT | Korp | Nenetsin korpuksen (UHLCS) Helsinki-Korp-versio | Nenets Corpus (Tundra Nenets) (UHLCS), Helsinki Korp Version | urn:nbn:fi:lb-2017022812 | RES NC LOC ND | Yes | T | No | Korp | Tapani Salminen | Tapani Salminen | 2007 | |||||||||||||||
Nganasan | Nganasanin kielen puhekorpus | Nganasan Speech Corpus | ELAN | VRT, ELAN | Larisa Leisiö | Nganasanin kielen puhekorpus | Nganasan Speech Corpus | urn:nbn:fi:lb-2014100302 | ACA NC DEP | Yes | P | ||||||||||||||||||||
nmk-korp | Nimimaiseman muutos -korpuksen Helsinki Korp -versio | Changes in Place Names Corpus, Helsinki Korp Version | VRT | Korp | Elisa Stenvall | Nimimaiseman muutos -korpuksen Helsinki Korp -versio | Changes in Place Names Corpus, Helsinki Korp Version | urn:nbn:fi:lb-2016031702 | https://www.kielipankki.fi/lic/nmk/ | ACA NC | Yes | T | Korp | ||||||||||||||||||
nmk-lat | Nimimaiseman muutos -korpuksen Helsinki LAT -versio | Changes in Place Names Corpus, Helsinki LAT Version | ELAN | Elisa Stenvall | Nimimaiseman muutos -korpuksen Helsinki LAT -versio | Changes in Place Names Corpus, Helsinki LAT Version | urn:nbn:fi:lb-2016031702 | https://www.kielipankki.fi/lic/nmk/ | ACA NC | Yes | P | ||||||||||||||||||||
NorDiga | Nordican digitaalinen arkisto | The Nordica Digital Archive | VRT | Korp | Jan Lindström | www | Nordican digitaalinen arkisto | The Nordica Digital Archive | urn:nbn:fi:lb-2016032401 | No | T | No | Korp | www | |||||||||||||||||
north-saami-literature-uhlcs-korp | Pohjoissaamen korpus (kirjallisuutta) (UHLCS), Helsinki-Korp-versio | North Saami Corpus (Literature) (UHLCS), Helsinki Korp Version | TXT | VRT | Korp | Pohjoissaamen korpus (kirjallisuutta) (UHLCS), Helsinki-Korp-versio | North Saami Corpus (Literature) (UHLCS), Helsinki Korp Version | urn:nbn:fi:lb-2017022810 | RES NC LOC ND | Yes | T | No | Korp | Kerttu Vuolab | Kerttu Vuolab | 2007 | |||||||||||||||
north-saami-report-uhlcs-korp | Pohjoissaamen korpuksen (Sámikultuvradoaibmagotti smiehttamush) (UHLCS) Helsinki-Korp-versio | North Saami Corpus (Sámikultuvradoaibmagotti smiehttamush) (UHLCS), Helsinki Korp Version Corpus | TXT | VRT | Korp | Pohjoissaamen korpuksen (Sámikultuvradoaibmagotti smiehttamush) (UHLCS) Helsinki-Korp-versio | North Saami Corpus (Sámikultuvradoaibmagotti smiehttamush) (UHLCS), Helsinki Korp Version Corpus | urn:nbn:fi:lb-2017022811 | RES NC LOC ND | Yes | T | No | Korp | Irja Seurujärvi-Kari | Irja Seurujärvi-Kari | 2007 | |||||||||||||||
now-ecorg-2021-05-src | News on the Web (Mark Davies, english-corpora.org) - Kielipankin versio 2021-05, lähdemateriaali | News on the Web (Mark Davies, english-corpora.org) - Kielipankki version 2021-05, source | B | FIN-CLARIN | News on the Web (Mark Davies, english-corpora.org) - Kielipankin versio 2021-05, lähdemateriaali | News on the Web (Mark Davies, english-corpora.org) - Kielipankki version 2021-05, source | urn:nbn:fi:lb-2022112401 | RES-fi | T | Mark Davies | Mark Davies | 2016 | 2022 | ||||||||||||||||||
nzadi | Nzadin korpus | Nzadi Corpus | WAV, PDF, TXT | WAV, PDF, TXT | Download, Korp | Thera Marie Crane | Nzadin korpus | Nzadi Corpus | No | P | No | Download, Korp | Thera Marie Crane; Larry Hyman; Simon Tukumu | Thera Marie Crane; Larry Hyman; Simon Tukumu | |||||||||||||||||
ona | Oulun nauhoitearkisto | The Audio Recordings Archive of Oulu (ONA) | ELAN | Niina Kunnas | Oulun nauhoitearkisto | The Audio Recordings Archive of Oulu (ONA) | urn:nbn:fi:lb-2016110701 | http://urn.fi/urn:nbn:fi:lb-2016121616 | RES NC PRIV DEP | Yes | P | {Oulun yliopisto, suomen kielen oppiaine} | {University of Oulu, Department of Finnish Language} | ||||||||||||||||||
Opus ECB | Opus EKP -korpus | Opus ECB Corpus | Jörg Tiedemann | Opus EKP -korpus | Opus ECB Corpus | urn:nbn:fi:lb-2016012801 | http://creativecommons.org/licenses/by-nc/4.0/ | PUB CC BY NC | T | Yes | |||||||||||||||||||||
Opus EU | Opus EU -korpus | Opus EU Corpus | Jörg Tiedemann | Opus EU -korpus | Opus EU Corpus | urn:nbn:fi:lb-2016012802 | http://creativecommons.org/licenses/by/4.0/ | PUB CC BY | T | Yes | |||||||||||||||||||||
Opus Localization | Opus lokalisointi -korpus | Opus Localization Corpus | Jörg Tiedemann | Opus lokalisointi -korpus | Opus Localization Corpus | urn:nbn:fi:lb-2016012803 | https://opensource.org/licenses/MIT | MIT | T | Yes | |||||||||||||||||||||
Opus Subtitles | Opus tekstitys -korpus | Opus Subtitles Corpus | Jörg Tiedemann | Opus tekstitys -korpus | Opus Subtitles Corpus | urn:nbn:fi:lb-2016012804 | http://creativecommons.org/licenses/by-nc/4.0/ | PUB CC BY NC | T | Yes | |||||||||||||||||||||
oulu-korp | Oulun korpuksen Helsinki-Korp-versio | Oulu Corpus, Helsinki Korp Version | TXT | VRT | Korp | Oulun korpuksen Helsinki-Korp-versio | Oulu Corpus, Helsinki Korp Version | urn:nbn:fi:lb-2017022805 | RES NC LOC ND | Yes | T | No | Korp | {Oulun yliopisto, suomen kielen oppiaine} | {University of Oulu, Department of Finnish Language} | 2013 | |||||||||||||||
parole-fi-korp | Suomen kielen Parole-korpuksen Helsinki-Korp-versio | The Finnish Parole Corpus, Helsinki Korp Version | TXT | VRT | Korp | Suomen kielen Parole-korpuksen Helsinki-Korp-versio | The Finnish Parole Corpus, Helsinki Korp Version | urn:nbn:fi:lb-2017022804 | RES NC LOC ND | Yes | T | No | Korp | {Helsingin yliopisto} | {University of Helsinki} | 1998 | |||||||||||||||
PERSO | PERSO Databases for Finnish Speech Synthesis | PERSO Databases for Finnish Speech Synthesis | TXT, WAV | ELAN | Martti Vainio, Heini Kallio | PERSO Databases for Finnish Speech Synthesis | PERSO Databases for Finnish Speech Synthesis | urn:nbn:fi:lb-2014073053 | ACA NC | Yes | P | Almost | |||||||||||||||||||
ProoF | ProoF - Maahanmuuttajien suomen kielen ääntäminen | ProoF - Pronunciation of Finnish by Immigrants in Finland | wav + Praat | ELAN | Mietta Lennes | ProoF - Maahanmuuttajien suomen kielen ääntäminen | ProoF - Pronunciation of Finnish by Immigrants in Finland | urn:nbn:fi:lb-20140730130 | RES | No | P | ||||||||||||||||||||
Prosodiakorpus | Suomen kielen prosodian variaation korpus | Corpus of Prosodic Variation of Finnish | ELAN | Tommi Kurki, Tommi Nieminen | Suomen kielen prosodian variaation korpus | Corpus of Prosodic Variation of Finnish | urn:nbn:fi:lb-2014090803 | ACA | No | P | |||||||||||||||||||||
puhelahjat-annotated | Lahjoita puhetta: Annotoitu aineisto | Donate Speech: Annotated dataset | WAV, FLAC, JSON | FLAC, CSV, TXT, TextGrid, ELAN | A | FIN-CLARIN | https://www.kielipankki.fi/lahjoita-puhetta/ | Lahjoita puhetta: Annotoitu aineisto | Donate Speech: Annotated dataset | urn:nbn:fi:lb-2022060128 | http://urn.fi/urn:nbn:fi:lb-2022020223 | RES NC PRIV DEP OTHER | Yes | P | https://www.kielipankki.fi/aineistot/puhelahjat/ | {Helsingin yliopisto} | {University of Helsinki} | 2023 | 2023 | https://www.kielipankki.fi/lahjoita-puhetta/ | |||||||||||
puhelahjat-dev | Lahjoita puhetta, Valikoitu aineisto: Kehitysdata (10h) | Donate Speech: Selected dataset, Development data (10h) | WAV, FLAC, JSON | FLAC, CSV, TXT, TextGrid, ELAN | A | Anssi Moisio | https://www.kielipankki.fi/lahjoita-puhetta/ | Lahjoita puhetta, Valikoitu aineisto: Kehitysdata (10h) | Donate Speech: Selected dataset, Development data (10h) | urn:nbn:fi:lb-2022060121 | http://urn.fi/urn:nbn:fi:lb-2022020223 | RES NC PRIV DEP OTHER | Yes | P | https://www.kielipankki.fi/aineistot/puhelahjat/ | {Helsingin yliopisto} | {University of Helsinki} | 2022 | 2022 | https://www.kielipankki.fi/lahjoita-puhetta/ | |||||||||||
puhelahjat-dev | Lahjoita puhetta, Valikoitu aineisto: Kehitysdata (10h) (yrityskäyttöön) | Donate Speech, Selected dataset: Development data (10h) (commercial use) | WAV, FLAC, JSON | FLAC, CSV, TXT, TextGrid, ELAN | A | Anssi Moisio | https://www.kielipankki.fi/lahjoita-puhetta/ | Lahjoita puhetta, Valikoitu aineisto: Kehitysdata (10h) (yrityskäyttöön) | Donate Speech, Selected dataset: Development data (10h) (commercial use) | urn:nbn:fi:lb-2022060121 | http://urn.fi/urn:nbn:fi:lb-2022060130 | Commercial license | Yes | P | https://www.kielipankki.fi/aineistot/puhelahjat-commercial/ | {Helsingin yliopisto} | {University of Helsinki} | 2023 | 2023 | https://www.kielipankki.fi/lahjoita-puhetta/ | |||||||||||
puhelahjat-korp | Lahjoita puhetta -aineisto, Korp | Donate Speech Corpus, Korp | TXT, TextGrid | VRT | Korp | A | FIN-CLARIN | Lahjoita puhetta -aineisto, Korp | Donate Speech Corpus, Korp | urn:nbn:fi:lb-2022112121 | http://urn.fi/urn:nbn:fi:lb-2022020223 | RES NC PRIV DEP OTHER | No | P | No | http://urn.fi/urn:nbn:fi:lb-2022112121 | Korp | http://urn.fi/urn:nbn:fi:lb-2022102122 | {Helsingin yliopisto} | {University of Helsinki} | 2022 | ||||||||||
puhelahjat-selected | Lahjoita puhetta: Valikoitu aineisto | Donate Speech: Selected dataset | WAV, FLAC, JSON | FLAC, CSV, TXT, TextGrid, ELAN | A | FIN-CLARIN | https://www.kielipankki.fi/lahjoita-puhetta/ | Lahjoita puhetta: Valikoitu aineisto | Donate Speech: Selected dataset | urn:nbn:fi:lb-2022060127 | http://urn.fi/urn:nbn:fi:lb-2022020223 | RES NC PRIV DEP OTHER | Yes | P | https://www.kielipankki.fi/aineistot/puhelahjat/ | {Helsingin yliopisto} | {University of Helsinki} | 2023 | 2023 | https://www.kielipankki.fi/lahjoita-puhetta/ | |||||||||||
puhelahjat-test | Lahjoita puhetta, Valikoitu aineisto: Testidata (10h) | Donate Speech: Selected dataset, Test data (10h) | WAV, FLAC, JSON | FLAC, CSV, TXT, TextGrid, ELAN | A | Anssi Moisio | https://www.kielipankki.fi/lahjoita-puhetta/ | Lahjoita puhetta, Valikoitu aineisto: Testidata (10h) | Donate Speech: Selected dataset, Test data (10h) | urn:nbn:fi:lb-2022060122 | http://urn.fi/urn:nbn:fi:lb-2022020223 | RES NC PRIV DEP OTHER | Yes | P | https://www.kielipankki.fi/aineistot/puhelahjat/ | {Helsingin yliopisto} | {University of Helsinki} | 2022 | 2022 | https://www.kielipankki.fi/lahjoita-puhetta/ | |||||||||||
puhelahjat-test | Lahjoita puhetta, Valikoitu aineisto: Testidata (10h) (yrityskäyttöön) | Donate Speech, Selected dataset: Test data (10h) (commercial use) | WAV, FLAC, JSON | FLAC, CSV, TXT, TextGrid, ELAN | A | Anssi Moisio | https://www.kielipankki.fi/lahjoita-puhetta/ | Lahjoita puhetta, Valikoitu aineisto: Testidata (10h) (yrityskäyttöön) | Donate Speech, Selected dataset: Test data (10h) (commercial use) | urn:nbn:fi:lb-2022060122 | http://urn.fi/urn:nbn:fi:lb-2022060130 | Commercial license | Yes | P | https://www.kielipankki.fi/aineistot/puhelahjat-commercial/ | {Helsingin yliopisto} | {University of Helsinki} | 2023 | 2023 | https://www.kielipankki.fi/lahjoita-puhetta/ | |||||||||||
puhelahjat-test-mtr | Lahjoita puhetta, Valikoitu aineisto: Usean litteroijan testidata (1h) | Donate Speech: Selected dataset, Multi-transcriber test data (1h) | WAV, FLAC, JSON | FLAC, CSV, TXT, TextGrid, ELAN | A | Anssi Moisio | https://www.kielipankki.fi/lahjoita-puhetta/ | Lahjoita puhetta, Valikoitu aineisto: Usean litteroijan testidata (1h) | Donate Speech: Selected dataset, Multi-transcriber test data (1h) | urn:nbn:fi:lb-2022060124 | http://urn.fi/urn:nbn:fi:lb-2022020223 | RES NC PRIV DEP OTHER | Yes | P | https://www.kielipankki.fi/aineistot/puhelahjat/ | {Helsingin yliopisto} | {University of Helsinki} | 2022 | 2022 | https://www.kielipankki.fi/lahjoita-puhetta/ | |||||||||||
puhelahjat-test-mtr | Lahjoita puhetta, Valikoitu aineisto: Usean litteroijan testidata (1h) (yrityskäyttöön) | Donate Speech, Selected dataset: Multi-transcriber test data (1h) (commercial use) | WAV, FLAC, JSON | FLAC, CSV, TXT, TextGrid, ELAN | A | Anssi Moisio | https://www.kielipankki.fi/lahjoita-puhetta/ | Lahjoita puhetta, Valikoitu aineisto: Usean litteroijan testidata (1h) (yrityskäyttöön) | Donate Speech, Selected dataset: Multi-transcriber test data (1h) (commercial use) | urn:nbn:fi:lb-2022060124 | http://urn.fi/urn:nbn:fi:lb-2022060130 | Commercial license | Yes | P | https://www.kielipankki.fi/aineistot/puhelahjat-commercial/ | {Helsingin yliopisto} | {University of Helsinki} | 2023 | 2023 | https://www.kielipankki.fi/lahjoita-puhetta/ | |||||||||||
puhelahjat-test-mtrs | Lahjoita puhetta, Valikoitu aineisto: Testidata useaan kertaan litteroiduilta puhujilta (10h) | Donate Speech: Selected dataset, Test data from multi-transcriber speakers (10h) | WAV, FLAC, JSON | FLAC, CSV, TXT, TextGrid, ELAN | A | Anssi Moisio | https://www.kielipankki.fi/lahjoita-puhetta/ | Lahjoita puhetta, Valikoitu aineisto: Testidata useaan kertaan litteroiduilta puhujilta (10h) | Donate Speech: Selected dataset, Test data from multi-transcriber speakers (10h) | urn:nbn:fi:lb-2022060125 | http://urn.fi/urn:nbn:fi:lb-2022020223 | RES NC PRIV DEP OTHER | Yes | P | https://www.kielipankki.fi/aineistot/puhelahjat/ | {Helsingin yliopisto} | {University of Helsinki} | 2022 | 2022 | https://www.kielipankki.fi/lahjoita-puhetta/ | |||||||||||
puhelahjat-test-mtrs | Lahjoita puhetta, Valikoitu aineisto: Testidata useaan kertaan litteroiduilta puhujilta (10h) (yrityskäyttöön) | Donate Speech, Selected dataset: Test data from multi-transcriber speakers (10h) (commercial use) | WAV, FLAC, JSON | FLAC, CSV, TXT, TextGrid, ELAN | A | Anssi Moisio | https://www.kielipankki.fi/lahjoita-puhetta/ | Lahjoita puhetta, Valikoitu aineisto: Testidata useaan kertaan litteroiduilta puhujilta (10h) (yrityskäyttöön) | Donate Speech, Selected dataset: Test data from multi-transcriber speakers (10h) (commercial use) | urn:nbn:fi:lb-2022060125 | http://urn.fi/urn:nbn:fi:lb-2022060130 | Commercial license | Yes | P | https://www.kielipankki.fi/aineistot/puhelahjat-commercial/ | {Helsingin yliopisto} | {University of Helsinki} | 2023 | 2023 | https://www.kielipankki.fi/lahjoita-puhetta/ | |||||||||||
puhelahjat-train | Lahjoita puhetta, Valikoitu aineisto: Opetusdata (100h) | Donate Speech: Selected dataset, Training data (100h) | WAV, FLAC, JSON | FLAC, CSV, TXT, TextGrid, ELAN | A | Anssi Moisio | https://www.kielipankki.fi/lahjoita-puhetta/ | Lahjoita puhetta, Valikoitu aineisto: Opetusdata (100h) | Donate Speech: Selected dataset, Training data (100h) | urn:nbn:fi:lb-2022060123 | http://urn.fi/urn:nbn:fi:lb-2022020223 | RES NC PRIV DEP OTHER | Yes | P | https://www.kielipankki.fi/aineistot/puhelahjat/ | {Helsingin yliopisto} | {University of Helsinki} | 2022 | 2022 | https://www.kielipankki.fi/lahjoita-puhetta/ | |||||||||||
puhelahjat-train | Lahjoita puhetta, Valikoitu aineisto: Opetusdata (100h) (yrityskäyttöön) | Donate Speech, Selected dataset: Training data (100h) (commercial use) | WAV, FLAC, JSON | FLAC, CSV, TXT, TextGrid, ELAN | A | Anssi Moisio | https://www.kielipankki.fi/lahjoita-puhetta/ | Lahjoita puhetta, Valikoitu aineisto: Opetusdata (100h) (yrityskäyttöön) | Donate Speech, Selected dataset: Training data (100h) (commercial use) | urn:nbn:fi:lb-2022060123 | http://urn.fi/urn:nbn:fi:lb-2022060130 | Commercial license | Yes | P | https://www.kielipankki.fi/aineistot/puhelahjat-commercial/ | {Helsingin yliopisto} | {University of Helsinki} | 2023 | 2023 | https://www.kielipankki.fi/lahjoita-puhetta/ | |||||||||||
quantlang-uhlcs-korp | Kvantifiointi suomessa ja keskisen Volgan ja Kaman alueella puhuttavissa kielissä (UHLCS), Helsinki-Korp-versio | Quantifiers and Quantification in Finnish and Languages Spoken in the Central Volga–Kama Region (UHLCS), Helsinki Korp Version | VRT | Korp | Kvantifiointi suomessa ja keskisen Volgan ja Kaman alueella puhuttavissa kielissä (UHLCS), Helsinki-Korp-versio | Quantifiers and Quantification in Finnish and Languages Spoken in the Central Volga–Kama Region (UHLCS), Helsinki Korp Version | urn:nbn:fi:lb-2017030104 | RES NC ND | Yes | T | No | Korp | Pirkko Suihkonen | Pirkko Suihkonen | 2016 | ||||||||||||||||
Saamen kielen korpus | Puhutun saamen kielen korpus (Giellagas) | Giellagas Corpus of Spoken Saami Languages | ELAN | Marko Jouste | Puhutun saamen kielen korpus (Giellagas) | Giellagas Corpus of Spoken Saami Languages | urn:nbn:fi:lb-2015060801 | RES INF NC PRIV DEP | Yes | P | |||||||||||||||||||||
sapu | Satakuntalaisuus puheessa -korpus | The Corpus of Sociolinguistic Variation in the Province of Satakunta | WAV, TextGrid, TXT | WAV, TextGrid, TXT | Tommi Kurki | Satakuntalaisuus puheessa -korpus | The Corpus of Sociolinguistic Variation in the Province of Satakunta | urn:nbn:fi:lb-2022092121 | http://urn.fi/urn:nbn:fi:lb-2022092122 | RES NC PRIV NORED DEP OTHER | No | P | No | Tommi Kurki; Kirsti Siitonen; Nobufumi Inaba | Tommi Kurki; Kirsti Siitonen; Nobufumi Inaba | ||||||||||||||||
sfnet-korp | SFNET-keskusteluryhmäkorpuksen Helsinki-Korp-versio | SFNET Corpus, Helsinki Korp Version | TXT | VRT | Korp | SFNET-keskusteluryhmäkorpuksen Helsinki-Korp-versio | SFNET Corpus, Helsinki Korp Version | urn:nbn:fi:lb-2017022803 | ACA NC | Yes | T | No | Korp | Tuuli Tuominen; Panu Kalliokoski; Antti Arppe; {CSC - Tieteen tietotekniikan keskus} | Tuuli Tuominen; Panu Kalliokoski; Antti Arppe; {CSC - IT Center for Science} | 2003 | |||||||||||||||
SignWiki | Viittomakielten SignWiki-hanke | The SignWiki Project of the Sign Languages in Finland | ELAN | Leena Savolainen | www | Viittomakielten SignWiki-hanke | The SignWiki Project of the Sign Languages in Finland | No | P | www | |||||||||||||||||||||
skk-vrt | Suomalaisen kirjallisuuden klassikoita, VRT | Classics of Finnish Literature, VRT | VRT | Petri Lauerma | Suomalaisen kirjallisuuden klassikoita, VRT | Classics of Finnish Literature, VRT | urn:nbn:fi:lb-2017121321 | http://ec.europa.eu/idabc/eupl.html | PUB EUPL v1.1 | Yes | T | http://urn.fi/urn:nbn:fi:lb-2021050703 | {Kotimaisten kielten keskus} | {Institute for the Languages of Finland} | |||||||||||||||||
soap-ecorg-src | Corpus of American Soap Operas (Mark Davies, english-corpora.org) - Kielipankin versio, lähdemateriaali | Corpus of American Soap Operas (Mark Davies, english-corpora.org) - Kielipankki version, source | B | FIN-CLARIN | Corpus of American Soap Operas (Mark Davies, english-corpora.org) - Kielipankin versio, lähdemateriaali | Corpus of American Soap Operas (Mark Davies, english-corpora.org) - Kielipankki version, source | urn:nbn:fi:lb-2022112406 | RES-fi | T | Mark Davies | Mark Davies | 2011 | 2022 | ||||||||||||||||||
stat-fi-en | Tilastokeskuksen suomi-englanti-käännösmuisti | Statistics Finland Translation Memory Finnish-English | TMX | TMX | Tilastokeskuksen suomi-englanti-käännösmuisti | Statistics Finland Translation Memory Finnish-English | urn:nbn:fi:lb-2017090405 | T | Yes | {Tilastokeskus} | {Statistics Finland} | ||||||||||||||||||||
stat-fi-sv | Tilastokeskuksen suomi-ruotsi-käännösmuisti | Statistics Finland's Finnish to Swedish Translation Memory | TMX | TMX | Tilastokeskuksen suomi-ruotsi-käännösmuisti | Statistics Finland's Finnish to Swedish Translation Memory | urn:nbn:fi:lb-2017090404 | T | Yes | {Tilastokeskus} | {Statistics Finland} | ||||||||||||||||||||
sus-fieldwork | Suomalais-Ugrilaisen Seuran kenttätyökorpus | The Finno-Ugrian Society Fieldwork Corpus | VRT | Korp | Jack Rueter | Suomalais-Ugrilaisen Seuran kenttätyökorpus | The Finno-Ugrian Society Fieldwork Corpus | urn:nbn:fi:lb-2016092001 | http://creativecommons.org/licenses/by-nc/4.0/ | PUB CC BY NC | Yes | T | Korp | ||||||||||||||||||
Suvi | Suvi-verkkosanakirja | Suvi Finnish Sign Language Online Dictionary | ELAN | Leena Savolainen | www | Suvi-verkkosanakirja | Suvi Finnish Sign Language Online Dictionary | urn:nbn:fi:lb-2014073039 | No | P | www | ||||||||||||||||||||
TAITO | TAITO-hankkeen kirjalliset ja suulliset aineistot | Written and Oral Data of the TAITO-project | TXT | ELAN | Marjo Vesalainen | www | TAITO-hankkeen kirjalliset ja suulliset aineistot | Written and Oral Data of the TAITO-project | urn:nbn:fi:lb-2014073035 | RES | No | P | www | ||||||||||||||||||
tampuhe | Tampereen puhekielen pitkittäisaineisto | Longitudinal data of Tampere spoken language | WAV, TextGrid | WAV, TextGrid | Liisa Mustanoja | Tampereen puhekielen pitkittäisaineisto | Longitudinal data of Tampere spoken language | urn:nbn:fi:lb-2022090821 | http://urn.fi/urn:nbn:fi:lb-2022090822 | RES NC PRIV NORED DEP OTHER | No | P | No | Liisa Mustanoja | Liisa Mustanoja | ||||||||||||||||
tboneslim-src | T-Bone Slim -korpus, lähdemateriaali | T-Bone Slim Corpus, source | PDF, JPG, TIFF | PDF, TXT | A | Kirsti Salmi-Niklander | https://blogs.helsinki.fi/tboneslim | T-Bone Slim -korpus, lähdemateriaali | T-Bone Slim Corpus, source | urn:nbn:fi:lb-2022111621 | http://urn.fi/urn:nbn:fi:lb-2022111623 | PUB CC BY | No | T | No | http://urn.fi/urn:nbn:fi:lb-2022111622 | Kirsti Salmi-Niklander; Lotta Leiwo; muita | Kirsti Salmi-Niklander; Lotta Leiwo; others | https://blogs.helsinki.fi/tboneslim | ||||||||||||
testipiste | Testipisteaineisto | Testipiste Corpus | VRT | Korp | Janne Laitinen | Testipisteaineisto | Testipiste Corpus | urn:nbn:fi:lb-2017020701 | RES NC | Yes | T | Korp | Janne Laitinen | Janne Laitinen | |||||||||||||||||
Turjansaame | Puhutun ja kirjoitetun turjansaamen korpus | The Corpus of Spoken and Written Ter Saami | TXT | VRT | Korp | Michael Riessler | Puhutun ja kirjoitetun turjansaamen korpus | The Corpus of Spoken and Written Ter Saami | urn:nbn:fi:lb-2015102002 | http://creativecommons.org/licenses/by/4.0/ | PUB CC BY | No | T | Korp | |||||||||||||||||
tv-ecorg-src | The TV Corpus (Mark Davies, english-corpora.org) - Kielipankin versio, lähdemateriaali | The TV Corpus (Mark Davies, english-corpora.org) - Kielipankki version, source | B | FIN-CLARIN | The TV Corpus (Mark Davies, english-corpora.org) - Kielipankin versio, lähdemateriaali | The TV Corpus (Mark Davies, english-corpora.org) - Kielipankki version, source | urn:nbn:fi:lb-2022112411 | RES-fi | T | Mark Davies | Mark Davies | 2019 | 2022 | ||||||||||||||||||
tver-1980 | Tverinkarjalan korpus 1957-1971 | The Corpus of Tver Karelian 1957-1971 | WAV, EAF, TXT | WAV, EAF, TXT | B | Marjatta Palander | Tverinkarjalan korpus 1957-1971 | The Corpus of Tver Karelian 1957-1971 | urn:nbn:fi:lb-2022053121 | PUB CC BY | No | P | Yes | Marjatta Palander; Milla Uusitupa; Helka Riionheimo | Marjatta Palander; Milla Uusitupa; Helka Riionheimo | ||||||||||||||||
tver-2020 | Tverinkarjalan korpus 2016-2019 | The Corpus of Tver Karelian 2016-2019 | WAV, EAF, TXT | WAV, EAF, TXT | B | Marjatta Palander | Tverinkarjalan korpus 2016-2019 | The Corpus of Tver Karelian 2016-2019 | urn:nbn:fi:lb-2022053122 | RES NC PRIV DEP OTHER | No | P | Yes | Marjatta Palander; Milla Uusitupa; Helka Riionheimo | Marjatta Palander; Milla Uusitupa; Helka Riionheimo | ||||||||||||||||
ume-saami-uhlcs-korp | Uumajansaamen korpuksen (UHLCS) Helsinki-Korp-versio | Ume Saami Corpus (UHLCS), Helsinki Korp Version Corpus | TXT | VRT | Korp | Uumajansaamen korpuksen (UHLCS) Helsinki-Korp-versio | Ume Saami Corpus (UHLCS), Helsinki Korp Version Corpus | urn:nbn:fi:lb-2017022809 | RES NC LOC ND | Yes | T | No | Korp | Olavi Korhonen | Olavi Korhonen | 2007 | |||||||||||||||
uralic-uhlcs-korp | Uralilaisia, turkkilaisia, indo-iranilaisia ja mongolikieliä sekä Siperian ja Kaukasian kieliä (UHLCS), Helsinki-Korp-versio | Uralic, Turkic, Indo-Iranian and Mongol languages; languages of Siberia and Caucasia (UHLCS), Helsinki Korp Version | TXT | VRT | Korp | Uralilaisia, turkkilaisia, indo-iranilaisia ja mongolikieliä sekä Siperian ja Kaukasian kieliä (UHLCS), Helsinki-Korp-versio | Uralic, Turkic, Indo-Iranian and Mongol languages; languages of Siberia and Caucasia (UHLCS), Helsinki Korp Version | urn:nbn:fi:lb-2017022808 | RES NC LOC ND | Yes | T | No | Korp | Pirkko Suihkonen | Pirkko Suihkonen | 2007 | |||||||||||||||
uzbek-uhlcs-korp | Uzbekki-englanti sanakirjan (UHLCS) Helsinki-Korp-versio | Uzbek-English Dictionary (UHLCS), Helsinki Korp Version | TXT | VRT | Korp | Uzbekki-englanti sanakirjan (UHLCS) Helsinki-Korp-versio | Uzbek-English Dictionary (UHLCS), Helsinki Korp Version | urn:nbn:fi:lb-2017022807 | RES NC LOC ND | Yes | T | No | Korp | Daniel Kimmage | Daniel Kimmage | 2007 | |||||||||||||||
VVKS | Virtuaalinen vanha kirjasuomi (VVKS) -kokoelman Kielipankin Korp-versio | Virtual Old Literary Finnish (VVKS) - Kielipankki Korp version | VRT | Korp | Mari Siiroinen | Virtuaalinen vanha kirjasuomi (VVKS) -kokoelman Kielipankin Korp-versio | Virtual Old Literary Finnish (VVKS) - Kielipankki Korp version | urn:nbn:fi:lb-2017082101 | https://creativecommons.org/licenses/by-nc-nd/4.0/legalcode | PUB CC BY NC ND | Yes | T | No | Korp | {Helsingin yliopisto, suomen kielen, suomalais-ugrilaisten ja pohjoismaisten kielten ja kirjallisuuksien laitos} | {University of Helsinki, The Department of Finnish, Finno-Ugrian and Scandinavian Studies} | 2016 | ||||||||||||||
wikipedia-ecorg-src | The Wikipedia Corpus (Mark Davies, english-corpora.org) - Kielipankin versio, lähdemateriaali | The Wikipedia Corpus (Mark Davies, english-corpora.org) - Kielipankki version, source | B | FIN-CLARIN | The Wikipedia Corpus (Mark Davies, english-corpora.org) - Kielipankin versio, lähdemateriaali | The Wikipedia Corpus (Mark Davies, english-corpora.org) - Kielipankki version, source | urn:nbn:fi:lb-2023032901 | http://urn.fi/urn:nbn:fi:lb-2023032903 | RES-fi | T | http://urn.fi/urn:nbn:fi:lb-2023032905 | Mark Davies | Mark Davies | 2023 | |||||||||||||||||
wikipedia-fi-2017-korp | Suomenkielinen Wikipedia 2017, Korp | Finnish Wikipedia 2017, Korp | VRT | VRT | Korp | Tatu Huovilainen | Suomenkielinen Wikipedia 2017, Korp | Finnish Wikipedia 2017, Korp | urn:nbn:fi:lb-2018060401 | https://creativecommons.org/licenses/by/4.0/legalcode | PUB CC BY | Yes | T | Yes | Korp | Tatu Huovilainen | Tatu Huovilainen | 2018 | |||||||||||||
wordlists-uhlcs-korp | Sanaluettelokorpuksen (UHLCS) Helsinki-Korp-versio | Lists of Words Corpus (UHLCS), Helsinki Korp Version | TXT | VRT | Korp | Sanaluettelokorpuksen (UHLCS) Helsinki-Korp-versio | Lists of Words Corpus (UHLCS), Helsinki Korp Version | urn:nbn:fi:lb-2017022814 | RES NC LOC ND | Yes | T | No | Korp | Pirkko Suihkonen | Pirkko Suihkonen | 2007 | |||||||||||||||
Yle-subtitle | Ylen ruututekstikorpus | The Finnish Broadcasting Company Corpus of Subtitles | TXT | VRT | Korp | Jukka Mäkisalo | Ylen ruututekstikorpus | The Finnish Broadcasting Company Corpus of Subtitles | urn:nbn:fi:lb-20140730134 | RES | No | T | Korp | ||||||||||||||||||
ylenews-fi-2019-2021-selko-korp | Ylen suomenkielisen uutisarkiston selkouutiset 2019-2021, Korp | Yle News Archive Easy-to-read Finnish 2019-2021, Korp | Korp | A | Ylen suomenkielisen uutisarkiston selkouutiset 2019-2021, Korp | Yle News Archive Easy-to-read Finnish 2019-2021, Korp | urn:nbn:fi:lb-2022080401 | http://urn.fi/urn:nbn:fi:lb-2019121001 | ACA NC | T | Korp | http://urn.fi/urn:nbn:fi:lb-2021020901 | {Yleisradio} | {Yleisradio} | 2022 | ||||||||||||||||
ylenews-fi-2019-2021-selko-s-korp | Ylen suomenkielisen uutisarkiston selkouutiset 2019-2021, sekoitettu, Korp | Yle News Archive Easy-to-read Finnish 2019-2021, scrambled, Korp | Korp | A | Ylen suomenkielisen uutisarkiston selkouutiset 2019-2021, sekoitettu, Korp | Yle News Archive Easy-to-read Finnish 2019-2021, scrambled, Korp | urn:nbn:fi:lb-2022080403 | http://creativecommons.org/licenses/by/4.0/ | PUB CC BY | T | Korp | http://urn.fi/urn:nbn:fi:lb-2021020901 | {Yleisradio} | {Yleisradio} | 2022 |