Työkalut

In English

På svenska

Kielipankin ylläpitämät työkalut ja palvelut voivat olla käytettävissä verkkosivustolla tai ladattavissa omalle koneelle latauspalvelusta (esim. GitHub tai Korp). Tältä sivulta löydät myös muita FIN-CLARINin tai CLARIN ERICin jäsenorganisaatioiden kehittämiä työkaluja.

Tukitasot

Kielipankin aineistoilla on kolme tukitasoa.

A: Kielivaraa kehitetään ja parannetaan aktiivisesti. Kielipankki korjaa aineistoon liittyvät ongelmat mahdollisimman nopeasti.
B: Kielivaraa kehitetään ainoastaan käyttäjien pyynnöstä. Kielipankki pyrkii korjaamaan ongelmia, mutta se saattaa edellyttää ulkopuolista työpanosta.
C: Kielivara on saatavilla sellaisenaan. Kielipankki ei korjaa eikä kehitä aineistoa.

Etsi muita saatavilla olevia työkaluja: CLARIN, CLARIN Virtual Language Observatory (VLO)

Löydät yleiskatsauksen kaikista aineistoistamme lajiteltuna aineistoperheiden mukaan FIN-CLARIN-aineistoperheet -sivulta.

Käynnistä työkaluNimiKuvausOhjeetAsentaminenInfoYlläpitäjäTukitaso
Kielipankin Korp-palveluKorpSelainpohjainen konkordanssityökalu, jolla voi tehdä hakuja tekstiaineistoista morfosyntaktisen jäsennyksen perusteella.Ohjeeticon-question-circleA
LatausLatauspalveluLataa aineistoja omalle koneellesi.icon-question-circleKielipankkiA
SanatSanatSanastojen ja luetteloiden julkaisemispalvelu.icon-question-circleKielipankkiB
FinTagFinnish TagtoolsSuomenkielisen tekstin morfologinen taggeri ja nimentunnistus.Asennus,
Docker-käyttö
icon-question-circleKielipankkiA
DemoKielipankin työkaludemojaKokoelma työkaluja ja resursseja, joita jalostetaan virallisempaan käyttöön: FinTag ja FiNER, FinSentiment, FinnWordNet, HFST:n POS-taggerit, HFST:n morfologiset jäsentimet, Lemmamatch jne.KielipankkiC
INCEpTIONAnnotaatiotyökalu.
(uudempi versio WebAnnosta)
User
Guide
(engl.)
Standalone
installation
(engl.)
icon-question-circleCLARIN:ELA
SignbankSuomalaisen viittomakielen leksikkotietokanta.icon-question-circleJyväskylän yliopistoA
OPUSAvoin rinnakkaisaineisto.icon-question-circleHelsingin yliopisto
Tieteen termipankkiKaikkien Suomessa harjoitettavien tieteenalojen yhteinen, avoin ja jatkuvasti päivitettävä termitietokanta tiedeyhteisön ja kansalaisten käyttöön.icon-question-circleHelsingin yliopistoA
LääketutkaLääketutka tarjoaa analytiikkaa terveyteen, lääkkeisiin ja oireisiin liittyvistä Suomi24-keskustelufoorumin keskusteluista.icon-question-circleHelsingin yliopistoC
ANEE Lex­ical NetworksANEE Lex­ical NetworksANEE:n leksikaalinen portaali on graafinen semanttinen sanakirja, joka on esitetty verkostona. Portaalissa voi tutkia yksikkömuotoisten akkadinkielisten sanojen merkityksiä visuaalisella tavalla.icon-question-circleHelsingin yliopisto
Proto-Indo-European LexiconIndoeurooppalaisten kielten generatiivinen etymologinen sanakirja.icon-question-circleHelsingin yliopisto
WancaWancaWanca on uralilaisten kielten portaalisivusto. icon-question-circleHelsingin yliopistoA
TNPP-LBFTurku Neural Parser Pipeline, Kielipankin versio (TNPP-LBF)Turku Neural Parsing Pipeline, muokannut KielipankkiPuhti
Asennus (Docker)
icon-question-circleThe Language Bank of Finland
Turku Neural Parser
Pipeline
Turku Neural Parser PipelineTurku NLP -ryhmän kehittämä suomen kielen jäsennystyökalu.Asennus (GitHub)
Demo
icon-question-circleTurun yliopisto
TDPP-LBFTurku Dependency Parser Pipeline, Kielipankin versio (TDPP-LBF)Finnish Dependency Parsing Pipeline, muokannut Kielipankki
Asennus (GitHub)icon-question-circleThe Language Bank of Finland
TDPPTurkuNLP:n kehittämä suomen dependenssijäsennin (TDPP)TurkuNLP-ryhmän kehittämä avoimen lähdekoodin dependenssijäsennysputki suomenkielisen tekstin analysointiin.Asennus (GitHub)icon-question-circleUniversity of Turku
UDPipe-LBFUDPipe Kielipankin versioUDPipe on koulutettavissa oleva putki CoNLL-U-tiedostojen saneistamista, taggausta, perusmuotoistamista ja dependenssijäsentämistä varten. Asennettu KielipankissaPuhtiicon-question-circleThe Language Bank of Finland
UDPipeUDPipeUDPipe on koulutettavissa oleva putki CoNLL-U-tiedostojen saneistamista, taggausta, perusmuotoistamista ja dependenssijäsentämistä varten.Asennus (GitHub)icon-question-circle
TurkuNLP word embeddingTurkuNLP word embedding demo (word2vec)Turku NLP -ryhmän kehittämä demotyökalu, jolla voidaan tutkia semanttista samankaltaisuutta.icon-question-circleTurun yliopisto
Finnish Internet Parsebank:
SETS
Syntax-based search (SETS)
from the Finnish Internet Parsebank
Syntaksiin perustuva haku Finnish Internet Parsebankin osasta.DokumentaatioTurun yliopisto
FinBERTFinBERTSuomelle harjoitettu BERT malli.Asennus(GitHub)icon-question-circleTurun yliopisto
TexthammerTexthammerTampereen yliopiston tuottamien rinnakkaisaineistojen haku- ja analyysipalveluOhjeet (PDF)icon-question-circleTampereen korkeakouluyhteisö
nimiarkisto.fiNimiarkistoNimiarkisto.fi on paikka, johon kootaan digitaalisessa muodossa Suomesta kerätyt ja arkistoidut keskeiset nimiaineistot. icon-question-circleKotimaisten kielten keskus
Terminology ForumTerminology ForumTerminology Forum – Eri alojen sanastojen linkkikokoelma, Vaasan yliopistoicon-question-circleVaasan yliopisto
SparvSparvRuotsin Språkbankenin työkalupakki monikielisten tekstiaineistojen jäsentämiseen.Käyttöohjeet (GUI)Asennusohjeeticon-question-circleSWE-CLARIN (Språkbanken)
WebMAUSWebMAUSTyökaluja puheen automaattiseen segmentaatioon ja annotointiin.Ohje
TranskribusTranskribusTyökaluja historiallisten dokumenttien (esim. kuvien ja skannattujen tekstien) transkriptioon, annotointiin ja hallintaan.Ohjeet (PDF)Asennusicon-question-circleUniversity of Innsbruck
Aalto-ASRAalto University Automatic Speech Recognition SystemPuheentunnistin, jota voi käyttää CSC:n laskentaympäristössä sekä rajoitetusti myös Mylly-palvelun kautta.OhjeetAsennus (GitHub)icon-question-circleAalto-yliopisto
ELANELANELAN on ohjelma, jolla voi litteroida ja annotoida ääni- ja videotiedostoja. Sillä voi myös tehdä hakuja paikallisesti tallennetuista annotoiduista aineistoista.OhjeetAsennusicon-question-circleThe Language Archive
PraatPraatPraat on kattava työkalupakki puheen ja muiden ääninäytteiden annotointiin, käsittelyyn, kuvantamiseen ja analyysiin. Praat sisältää oman skriptikielen.OhjeetAsennusicon-question-circleUniversity of Amsterdam
CLARIN Federated Content SearchHae keskitetysti kaikkien CLARIN-keskusten aineistoista.icon-question-circleCLARIN ERIC
GephiGephiOhjelma verkkoanalyysiin ja visualisointiin.Asennus
Kielipankin LAT-palveluLAT (Language Archive Tools)Annotoitujen ääni- ja videoaineistojen selailun, hakujen ja jakamisen työkalupakki.
Huom: LAT-palvelu lakkautettiin Kielipankissa 30.11.2020 mennessä, ks. lisätiedot!
OhjeetC
digi.kansalliskirjasto.fiDigitaaliset aineistotKansalliskirjaston palvelu, jossa voi tehdä hakuja digitaalisista kokoelmista ja ladata sisältöjä omalle koneelle. Sanoma- ja aikakauslehtien lisäksi Digissä on myös mm. kirjoja, kuvia, karttoja, nuotteja jne. Huomaa, että suuri osa lehtiaineistoista on käytettävissä myös Kielipankin Korp-palvelun kautta (ks. KLK).icon-question-circleKansalliskirjasto
textreuse.sls.fiTekstin kierrätys ruotsinkielisessä lehdistössä 1645-1918Hakukone, jolla voi etsiä ja analysoida useaan kertaan esiintyviä tekstikatkelmia ja niistä muodostuvia klustereita ruotsinkielisissä lehdissä vuosina 1645-1918.icon-question-circle
FinnONTOFinnONTOFinnish and international ontologies, vocabularies and thesauri needed for publishing content cost-efficiently on the Semantic Web.icon-question-circle
Kielitoimiston sanakirjaKielitoimiston sanakirjaKielitoimiston sanakirja on Kotimaisten kielten keskuksessa laadittu suomen yleiskielen sanakirja.icon-question-circleInstitute for the Languages of Finland
HeLI-OTSHeLI-OTS 2.0HeLI-menetelmään perustuva kielentunnistin valmiilla kielimalleilla 200 kielelle.icon-question-circleHelsingin yliopisto
Kotus digitaaliset aineistotKotuksen digitaaliset aineistotKotuksen vapaasti käytettävät verkkoaineistot kootusti.icon-question-circleInstitute for the Languages of Finland
GiellateknoGiellatekno - Sanakirjat ja työkalutSanakirjat ja työkalut saamen ja muiden morfologialtaan rikkaiden kielten kielitieteellisen ja kieliteknologisen tutkimukseen.icon-question-circle
GiellaLTGiellaLTGiellaLT tarjoaa infrastruktuurin sääntöpohjaiselle kieliteknologialle, joka on suunnattu vähemmistö- ja alkuperäiskielille.icon-question-circle
FinMeterFinMeter - Työkaluja suomenkielisen runouden analysointiinFinMeter on kirjasto suomenkielisen runouden analysointiin. Se käsittelee tyypillistä riimittelyä, kuten allitteraatiota, assonanssia ja konsonanssia, japanilaista metriikkaa ja Kalevalan metriikkaa. Sitä voidaan käyttää myös suomen kielen yhdyssanoihin ja metrin analysointiin. Lisäksi sillä voidaan tehdä semanttista klusterointia, metaforatulkintaa, konkretiapisteytystä ja sentimenttianalyysiä.Helsingin yliopisto
MurreMurreMurre-työkalulla voi kirjakielistää/yleiskielistää tekstimuotoista puhekielistä suomea. Murrea ylläpitää Mika Hämäläinen.Helsingin yliopisto
UralicNLPUralicNLP - Luonnollisen kielen käsittelyä monilla eri kielilläUralicNLP:llä voi tuottaa tekstistä morfologisia analyyseja, generoida morfologisia muotoja, perusmuotoistaa sanoja ja saada leksikaalista tietoa sanoista uralilaisissa ja muissa kielissä. Toiminnallisuudet pohjautuvat pääosin FST-työkaluihin sekä GiellaLT-infrastruktuurissa ja Apertiumissa tuotettuihin sanakirjoihin.Helsingin yliopisto
AnnifAnnifAnnif on Kansalliskirjastossa kehitettävä avoimen lähdekoodin työkalu, jolla voi automaattisesti etsiä asiasanoja tekstille.Kansalliskirjasto
tekstiks.eetekstiks.ee – Puheentunnistus: puheesta tekstiksiAutomaattisen puheentunnistuksen palvelu viron ja suomen kielille sekä käyttöliittymä transkription muokkaamiseen.icon-question-circle
finnsurveytextfinnsurveytextTyökalupaketti yhteiskuntatieteiden tutkijoille, jotta he voivat analysoida ja ymmärtää kyselytutkimuksissaan avoimiin kysymyksiin annettuja vastauksia.OhjeetAsennus (GitHub)icon-question-circle
Nordic Tweet Stream (NTS)Nordic Tweet Stream (NTS) search & visualization interfaceMonikielinen monitorikorpus, joka sisältää maantieteellisesti paikannettuja twiittejä ja niihin liittyviä metatietoja Pohjoismaista.icon-question-circle
MyllyMylly (poistunut käytöstä)Aineistojen käsittelyalusta.Ohjeeticon-question-circleKielipankkiC

Vastaa