Verktygen och tjänsterna som underhålls av språkbanken kan vara tillgängliga via ett webbgränssnitt eller installeras via nedladdning från t.ex. GitHub eller Korp. Du kan också hitta andra verktyg som utvecklats av medlemsorganisationer i FIN-CLARIN / CLARIN ERIC.
Våra språkresurser har tre olika stödnivåer.
A: Resursen är under aktiv utveckling. Finlands språkbank åtgärdar eventuella problem så snart som möjligt.
B: Resursen utvecklas endast på användarens begäran. Språkbanken i Finland strävar efter att åtgärda problem med resursen, men det kan krävas externa bidrag.
C: Resursen är tillgänglig ”i befintligt skick”. Språkbanken i Finland varken fixar eller utvecklar resursen.
Om du letar efter ett verktyg som inte finns med här kan du söka i CLARIN eller CLARIN Virtual Language Observatory (VLO).
Du hittar en översikt över alla våra resurser sorterade efter resursfamiljer på Resursfamiljer FIN-CLARIN.
Starta verktyget | Namn (och metadata) | Beskrivning | Instruktioner | Installera | Info | Administratör | Stödnivå |
---|---|---|---|---|---|---|---|
![]() | Korp | Ett webbaserat konkordansverktyg som kan användas för korpusförfrågningar baserade på morfosyntaktisk analys och olika andra funktioner. | Instruktioner | icon-question-circle | ![]() | A | |
Download | Nedladdningstjänst | Ladda ner materialet till din egen dator. | icon-question-circle | ![]() | A | ||
Aalto-ASR | Aalto University Automatic Speech Recognition System | En verktygslåda för automatisk taligenkänning som kan användas i CSC:s datormiljö. | Instruktioner | Installera (GitHub) | icon-question-circle | ![]() | |
ANEE Lexical Networks | ANEE Lexical Networks | ANEE Lexical Networks är ett grafiskt semantiskt lexikon i form av ett nätverk. Du kan använda portalen för att utforska betydelsen av enskilda akkadiska ord på ett visuellt sätt. | icon-question-circle | ![]() | |||
Annif | Annif | Annif är ett verktyg för automatiserad ämnesordsindexering som utvecklats vid Finlands nationalbibliotek. | ![]() | ||||
![]() | CLARIN Federated Content Search | Kör en centraliserad sökning från alla resurser som tillhandahålls av CLARIN-center. | icon-question-circle | ![]() | |||
Demo | Demoverktyg på Språkbanken i Finland | Demonstrationer av verktyg som utvecklas vid Språkbanken i Finland: FinTag och FiNER, FinSentiment, FinnWordNet, HFST POS-taggare, HFST morfologiska analysatorer, Lemmamatch osv. | ![]() | C | |||
digi.kansalliskirjasto.fi | Digitala samlingar | En sök- och nedladdningstjänst för digitala samlingar från Finlands nationalbibliotek. Förutom tidningar och tidskrifter omfattar samlingarna t.ex. böcker, bilder och kartor. Observera att en stor del av tidningarna och tidskrifterna också kan användas via Korp-tjänsten i Språkbanken (se KLK). | icon-question-circle | ![]() | |||
![]() | ELAN | ELAN är ett program för att transkribera och kommentera ljud- och videofiler. Det kan också användas för att söka i lokalt lagrade samlingar av kommenterat material. | Instruktioner | Installera | icon-question-circle | ![]() | |
FinBERT | FinBERT | BERT-modell som tränats från grunden för finska. | Installera (GitHub) | icon-question-circle | ![]() | ||
Finland Swedish Online | Finland Swedish Online | En plattform som erbjuder onlinekurser för studenter i finlandssvenska. | icon-question-circle | ![]() | |||
FinMeter | FinMeter - Verktyg för att analysera poesi på finska | FinMeter är ett bibliotek för att analysera poesi på finska. Det hanterar typiska rim som allitteration, assonans och konsonans, japanska meter och Kalevalameter. Det kan också användas för att binda finska och analysera meter. Dessutom kan den göra semantisk klustring, tolkning av metaforer, poängsättning av konkretion och sentimentanalys. | ![]() | ||||
TDPP | Finnish dependency parser developed by TurkuNLP (TDPP) | En pipeline för beroendeparsing med öppen källkod som utvecklats av TurkuNLP-gruppen för analys av finsk text. | Installera (GitHub) | icon-question-circle | ![]() | ||
FinTag | Finnish Tagtools | En taggare för ordklasser och morfologi och en igenkänning av namngivna enheter för finska. | Install Användning via docker | icon-question-circle | ![]() | A | |
FinnONTO | FinnONTO | Finska och internationella ontologier, vokabulärer och tesauri som behövs för att publicera innehåll kostnadseffektivt på den semantiska webben. | icon-question-circle | ||||
finnsurveytext | finnsurveytext | Verktyg för forskare inom samhällsvetenskap för att kunna analysera och förstå svaren på öppna frågor i sina undersökningar. | Instruktioner | Installera (GitHub) | icon-question-circle | ||
Gephi | Gephi | Ett program för nätverksanalys och visualisering. | Installera | ||||
GiellaLT | GiellaLT | GiellaLT tillhandahåller en infrastruktur för regelbaserad språkteknologi inriktad på minoritets- och ursprungsspråk | icon-question-circle | ||||
Giellatekno | Giellatekno - Ordböcker och verktyg | Ordböcker och verktyg för analys av samiska och andra morfologiskt rika språk. | icon-question-circle | ||||
HeLI-OTS | HeLI-OTS 2.0 | En språkidentifierare baserad på HeLI-metoden med fördefinierade språkmodeller för 200 språk. | Demo | icon-question-circle | ![]() | ||
![]() | INCEpTION | Verktyg för textannotering. (nyare version av WebAnno) | User Guide (engl.) | Standalone installation (engl.) | icon-question-circle | ![]() | A |
Kotus digital collections | Kotus digitala material | Länkar till Kotus kostnadsfria online-resurser. | icon-question-circle | ![]() | |||
![]() | Lääketutka | Läääketutka, "Läkarradaren", ger analyser av diskussioner om hälsa, medicin och symtom i Suomi24-diskussionsforumet. | icon-question-circle | ![]() | C | ||
Murre | Murre | ![]() | |||||
nimiarkisto.fi | Nimiarkisto | Nimiarkisto.fi är en portal med de viktigaste digitala resurserna för namn och namngivna enheter som samlats in och arkiverats i Finland. | icon-question-circle | ![]() | |||
Nordic Tweet Stream (NTS) | Nordic Tweet Stream (NTS) search & visualization interface | En flerspråkig monitor-korpus av geolokaliserade tweets och tillhörande metadata från Norden. | icon-question-circle | ||||
![]() | OPUS | Ett gränssnitt för parallella korpusar med öppen källkod. | icon-question-circle | ![]() | |||
Dictionary of Contemporary Finnish | Ordbok för modern finska | Ordbok i standardfinska från Institutet för de inhemska språken | icon-question-circle | ![]() | |||
![]() | Praat | Praat är en omfattande verktygslåda för att kommentera, bearbeta, analysera och visualisera tal. Praat innehåller ett skriptspråk. | Instruktioner | Installera | icon-question-circle | ![]() | |
![]() | Proto-Indo-European Lexicon | En generativ etymologisk ordbok över de indoeuropeiska språken. | icon-question-circle | ![]() | |||
Sanat | Sanat | En plattform för publicering av lexica och ordlistor. | icon-question-circle | ![]() | B | ||
![]() | Signbank | Lexikalisk databas för finskt teckenspråk. | icon-question-circle | ![]() | A | ||
![]() | Sparv | En flerspråkig verktygslåda som tillhandahålls av svenska Språkbanken för att analysera och kommentera text på olika språk. | icon-question-circle | ![]() | |||
Finnish Internet Parsebank: SETS | Syntax-based search (SETS) from the Finnish Internet Parsebank | Syntaxbaserad sökning från delar av den Finska Internet Parsebanken. | Dokumentation | ![]() | |||
tekstiks.ee | tekstiks.ee – Taligenkänning: tal till text | Automatiserad transkriptionstjänst för estniskt och finskt tal och ett användargränssnitt för att redigera transkriptionen. | icon-question-circle | ||||
Terminology Forum | Terminology Forum | Terminology Forum - En samling länkar till specialordlistor för olika områden, Vasa universitet | icon-question-circle | ||||
Texthammer | Texthammer | En verktygslåda för sökning och analys av parallella korpusar som tillhandahålls av Tammerfors universitet. | Dokumentation (PDF) | icon-question-circle | ![]() | ||
![]() | Transkribus | En verktygslåda för att transkribera och hantera historiska dokument (t.ex. bilder och skannad text). | Instruktioner (PDF) | Installera | icon-question-circle | ![]() | |
TDPP-LBF | Turku Dependency Parser Pipeline, Kielipankki version (TDPP-LBF) | Finnish Dependency Parsing Pipeline, anpassad av Språkbanken i Finland | Installera (GitHub) | icon-question-circle | ![]() | ||
Turku Neural Parser Pipeline | Turku Neural Parser Pipeline | Ett verktyg som utvecklats av NLP-gruppen i Åbo för att analysera finsk text. | Installera (GitHub) Demo | icon-question-circle | ![]() | ||
TNPP-LBF | Turku Neural Parser Pipeline, Kielipankki version (TNPP-LBF) | Turku Neural Parsing Pipeline, anpassad av Språkbanken i Finland | Tillträde via Puhti Installera (Docker) | icon-question-circle | ![]() | ||
TurkuNLP word embedding | TurkuNLP word embedding demo (word2vec) | Ett demoverktyg som utvecklats av NLP-gruppen i Åbo för att analysera ords semantiska likhet. | icon-question-circle | ![]() | |||
UDPipe | UDPipe | UDPipe är en utbildbar pipeline för tokenisering, taggning, lemmatisering och dependency parsing av CoNLL-U-filer. | Installera (GitHub) | icon-question-circle | |||
UDPipe-LBF | UDPipe Kielipankki version | UDPipe är en utbildbar pipeline för tokenisering, taggning, lemmatisering och dependency parsing av CoNLL-U-filer. Installerad i Kielipankki | Tillträde via Puhti | icon-question-circle | ![]() | ||
UralicNLP | UralicNLP- Behandling av naturliga språk för många språk | UralicNLP kan producera morfologiska analyser, generera morfologiska former, lemmatisera ord och ge lexikalisk information om ord på uraliska och andra språk.Funktionaliteten kommer huvudsakligen från FST-verktyg och ordböcker som utvecklats i GiellaLT-infrastrukturen och Apertium. | ![]() | ||||
![]() | Vetenskapstermbanken i Finland | Ett tvärvetenskapligt projekt som syftar till att samla in en permanent terminologisk databas för alla forskningsområden i Finland. | icon-question-circle | ![]() | A | ||
VRT Tools | VRT Tools | Command-line tools for manipulating segmented and annotated text by using VRT (verticalized text) as an interchange format. VRT is related to Corpus WorkBench (used in the backend of the Korp concordancer tool). | GitHub | ![]() | A | ||
Wanca | Wanca | Wanca är en portal för webbplatser på uraliska språk. | icon-question-circle | ![]() | A | ||
WebMAUS | WebMAUS | En uppsättning verktyg för automatisk segmentering och märkning av tal. | Instruktioner | ||||
Whisper | Whisper | Whisper is a general-purpose speech recognition model trained on a large dataset of diverse audio. Whisper can perform multilingual speech recognition, speech translation, and language identification. Whisper can be used in the CSC computing environment, also in SD Desktop. | Tutorial (CSC) | GitHub: Whisper (OpenAI) and WhisperDO for calling Whisper (by Nicholas G. Cotton) | Tutorial (CSC) | ![]() | A |
textreuse.sls.fi | Återanvändning av texter i den svenskspråkiga pressen, 1645-1918 | En sökmotor för att söka och analysera kluster av textåteranvändning i den svenskspråkiga pressen från 1645 till 1918. | icon-question-circle |