Verktygen och tjänsterna som underhålls av språkbanken kan vara tillgängliga via ett webbgränssnitt eller installeras via nedladdning från t.ex. GitHub eller Korp. Du kan också hitta andra verktyg som utvecklats av medlemsorganisationer i FIN-CLARIN / CLARIN ERIC.
Våra språkresurser har tre olika stödnivåer.
A: Resursen är under aktiv utveckling. Finlands språkbank åtgärdar eventuella problem så snart som möjligt.
B: Resursen utvecklas endast på användarens begäran. Språkbanken i Finland strävar efter att åtgärda problem med resursen, men det kan krävas externa bidrag.
C: Resursen är tillgänglig ”i befintligt skick”. Språkbanken i Finland varken fixar eller utvecklar resursen.
Om du letar efter ett verktyg som inte finns med här kan du söka i CLARIN eller CLARIN Virtual Language Observatory (VLO).
Du hittar en översikt över alla våra resurser sorterade efter resursfamiljer på Resursfamiljer FIN-CLARIN.
Starta verktyget | Namn | Beskrivning | Instruktioner | Installera | Info | Administratör | Stödnivå |
---|---|---|---|---|---|---|---|
Korp | Ett webbaserat konkordansverktyg som kan användas för korpusförfrågningar baserade på morfosyntaktisk analys och olika andra funktioner. | Instruktioner | A | ||||
Download | Nedladdningstjänst | Ladda ner materialet till din egen dator. | A | ||||
Sanat | Sanat | En plattform för publicering av lexica och ordlistor. | B | ||||
FinTag | Finnish Tagtools | En taggare för ordklasser och morfologi och en igenkänning av namngivna enheter för finska. | Install Användning via docker | A | |||
Demo | Demoverktyg på Språkbanken i Finland | Demonstrationer av verktyg som utvecklas vid Språkbanken i Finland: FinTag och FiNER, FinSentiment, FinnWordNet, HFST POS-taggare, HFST morfologiska analysatorer, Lemmamatch osv. | C | ||||
INCEpTION | Verktyg för textannotering. (nyare version av WebAnno) | User Guide (engl.) | Standalone installation (engl.) | A | |||
Signbank | Lexikalisk databas för finskt teckenspråk. | A | |||||
OPUS | Ett gränssnitt för parallella korpusar med öppen källkod. | ||||||
Vetenskapstermbanken i Finland | Ett tvärvetenskapligt projekt som syftar till att samla in en permanent terminologisk databas för alla forskningsområden i Finland. | A | |||||
Lääketutka | Läääketutka, "Läkarradaren", ger analyser av diskussioner om hälsa, medicin och symtom i Suomi24-diskussionsforumet. | C | |||||
ANEE Lexical Networks | ANEE Lexical Networks | ANEE Lexical Networks är ett grafiskt semantiskt lexikon i form av ett nätverk. Du kan använda portalen för att utforska betydelsen av enskilda akkadiska ord på ett visuellt sätt. | |||||
Proto-Indo-European Lexicon | En generativ etymologisk ordbok över de indoeuropeiska språken. | ||||||
Wanca | Wanca | Wanca är en portal för webbplatser på uraliska språk. | A | ||||
TNPP-LBF | Turku Neural Parser Pipeline, Kielipankki version (TNPP-LBF) | Turku Neural Parsing Pipeline, anpassad av Språkbanken i Finland | Tillträde via Puhti Installera (Docker) | ||||
Turku Neural Parser Pipeline | Turku Neural Parser Pipeline | Ett verktyg som utvecklats av NLP-gruppen i Åbo för att analysera finsk text. | Installera (GitHub) Demo | ||||
TDPP-LBF | Turku Dependency Parser Pipeline, Kielipankki version (TDPP-LBF) | Finnish Dependency Parsing Pipeline, anpassad av Språkbanken i Finland | Installera (GitHub) | ||||
TDPP | Finnish dependency parser developed by TurkuNLP (TDPP) | En pipeline för beroendeparsing med öppen källkod som utvecklats av TurkuNLP-gruppen för analys av finsk text. | Installera (GitHub) | ||||
UDPipe-LBF | UDPipe Kielipankki version | UDPipe är en utbildbar pipeline för tokenisering, taggning, lemmatisering och dependency parsing av CoNLL-U-filer. Installerad i Kielipankki | Tillträde via Puhti | ||||
UDPipe | UDPipe | UDPipe är en utbildbar pipeline för tokenisering, taggning, lemmatisering och dependency parsing av CoNLL-U-filer. | Installera (GitHub) | ||||
TurkuNLP word embedding | TurkuNLP word embedding demo (word2vec) | Ett demoverktyg som utvecklats av NLP-gruppen i Åbo för att analysera ords semantiska likhet. | |||||
Finnish Internet Parsebank: SETS | Syntax-based search (SETS) from the Finnish Internet Parsebank | Syntaxbaserad sökning från delar av den Finska Internet Parsebanken. | Dokumentation | ||||
FinBERT | FinBERT | BERT-modell som tränats från grunden för finska. | Installera (GitHub) | ||||
Texthammer | Texthammer | En verktygslåda för sökning och analys av parallella korpusar som tillhandahålls av Tammerfors universitet. | Dokumentation (PDF) | ||||
nimiarkisto.fi | Nimiarkisto | Nimiarkisto.fi är en portal med de viktigaste digitala resurserna för namn och namngivna enheter som samlats in och arkiverats i Finland. | |||||
Terminology Forum | Terminology Forum | Terminology Forum - En samling länkar till specialordlistor för olika områden, Vasa universitet | |||||
Sparv | En flerspråkig verktygslåda som tillhandahålls av svenska Språkbanken för att analysera och kommentera text på olika språk. | ||||||
WebMAUS | WebMAUS | En uppsättning verktyg för automatisk segmentering och märkning av tal. | Instruktioner | ||||
Transkribus | En verktygslåda för att transkribera och hantera historiska dokument (t.ex. bilder och skannad text). | Instruktioner (PDF) | Installera | ||||
Aalto-ASR | Aalto University Automatic Speech Recognition System | En verktygslåda för automatisk taligenkänning som kan användas i CSC:s datormiljö. Vissa funktioner är tillgängliga via Mylly-tjänsten. | Instruktioner | Installera (GitHub) | |||
ELAN | ELAN är ett program för att transkribera och kommentera ljud- och videofiler. Det kan också användas för att söka i lokalt lagrade samlingar av kommenterat material. | Instruktioner | Installera | ||||
Praat | Praat är en omfattande verktygslåda för att kommentera, bearbeta, analysera och visualisera tal. Praat innehåller ett skriptspråk. | Instruktioner | Installera | ||||
CLARIN Federated Content Search | Kör en centraliserad sökning från alla resurser som tillhandahålls av CLARIN-center. | ||||||
Gephi | Gephi | Ett program för nätverksanalys och visualisering. | Installera | ||||
LAT (Language Archive Tools) | En verktygslåda för att bläddra i och söka efter kommenterade tal- och videokorpora. | Instruktioner | C | ||||
digi.kansalliskirjasto.fi | Digitala samlingar | En sök- och nedladdningstjänst för digitala samlingar från Finlands nationalbibliotek. Förutom tidningar och tidskrifter omfattar samlingarna t.ex. böcker, bilder och kartor. Observera att en stor del av tidningarna och tidskrifterna också kan användas via Korp-tjänsten i Språkbanken (se KLK). | |||||
textreuse.sls.fi | Återanvändning av texter i den svenskspråkiga pressen, 1645-1918 | En sökmotor för att söka och analysera kluster av textåteranvändning i den svenskspråkiga pressen från 1645 till 1918. | |||||
FinnONTO | FinnONTO | Finska och internationella ontologier, vokabulärer och tesauri som behövs för att publicera innehåll kostnadseffektivt på den semantiska webben. | |||||
Dictionary of Contemporary Finnish | Ordbok för modern finska | Ordbok i standardfinska från Institutet för de inhemska språken | |||||
HeLI-OTS | HeLI-OTS 2.0 | En språkidentifierare baserad på HeLI-metoden med fördefinierade språkmodeller för 200 språk. | |||||
Kotus digital collections | Kotus digitala material | Länkar till Kotus kostnadsfria online-resurser. | |||||
Giellatekno | Giellatekno - Ordböcker och verktyg | Ordböcker och verktyg för analys av samiska och andra morfologiskt rika språk. | |||||
GiellaLT | GiellaLT | GiellaLT tillhandahåller en infrastruktur för regelbaserad språkteknologi inriktad på minoritets- och ursprungsspråk | |||||
FinMeter | FinMeter - Verktyg för att analysera poesi på finska | FinMeter är ett bibliotek för att analysera poesi på finska. Det hanterar typiska rim som allitteration, assonans och konsonans, japanska meter och Kalevalameter. Det kan också användas för att binda finska och analysera meter. Dessutom kan den göra semantisk klustring, tolkning av metaforer, poängsättning av konkretion och sentimentanalys. | |||||
Murre | Murre | ||||||
UralicNLP | UralicNLP- Behandling av naturliga språk för många språk | UralicNLP kan producera morfologiska analyser, generera morfologiska former, lemmatisera ord och ge lexikalisk information om ord på uraliska och andra språk.Funktionaliteten kommer huvudsakligen från FST-verktyg och ordböcker som utvecklats i GiellaLT-infrastrukturen och Apertium. | |||||
Annif | Annif | Annif är ett verktyg för automatiserad ämnesordsindexering som utvecklats vid Finlands nationalbibliotek. | |||||
tekstiks.ee | tekstiks.ee – Taligenkänning: tal till text | Automatiserad transkriptionstjänst för estniskt och finskt tal och ett användargränssnitt för att redigera transkriptionen. | |||||
finnsurveytext | finnsurveytext | Verktyg för forskare inom samhällsvetenskap för att kunna analysera och förstå svaren på öppna frågor i sina undersökningar. | Instruktioner | Installera (GitHub) | |||
Nordic Tweet Stream (NTS) | Nordic Tweet Stream (NTS) search & visualization interface | En flerspråkig monitor-korpus av geolokaliserade tweets och tillhörande metadata från Norden. | |||||
Mylly | Mylly (ur bruk) | Mångsidig plattform för dataanalys med interaktiva visualiseringar och arbetsflöden. | Instruktioner | C | |||
Finland Swedish Online | Finland Swedish Online | En plattform som erbjuder onlinekurser för studenter i finlandssvenska. |