Seuraavassa kuvataan FinnTreeBank (FTB) -korpusten saneiden piirteet. Näiden puupankkiaineistojen morfologinen annotaatio on alun perin pohjautunut OMorFi-työkalun tuottamiin tageihin (ks. lyhenteet sarakkeessa FTB 3.1). Alkuperäisen mallipuupankin (FTB1 ja FTB2) annotaatio on kuitenkin tuotettu käsin. Puupankissa käytetty annotaatio on kuvattu tarkemmin annotaatiomanuaalissa.
nimi | merkitys |
---|---|
word |
sananmuoto (pintamuoto) |
lemma |
sanan perusmuoto |
lemmacomp |
sanan perusmuoto, johon on merkitty yhdyssanaraja (# ) |
pos |
sanaluokka |
msd |
morfologinen analyysi (morfosyntaktinen kuvaus) |
ref |
sanan järjestysnumero virkkeen sisällä |
dephead |
pääsanan järjestysnumero virkkeen sisällä |
deprel |
dependenssirelaatio suhteessa pääsanaan |
koodi | merkitys (Korpissa näkyvä nimitys) |
---|---|
A |
adjektiivi |
Abbr |
lyhenne |
Adp |
adpositio |
Adv |
adverbi |
AgPrc |
agenttipartisiippi |
CC |
rinnastuskonjunktio |
CS |
alistuskonjunktio |
Forgn |
vierassana |
Interj |
interjektio |
N |
substantiivi |
NegPrc |
kieltopartisiippi |
Num |
numeraali |
PrfPrc |
partisiipin perfekti |
Pron |
pronomini |
PrsPrc |
partisiipin preesens |
Punct |
välimerkki |
TrunCo |
yhdyssanan osa |
Unkwn |
tunnistamaton |
V |
verbi |
koodi | merkitys (Korpissa näkyvä nimitys) |
---|---|
advl |
adverbiaali |
attr |
attribuutti |
aux |
apuverbi |
comp |
komplementti |
conjunct |
konjunkti |
idiom |
idiomi |
main |
pääverbi |
mod |
modifioija |
modal |
modaaliverbi |
obj |
objekti |
phrm |
lausekemerkitsin |
phrv |
fraasiverbi |
scomp |
subjektin komplementti |
subj |
subjekti |
voc |
puhuttelu |
_ |
muu |