Kielipankin käyttäjille CSC:n laskentaympäristön oletusmerkistökoodauksen pitäisi olla en_US.UTF-8 (eli Unicode-merkistö). Näin ollen ongelmia ei yleensä pitäisi esiintyä esimerkiksi ääkkösten ja muiden erikoismerkkien suhteen. Tämä toki edellyttää myös, että kaikki palvelimella käsittelemäsi tekstitiedostot on tallennettu UTF8-muotoisina.
Huom. Myös käyttämäsi pääteohjelmassa (Windows-koneissa esim. PuTTY tai Mac-koneissa Terminal) täytyy säätää merkistöasetus vastaavasti, jotta verkon yli siirtyvät merkit myös näkyvät oikein omalla koneellasi.
Kaikki Kielipankin työkalut (paitsi AaltoASR-puheentunnistin) olettavat syötteen olevan UTF8-muodossa.
Alla olevin määrityksin voi tarvittaessa muuttaa unix-pohjaisen laskentaympäristön merkistöasetuksia. Asetukset täytyy tallentaa ko. tavalla vain kerran, minkä jälkeen ne tulevat voimaan aina heti ko. palvelimelle kirjautuessa.
Kirjaudu ensin laskentaympäristöön.
Lisää kotihakemistosi tiedostoihin .bashrc ja .cshrc rivit:
Jos kyseisiä tiedostoja ei vielä ole kotihakemistossa olemassa, sellaiset tulee samalla luotua.
Mainitut lisäykset voi tehdä esim. pico-tekstieditorilla seuraavasti:
cdja painamalla rivinvaihtoa.
pico .bashrc
pico .cshrcja lisää samat rivit siihenkin. Tallenna.
Lisää vielä vastaavalla tavalla kotihakemistosi tiedostoon .bash_profile seuraava rivi:
. ~/.bashrc
Kirjaudu lopuksi ulos palvelimelta ja uudelleen sisään, jotta muutokset tulevat voimaan.<
Muita laskentaympäristön käyttöohjeita