Sivu 1/1

Suomen kielen verkkolähteitä

ViestiLähetetty: 23 Helmi 2011 03:33
Kirjoittaja Jaska
Iso suomen kielioppi
http://kaino.kotus.fi/visk/etusivu.php

Virtuaalinen vanha kirjasuomi
http://www.vvks.info/

Suomen kansan vanhat runot -tietokanta
http://dbgw.finlit.fi/skvr/skvr.phtml

Re: Suomen kielen verkkolähteitä

ViestiLähetetty: 11 Joulu 2015 00:45
Kirjoittaja Pystynen
Netistä nykyään saatavilla skannattuna: Lauri Kettusen Suomen murrekartasto.

AVAA-portaalista löytyy myös mahdollisuus tehdä hakuja tähän ja muutamaan muuhun samanlaiseen murrekartta-aineistoon:
http://avaa.tdata.fi/web/kotus/kielikartastot
Näiden jälkimmäisten käyttö on tosin sokkona hieman hankalaa. Jos joku tietää, missä Itämerensuomalaisen kielikartaston hakemisto olisi saatavilla, niin sanokaa toki.

Re: Suomen kielen verkkolähteitä

ViestiLähetetty: 02 Maalis 2021 20:00
Kirjoittaja Jaska
Nykysuomen sanakirja löytyy nyt PDF:inä verkosta:

"Nykysuomen sanakirja on ensimmäinen kattava esitys suomen kielen keskeisestä sanastosta. Sanakirja kuvaa viime vuosisadan alkupuolen kielenkäyttöä ja sisältää yleiskielen sanojen lisäksi runsaasti vanhaa ja murteellista sanastoa.

Aineistona oli neljä miljoonaa sanalippua, joihin sisältyi 850 000 eri sanaa. Sanakirjan keskiössä ovat silloisen nykysuomen keskeiset sanavarat. Sanakirjassa on 201 000 sanaa ja 4 588 sivua."
https://www.kotus.fi/nyt/uutistekstit/k ... LOLBMGjYG8

Re: Suomen kielen verkkolähteitä

ViestiLähetetty: 02 Maalis 2021 23:41
Kirjoittaja Lri
XML-muotoinen sanalista (https://kaino.kotus.fi/sanat/nykysuomi/):

$ curl -LsO kaino.kotus.fi/sanat/nykysuomi/kotus-sanalista-v1.tar.gz
$ tar -xf kotus-sanalista-v1.tar.gz
$ xmlstarlet sel -t -v //s kotus-sanalista_v1/kotus-sanalista_v1.xml|grep sana|head|paste -sd' ' -
ainesana alkusanat ammattisana ammattisanasto ankarasanainen approbatur-arvosana apusana arvosana asemosana asetussanat

Etsi sanoja joilla on sama taivutusluokka kuin sanalla "ohut":

$ f=kotus-sanalista_v1/kotus-sanalista_v1.xml;xml sel -t -v "//st[t/tn=$(xml sel -t -v '//st[s="ohut"]/t/tn' $f)]/s" $f|paste -sd' ' -
airut ehyt immyt kevyt kytkyt kätkyt lyhyt neitsyt ohut olut pehmyt tiehyt