Aiemmin on jo tehty analyysi Suomen murteista sanaston pohjalta (Leino, Hyvönen & Salmenkivi 2006); siinä itä--länsi-jaon jälkeen seuraavana erottui pohjoissuomalainen murteisto.
https://www.cs.helsinki.fi/u/leino/jutu ... aja-06.pdf
Nyt uusi tutkimus (Syrjänen, Honkola, Lehtinen, Leino & Vesakoski 2016) ottaa huomioon Kettusen laajan murrekartaston äänteellisetkin eroavaisuudet, ja tulos muuttuu: itä--länsi-jako on edelleen primaari, mutta sen jälkeen erottuu varsinaissuomalainen murrealue. K=4:ssä erottuu hämäläismurteisto, K=5:ssä savolainen erottuu kaakkoismurteistosta jne. (K=14 on maksimierottelu, sen jälkeen ei enää "parane".)
https://www.academia.edu/30649345/Apply ... opulations
Mukana on myös pareittaiset FST-arvot murteiden välillä (14 kpl). Pienimmät erot odotetusti on lähisukuisten murteiden välillä:
- Etelä- ja Pohjois-Karjala 0,42
- Pohjois-Karjala ja Etelä-Savo 0,44
- Häme ja Etelä-Häme 0,46
- Lappi ja Pohjois-Pohjanmaa 0,48
- Kainuu ja Pohjois-Pohjanmaa 0,49
- Etelä-Karjala ja Etelä-Savo 0,52
- Pohjois-Savo ja Keski-Suomi 0,54
- Etelä- ja Pohjois-Savo 0,61
Huomattavaa on, että Etelä-Pohjanmaalle ja Lapille lähin murre on varsinais-suomalais-hämäläinen välimurteisto; tällä ilmiöllä lienee asutushistoriallinen tausta. Toisaalta Etelä-Häme (Uudellemaalle asti) on myös yllättävän lähellä Lappia ja Pohjois-Pohjanmaata.
http://i64.tinypic.com/m9u79w.png