Uralilaisten kielten foneemivarastoja

Kielitiede tutkii menneisyyttä kielten kautta.

Uralilaisten kielten foneemivarastoja

ViestiKirjoittaja Lri » 09 Helmi 2021 16:04

Phoible-nimiseen tietokantaan on lisätty kielten foneemivarastoja eri lähteistä: https://phoible.org/inventories. Niistä eniten uralilaisia kieliä sisältävä lähde oli tämä: http://eurasianphonology.info.

Sivun eurasianphonology.info etusivulla on linkki JSON-tiedostoon, joka ei tällä hetkellä toimi, mutta joka löytyy vielä täältä: http://web.archive.org/web/20200224040915/eurasianphonology.info/static/phono_dbase.json.

Tein JSON-tiedoston perusteella listan uralilaisten kielten foneemivarastoista. Eri kielten tiedot ovat eri lähteistä, joten esimerkiksi joidenkin kielten kohdalla listaan on lisätty diftongeja, mutta toisten kohdalla ei. Joillain kielille on myös listattu erikseen pitkät vokaalit ja geminoidut konsonantit, mutta toisille ei. Virolle ja niittymarille oli lisätty tiedot kahdesta eri lähteestä, joista jätän kummankin kohdalla jatkossa toisen lähteen pois.

$ curl http://web.archive.org/web/20200224040915/eurasianphonology.info/static/phono_dbase.json|jq -r '.[]|select(.gen|index("Uralic"))|.name+";"+(.cons|join(" "))+";"+(.vows|join(" "))'|sort
Beserman (Šamardan);p t̻ k c̟ b d̻ g ɟ̟ s̻ ʂ ɕ v z̻ ʐ ʑ tɕ dʑ m n̻ ɲ̟ ɫ r ʎ̟ j w;ɑ ʌ o ɘ e u i ɨ̹
Eastern Khanty (Vakh);p v m t s n l ʈʂ ɳ ɭ r c j ɲ ʎ q ʁ ŋ;iː eː æː yː øː ɯː ɑː oː ɪ ʏ ɯ̽ ʊ
Eastern Mari;p t̺̪ k ð̺̪ s ʂ β ɣ z ʐ m n̺ ɲ ŋ l̺ ʎ r j ʈʂ tɕ sʲ zʲ;æ i e a y̞ œ u o ɪ̈
Erzya (Standard);b p v f m t̪ tʲ d̪ dʲ s̪ sʲ z̪ zʲ ʂ ʐ ɫ lʲ ɾ ɾʲ j k g x n̪ nʲ ʈʂ t̪s̪ tsʲ ŋ;i e̞ a u o̞ ɨ
Estonian (Standard);p m ʋ f t̪ n s̪ l r tʲ nʲ sʲ lʲ ʃ j k h;æ e i ø y o u ɑ ɤ
Estonian;p t tʲ k m n nʲ r f v s ʃ sʲ l lʲ h j pː tː tʲː kː mː nː nʲː rː fː sː ʃː sʲː lː lʲː hː jː pːː tːː tʲːː kːː mːː nːː nʲːː rːː fːː sːː ʃːː sʲːː lːː lʲːː hːː jːː;i y u e ø ɤ o æ ɑ iː yː uː eː øː ɤː oː æː ɑː iːː yːː uːː eːː øːː ɤːː oːː æːː ɑːː ɑe ɑi ɑo ɑu eɑ ei eo eu iɑ ie io iu oɑ oe oi ou uɑ ue ui uo ɤɑ ɤe ɤi ɤo ɤu æe æi æo æu øɑ øe øi yɑ ye yi yo
Finnish (Standard);p t̪ k s h m j ʋ ŋ d̺ n̺ r̺ l̺ f ʔː;ɑ o̞ e̞ ø̞ æ u i y
Forest Enets;p m b w t d tʃ s ʃ ð n l r tʲ dʲ tɕ sʲ ɕ nʲ j k g x ŋ ʔ;i e ɨ ɤ u o ɔ ɑ
Forest Nenets;p t s ɬ k x ʔ pʲ tɕ ɕ ɬʲ kʲ xʲ m n ŋ l w j mʲ nʲ ŋʲ lʲ wʲ r;ɑ o̞ u æ e̞ i ɑː o̞ː uː æː e̞ː iː ə̆
Hill Mari (Kozmodemjansk);p t̺̪ k ð̺̪ s ʂ β ɣ z ʐ m n̺ ɲ ŋ l̺ ʎ r j tɕ sʲ zʲ t̺s̺ x ɸ;æ ɪ i e a y̞ œ u o ɪ̈
Hungarian (Standard);b ts tʃ d̪ dz dʒ f g h j k ʃ ʒ s z t̪ v cç ɟʝ l m n̪ ɲ p r;i iː y yː u uː ø øː o oː eː ɛ ɑ aː
Kamassian;pʰ b m w t̪ʰ d̪ s̪ z̪ n̪ l̪ r̪ tɕʰ dʑ j sʲ zʲ lʲ ɕ ʑ nʲ ŋ kʰ g x ɣ ʔ;i y e̞ ø̞ ə̆ ə̟̆ ə ɨ ɒ o̞ u
Karelian (North);k t̪ p s̪ v tʲ sʲ j h tʃ l̪ lʲ r m n̪ nʲ;i y u e̞ o̞ ø̞ æ ɑ ie̞ uo̞ yø̞ yæ iæ uɑ
Kildin Saami;β f b p m m̥ z s d t n l n̥ l̥ dz ts ʐ ʂ dʑ tɕ r r̥ ʝ ç x g k ŋ ɟ c ɲ βʲ fʲ bʲ pʲ mʲ m̥ʲ zʲ sʲ dʲ tʲ nʲ lʲ n̥ʲ l̥ʲ dzʲ tsʲ ʑ ɕ rʲ r̥ʲ xʲ gʲ kʲ ŋʲ βː fː d̥ː b̥ː g̊ː pː mː m̥ː zː sː tː nː lː n̥ː l̥ː tsː ʂː tɕː rː r̥ː ʝː çː xː kː ŋː ɲː βʲː fʲː bʲː pʲː mʲː m̥ʲː zʲː sʲː nʲː lʲː n̥ʲː l̥ʲː tsʲː ɕː rʲː r̥ʲː xʲː gʲː kʲː ŋʲː d̥z̥ d̥ʑ̥ d̥z̥ʲ ʰp ʰt ʰk ʰts ʰtɕ ʰpʲ ʰtʲ ʰkʲ ʰtsʲ;i iː e̞ e̞ː o̞ o̞ː ɨ ɨː u uː ɐ aː o̞a ua ue̞
Komi-Permyak;p t̻ k c b d̻ g ɟ s̻ ʂ ɕ ʋ z̻ ʐ ʑ tɕ dʑ ʈʂ ɖʐ t̻s̻̪ f x m n̻ ɲ l̻ r ʎ j rʲ;a̠ o u ɘ̠ ɨ̠ e i
Komi-Zyrian (Syktyvkar);p t̻ k c b d̻ g ɟ s̻ ʂ ɕ ʋ z̻ ʐ ʑ tɕ dʑ ʈʂ ɖʐ t̻s̻̪ f x m n̻ ɲ l̻ r ʎ j rʲ;a̠ o u ɘ̠ ɨ̠ e i
Livonian (Vidzeme);p b t̺ d̺ c ɟ k g s̺ z̺ ʃ ʒ f v m n̺ ɲ l̺ ʎ r rʲ j h;i ɛ æ ɨ u ʊ̜ o ɑ
Meadow Mari (Morki-Sernur);p t̺̪ k tɕ ð̺̪ s ʂ β ɣ z ʐ m n̺ ɲ ŋ l̺ ʎ r j;i e a y̞ œ u o ɪ̈
Moksha (Standard);b p v f m t̪ tʲ d̪ dʲ s̪ sʲ z̪ zʲ ʂ ʐ ɫ lʲ ɾ ɾʲ j k g x n̪ nʲ tɕ ɬˠ ɬʲ ɾ̥ ɾ̥ʲ ɕ t̪s̪ tsʲ;i e̞ æ ə̆ a u o̞
Nganasan (Avam);p t tʲ k ʔ b d dʲ g ð j s sʲ x m n nʲ ŋ l lʲ r;i y ɨ u e o ə i̯a a u̯a
Northern Khanty (Kazym);p t k ŋ m n ɲ ɬ ɬʲ l w s ç ʃ j x̠ r b g d ʒ z f ts tʃ ɕː;ɑ̟ː ɑ̝̟ o̟ː ɞ ʊ̈ u̞ː eː i ə̆ ɛ
Northern Mansi (Sośva);p t̪ t̪ʲ k kʷ β j x ɣ xʷ s̪ ɕ l̪ ʎ̟ r m n̪ ɲ̟ ŋ ŋʷ;iː i e eɛ uː u oɔ o ɑː ɐ ə
Pite Saami;p ʰp pː ʰpː m mː f fː v vː t ʰt tː ʰtː ts ʰts tsː ʰtsː s sː n nː r rː l lː tʃ ʰtʃ tʃː ʰtʃː ʃː ʃ ɲː ɲ j jː k ʰk kː ʰkː ŋ ŋː h ð ðː;ɪ ie ɛ a aː ɔ o ʊ ʊa
Skolt Saami (Suõʹnnʼjel);p b m f v ð t d n r s z ts dz l ʃ ʒ tʃ dʒ c ɟ ɲ ʝ j ʎ k g ŋ x ɣ w pʲ bʲ mʲ fʲ vʲ ðʲ tʲ dʲ nʲ rʲ sʲ zʲ tsʲ dzʲ lʲ ʃʲ ʒʲ tʃʲ dʒʲ ç;i ɛ e a̟ ɐ ə ɑ ɔ o u ɑ̆ ĕ ɛa̟ ɛɐ iɐ iə uə uɐ ua̟ uɔ ue ie ii ui
Taz Selkup;p t tɕ k q s ɕ m n nʲ r l lʲ w j ŋ;u uː i iː y yː ɨ ɨː e eː o oː ø øː ɘ ɘː æ æː a aː ɪ ɪː ɛ ɛː ɔː
Ter Saami;p pʲ b bʲ t tʲ c d dʲ ɟ k kʲ g gʲ f fʲ v vʲ s sʲ z zʲ ʃ ɕ ʒ ʑ ɫ̥ l̥ʲ r̥ r̥ʲ j x xʲ h hʲ ts tsʲ tɕ dz dzʲ dʑ m mʲ n nʲ ɫ lʲ r rʲ ŋ ŋʲ;i iː ɛ a aː ɨ ɨː o u uː ɒ oa iɛ ai̯ ɨi̯ ɛi̯ oi̯ iɛi̯
Tundra Nenets (Central-Eastern);p b t ð k pʲ bʲ tʲ dʲ ts tsʲ s sʲ ʔ x r rʲ l ʎ j w m mʲ n ɲ ŋ;ɑː oː u uː ɤː ɨ ɨː ə æː
Udmurt (Standard);t̻ d̻ s̻ z̻ t̻s̻ p b v f ʂ ʐ ʈʂ ɖʐ ɕ ʑ c ɟ tɕ dʑ k g x n̻ ɫ r m ɲ̟ ʎ̟ j;ɑ ɛ̠ o̞ ɯ̟ u i ɤ̟̹
Veps (Šimozero);p pʲ b m mʲ f v vʲ t d s z ts n ɫ tʲ dʲ sʲ zʲ nʲ lʲ ʃ ʒ tʃ dʒ r rʲ j k g c ɟ h hʲ;y i ø̞ e̞ æ u o̞ ɑ ɨ ɤ̞
Votic (Jõgõperä);k g t̪ d̪ t̪ʲ d̪ʲ p b pʲ m mʲ n̪ n̪ʲ ʃ ʒ s sʲ zʲ z ɕ f fʲ v vʲ j ɫ l r ts tʃ dʒ lʲ rʲ h hʲ;u o ɑ ɨ ɘ i e æ y ø uː oː ɑː ɨː ɘː iː eː æː yː øː
Võro;p m f ʋ t̪ t̪s̪ s̪ n r l j k h ʔ pʲ mʲ fʲ ʋʲ tʲ tsʲ nʲ rʲ lʲ sʲ kʲ hʲ;ɑ æ e̞ ø̞ o̞ ɤ̞ i y u ɯ ɑː æː ɪː ʏː ʊː iː yː uː
Yodzyak Komi;p t̻ k c b d̻ g ɟ̟ s̻ ʂ ɕ v z̻ ʐ ʑ tɕ dʑ t̻s̻̪ ʈʂ ɖʐ f m n̻ ɲ̟ ɫ r ʎ̟ j rʲ;ʌ ʉ̟ ɵ̟ i̠ e̠ o a̠ u

Tietokantaan merkityt lähteet:

Beserman (Šamardan): Идрисов, Р.И. 2013. Тюркские заимствования разных периодов в бесермянском диалекте удмуртского языка. Москва: Московский государственный университет
Eastern Khanty (Vakh): Терешкин, Н.И. 1967. Ваховский диалект хантыйского языка (фонетика и морфология). Ленинград: Институт языкознания Академии наук СССР
Eastern Mari: Галкин, И.С.; Исанбаев, Н.И.; Пенгитов, Н.Т.; Барцева З.Ф. (eds.) 1960. Современный марийский язык. Фонетика. Йошкар-Ола: Марийское книжное издательство
Erzya (Standard): Rueter, Jack. 2010. Adnominal person in the morphological system of Erzya. Helsinki: Société Finno-Ougrienne
Estonian (Standard): Hebedová, Petra. 2013. Stručná gramatika estonštiny. Masarykova univerzita, Brno.
Estonian: Asu, Eva Liina.; and Pire Teras. 2009. Estonian. Journal of the International Phonetic Association 39.367–372. doi:10.1017/S002510030999017X.
Finnish (Standard): Suomi, Kari; Toivanen, Juhani; Ylitalo, Riikka. 2008. Finnish sound structure: Phonetics, phonology, phonotactics and prosody. University of Oulu, Oulu.
Forest Enets: Künnap, Ago. 1999. Enets. Language of the World/Materials 186. Lincom Europa
Forest Nenets: Salminen, Tapani. 2007. Notes on Forest Nenets phonology. // Sámit, sánit, sátnehámit. Riepmočála Pekka Sammallahtii miessemánu 21. beaivve 2007. Suomalais-Ugrilaisen Seuran Toimituksia = Mémoires de la Société Finno-Ougrienne 253. Helsinki
Hill Mari (Kozmodemjansk): Галкин, И.С.; Исанбаев, Н.И.; Пенгитов, Н.Т.; Барцева З.Ф. (eds.) 1960. Современный марийский язык. Фонетика. Йошкар-Ола: Марийское книжное издательство
Hungarian (Standard): Szende, Tamás. 1999. Hungarian. Handbook of the International Phonetic Association: a guide to the use of the International Phonetic Alphabet, 104–107. Cambridge, U.K. ; New York, NY: Cambridge University Press
Kamassian: Simoncsics, Péter. 1998. Kamassian. The Uralic Languages (ed.: Abondolo, Daniel), 580-601. London: Routledge
Karelian (North): Зайков, П.М. 1999. Грамматика карельского языка (фонетика и морфология). Петрозаводск: Периодика
Kildin Saami: Куруч, Р.Д. 1985. Краткий грамматический очерк саамского языка. Москва: Русский язык
Komi-Permyak: Майшев, И.И. 1940. Грамматика коми-пермяцкого языка. Москва — Ленинград: Издательство Академии наук СССР
Komi-Zyrian (Syktyvkar): Лыткин, В.И. (ed.) 1955. Современный коми язык. Сыктывкар: Коми книжное издательство
Livonian (Vidzeme): Moseley, Christopher. 2002. Livonian. Languages of the World/Materials 144. Lincom Europa
Meadow Mari (Morki-Sernur): Галкин, И.С.; Исанбаев, Н.И.; Пенгитов, Н.Т.; Барцева З.Ф. (eds.) 1960. Современный марийский язык. Фонетика. Йошкар-Ола: Марийское книжное издательство
Moksha (Standard): Бондарко, Л.В.; Полякова, О.Е. 1993. Современные мордовские языки. Фонетика. Саранск: Мордовское книжное издательство
Nganasan (Avam): Helimski, Eugene. 1998. Nganasan. The Uralic languages, ed. by Daniel Mario Abondolo, 480–515. Routledge language family descriptions. New York: Routledge.
Northern Khanty (Kazym): Каксин, А.Д. 2007. Казымский диалект хантыйского языка. Ханты-Мансийск: Полиграфист
Northern Mansi (Sośva): Riese, Timothy. 2001. Vogul. Languages of the World/Materials 158
Pite Saami: Wilbur, Joshua. 2014. A grammar of Pite Saami. Berlin: Language Science Press
Skolt Saami (Suõʹnnʼjel): Feist, Timothy. 2010. A grammar of Skolt Saami. PhD thesis. The University of Manchester
Taz Selkup: Helimski, Eugene. 1998. Selkup. Uralic languages (ed.: Abondolo, David). London-New York: Routledge
Ter Saami: Терешкин, С.Н. 2002. Йоканьгский диалект саамского языка. Санкт-Петербург: Российский государственный педагогический институт имени А.И. Герцена
Tundra Nenets (Central-Eastern): Salminen, Tapani. 1998. Nenets. The Uralic languages, 516–547. Ed.: Daniel Abondolo. London & New York: Routledge
Udmurt (Standard): Перевощиков, П.Н. (ed.) 1962. Грамматика современного удмуртского языка. Фонетика и морфология. Ижевск: Удмуртское книжное издательство
Veps (Šimozero): Зайцева, М.И. 1981. Грамматика вепсского языка (фонетика и морфология). Ленинград: Наука
Votic (Jõgõperä): Маркус, Е.Б., Рожанский, Ф.И. 2011. Современный водский язык. Тексты и грамматический очерк. Том 2. Грамматический очерк и библиография. Санкт-Петербург: Нестор-История
Võro: Jüvä, Sullõv. 2002. Võro-eesti synaraamat: päält 15,000 tähüssyna. Võro Instituut; Teras, Pire. 2003. Võru keskkõrgete vokaalide kvaliteedist. In: Lõunaeesti häälikud II. Tartu Ülikooli eesti keele õppetooli toimetised 27 (Pajusalu, Karl and Pire Teras, eds.). Tartu
Yodzyak Komi: Лыткин, В.И. 1961. Коми-язьвинский диалект. Москва: Издательство Академии наук СССР

Tässä on sama taulukko muodossa, jossa pitkät vokaalit ja geminoituneet konsonantit on samaistettu lyhyiden äänteiden kanssa, diftongit on poistettu, merkkien alapuolella olevat diakritiikit on poistettu, ja esimerkiksi aspiraatiota ja liudennusta ilmaisevat yläindeksoidut kirjaimet on poistettu:

$ ruby -rjson -e'JSON.parse(File.read("phono_dbase.json")).each{|k,v|next unless v["gen"].include?("Uralic");puts v["name"]+";"+[v["cons"],v["vows"]].map{|x|x.reject{|y|y=~/[aeiouyæøɐɑɔəɛɤɨʊ]{2}/}.map{|y|y.gsub(/[\u0325\u031c\u031d\u031e\u031f\u0320\u032a\u032f\u0339\u033a\u033b\u033d]/,"").gsub(/[ːʲʰʷˠ]/,"")}.uniq*" "}*";"}'|sort|grep -Ev 'Estonian;|Eastern Mari'
Beserman (Šamardan);p t k c b d g ɟ s ʂ ɕ v z ʐ ʑ tɕ dʑ m n ɲ ɫ r ʎ j w;ɑ ʌ o ɘ e u i ɨ
Eastern Khanty (Vakh);p v m t s n l ʈʂ ɳ ɭ r c j ɲ ʎ q ʁ ŋ;i e æ y ø ɯ ɑ o ɪ ʏ ʊ
Erzya (Standard);b p v f m t d s z ʂ ʐ ɫ l ɾ j k g x n ʈʂ ts ŋ;i e a u o ɨ
Estonian (Standard);p m ʋ f t n s l r ʃ j k h;æ e i ø y o u ɑ ɤ
Finnish (Standard);p t k s h m j ʋ ŋ d n r l f ʔ;ɑ o e ø æ u i y
Forest Enets;p m b w t d tʃ s ʃ ð n l r tɕ ɕ j k g x ŋ ʔ;i e ɨ ɤ u o ɔ ɑ
Forest Nenets;p t s ɬ k x ʔ tɕ ɕ m n ŋ l w j r;ɑ o u æ e i ə̆
Hill Mari (Kozmodemjansk);p t k ð s ʂ β ɣ z ʐ m n ɲ ŋ l ʎ r j tɕ ts x ɸ;æ ɪ i e a y œ u o ɪ̈
Hungarian (Standard);b ts tʃ d dz dʒ f g h j k ʃ ʒ s z t v cç ɟʝ l m n ɲ p r;i y u ø o e ɛ ɑ a
Kamassian;p b m w t d s z n l r tɕ dʑ j ɕ ʑ ŋ k g x ɣ ʔ;i y e ø ə̆ ə ɨ ɒ o u
Karelian (North);k t p s v j h tʃ l r m n;i y u e o ø æ ɑ
Kildin Saami;β f b p m z s d t n l dz ts ʐ ʂ dʑ tɕ r ʝ ç x g k ŋ ɟ c ɲ ʑ ɕ g̊;i e o ɨ u ɐ a
Komi-Permyak;p t k c b d g ɟ s ʂ ɕ ʋ z ʐ ʑ tɕ dʑ ʈʂ ɖʐ ts f x m n ɲ l r ʎ j;a o u ɘ ɨ e i
Komi-Zyrian (Syktyvkar);p t k c b d g ɟ s ʂ ɕ ʋ z ʐ ʑ tɕ dʑ ʈʂ ɖʐ ts f x m n ɲ l r ʎ j;a o u ɘ ɨ e i
Livonian (Vidzeme);p b t d c ɟ k g s z ʃ ʒ f v m n ɲ l ʎ r j h;i ɛ æ ɨ u ʊ o ɑ
Meadow Mari (Morki-Sernur);p t k tɕ ð s ʂ β ɣ z ʐ m n ɲ ŋ l ʎ r j;i e a y œ u o ɪ̈
Moksha (Standard);b p v f m t d s z ʂ ʐ ɫ l ɾ j k g x n tɕ ɬ ɕ ts;i e æ ə̆ a u o
Nganasan (Avam);p t k ʔ b d g ð j s x m n ŋ l r;i y ɨ u e o ə a
Northern Khanty (Kazym);p t k ŋ m n ɲ ɬ l w s ç ʃ j x r b g d ʒ z f ts tʃ ɕ;ɑ o ɞ ʊ̈ u e i ə̆ ɛ
Northern Mansi (Sośva);p t k β j x ɣ s ɕ l ʎ r m n ɲ ŋ;i e u o ɑ ɐ ə
Pite Saami;p m f v t ts s n r l tʃ ʃ ɲ j k ŋ h ð;ɪ ɛ a ɔ o ʊ
Skolt Saami (Suõʹnnʼjel);p b m f v ð t d n r s z ts dz l ʃ ʒ tʃ dʒ c ɟ ɲ ʝ j ʎ k g ŋ x ɣ w ç;i ɛ e a ɐ ə ɑ ɔ o u ɑ̆ ĕ
Taz Selkup;p t tɕ k q s ɕ m n r l w j ŋ;u i y ɨ e o ø ɘ æ a ɪ ɛ ɔ
Ter Saami;p b t c d ɟ k g f v s z ʃ ɕ ʒ ʑ ɫ l r j x h ts tɕ dz dʑ m n ŋ;i ɛ a ɨ o u ɒ
Tundra Nenets (Central-Eastern);p b t ð k d ts s ʔ x r l ʎ j w m n ɲ ŋ;ɑ o u ɤ ɨ ə æ
Udmurt (Standard);t d s z ts p b v f ʂ ʐ ʈʂ ɖʐ ɕ ʑ c ɟ tɕ dʑ k g x n ɫ r m ɲ ʎ j;ɑ ɛ o ɯ u i ɤ
Veps (Šimozero);p b m f v t d s z ts n ɫ l ʃ ʒ tʃ dʒ r j k g c ɟ h;y i ø e æ u o ɑ ɨ ɤ
Votic (Jõgõperä);k g t d p b m n ʃ ʒ s z ɕ f v j ɫ l r ts tʃ dʒ h;u o ɑ ɨ ɘ i e æ y ø
Võro;p m f ʋ t ts s n r l j k h ʔ;ɑ æ e ø o ɤ i y u ɯ ɪ ʏ ʊ
Yodzyak Komi;p t k c b d g ɟ s ʂ ɕ v z ʐ ʑ tɕ dʑ ts ʈʂ ɖʐ f m n ɲ ɫ r ʎ j;ʌ ʉ ɵ i e o a u

Tässä on eri foneemien yleisyys yllä olevassa taulukossa:

$ ruby -rjson -e'h=Hash.new(0);JSON.parse(File.read("phono_dbase.json")).each{|k,v|next unless v["gen"].include?("Uralic");next if["Estonian","Eastern Mari"].include?(v["name"]);v["inv"].map{|y|next if y=~/[aeiouyæøɐɑɔəɛɤɨʊ]{2}/;y.gsub(/[\u0306\u0325\u031c\u031d\u031e\u031f\u0320\u032a\u032f\u0339\u033a\u033b\u033d]/,"").gsub(/[ːʰʲʷˠ]/,"")}.compact.uniq.each{|x|h[x]+=1}};puts h.group_by{|k,v|v}.sort_by{|k,v|-k}.map{|k,v|"#{k} #{v.map{|x|x[0]}*" "}"}'
30 p t s m n o
29 k j
28 r i u
27 l
25 e
20 d
19 b
18 g f z
17 ŋ ts ɑ
16 x ɲ
15 ɕ
14 ɨ a v tɕ
13 y æ
12 ʎ
11 c
10 h ʃ ø ɟ ʂ ʐ
8 ə tʃ ɛ ɫ w ʑ dʑ
7 ʔ ð ʒ
6 ɤ ʈʂ
5 ɘ ʋ ɪ ɣ
4 dz dʒ ʊ ɔ ɖʐ β
3 ɯ ç ɐ ɬ
2 ʏ ʝ ʌ q ɒ œ ɪ̈ ɾ
1 cç ɟʝ ʉ ɵ ɞ ʊ̈ ɳ ɭ ʁ ɸ g̊

Huomioita JSON-tiedoston datan perusteella (ei varmaan monilta osin vastaa todellisuutta):

- Yllä äänteiden /t/ ja /p/ on merkitty sisältyvän jokaiseen kieleen, koska en ottanut aspiroituneisuutta huomioon, vaikka kamassissa oli merkitty olevan ainoastaan aspiroituneet /tʰ/, /kʰ/, ja /pʰ/.
- /k/ puuttuu itähantin Vahin murteesta, jossa on kuitenkin /q/. Itähantin lisäksi /q/ on ainoastaan Tazin selkupissa eli selkupin päämurteessa.
- IE-kieliin verrattuna oli yllättävää, että /r/ puuttuu vain kahdesta kielestä. Ne ovat ersä ja mokša, joissa sen tilalla on /ɾ/.
- /l/ puuttuu 7:stä kielestä, joissa sen tilalla on /ɫ/: vepsä, turjansaami, ersä, mokša, udmurtti, beserman, ja jazvankomi.
- /ʋ/ on suomen lisäksi vain muutamassa kielessä: virossa, võrossa, komisyrjäänissä, ja komipermjakissa.
- /h/ esiintyy itämerensuomalaisten kielten lisäksi ainoastaan turjansaamessa, piitimensaamessa, ja unkarissa. Monissa muissa kielissä sen tilalla on /x/.
- Suomen lisäksi äänteitä /ʃ/ tai /ɕ/ ei ole võrossa, ersässä, itähantissa, tundranenetsissä, tai nganasanissa.
- /dʒ/ on IE-kieliin nähden harvassa kielessä: ainoastaan vepsässä, vatjassa, koltansaamessa, ja unkarissa.
- /j/ puuttuu ainoastaan kiltinänsaamesta, jossa sen tilalla on /ʝ/. /ʝ/ esiintyy vain koltansaamessa ja kiltinänsaamessa. /ç/ esiintyy koltansaamen ja kiltinänsaamen lisäksi unkarissa ja pohjoishantissa.
- Kieliä joissa esiintyy /ð/ ovat koltansaame ja piitimensaami, niittymari, vuorimari, tundranenetsi, metsäenetsi, ja nganasani.
- /ɣ/ (voiced velar fricative) on koltansaamessa, niittymarissa, vuorimarissa, pohjoismansissa, ja kamassissa. Pienempi gamma (/ɤ/) on eri äänne (close-mid back unrounded vowel), eli viron "õ", joka on viron ja võron lisäksi vepsässä, udmurtissa, tundranenetsissä, ja metsänenetsissä.
- Noin puolessa kielistä on /a/:n tilalla on /ɑ/. Kumpikin /ɑ/ ja /a/ on unkarissa ja koltansaamessa. Kamassissa on pelkästään /ɒ/.
- /æ/ esiintyy noin puolessa kielistä: itämerensuomalaisten kielten lisäksi mokšassa, marissa, tundranenetsissä, metsänenetsissä, ja selkupissa. /ø/ on hieman harvinaisempi kuin /æ/, ja se esiintyy itämerensuomalaisten kielten lisäksi unkarissa, itähantissa, selkupissa, ja kamassissa.
- Yleisin vokaali on /o/, jonka on merkitty sisältyvän jokaiseen kieleen. /i/ ja /u/ merkitty puuttuvaksi kahdesta kielestä.
- Suurimmassa osassa kielistä on joko /ɨ/ tai /ɪ/, mutta ainoastaan selkupissa on kumpikin. Võrossa on samat kahdeksan vokaalia kuin suomessa, mutta niiden lisäksi myös /ɨ/ ja /ɤ/.

Tein vielä ClustVis-nimisen netti-UI:n avulla lämpökartan konsonanttien ja vokaalien esiintymisestä: https://biit.cs.ut.ee/clustvis/. Jätin pois foneemit joiden oli merkitty esiintyvän vain yhdessä kielessä tai kaikissa kielissä.

Konsonanttien perusteella jakautuminen kahteen pääklusteriin näyttää perustuvan lähinnä friktatiivivarastoihin. Vasemmalla puolella on alveolopalataarisia friktatiiveja (/ɕ/ ja /ʑ/) ja Volga-Uralin kielissä esiintyviä retrofleksifriktatiiveja (/ʂ/ ja /ʐ/). Oikealla puolella on palatoalveolaarisia friktatiiveja (/ʃ/ ja /ʒ/) tai suomen tapaan ei mitään suhuässiä. Vasemmalla puolella on myös yleensä /x/ ja oikealla puolella /h/.

Kuvaajan keskiosassa on kieliä, joista puuttuvat soinnilliset klusiilit. Niiden joukosta niittymarissa ja vuorimarissa on sarja /ð/-/ɣ/-/β/, ja pohjoismansissakin on /ɣ/ ja /β/.

Kuva

Vokaalien perusteella jako kahteen pääklusteriin seuraa aika hyvin sitä, että vasemmalla puolella olevissa kielissä on /ɑ/ ja oikealla on /a/.

Vasemmalta lukien ensimmäiset kahdeksan kieltä sisältävät jokainen äänteet /æ/, /ø/, /y/, ja /ɑ/, lukuunottamatta unkaria josta puuttuu /æ/. Yksikään kahdeksasta ensimmäisestä kielistä ei sisällä schwa:ta (/ə/). Kamassi on ainoa kieli, jossa on merkitty olevan kumpikin /ə/ ja /ø/.

Kuva

Tästä näkyy foneemien esiintyminen taulukkona (vain yhdessä kielessä esiintyvät foneemit eivät ole mukana):

;t;s;p;n;m;k;j;r;l;d;z;f;b;ŋ;g;ɲ;ts;x;ɕ;v;tɕ;ʎ;ʐ;ʃ;ʂ;h;c;ɟ;ʑ;ɫ;ð;w;tʃ;dʑ;ʔ;ʒ;ʈʂ;ɣ;β;ʋ;ɖʐ;dʒ;dz;ɬ;ç;ʝ;ɾ;q;o;u;i;e;ɑ;æ;y;a;ɨ;ø;ɛ;ɤ;ɪ;ə;ɘ;ʊ;ə̆;ɔ;ɯ;ɪ̈;ɐ;œ;ʏ;ʌ;ɒ
Beserman;1;1;1;1;1;1;1;1;0;1;1;0;1;0;1;1;0;0;1;1;1;1;1;0;1;0;1;1;1;1;0;1;0;1;0;0;0;0;0;0;0;0;0;0;0;0;0;0;1;1;1;1;1;0;0;0;1;0;0;0;0;0;1;0;0;0;0;0;0;0;0;1;0
Eastern Khanty;1;1;1;1;1;0;1;1;1;0;0;0;0;1;0;1;0;0;0;1;0;1;0;0;0;0;1;0;0;0;0;0;0;0;0;0;1;0;0;0;0;0;0;0;0;0;0;1;1;0;1;1;1;1;1;0;0;1;0;0;1;0;0;1;0;0;1;0;0;0;1;0;0
Erzya;1;1;1;1;1;1;1;0;1;1;1;1;1;1;1;0;1;1;0;1;0;0;1;0;1;0;0;0;0;1;0;0;0;0;0;0;1;0;0;0;0;0;0;0;0;0;1;0;1;1;1;1;0;0;0;1;1;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0
Estonian;1;1;1;1;1;1;1;1;1;0;0;1;0;0;0;0;0;0;0;0;0;0;0;1;0;1;0;0;0;0;0;0;0;0;0;0;0;0;0;1;0;0;0;0;0;0;0;0;1;1;1;1;1;1;1;0;0;1;0;1;0;0;0;0;0;0;0;0;0;0;0;0;0
Finnish;1;1;1;1;1;1;1;1;1;1;0;1;0;1;0;0;0;0;0;0;0;0;0;0;0;1;0;0;0;0;0;0;0;0;1;0;0;0;0;1;0;0;0;0;0;0;0;0;1;1;1;1;1;1;1;0;0;1;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0
Forest Enets;1;1;1;1;1;1;1;1;1;1;0;0;1;1;1;0;0;1;1;0;1;0;0;1;0;0;0;0;0;0;1;1;1;0;1;0;0;0;0;0;0;0;0;0;0;0;0;0;1;1;1;1;1;0;0;0;1;0;0;1;0;0;0;0;0;1;0;0;0;0;0;0;0
Forest Nenets;1;1;1;1;1;1;1;1;1;0;0;0;0;1;0;0;0;1;1;0;1;0;0;0;0;0;0;0;0;0;0;1;0;0;1;0;0;0;0;0;0;0;0;1;0;0;0;0;1;1;1;1;1;1;0;0;0;0;0;0;0;1;0;0;0;0;0;0;0;0;0;0;0
Hill Mari;1;1;1;1;1;1;1;1;1;0;1;0;0;1;0;1;1;1;0;0;1;1;1;0;1;0;0;0;0;0;1;0;0;0;0;0;0;1;1;0;0;0;0;0;0;0;0;0;1;1;1;1;0;1;1;1;0;0;0;0;1;0;0;0;0;0;0;0;0;1;0;0;0
Hungarian;1;1;1;1;1;1;1;1;1;1;1;1;1;0;1;1;1;0;0;1;0;0;0;1;0;1;0;0;0;0;0;0;1;0;0;1;0;0;0;0;0;1;1;0;0;0;0;0;1;1;1;1;1;0;1;1;0;1;1;0;0;0;0;0;0;0;0;0;0;0;0;0;0
Kamassian;1;1;1;1;1;1;1;1;1;1;1;0;1;1;1;0;0;1;1;0;1;0;0;0;0;0;0;0;1;0;0;1;0;1;1;0;0;1;0;0;0;0;0;0;0;0;0;0;1;1;1;1;0;0;1;0;1;1;0;0;0;1;0;0;0;0;0;0;0;0;0;0;1
Karelian;1;1;1;1;1;1;1;1;1;0;0;0;0;0;0;0;0;0;0;1;0;0;0;0;0;1;0;0;0;0;0;0;1;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;1;1;1;1;1;1;1;0;0;1;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0
Kildin Saami;1;1;1;1;1;1;0;1;1;1;1;1;1;1;1;1;1;1;1;0;1;0;1;0;1;0;1;1;1;0;0;0;0;1;0;0;0;0;1;0;0;0;1;0;1;1;0;0;1;1;1;1;0;0;0;1;1;0;0;0;0;0;0;0;0;0;0;0;1;0;0;0;0
Komi-Permyak;1;1;1;1;1;1;1;1;1;1;1;1;1;0;1;1;1;1;1;0;1;1;1;0;1;0;1;1;1;0;0;0;0;1;0;0;1;0;0;1;1;0;0;0;0;0;0;0;1;1;1;1;0;0;0;1;1;0;0;0;0;0;1;0;0;0;0;0;0;0;0;0;0
Komi-Zyrian;1;1;1;1;1;1;1;1;1;1;1;1;1;0;1;1;1;1;1;0;1;1;1;0;1;0;1;1;1;0;0;0;0;1;0;0;1;0;0;1;1;0;0;0;0;0;0;0;1;1;1;1;0;0;0;1;1;0;0;0;0;0;1;0;0;0;0;0;0;0;0;0;0
Livonian;1;1;1;1;1;1;1;1;1;1;1;1;1;0;1;1;0;0;0;1;0;1;0;1;0;1;1;1;0;0;0;0;0;0;0;1;0;0;0;0;0;0;0;0;0;0;0;0;1;1;1;0;1;1;0;0;1;0;1;0;0;0;0;1;0;0;0;0;0;0;0;0;0
Meadow Mari;1;1;1;1;1;1;1;1;1;0;1;0;0;1;0;1;0;0;0;0;1;1;1;0;1;0;0;0;0;0;1;0;0;0;0;0;0;1;1;0;0;0;0;0;0;0;0;0;1;1;1;1;0;0;1;1;0;0;0;0;1;0;0;0;0;0;0;0;0;1;0;0;0
Moksha;1;1;1;1;1;1;1;0;1;1;1;1;1;0;1;0;1;1;1;1;1;0;1;0;1;0;0;0;0;1;0;0;0;0;0;0;0;0;0;0;0;0;0;1;0;0;1;0;1;1;1;1;0;1;0;1;0;0;0;0;0;1;0;0;0;0;0;0;0;0;0;0;0
Nganasan;1;1;1;1;1;1;1;1;1;1;0;0;1;1;1;0;0;1;0;0;0;0;0;0;0;0;0;0;0;0;1;0;0;0;1;0;0;0;0;0;0;0;0;0;0;0;0;0;1;1;1;1;0;0;1;1;1;0;0;0;0;1;0;0;0;0;0;0;0;0;0;0;0
Northern Khanty;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;0;0;0;0;1;0;0;0;0;0;0;0;1;1;0;0;1;0;0;0;0;0;0;0;1;1;0;0;0;1;1;1;1;1;0;0;0;0;0;1;0;0;1;0;1;0;0;0;0;0;0;0;0;0
Northern Mansi;1;1;1;1;1;1;1;1;1;0;0;0;0;1;0;1;0;1;1;0;0;1;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;1;1;0;0;0;0;0;0;0;0;0;1;1;1;1;1;0;0;0;0;0;0;0;0;1;0;0;0;0;0;0;1;0;0;0;0
Pite Saami;1;1;1;1;1;1;1;1;1;0;0;1;0;1;0;1;1;0;0;1;0;0;0;1;0;1;0;0;0;0;1;0;1;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;1;0;0;0;0;0;0;1;0;0;1;0;1;0;0;1;0;1;0;0;0;0;0;0;0
Skolt Saami;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;0;1;0;1;0;1;0;0;1;1;0;0;1;1;1;0;0;1;0;1;0;0;0;1;1;0;1;1;0;0;1;1;1;1;1;0;0;1;0;0;1;0;0;1;0;0;0;1;0;0;1;0;0;0;0
Selkup;1;1;1;1;1;1;1;1;1;0;0;0;0;1;0;0;0;0;1;0;1;0;0;0;0;0;0;0;0;0;0;1;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;1;1;1;1;1;0;1;1;1;1;1;1;0;1;0;1;0;0;1;0;0;0;0;0;0;0
Ter Saami;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;0;1;1;1;1;1;0;0;1;0;1;1;1;1;1;0;0;0;1;0;1;0;0;0;0;0;0;1;0;0;0;0;0;1;1;1;0;0;0;0;1;1;0;1;0;0;0;0;0;0;0;0;0;0;0;0;0;1
Tundra Nenets;1;1;1;1;1;1;1;1;1;1;0;0;1;1;0;1;1;1;0;0;0;1;0;0;0;0;0;0;0;0;1;1;0;0;1;0;0;0;0;0;0;0;0;0;0;0;0;0;1;1;0;0;1;1;0;0;1;0;0;1;0;1;0;0;0;0;0;0;0;0;0;0;0
Udmurt;1;1;1;1;1;1;1;1;0;1;1;1;1;0;1;1;1;1;1;1;1;1;1;0;1;0;1;1;1;1;0;0;0;1;0;0;1;0;0;0;1;0;0;0;0;0;0;0;1;1;1;0;1;0;0;0;0;0;1;1;0;0;0;0;0;0;1;0;0;0;0;0;0
Veps;1;1;1;1;1;1;1;1;1;1;1;1;1;0;1;0;1;0;0;1;0;0;0;1;0;1;1;1;0;1;0;0;1;0;0;1;0;0;0;0;0;1;0;0;0;0;0;0;1;1;1;1;1;1;1;0;1;1;0;1;0;0;0;0;0;0;0;0;0;0;0;0;0
Votic;1;1;1;1;1;1;1;1;1;1;1;1;1;0;1;0;1;0;1;1;0;0;0;1;0;1;0;0;0;1;0;0;1;0;0;1;0;0;0;0;0;1;0;0;0;0;0;0;1;1;1;1;1;1;1;0;1;1;0;0;0;0;1;0;0;0;0;0;0;0;0;0;0
Võro;1;1;1;1;1;1;1;1;1;0;0;1;0;0;0;0;1;0;0;0;0;0;0;0;0;1;0;0;0;0;0;0;0;0;1;0;0;0;0;1;0;0;0;0;0;0;0;0;1;1;1;1;1;1;1;0;0;1;0;1;1;0;0;1;0;0;1;0;0;0;1;0;0
Yodzyak Komi;1;1;1;1;1;1;1;1;0;1;1;1;1;0;1;1;1;0;1;1;1;1;1;0;1;0;1;1;1;1;0;0;0;1;0;0;1;0;0;0;1;0;0;0;0;0;0;0;1;1;1;1;0;0;0;1;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;1;0


Kokeilin vielä tehdä PCA:n kielistä yllä olevan taulukon perusteella. Sen voi tehdä menemällä tänne: https://biit.cs.ut.ee/clustvis/. Mene "Data import"-tabiin, valitse "Paste data", liitä taulukko tekstikenttään, valitse "transpose matrix", mene PCA-tabiin, valitse "change display options", ja valitse "show sample IDs".

Kuva

PC1:n painotuksista korkeimpia itseisarvoja on alveolopalataarilla friktatiiveilla, retrofleksifriktatiiveilla, ja soinnillisilla klusiileilla. PC2:n painotuksista korkeimpia itseisarvoja on puolestaan palatoalveolaarisilla friktatiiveilla ja /h/:lla.

PC1: ʑ:-.23 ɟ:-.23 dʑ:-.23 z:-.22 g:-.22 ʐ:-.21 ʂ:-.21 b:-.21 ɖʐ:-.19 d:-.19 c:-.19 y:.18 æ:.17 ɕ:-.16 tɕ:-.16 l:.16 ɫ:-.15 ʈʂ:-.14 ts:-.14 ɑ:.12 x:-.12 a:-.12 ʔ:.11 ɲ:-.11 h:.11 f:-.11 ʎ:-.10 u:-.10 q:.09 j:.09 ŋ:.08 ʝ:-.08 k:-.08 dz:-.08 v:-.07 ð:.06 ç:-.06 tʃ:.06 i:-.06 ɾ:-.05 r:.05 ʃ:.03 e:.03 ʋ:.02 ɣ:.02 ʒ:-.02 w:.02 ɬ:.01 β:-.01 dʒ:.00
PC2: ʒ:-.31 ʃ:-.30 tʃ:-.25 dʒ:-.25 h:-.22 f:-.20 ʐ:.19 ʂ:.19 β:.18 v:-.18 tɕ:.18 g:-.17 d:-.17 b:-.17 ɑ:-.16 dz:-.16 ʎ:.15 ʈʂ:.11 ɣ:.11 ts:-.11 ŋ:.10 ç:-.10 ɫ:-.09 q:.09 ɖʐ:.08 ɟ:-.08 z:-.08 e:.08 ʝ:-.07 k:-.07 ʑ:.06 ɲ:.06 ð:.06 x:.06 dʑ:.06 a:.06 ʔ:.05 ʋ:.05 l:-.05 c:-.05 ɕ:.04 u:-.03 ɾ:.02 y:.02 r:-.02 j:-.02 ɬ:-.01 æ:-.01 w:-.01 i:.01

Tästä näkyy suomen kielen euklidinen etäisyys muihin kieliin yllä olevan taulukon perusteella (saman voi laskea Vahaduon avulla):

2.24 Estonian
2.65 Karelian
2.83 Võro
3.46 Forest Nenets
3.61 Nganasan
4.00 Northern Mansi
4.00 Selkup
4.00 Votic
4.12 Eastern Khanty
4.12 Hungarian
4.12 Tundra Nenets
4.12 Veps
4.24 Forest Enets
4.24 Kamassian
4.36 Livonian
4.47 Meadow Mari
4.58 Erzya
4.58 Hill Mari
4.58 Pite Saami
4.69 Northern Khanty
4.80 Moksha
5.20 Komi-Permyak
5.20 Komi-Zyrian
5.20 Ter Saami
5.29 Beserman
5.39 Kildin Saami
5.39 Yodzyak Komi
5.57 Skolt Saami
5.57 Udmurt
Lri
Mettänpeikko
Mettänpeikko
 
Viestit: 323
Liittynyt: 09 Maalis 2019 15:01

Paluu Kielitiede

Paikallaolijat

Käyttäjiä lukemassa tätä aluetta: Ei rekisteröityneitä käyttäjiä ja 1 vierailijaa