Tambets et al. 2018: Genes of the Uralic speaking populations

Alkuperää koskeva uutisointi ja uudet tutkimukset.

Re: Tambets et al. 2018: Genes of the Uralic speaking popula

ViestiKirjoittaja Kristiina » 22 Syys 2019 21:09

Minulla on tiedossa 12 Sintashta outlieria, eikä yksikään niistä kanna N-haploa.

Olisi pakko löytää jostain kulttuuri/kulttuureja, jossa on N-L1026-linjoja aikavälllä 2500-1500 eaa. Tällä hetkellä vanhin L1026 on kai Bolshoy Kuolassa.

Minulla ei ole tällä hetkellä kovin paljon toiveita aron suhteen.
Kristiina
SuuBaltti
SuuBaltti
 
Viestit: 1368
Liittynyt: 18 Maalis 2015 12:24

Re: Tambets et al. 2018: Genes of the Uralic speaking popula

ViestiKirjoittaja Rekonpoika » 22 Syys 2019 22:04

Kristiina kirjoitti:Minulla on tiedossa 12 Sintashta outlieria, eikä yksikään niistä kanna N-haploa.

Olisi pakko löytää jostain kulttuuri/kulttuureja, jossa on N-L1026-linjoja aikavälllä 2500-1500 eaa. Tällä hetkellä vanhin L1026 on kai Bolshoy Kuolassa.

Minulla ei ole tällä hetkellä kovin paljon toiveita aron suhteen.


Merekellä on N-haploa (ei tosin uralilaista) ja se on samanlainen kuin sintashta/srubna-outlierit. Ei uralilaisia pitäisi kielitieteen pohjalta ollakaan arolla, Udmurtiasta, Tatarstanista jne. taas ei ole näytteitä pronssikaudelta.
Rekonpoika
SuuBaltti
SuuBaltti
 
Viestit: 4295
Liittynyt: 12 Elo 2013 12:41

Re: Tambets et al. 2018: Genes of the Uralic speaking popula

ViestiKirjoittaja Johannes » 22 Syys 2019 23:33

Tuosta OLS10:stä ja siitä, ettei se klusteroidu minkään tunnetun muinais- tai nykyväestön kanssa. Tällaisen yksittäisen näytteen tapauksessa on aina myös se mahdollisuus, ettei se edustakaan selkeästi vain yhtä aikansa heimoa, väestöä tms., vaan vanhemmat ovat jostain syystä voineet tulla kahdesta eri ryhmästä.

OLS10:stä tiedetään isotooppianalyysin perusteella toistaiseksi, ettei hän ollut syntyisin mistään hautauspaikkansa Kundan lähettyviltä Länsi-Virumaalta eikä myöskään Ruotsista tai Lounais-Suomesta. Fenotyyppianalyysin mukaan hänellä todennäköisesti oli siniset silmät, tumman tai vaalean ruskeat hiukset ja keskimääräinen ihon sävy (eli ei tumma eikä kovin vaalea). Jos ja kun OLS10:n syntymä- ja varttumispaikka selviää, on toivottavasti mahdollisuus saada vertailuaineistoa sen selvittämiseksi, löytyykö sieltä mahdollisista muinaisnäytteistä selvästi OLS10:n kanssa geneettisesti samankaltaista väestöä vai ei.
Johannes
Sutki savolainen
Sutki savolainen
 
Viestit: 601
Liittynyt: 07 Tammi 2015 01:30
Paikkakunta: Helsinki

Re: Tambets et al. 2018: Genes of the Uralic speaking popula

ViestiKirjoittaja Jaska » 23 Syys 2019 00:12

Johannes kirjoitti:Tuosta OLS10:stä ja siitä, ettei se klusteroidu minkään tunnetun muinais- tai nykyväestön kanssa. Tällaisen yksittäisen näytteen tapauksessa on aina myös se mahdollisuus, ettei se edustakaan selkeästi vain yhtä aikansa heimoa, väestöä tms., vaan vanhemmat ovat jostain syystä voineet tulla kahdesta eri ryhmästä.

OLS10:stä tiedetään isotooppianalyysin perusteella toistaiseksi, ettei hän ollut syntyisin mistään hautauspaikkansa Kundan lähettyviltä Länsi-Virumaalta eikä myöskään Ruotsista tai Lounais-Suomesta. Fenotyyppianalyysin mukaan hänellä todennäköisesti oli siniset silmät, tumman tai vaalean ruskeat hiukset ja keskimääräinen ihon sävy (eli ei tumma eikä kovin vaalea). Jos ja kun OLS10:n syntymä- ja varttumispaikka selviää, on toivottavasti mahdollisuus saada vertailuaineistoa sen selvittämiseksi, löytyykö sieltä mahdollisista muinaisnäytteistä selvästi OLS10:n kanssa geneettisesti samankaltaista väestöä vai ei.

Hyvä pointti.
~ "Per aspera ad hominem - vaikeuksien kautta henkilökohtaisuuksiin" ~

Y-DNA: N1c1-YP1143 (Olavi Häkkinen 1620 Kuhmo? >> Juhani Häkkinen 1816 Eno)
mtDNA: H5a1e (Elina Mäkilä 1757 Kittilä >> Riitta Sassali 1843 Sodankylä)
Avatar
Jaska
Ylihärmiö
Ylihärmiö
 
Viestit: 10977
Liittynyt: 14 Helmi 2011 04:02

Re: Tambets et al. 2018: Genes of the Uralic speaking popula

ViestiKirjoittaja Kinaporin kalifi » 23 Syys 2019 08:25

Kristiina kirjoitti:Olisi pakko löytää jostain kulttuuri/kulttuureja, jossa on N-L1026-linjoja aikavälllä 2500-1500 eaa.

Vaikka todiste on vain välillinen, Ananjino- ja Mälar Akozino-kirveiden itäinen levikkialue lienee aika hyvä vihje. Alue kattaa laajemmin Kaman valuma-aluetta sivujokineen, lisäksi osan läheistä Volgaa mutta ei kuitenkaan lännempänä kuin Suralla, siis hieman Tsuvassian pääkaupungin Tseboksarin länsipuolella. Siis pronssikauden Tsuvassia, Marimaa, Kirovin ja Permin oblastit, Tatarstan sekä Bashkiria jne. Figs 7 & 10:

https://journal.fi/susa/article/view/70229

Tuolla Kaman alueella muuten sijaitsee siis kuten tunnettua kuuluisa Turbinon hauta-alue, jota sivutaan tällä sivustolla:

http://www.bronsereplika.no/Bronze%20Ag ... %20II.html
Avatar
Kinaporin kalifi
SuuBaltti
SuuBaltti
 
Viestit: 6925
Liittynyt: 14 Helmi 2011 19:18

Re: Tambets et al. 2018: Genes of the Uralic speaking popula

ViestiKirjoittaja Kristiina » 23 Syys 2019 13:17

Eli jos Rostovkasta ja Turbinosta löytyy R1a1-z93-haploa, R1a1 on kantauralilainen haplotyyppi?
On kuitenkin totta että N (mm. vanha N1a) näyttää olevan Kiinassa metallurgihaplotyyppi, mutta nuo Kauko-Idän N-haplot eivät ole tietääkseni uralilaista tyyppiä.
Kristiina
SuuBaltti
SuuBaltti
 
Viestit: 1368
Liittynyt: 18 Maalis 2015 12:24

Re: Tambets et al. 2018: Genes of the Uralic speaking popula

ViestiKirjoittaja Rekonpoika » 23 Syys 2019 14:52

Kristiina kirjoitti:Eli jos Rostovkasta ja Turbinosta löytyy R1a1-z93-haploa, R1a1 on kantauralilainen haplotyyppi?
On kuitenkin totta että N (mm. vanha N1a) näyttää olevan Kiinassa metallurgihaplotyyppi, mutta nuo Kauko-Idän N-haplot eivät ole tietääkseni uralilaista tyyppiä.


N1b joka oli kivikaudella baikalilla ja rautakaudella ilmestyy vietnamiin taitaa olla metallurgiaan liittyvä idässä. Uralilaisissa se esiintyy lähinnä substraattina toisin kuin L1026 jota löytyy kaikista uralinpuhujista nganasaneista unkarilaisiin, tosin näillä äärilaidoilla vain vähän.
Rekonpoika
SuuBaltti
SuuBaltti
 
Viestit: 4295
Liittynyt: 12 Elo 2013 12:41

Re: Tambets et al. 2018: Genes of the Uralic speaking popula

ViestiKirjoittaja Jaska » 25 Syys 2019 17:42

Liitetaulukko S14 (Excel-tiedosto) on erittäin mielenkiintoinen, koska siihen on koottu monia erilaisia geneettisen etäisyyden mittareita.

1. FST

Vihdoinkin! Olen jo kymmenen vuotta odotellut saamelaisten ja itämerensuomalaisten välistä FST-vertailua. Tässä huomiota kiinnittää saamelaisten suuri FST-etäisyys kaikkiin muihin, alkaen jo ruotsin- ja kuolansaamelaisten keskinäisestä etäisyydestä 0,026 = 260. (Esim. suomalaisten ja unkarilaisten välilläkin FST on vain 50.)

Kuolansaamelaiset:
160 suomalaiset ja komit
170 karjalaiset
180 mordvalaiset
190 vepsäläiset ja virolaiset
220 unkarilaiset
240 marit
260 udmurtit ja ruotsinsaamelaiset
430 mansit
460 hantit
470 selkupit
550 nenetsit
830 nganasanit

Ruotsinsaamelaiset:
260 kuolansaamelaiset
290 komit
310 suomalaiset
320 karjalaiset
330 vepsäläiset
340 mordvalaiset ja marit
350 virolaiset
380 unkarilaiset
360 udmurtit
480 mansit
510 hantit ja selkupit
580 nenetsit
830 nganasanit

Ruotsinsaamelaiset ovat siis kauempana muista ja ajautuneempia kuin kuolansaamelaiset. Kuva on kuitenkin johdonmukainen siinä, että komit ovat kummallekin lähin ei-saamelainen väestö, sitten itämerensuomalaiset.

Myös Admixture osoittaa kuolansaamelaisissa selvästi erilaista perimäjakaumaa kuin skandinaviansaamelaisissa (Lamnidis et al. 2018). Näyttääkin siltä, että BOO-perimä ei ole levinnyt siinä määrin länteen, mutta vanhempi itäinen hantiperimä on. Toisin sanoen koko eroa saamelaisten välillä ei selitä ajautuminen.

Mansit
60 hantit
160 selkupit ja nenetsit
260 marit
280 udmurtit
290 komit
420 mordvalaiset
430 nganasanit, karjalaiset ja kuolansaamelaiset
440 vepsäläiset
450 suomalaiset
480 ruotsinsaamelaiset ja virolaiset
500 unkarilaiset

Keski-Volgan väestöt osuvat nätisti siperialaisten ja läntisten väestöjen väliin etäisyyksissä, kuten odottaisikin.

Virolaiset
20 suomalaiset
30 mordvalaiset ja unkarilaiset
40 karjalaiset
60 vepsäläiset
80 komit
190 kuolansaamelaiset
200 marit ja udmurtit
350 ruotsinsaamelaiset
480 mansit
520 hantit
550 selkupit
650 nenetsit
930 nganasanit

Virolaisethan ovat genominlaajuisesti lähellä venäläisiä, samoin kuin mordvalaiset. Silti suuri etäisyys vepsäläisiin on vähän yllättävä; lähes yhtä kaukana kuin komit.


2. FineStructure chunkcount matrix

Tulokset aivan samankaltaisia kuin FST:lläkin. Ei merkittäviä eroja.

Sitten on Y- ja mtDNA-FST:t sekä sanastollisia ja maantieteellisiä etäisyyksiä.
~ "Per aspera ad hominem - vaikeuksien kautta henkilökohtaisuuksiin" ~

Y-DNA: N1c1-YP1143 (Olavi Häkkinen 1620 Kuhmo? >> Juhani Häkkinen 1816 Eno)
mtDNA: H5a1e (Elina Mäkilä 1757 Kittilä >> Riitta Sassali 1843 Sodankylä)
Avatar
Jaska
Ylihärmiö
Ylihärmiö
 
Viestit: 10977
Liittynyt: 14 Helmi 2011 04:02

Re: Tambets et al. 2018: Genes of the Uralic speaking popula

ViestiKirjoittaja jussipussi » 26 Syys 2019 02:16

No Rekonpoika varmaan kertoo miten nämä pitää tulkita.
jussipussi
Mettänpeikko
Mettänpeikko
 
Viestit: 3104
Liittynyt: 22 Huhti 2012 00:25
Paikkakunta: Lappi

Re: Tambets et al. 2018: Genes of the Uralic speaking popula

ViestiKirjoittaja Jaska » 26 Syys 2019 03:18

Pannaan nyt vielä suomalaistenkin listaus. Mukana on siis vain uralilaisia väestöjä, joten ruotsalaisiin ja venäläisiin eroa ei nähdä. Aiemmissa tutkimuksissa FST-etäisyys niihin oli länsisuomalaisista n. 30 ja itäsuomalaisista n. 70. Nämä suomalaiset lienevät länsipainotteisia, vaikkei sitä missään lisämateriaaleissakaan valitettavasti kerrota.

Suomalaiset
20 virolaiset
30 karjalaiset
50 vepsäläiset, mordvalaiset, unkarilaiset
70 komit
160 kuolansaamelaiset
190 marit, udmurtit
310 ruotsinsaamelaiset
450 mansit
490 hantit
510 selkupit
600 nenetsit
890 nganasanit

Muuten suomalaiset ovat lähempänä uralilaisia väestöjä kuin saamelaiset, mutta siperialaisiin väestöihin etäisyys on samaa suuruusluokkaa kuin saamelaisilla.

Tässä myös hahmottuu pohjoinen ja eteläinen kaista: saamelaisille lähimpiä "keskiuralilaisista" väestöistä ovat komit, suomalaisille mordvalaiset.
~ "Per aspera ad hominem - vaikeuksien kautta henkilökohtaisuuksiin" ~

Y-DNA: N1c1-YP1143 (Olavi Häkkinen 1620 Kuhmo? >> Juhani Häkkinen 1816 Eno)
mtDNA: H5a1e (Elina Mäkilä 1757 Kittilä >> Riitta Sassali 1843 Sodankylä)
Avatar
Jaska
Ylihärmiö
Ylihärmiö
 
Viestit: 10977
Liittynyt: 14 Helmi 2011 04:02

Re: Tambets et al. 2018: Genes of the Uralic speaking popula

ViestiKirjoittaja Jaska » 26 Syys 2019 17:33

Jaska kirjoitti:Tässä myös hahmottuu pohjoinen ja eteläinen kaista: saamelaisille lähimpiä "keskiuralilaisista" väestöistä ovat komit, suomalaisille mordvalaiset.

IBD-jaot, 2-3 cM:

Saamelaiset:
8,57 karjalaiset
8,35 suomalaiset
7,97 vepsäläiset
4,67 virolaiset
4,12 pohjoisvenäläiset
3,73 komit

3,72 udmurtit
3,57 mansit
3,49 latvialaiset
3,48 puolalaiset
3,37 marit
3,32 ruotsalaiset
2,97 tshuvassit, hantit
2,37 mordvalaiset

Suomalaiset:
10,1 karjalaiset
8,2 vepsäläiset
7,82 saamelaiset
6,32 virolaiset
5,42 liettualaiset
5,28 keskivenäläiset
5,14 latvialaiset

4,95 pohjoisvenäläiset
4,92 ruotsalaiset
4,41 komit
4,21 mordvalaiset


Mielenkiintoista, että saamelaisten kanssa jaetaan enemmän vanhoja pätkiä kuin virolaisten kanssa. Osaltaan tämä tietysti heijastaa sitä, että suurimmassa osassa maata sekoittuminen saamelaisten kanssa on tapahtunut vasta viimeisen 1000 vuoden aikana.

Toisaalta balttien ja keskivenäläisten kanssa jaetaan enemmän kuin pohjoisvenäläisten ja komien kanssa, mikä sopii hyvin yhteen Langin eteläisen Väinäjoen reitin kanssa. Mordvalaiset jäävät tällä tasolla suhteessa kauemmas kuin FST-tasolla, koska IBD-jaksot pilkkoutuvat ajan saatossa pienemmiksi, kun taas laskennallinen yksittäisten alleelien suhde ei.

Virolaiset ovat ilmeisen heterogeeninen, monijuurinen väestö, koska he jakavat enemmän balttien ja suomalaisten kanssa kuin keskenään. Puolalaiset sekä keski- ja pohjoisvenäläiset ovat lähempänä virolaisia kuin Volgan kansat.
~ "Per aspera ad hominem - vaikeuksien kautta henkilökohtaisuuksiin" ~

Y-DNA: N1c1-YP1143 (Olavi Häkkinen 1620 Kuhmo? >> Juhani Häkkinen 1816 Eno)
mtDNA: H5a1e (Elina Mäkilä 1757 Kittilä >> Riitta Sassali 1843 Sodankylä)
Avatar
Jaska
Ylihärmiö
Ylihärmiö
 
Viestit: 10977
Liittynyt: 14 Helmi 2011 04:02

Re: Tambets et al. 2018: Genes of the Uralic speaking popula

ViestiKirjoittaja perttimp » 26 Syys 2019 19:55

Nämä on vahaduo + global25 mittarilla suomalaisten js saamelaisten lähimmät populaatiot.

Distance to: Finnish
0.01524346 Ingrian
0.02259139 Finnish_East
0.02352552 Karelian
0.02687788 Russian_Kostroma
0.03005140 Vepsian
0.03670159 Estonian
0.03738447 Mordovian
0.03929661 Russian_Tver
0.03950291 Russian_Pinega
0.04280206 Cossack_Kuban
0.04625422 Russian_Kursk
0.04793338 Cossack_Ukrainian
0.04805724 Russian_Orel
0.04923731 Russian_Voronez
0.05051690 Belarusian
0.05074165 Russian_Smolensk
0.05336052 Ukrainian
0.05396479 Polish
0.05678075 Latvian
0.05695243 Swedish
0.05768465 Lithuanian
0.06230980 Czech
0.06282418 Slovakian
0.06603923 Sorb_Niederlausitz
0.06710421 Norwegian

Distance to: Saami
0.05561234 Udmurt
0.06127826 Besermyan
0.06905893 Komi
0.06909855 Chuvash
0.08005741 Tatar_Kazan
0.09589130 Tatar_Mishar
0.09601765 Mari
0.10261636 Russian_Pinega
0.10419108 Tatar_Lipka
0.11216041 Vepsian
0.11398982 Finnish_East
0.11569555 Karelian
0.11809222 Bashkir
0.12822160 Mordovian
0.12978147 Russian_Kostroma
0.13109209 Ingrian
0.13202648 Finnish
0.14535997 Cossack_Kuban
0.14592922 Yukagir_Forest
0.14864738 Tatar_Siberian
0.15482745 Russian_Tver
0.15983834 Estonian
0.16124673 Tlingit
0.16283692 Russian_Kursk
0.16348012 Tatar_Siberian_Zabolotniye
perttimp
Pohtiva pohjalainen
Pohtiva pohjalainen
 
Viestit: 181
Liittynyt: 30 Joulu 2011 12:21

Re: Tambets et al. 2018: Genes of the Uralic speaking popula

ViestiKirjoittaja Jaska » 26 Syys 2019 19:57

Kiitos, mielenkiintoista.
~ "Per aspera ad hominem - vaikeuksien kautta henkilökohtaisuuksiin" ~

Y-DNA: N1c1-YP1143 (Olavi Häkkinen 1620 Kuhmo? >> Juhani Häkkinen 1816 Eno)
mtDNA: H5a1e (Elina Mäkilä 1757 Kittilä >> Riitta Sassali 1843 Sodankylä)
Avatar
Jaska
Ylihärmiö
Ylihärmiö
 
Viestit: 10977
Liittynyt: 14 Helmi 2011 04:02

Re: Tambets et al. 2018: Genes of the Uralic speaking popula

ViestiKirjoittaja Rekonpoika » 26 Syys 2019 23:31

Jaska kirjoitti:Liitetaulukko S14 (Excel-tiedosto) on erittäin mielenkiintoinen, koska siihen on koottu monia erilaisia geneettisen etäisyyden mittareita.

1. FST

Vihdoinkin! Olen jo kymmenen vuotta odotellut saamelaisten ja itämerensuomalaisten välistä FST-vertailua. Tässä huomiota kiinnittää saamelaisten suuri FST-etäisyys kaikkiin muihin, alkaen jo ruotsin- ja kuolansaamelaisten keskinäisestä etäisyydestä 0,026 = 260. (Esim. suomalaisten ja unkarilaisten välilläkin FST on vain 50.)

Kuolansaamelaiset:
160 suomalaiset ja komit
170 karjalaiset
180 mordvalaiset
190 vepsäläiset ja virolaiset
220 unkarilaiset
240 marit
260 udmurtit ja ruotsinsaamelaiset
430 mansit
460 hantit
470 selkupit
550 nenetsit
830 nganasanit

Ruotsinsaamelaiset:
260 kuolansaamelaiset
290 komit
310 suomalaiset
320 karjalaiset
330 vepsäläiset
340 mordvalaiset ja marit
350 virolaiset
380 unkarilaiset
360 udmurtit
480 mansit
510 hantit ja selkupit
580 nenetsit
830 nganasanit

Ruotsinsaamelaiset ovat siis kauempana muista ja ajautuneempia kuin kuolansaamelaiset. Kuva on kuitenkin johdonmukainen siinä, että komit ovat kummallekin lähin ei-saamelainen väestö, sitten itämerensuomalaiset.

Myös Admixture osoittaa kuolansaamelaisissa selvästi erilaista perimäjakaumaa kuin skandinaviansaamelaisissa (Lamnidis et al. 2018). Näyttääkin siltä, että BOO-perimä ei ole levinnyt siinä määrin länteen, mutta vanhempi itäinen hantiperimä on. Toisin sanoen koko eroa saamelaisten välillä ei selitä ajautuminen.

Mansit
60 hantit
160 selkupit ja nenetsit
260 marit
280 udmurtit
290 komit
420 mordvalaiset
430 nganasanit, karjalaiset ja kuolansaamelaiset
440 vepsäläiset
450 suomalaiset
480 ruotsinsaamelaiset ja virolaiset
500 unkarilaiset

Keski-Volgan väestöt osuvat nätisti siperialaisten ja läntisten väestöjen väliin etäisyyksissä, kuten odottaisikin.

Virolaiset
20 suomalaiset
30 mordvalaiset ja unkarilaiset
40 karjalaiset
60 vepsäläiset
80 komit
190 kuolansaamelaiset
200 marit ja udmurtit
350 ruotsinsaamelaiset
480 mansit
520 hantit
550 selkupit
650 nenetsit
930 nganasanit

Virolaisethan ovat genominlaajuisesti lähellä venäläisiä, samoin kuin mordvalaiset. Silti suuri etäisyys vepsäläisiin on vähän yllättävä; lähes yhtä kaukana kuin komit.


2. FineStructure chunkcount matrix

Tulokset aivan samankaltaisia kuin FST:lläkin. Ei merkittäviä eroja.

Sitten on Y- ja mtDNA-FST:t sekä sanastollisia ja maantieteellisiä etäisyyksiä.


BOO:ta ennen ei ollut mitään vanhempaa itäistä hantiperimää. Ruotsinsaamelaiset ovat ajautuneita vrt. kuolansaamelaisiin mutta muuten edustavat samanlaista perimää pl. venäläissekoitus kuolalaisissa.
Rekonpoika
SuuBaltti
SuuBaltti
 
Viestit: 4295
Liittynyt: 12 Elo 2013 12:41

Re: Tambets et al. 2018: Genes of the Uralic speaking popula

ViestiKirjoittaja Lri » 28 Maalis 2021 01:56

Jaska kirjoitti:2. FineStructure chunkcount matrix

Tulokset aivan samankaltaisia kuin FST:lläkin. Ei merkittäviä eroja.


Jos taulukkoa S14B (fineSTRUCTURE chunkcount matrix) vertaa taulukkoon S14A (FST-etäisyydet), niin siinä esimerkiksi nganasanien etäisyys manseihin on 55% nganasanien etäisyydestä unkarilaisiin, kun FST-etäisyyksien perusteella se on 45%:

$ curl -Ls pastebin.com/raw/PQGBv8MZ|tr -d \\r>chunkcount
$ curl -Ls pastebin.com/raw/pSE2tKWt|tr -d \\r>fst
$ Rscript -e 't=read.csv("chunkcount",row.names=1,header=T);d=as.matrix(as.dist(t));d["Nganasans","Mansis"]/d["Nganasans","Hungarians"]'
[1] 0.5482543
$ Rscript -e 't=read.csv("fst",row.names=1,header=T);d=as.matrix(as.dist(t));d["Nganasans","Mansis"]/d["Nganasans","Hungarians"]'
[1] 0.4479167

Myös esimerkiksi FST-taulukon perusteella suomalaiset ovat paljon kauempana Ruotsin saamelaisista kuin mareista, mutta chunkcount-taulukon perusteella suomalaiset ovat vähän lähempänä Ruotsin saamelaisia kuin mareja. FST-taulukon perusteella marit ovat lähempänä komeja kuin udmurtteja, mutta chunkcount-taulukon perusteella se on päinvastoin.

Chunkcount-taulukon perusteella nganasanit ovat kauimpana karjalaisista, mutta FST-taulukon perusteella nganasanit ovat kauimpana unkarilaisista.

FST-taulukon perusteella suomalaisten etäisyys unkarilaisiin on pienempi kuin hantien etäisyys manseihin, mutta chunkcount-taulukon perusteella suomalaiset ovat noin 4 kertaa kauempana unkarilaisista kuin hantit manseista. Tosin chunkcount-taulukon asteikko on enemmän lineaarinen, joten siinä pienet etäisyydet ovat harvinaisempia.

Tässä taulukot on normalisoitu niin, että pisin etäisyys on 100 ja lyhin 0:

Kuva

Koodi: Valitse kaikki
library(pheatmap)
library(colorspace)

t=read.csv("https://pastebin.com/raw/PQGBv8MZ",row.names=1,header=T) # chunkcount
# t=read.csv("https://pastebin.com/raw/pSE2tKWt",row.names=1,header=T) # FST

t=100*t/max(t)

p=c("Hungarians","Estonians","Finns","Karelians","Vepsians","Mordovians","Saami_Kola",
"Saami_SWE","Komis","Udmurts","Maris","Mansis","Khanty","Selkups","Nenets","Nganasans")
t=t[p,p]

pheatmap(
  t,
  filename="a.png",
  cluster_cols=F,
  cluster_rows=F,
  legend=F,
  cellwidth=16,
  cellheight=16,
  fontsize=8,
  border_color=NA,
  display_numbers=T,
  number_format="%.0f",
  fontsize_number=7,
  number_color="black",
  colorRampPalette(hex(HSV(c(210,170,120,60,40,20,0),.5,1)))(256)
)


FST-taulukkoon verrattuna chunkcount-matriisissa pienet etäisyydet ovat harvinaisempia ja isot etäisyydet ovat yleisempiä:

Kuva

FST-taulukon perusteella tehdyssä MDS-kuvaajassa yksi kliini kulkee Ruotsin saamelaisista unkarilaisiin ja toinen unkarilaisista nganasaneihin. Chunkcount-taulukon perusteella tehdyssä MDS-kuvaajassa yksi kliini kulkee karjalaisista udmurtteihin ja toinen udmurteista nganasaneihin.

KuvaKuva
Lri
Mettänpeikko
Mettänpeikko
 
Viestit: 323
Liittynyt: 09 Maalis 2019 15:01

Re: Tambets et al. 2018: Genes of the Uralic speaking popula

ViestiKirjoittaja Lri » 28 Maalis 2021 21:41

Tambetsin paperin näytteiden datan saa ladatua täältä: https://evolbio.ut.ee/Tambets2018. Tiedostot saa yhdistettyä PLINKin kanssa:

wget evolbio.ut.ee/Tambets2018/Tambets_et_al_2018_{1M,660k,650k,610k}.{bed,bim,fam}
printf %s\\n Tambets_et_al_2018_{660k,610k}>mergelist
plink --allow-no-sex --bfile Tambets_et_al_2018_1M --merge-list mergelist --make-bed --out yhdistetty

Tambets_et_al_2018_650k ei suostunut yhdistymään muiden kanssa:

$ plink --allow-no-sex --bfile Tambets_et_al_2018_1M --bmerge Tambets_et_al_2018_650k --make-bed --out testi
[...]
2 more multiple-position warnings: see log file.
Error: 167034 variants with 3+ alleles present.
* If you believe this is due to strand inconsistency, try --flip with
testi.missnp.

Sen sai yhdistettyä näin:

a=yhdistetty;b=Tambets_et_al_2018_650k
plink --allow-no-sex --bfile $a --bmerge $b --make-bed --out merge
plink --bfile $b --flip merge-merge.missnp --make-bed --out $b-flip
plink --allow-no-sex --bfile $a --bmerge $b-flip --make-bed --out merge
plink --bfile $b-flip --exclude merge-merge.missnp --make-bed --out $b-filtered
plink --bfile $a --bmerge $b-filtered --make-bed --out yhdistetty2 --allow-no-sex

Latasin PLINK 1.9:n tältä sivulta: https://www.cog-genomics.org/plink/. Alkuperäisellä Harvardin sivulla olevan PLINK 1.9:n Mac-binaarit eivät toimineet koneellani. PLINK 2:ssa piti korvata `--bmerge` asetuksella `--pmerge`, mutta senkin jälkeen sain seuraavan virheen, koska PLINK 2 käyttää uutta pgen-pvar-psam -formaattia: `Error: Failed to open Tambets_et_al_2018_650k.psam`.

Kokeilin sitten tehdä PCA:n kummallakin PLINKillä ja SmartPCA:lla:

x=yhdistetty2;plink --bfile $x --indep-pairwise 50 10 .5 --make-bed --out $x.2;plink --bfile $x.2 --extract $x.2.prune.in --geno .1 --make-bed --out $x.3;plink --bfile $x.3 --pca
curl -Ls pastebin.com/raw/md6FrMM4|tr -d \\r>popnames # taulukosta S1B
awk 'NR==FNR{a[$1]=$2;next}{$1=a[$1]}1' popnames plink.eigenvec>plink.eigenvec.2
f=yhdistetty2.3;smartpca -p <(printf %s\\n genotypename:\ $f.bed snpname:\ $f.bim indivname:\ $f.fam evecoutname:\ $f.evec evaloutname:\ $f.eval numoutlieriter:\ 0 autoshrink:\ YES)
awk 'NR==FNR{a[$1]=$2;next}{$1=a[$1]":"$1};NF--' popnames <(sed 1d $f.evec|sed 's/[^:]*://')>$f.evec.2

En osaa vielä tehdä filtteröintiä tai imputointia kunnolla, ja tein tässä varmaan muutenkin jotain väärin. Ainakin se on epäilyttävää, että yksi burjatti on suunnilleen samassa kohdassa PC1:llä kuin yksi tataari. Mansien sijoittuminen vaikuttaa kuitenkin vastaavan Tambetsin ADMIXTURE-analyysiä, jossa mansien siperialainen perimä vaihteli suunnilleen hantien tasosta suomalaisten tasoon.

KuvaKuva

Yllä SmartPCA:n kuvaajassa on korkeampi PC1:n ja PC2:n selittämän varianssin prosentti, koska SmartPCA palautti 10 ominaisvektoria mutta `plink --pca` palautti 20.

Tein kummankin SmartPCA:n ja `plink --pca`:n kohdalla klusteroinnin niin, että kerroin ensin sarakkeet ominaisarvojen neliöjuurilla, ja otin sitten klusteroinnissa huomioon vain ensimmäiset kuusi ulottuvuutta. G25:ssäkin klusterointi menee usein sekaisin skaalaamattomilla koordinaateilla.

Koodi: Valitse kaikki
library(tidyverse)

t=read.table("plink.eigenvec.2")
eig=as.double(readLines("plink.eigenval"))

pct=paste0("PC",seq(length(eig))," (",sprintf("%.1f",100*eig/sum(eig)),"%)")

t=cbind(t[,c(1,2)],t(t(t[,-c(1,2)])*sqrt(eig)))

t$k=cutree(hclust(dist(t[,c(3:8)])),k=16)
t$lab=paste0(t[,1],":",t[,2])

ggplot(t,aes(x=V3,y=V4))+
geom_polygon(data=t%>%group_by(k)%>%slice(chull(V3,V4)),alpha=.2,aes(color=as.factor(k),fill=as.factor(k)),size=.3)+
geom_point(aes(color=as.factor(k)),size=.5)+
geom_text(aes(label=lab,color=as.factor(k)),size=2,vjust=-.7)+
ggtitle("plink --pca")+
labs(x=pct[1],y=pct[2])+
scale_x_continuous(breaks=seq(-10,10,.1),expand=expansion(mult=.12))+
scale_y_continuous(breaks=seq(-10,10,.1),expand=expansion(mult=.03))+
scale_color_manual(values=hcl(head(seq(15,375,length=length(unique(t$k))+1),-1),90,50))+
theme(
  aspect.ratio=1/sqrt(2),
  axis.text=element_text(color="black",size=6),
  axis.ticks.length=unit(0,"pt"),
  axis.ticks.x=element_blank(),
  axis.ticks.y=element_blank(),
  axis.title=element_text(color="black",size=8),
  legend.position="none",
  panel.background=element_rect(fill="white"),
  panel.border=element_rect(color="gray75",fill=NA,size=.4),
  panel.grid.major=element_line(color="gray70",size=.15),
  plot.title=element_text(size=10)
)

ggsave("a.png")
system("mogrify -trim -bordercolor white -border 16x16 a.png")
Lri
Mettänpeikko
Mettänpeikko
 
Viestit: 323
Liittynyt: 09 Maalis 2019 15:01

Re: Tambets et al. 2018: Genes of the Uralic speaking popula

ViestiKirjoittaja Lri » 05 Touko 2021 12:00

Tambets et al. 2018:n taulukoissa S4 ja S5 on mtDNA- ja Y-DNA-haploryhmien prosenttiosuuksia uralilaisten kansojen ja muiden pohjoiseuraasialaisten väestöjen keskuudessa. Tein taulukkojen perusteella biplotteja, joihin on piirretty nuolet eri haploryhmien painotuksille. Jokaisen väestön pisteestä on piirretty viiva sen kolmeen lähimpään naapuriin, missä väestöjen väliset etäisyydet perustuvat haploryhmätaulukon prosenttiosuuksien perusteella laskettuihin euklidisiin etäisyyksiin.

Anteeksi jussipussille, mutta en viitsi kirjoittaa näistä mitään analyysia.

Y-DNA:

KuvaKuvaKuvaKuva

mtDNA:

KuvaKuvaKuvaKuva

Koodi: Valitse kaikki
library(tidyverse)
library(ggforce)

t=read.csv("https://pastebin.com/raw/aGPQSC24",row.names=1,header=T,check.names=F) # Y-DNA
# t=read.csv("https://pastebin.com/raw/MmttxJJM",row.names=1,header=T,check.names=F) # mtDNA

p=prcomp(t)
pct=paste0(colnames(p$x)," (",sprintf("%.1f",p$sdev/sum(p$sdev)*100),"%)")
p2=as.data.frame(p$x)
p2$k=as.factor(cutree(hclust(dist(t)),k=12))
load=p$rotation

for(i in seq(1,7,2)){
  xpc=sym(paste0("PC",i))
  ypc=sym(paste0("PC",i+1))

  nneigh=3
  dist=as.data.frame(as.matrix(dist(t)))
  seg0=lapply(1:nneigh+1,function(j)apply(dist,1,function(x)unlist(p2[names(sort(x)[j]),c(i,i+1)],use.names=F))%>%t%>%cbind(p2[,c(i,i+1)]))
  seg=do.call(rbind,seg0)%>%setNames(paste0("V",1:4))

  mult=min(max(p2[,i])/max(load[,i]),max(p2[,i+1])/max(load[,i+1]))

  ggplot(p2,aes(!!xpc,!!ypc))+
    geom_segment(data=seg,aes(x=V1,y=V2,xend=V3,yend=V4),color="gray80",size=.3)+
    ggforce::geom_mark_hull(aes(color=k,fill=k),concavity=100,radius=unit(.15,"cm"),expand=unit(.15,"cm"),alpha=.2,size=.1)+
    # geom_polygon(data=p2%>%group_by(k)%>%slice(chull(!!xpc,!!ypc)),alpha=.2,aes(color=k,fill=k),size=.3)+
    geom_segment(data=load,aes(x=0,y=0,xend=mult*!!xpc,yend=mult*!!ypc),arrow=arrow(length=unit(.3,"lines")),color="gray60",size=.4)+
    annotate("text",x=(mult*load[,i]),y=(mult*load[,i+1]),label=rownames(load),size=2.5,vjust=ifelse(load[,i+1]>0,-.5,1.4))+
    geom_point(aes(color=k),size=.6)+
    geom_text(aes(label=rownames(t),color=k),size=2.5,vjust=-.6)+
    # ggrepel::geom_text_repel(aes(label=rownames(t),color=k),max.overlaps=Inf,force=5,size=2.2,min.segment.length=.1,segment.size=.2)+
    labs(x=pct[i],y=pct[i+1])+
    coord_fixed()+
    scale_x_continuous(breaks=seq(-200,200,10),expand=expansion(mult=.10))+
    scale_y_continuous(breaks=seq(-200,200,10),expand=expansion(mult=.10))+
    scale_color_manual(values=hcl(head(seq(15,375,length=length(unique(p2$k))+1),-1),120,50))+
    theme(aspect.ratio=1,
          axis.text=element_text(color="black",size=6),
          axis.ticks=element_line(size=.3,color="gray60"),
          axis.ticks.length=unit(-.1,"cm"),
          axis.text.x=element_text(margin=margin(.2,0,0,0,"cm")),
          axis.text.y=element_text(angle=90,vjust=1,hjust=.5,margin=margin(0,.2,0,0,"cm")),
          axis.title=element_text(color="black",size=8),
          legend.position="none",
          panel.background=element_rect(fill="white"),
          panel.border=element_rect(color="gray60",fill=NA,size=.4),
          panel.grid=element_blank())

  ggsave(paste0(i,".png"),width=6,height=6)
}


Edit: tässä on vielä klusteroidut lämpökartat Y-DNA- ja mtDNA-taulukoista. Parempilaatuiset versiot: https://i.ibb.co/L6h0jtM/complexheatmap-tambets-2018-ydna.png, Kuva.

Kuva
Kuva

Koodi: Valitse kaikki
library(ComplexHeatmap)
library(circlize)
library(colorspace)
library(vegan)

t=read.table("https://pastebin.com/raw/9VcbF62f",sep="\t",check.names=F,header=T,comment.char="") # mtDNA
# t=read.table("https://pastebin.com/raw/N30HaLsz",sep="\t",check.names=F,header=T,comment.char="") # Y-DNA
t2=as.matrix(t[,-c(1:3)])

east=23:34
# east=c(1,2,4,10,11,12,13,14)
roweast=rowSums(t2[,east])
coleast=as.numeric(seq(ncol(t2))%in%east)

png("a.png",w=4000,h=4000,res=100)

ht_opt$COLUMN_ANNO_PADDING=unit(0,"mm")
ht_opt$ROW_ANNO_PADDING=unit(0,"mm")

Heatmap(
  t2,
  show_heatmap_legend=F,
  show_column_names=F,
  show_row_names=F,
  width=ncol(t)*unit(30,"pt"),
  height=nrow(t)*unit(30,"pt"),
  column_dend_height=unit(200,"pt"),
  row_dend_width=unit(200,"pt"),
  clustering_distance_rows="euclidean",
  clustering_distance_columns="euclidean",
  cluster_rows=reorder(hclust(dist(t2)),-roweast),
  cluster_columns=reorder(hclust(dist(t(t2))),-coleast),
  column_title="Source: Tambets et al. 2018, table S5",column_title_gp=gpar(fontsize=24),
  rect_gp=gpar(col="gray80",lwd=1.5),
  col=colorRamp2(seq(0,100,length.out=7),hex(HSV(c(210,210,130,60,40,20,0),c(0,rep(.5,6)),1))),
  cell_fun=function(j,i,x,y,w,h,fill)grid.text(sprintf("%.0f",t2[i,j]),x,y,gp=gpar(fontsize=17)),
  top_annotation=columnAnnotation(text=anno_text(gt_render(colnames(t2),padding=unit(c(3,3,3,3),"mm")),just="left",rot=90,location=unit(0,"npc"),gp=gpar(fontsize=17,border="gray80",lwd=1.5))),
  bottom_annotation=columnAnnotation(text=anno_text(gt_render(colnames(t2),padding=unit(c(3,3,3,3),"mm")),just="left",rot=270,gp=gpar(fontsize=17,border="gray80",lwd=1.5))),
  left_annotation=rowAnnotation(text=anno_text(gt_render(t[,1],padding=unit(c(3,3,3,3),"mm")),just="right",location=unit(1,"npc"),gp=gpar(fontsize=17,border="gray80",lwd=1.5))),
  right_annotation=rowAnnotation(
    text1=anno_text(gt_render(t[,1],padding=unit(c(3,3,3,3),"mm")),just="left",location=unit(0,"npc"),gp=gpar(fontsize=17,border="gray80",lwd=1.5)),
    text2=anno_text(gt_render(sprintf("%.0f",roweast),padding=unit(c(3,3,3,3),"mm")),just="center",location=unit(.5,"npc"),gp=gpar(fontsize=17,border="gray80",lwd=1.5)),
    text3=anno_text(gt_render(t[,2],name="N",padding=unit(c(3,3,3,3),"mm")),just="center",location=unit(.5,"npc"),gp=gpar(fontsize=17,border="gray80",lwd=1.5)),
    text4=anno_text(gt_render(t[,3],name="Sources",padding=unit(c(3,3,3,3),"mm")),just="left",location=unit(0,"npc"),gp=gpar(fontsize=17,border="gray80",lwd=1.5))
  )
)

decorate_annotation("text2",grid.text("Total eastern (%)",y=unit(1,"npc")+unit(3,"mm"),rot=90,just="left",gp=gpar(fontsize=17)))
decorate_annotation("text3",grid.text("N",y=unit(1,"npc")+unit(3,"mm"),rot=90,just="left",gp=gpar(fontsize=17)))

dev.off()
system("mogrify -gravity center -trim -border 16 -bordercolor white a.png")
Viimeksi muokannut Lri päivämäärä 06 Touko 2021 12:21, muokattu yhteensä 9 kertaa
Lri
Mettänpeikko
Mettänpeikko
 
Viestit: 323
Liittynyt: 09 Maalis 2019 15:01

Re: Tambets et al. 2018: Genes of the Uralic speaking popula

ViestiKirjoittaja jussipussi » 05 Touko 2021 14:45

Lri kirjoitti:Anteeksi jussipussille, mutta en viitsi kirjoittaa näistä mitään analyysia.


Lähes anteeksiantamatonta kyllä, mutta menköön. Jaska varmaan tekee sen.
jussipussi
Mettänpeikko
Mettänpeikko
 
Viestit: 3104
Liittynyt: 22 Huhti 2012 00:25
Paikkakunta: Lappi

Re: Tambets et al. 2018: Genes of the Uralic speaking popula

ViestiKirjoittaja Jaska » 05 Touko 2021 15:09

jussipussi kirjoitti:
Lri kirjoitti:Anteeksi jussipussille, mutta en viitsi kirjoittaa näistä mitään analyysia.


Lähes anteeksiantamatonta kyllä, mutta menköön. Jaska varmaan tekee sen.

Hyvin Larry kyllä haldaa nuo bittiveivaimet, kiitos siitä! PDT_Armataz_01_01
Tuloksista ei nyt noussut esiin mitään kommentoitavaa.
~ "Per aspera ad hominem - vaikeuksien kautta henkilökohtaisuuksiin" ~

Y-DNA: N1c1-YP1143 (Olavi Häkkinen 1620 Kuhmo? >> Juhani Häkkinen 1816 Eno)
mtDNA: H5a1e (Elina Mäkilä 1757 Kittilä >> Riitta Sassali 1843 Sodankylä)
Avatar
Jaska
Ylihärmiö
Ylihärmiö
 
Viestit: 10977
Liittynyt: 14 Helmi 2011 04:02

Edellinen

Paluu Uutiset ja tutkimukset

Paikallaolijat

Käyttäjiä lukemassa tätä aluetta: Ei rekisteröityneitä käyttäjiä ja 21 vierailijaa