Testasin hypoteesia siitä, että tundrajukagiireilla olisi muutakin kuin Yakutia_LNBA-perimää, ja tein sitä varten joitakin qpAdm-mallinnuksia. Käytin niissä referenssiväestöinä samoja näytteitä kuin Zeng et al. oheismateriaalin kuvan S79 mukaan ("qpAdm results for Admixed Inner Asian populations", Data S7: Table 1), paitsi minulla ei ollut käyttämässäni datasetissä Altain vanhoja näytteitä (Altai_N_old), joten korvasin ne Ust'-Kyakhtalla, koska Altai_N_old on sekoitus Ust'-Kyakhtaa (62%) ja Afontova Gora 3:a (38%) (ks. Zeng et al. 2023: Table S10, oheismateriaalin sivu 177).
right = c('Ethiopia_4500BP', 'China_Paleolithic', 'Russia_AfontovaGora3', 'Italy_South_HG_Ostuni', 'Iran_GanjDareh_N', 'Turkey_Boncuklu_PPN', 'Morocco_Iberomaurusian', 'Peru_Laramate_900BP', 'China_SEastAsia_Island_EN', 'China_NEastAsia_Inland_EN', 'USA_AK_PaleoAleut', 'USA_AK_NeoAleut', 'Ust_Kyakhta_14kya', 'Syalakh-Belkachi')
Referenssiväestöihin kuuluvat Alaskan paleo- ja neoaleutit ovat iältään niin nuoria näytteitä, että käytin qpAdm-mallinnuksissa varsinaisina lähdeväestöinä vain nykyaikaisia näytteitä. Niin kannattaa tehdä siksi, että qpAdm-mallinnuksen ohjeiden mukaan varsinaiset lähdeväestöt (left groups) eivät saisi olla vanhempia kuin referenssiväestöt (right groups/outgroups). Siksi en käyttänyt lähdeväestöinä esimerkiksi Magadan_BA- tai Syalakh-Belkachi-näytteitä, vaikka Zeng et al. toteavat esijulkaisuversion oheismateriaalissa sivulla 203, että noin 3000 vuotta vanha Magadan_BA-väestö Ohotanmeren rannalta on kaikkein lähintä sukua nykyisille Chukotko-Kamchatkan-väestöille. Tein kuitenkin poikkeuksen sääntöön Yakutia_LNBA-näytteiden kohdalla, koska Zeng et al. käyttivät niitä myös alkuperäisissä mallinnuksissa.
left = c('Yakutia_LNBA', 'Chukchi.HO')
left = c('Yakutia_LNBA', 'Chukchi1.HO')
left = c('Yakutia_LNBA', 'Itelmen.HO')
left = c('Yakutia_LNBA', 'Koryak.HO')
left = c('Yakutia_LNBA', 'Eskimo_Naukan.HO')
left = c('Yakutia_LNBA', 'Eskimo_ChaplinSireniki.HO')
left = c('Yakutia_LNBA', 'Evenk_FarEast.HO')
left = c('Yakutia_LNBA', 'Evenk_Transbaikal.HO')
left = c('Yakutia_LNBA', 'Even.HO')
left = c('Yakutia_LNBA', 'Yakut.HO')
left = c('Yakutia_LNBA', 'Khakass.HO')
target = 'Yukagir_Tundra.HO'
Tein ensin mallinnuksia, joissa käytin perusasetuksia. Silloin parametri "allsnps = FALSE", mikä tarkoittaa käsittääkseni sitä, että qpAdm vertaa kaikkien väestöjen näytteissä samoja kohtia eli
SNP:itä. Perusasetuksilla vertailtavia SNP:itä oli kuitenkin todella vähän, koska qpAdm ilmoitti, että "Number of SNPs after excluding those with missing data: 3369". Se heikentää todennäköisesti tulosten luotettavuutta.
Perusasetuksilla menee läpi malli, jossa on pelkästään Yakutia_LNBA-perimää, mutta paremman p-arvon saavat mallit, joissa on Yakutia_LNBA-perimän lisäksi joko tšuktšien, korjakkien tai eskimoiden perimää. Hylätyiksi tulevat toisaalta mallit, joissa on Yakutia_LNBA-perimän lisäksi joko evenkien, evenien, jakuuttien tai hakassien perimää, koska niissä jälkimmäisten perimien osuus on negatiivinen.
p | target | left | weight | se | z
0.606 Yukagir_Tundra.HO Yakutia_LNBA 1 1.14e-13 8.79e12
0.964 Yukagir_Tundra.HO Yakutia_LNBA 0.658 0.104 6.30
0.964 Yukagir_Tundra.HO Chukchi.HO 0.342 0.104 3.28
0.733 Yukagir_Tundra.HO Yakutia_LNBA 0.751 0.173 4.33
0.733 Yukagir_Tundra.HO Chukchi1.HO 0.249 0.173 1.44
0.757 Yukagir_Tundra.HO Yakutia_LNBA 0.634 0.279 2.27
0.757 Yukagir_Tundra.HO Itelmen.HO 0.366 0.279 1.31
0.946 Yukagir_Tundra.HO Yakutia_LNBA 0.494 0.190 2.60
0.946 Yukagir_Tundra.HO Koryak.HO 0.506 0.190 2.66
0.903 Yukagir_Tundra.HO Yakutia_LNBA 0.794 0.0836 9.50
0.903 Yukagir_Tundra.HO Eskimo_Naukan.HO 0.206 0.0836 2.47
0.935 Yukagir_Tundra.HO Yakutia_LNBA 0.767 0.0858 8.94
0.935 Yukagir_Tundra.HO Eskimo_ChaplinSireniki.HO 0.233 0.0858 2.71
0.517 Yukagir_Tundra.HO Yakutia_LNBA 1.22 0.366 3.32
0.517 Yukagir_Tundra.HO Evenk_FarEast.HO -0.215 0.366 -0.589
0.461 Yukagir_Tundra.HO Yakutia_LNBA 1.13 0.756 1.49
0.461 Yukagir_Tundra.HO Evenk_Transbaikal.HO -0.129 0.756 -0.171
0.603 Yukagir_Tundra.HO Yakutia_LNBA 1.15 0.200 5.75
0.603 Yukagir_Tundra.HO Even.HO -0.149 0.200 -0.743
0.615 Yukagir_Tundra.HO Yakutia_LNBA 1.53 1.03 1.48
0.615 Yukagir_Tundra.HO Yakut.HO -0.526 1.03 -0.510
0.494 Yukagir_Tundra.HO Yakutia_LNBA 1.13 0.225 5.00
0.494 Yukagir_Tundra.HO Khakass.HO -0.126 0.225 -0.561
Seuraavaksi tein samat mallinnukset uudelleen, mutta käytin tällä kertaa parametria "allsnps = TRUE". Silloin qpAdm ei käsittääkseni vertaa kaikkien väestöjen näytteissä samoja kohtia, vaan se voi verrata eri kohtia eri väestöparien välillä. Niinpä qpAdm ilmoitti, että "Number of SNPs used for each f4-statistic" oli vähimmillään 49505 ja enimmillään 560439, eli useimmilla väestöpareilla satojatuhansia SNP:itä. Se parantaa tässä tapauksessa todennäköisesti tulosten luotettavuutta.
Näillä asetuksilla menee läpi ainoastaan malli, joka yhdistää Yakutia_LNBA- ja itelmen-perimää, koska sen p-arvo on 0,133. Kaikki muut mallit voi periaatteessa hylätä, koska ne alittavat monissa tutkimuksissa käytetyn alimman p-arvon 0,05, joskin Zeng et al. hyväksyvät myös mallit, joiden p-arvo on vähintään 0,01 (ks. Figure S79 esijulkaisun oheismateriaalin sivulla 221). Sillä perusteella voisi hyväksyä myös mallit, jotka yhdistävät Yakutia_LNBA- ja tšuktši-perimää.
p | target | left | weight | se | z
0.0000000000491 Yukagir_Tundra.HO Yakutia_LNBA 1 1.14e-13 8.79e12
0.0147 Yukagir_Tundra.HO Yakutia_LNBA 0.793 0.0254 31.2
0.0147 Yukagir_Tundra.HO Chukchi.HO 0.207 0.0254 8.16
0.0102 Yukagir_Tundra.HO Yakutia_LNBA 0.801 0.0262 30.5
0.0102 Yukagir_Tundra.HO Chukchi1.HO 0.199 0.0262 7.57
0.133 Yukagir_Tundra.HO Yakutia_LNBA 0.605 0.0447 13.5
0.133 Yukagir_Tundra.HO Itelmen.HO 0.395 0.0447 8.85
0.00741 Yukagir_Tundra.HO Yakutia_LNBA 0.605 0.0490 12.3
0.00741 Yukagir_Tundra.HO Koryak.HO 0.395 0.0490 8.07
0.00802 Yukagir_Tundra.HO Yakutia_LNBA 0.871 0.0172 50.7
0.00802 Yukagir_Tundra.HO Eskimo_Naukan.HO 0.129 0.0172 7.49
0.00802 Yukagir_Tundra.HO Yakutia_LNBA 0.859 0.0188 45.8
0.00802 Yukagir_Tundra.HO Eskimo_ChaplinSireniki.HO 0.141 0.0188 7.52
0.0000000000674 Yukagir_Tundra.HO Yakutia_LNBA 1.08 0.0568 19.0
0.0000000000674 Yukagir_Tundra.HO Evenk_FarEast.HO -0.0778 0.0568 -1.37
0.0000269 Yukagir_Tundra.HO Yakutia_LNBA 2.09 0.483 4.32
0.0000269 Yukagir_Tundra.HO Evenk_Transbaikal.HO -1.09 0.483 -2.25
0.0000000000203 Yukagir_Tundra.HO Yakutia_LNBA 0.991 0.0221 44.8
0.0000000000203 Yukagir_Tundra.HO Even.HO 0.00851 0.0221 0.385
0.000000000394 Yukagir_Tundra.HO Yakutia_LNBA 1.16 0.0751 15.4
0.000000000394 Yukagir_Tundra.HO Yakut.HO -0.155 0.0751 -2.07
0.0000000000216 Yukagir_Tundra.HO Yakutia_LNBA 0.988 0.0231 42.9
0.0000000000216 Yukagir_Tundra.HO Khakass.HO 0.0118 0.0231 0.512
Tulosten perusteella näyttää siltä, että tundrajukagiireilla voi hyvinkin olla samantyyppistä perimää kuin itelmeneillä ja tšuktšeilla tai vaihtoehtoisesti jotain vanhempaa perimää, jota en tässä testannut. Zeng et al. eivät ottaneet huomioon sitä mahdollisuutta, koska heidän qpAdm-malleistaan puuttuu Chukotko-Kamchatkan- ja inuiittiperimä, vaikka ne ovat heillä mukana admixture-mallinnuksessa. Niinpä Zeng et al. mallintavat tundrajukagiirit pelkästään Yakutia_LNBA-perimällä, mutta sellainen malli ei mennyt minulla edes läpi, kun käytin parametria "allsnps = TRUE", koska silloin mallin p-arvo oli 0,0000000000491.
