Toukokuussa 2021 on julkaistu Annina Preusnerin hieno pro gradu -tutkielma: Assessing Finnish Y-chromosomal haplogroups using genotyping array data : towards understanding the role of Y in complex disease
Mitään yllätyksiä tutkimuksesta ei haploryhmäjaon osalta ilmene. Aikaisempiin tutkimuksiin verrattuna aineisto on kuitenkin omaa luokkaansa, joten tilastollinen luotettavuus lienee huippuluokkaa. Haploryhmäjako löytyy sekä 33 001 miehen että 24 160 miehen otokselle. Niiden kesken ei ole juurikaan eroa.
Tässä on tuon jälkimmäisen otoksen haploryhmäjako:
N1c1 60,18 %
I1 26,44 %
R1a1 5,99 %
R1b 5,01 %
I2 0,97 %
E1b1 0,51 %
Kuvassa 7 (Fig 7) Suomi on jaettu kahtia Länsi-Suomeen ja Itä-Suomeen. Odotetusti N1c1 nousee idässä, eli lännessä osuus on 53,8 % ja idässä 71,6 %. Muiden haploryhmien osuus kasvaa lännessä yksittäisten haploryhmien osalta noin 50-100 %, eli esim. R1b:n osuus kasvaa 3,1 prosentista 6,1 prosenttiin.
Tutkimuksesta käyvät ilmi myös kahden aiemman tutkimuksen luvut N1c1:n ja I1:n osalta. Tutkimukset ovat Lappalainen et al. 2006 ja Neuvonen et al. 2015. Ero Lappalaisen tutkimukseen, jonka N1c1-otos on 312 miestä, on pieni. Tässä uudessa tutkimuksessa N1c1-otos on peräti 14 397 miestä. N1c1:n osuus on Lappalaisella 58,2, eli Lappalaisen tutkimuksessa on todennäköisesti enemmän näytteitä lännestä. Sitä vastoin erot Neuvosen tutkimukseen ovat merkittäviä. Neuvosen N1c1-otos on 289 miestä ja prosenttiosuus 49,5.
Jos halutaan viitata suomalaisten miesten haploryhmäjakaumaan, tämä uusi tutkimus lienee paras referenssi. Alueellista jakautumaa selitetään seuraavasti:
"Sample frequencies were calculated within each of the 18 Finnish regions (N = 23 074), excluding samples from abroad and ceded Karelia. The sample frequencies of each birth region were compared with the population structure of Finland from 2019 (https://www.tilastokeskus.fi/tup/suoluk ... y%20region 10.1.2021) to infer the representativeness of different regions in Finland in the data. The correlation between the distribution of samples in the dataset and the regional distribution of the Finnish population (Pearson r = 0.94; 95% CI = 0.85-0.98; p = 2.5x10-9) implied that the dataset comprehensively represented Finland."
https://helda.helsinki.fi/handle/10138/ ... tribute=fi