Sivu 1/2

ViestiLähetetty: 18 Elo 2012 01:51
Kirjoittaja Eskous
Analysoituani taulukon dataa minusta näyttää siltä, että jonkinlainen sukulaisuussignaali alkaa erottua taustasta noin arvosta 0,765 ylöspäin. Vanhempi-lapsi IBS keskiarvo puolestaan on aineistossa noin 0,851.

Hahmottelin seuraavanlaisen empiirisen kaavan datalle, liekö miten pätevä? Ainakin siinä on ennakoitu eksponentiaalisuus mukana.
IBS[sukulainen1, sukulainen2] ~= 0,765 + (0,851 - 0,765) / 2^(n-k+1)

Jossa n (>0) on sukulaisuussuhteeseen vaadittujen hedelmöitymisten määrä, ja k (1 tai 2) on yhteisten lähimpien esivanhempien määrä.

Eli IBS[vanhempi, lapsi] (n = 1, k = 2; vanhemman vanhemmat ovat yhteisiä) olisi keskimäärin noin 0,765 + (0,851 - 0,765) / 2^(1-2+1) = 0,765 + 0,086 = 0,851.

IBS[isovanhempi, lapsenlapsi] (n = 2, k = 2) olisi keskimäärin noin 0,765 + 0,086/2 = 0,808. Tulosten ka on 0,8049. - Aika hyvä?

Toisinpäin sovellettuna: IBS = 0,7774. Vähennetään 0,765, jää 0,0124, jaetaan 0,086:lla, saadaan ~ 0,1442, otetaan käänteisluku ja käänteisluvusta 2-kantainen logaritmi, saadaan ~ 2,8. Lähin kokonaislukuarvoinen n - k + 1 on siis 3, eli n - k = 2. Oletetaan että k = 2, saadaan n = 4. Johtopäätös olisi että IBS on suuruusluokaltaan serkusten tasoa.

IBS 0,7651 vastaisi puolestaan noin 5th cousin once removed (n=11) tasoa.

ViestiLähetetty: 18 Elo 2012 08:36
Kirjoittaja Jaska
Hei tuohan vaikuttaa pätevältä, Eskous!
Tosin logaritmien kohdalla putosin kärryiltä... Olisiko mahdollista saada taulukkomuotoisena tai listauksena aukikirjoitettuja esimerkkejä kaikista eri n-arvoista?

ViestiLähetetty: 18 Elo 2012 10:41
Kirjoittaja Eskous
Ehkä on kätevämpää, jos saat kaavan suoraan omaan Excel-taulukkoosi. Tässä kaava lausekkeelle n - k + 1, jos sinulla on IBS arvo Excelin ruudussa A1:

=LN((0.851-0.765)/(A1-0.765))/LN(2)

eli jos k = 1 ("sukulaispuoli"), niin tuosta tulee suoraan n, ja jos k = 2, niin tuohon lisätään 1. Pyöristys k=2 lausekkeelle:

=ROUND(LN((0.851-0.765)/(A1-0.765))/LN(2); 0)+1

Kaavat eivät toimi IBS-arvoilla <= 0,765 (Excel antaa #DIV/0!). Suuremmat IBS:t kuin 0,851 ovat myös tavallaan määrittelyalueen ulkopuolella, mutta ei kaava heti 0,851:n yläpuolella hajoa.

ViestiLähetetty: 18 Elo 2012 12:45
Kirjoittaja Jaska
Eskous kirjoitti:Ehkä on kätevämpää, jos saat kaavan suoraan omaan Excel-taulukkoosi. Tässä kaava lausekkeelle n - k + 1, jos sinulla on IBS arvo Excelin ruudussa A1:

=LN((0.851-0.765)/(A1-0.765))/LN(2)

eli jos k = 1 ("sukulaispuoli"), niin tuosta tulee suoraan n, ja jos k = 2, niin tuohon lisätään 1. Pyöristys k=2 lausekkeelle:

=ROUND(LN((0.851-0.765)/(A1-0.765))/LN(2); 0)+1

Kaavat eivät toimi IBS-arvoilla <= 0,765 (Excel antaa #DIV/0!). Suuremmat IBS:t kuin 0,851 ovat myös tavallaan määrittelyalueen ulkopuolella, mutta ei kaava heti 0,851:n yläpuolella hajoa.

Kuulostaa kätevältä, mutta minun Excelilläni tuo ensimmäinen kaava ei toimi: se herjaa että kaavassa on virhe, ja kun muutin pisteet pilkuiksi, ruutuun ilmestyi vain #NIMI?

ViestiLähetetty: 18 Elo 2012 13:49
Kirjoittaja Eskous
Excelisi on sitten kaiketi suomenkielinen? LN on vissiin suomenkielisessä versiossa LUONNLOG, eli

=LUONNLOG((0.851-0.765)/(A1-0.765))/LUONNLOG(2)

Kaksikantaista logaritmia käyttäen, myös suomiversiossa:

=LOG((0.851-0.765)/(A1-0.765);2)

mutta arvo on sama, matemaattisestikin.

ViestiLähetetty: 18 Elo 2012 17:28
Kirjoittaja Jaska
Eskous kirjoitti:Excelisi on sitten kaiketi suomenkielinen? LN on vissiin suomenkielisessä versiossa LUONNLOG, eli

=LUONNLOG((0.851-0.765)/(A1-0.765))/LUONNLOG(2)

Kaksikantaista logaritmia käyttäen, myös suomiversiossa:

=LOG((0.851-0.765)/(A1-0.765);2)

mutta arvo on sama, matemaattisestikin.

Suomenkielinen on, joo. Taas se herjaa virheeksi, mutta kun taas koitan muuttaa pisteet pilkuiksi, ruutuun ilmestyy #ARVO!

ViestiLähetetty: 18 Elo 2012 21:44
Kirjoittaja Eskous
No sinulla ei sitten ole numeerista IBS arvoa solussa A1?

ViestiLähetetty: 18 Elo 2012 21:46
Kirjoittaja Sigfrid
Solu A1 arvo suattaapi olla viärä.

ViestiLähetetty: 19 Elo 2012 00:44
Kirjoittaja Jaska
Kokeilin tietysti monella solulla joissa on numero. Kaava on vain väärä. Onkohan Excelistä eri versioita, joissa olisi eri koodilyhenteet tietyille funktioille?

ViestiLähetetty: 19 Elo 2012 01:09
Kirjoittaja Eskous
=LOG10((0,851-0,765)/(A1-0,765))/LOG10(2)

Jos tuokaan ei pelitä, niin sinulla on joku ihme funktioista riisuttu Excel.

ViestiLähetetty: 19 Elo 2012 14:38
Kirjoittaja Jaska
Eskous kirjoitti:=LOG10((0,851-0,765)/(A1-0,765))/LOG10(2)

Jos tuokaan ei pelitä, niin sinulla on joku ihme funktioista riisuttu Excel.

Ei anna enää virheilmoitusta, mutta ruutuun ilmestyy #LUKU! eikä lukua.

Kokeilin poistaa kamaa loppupäästä, ja tämä alkupätkä kyllä toimii:
=LOG10(0,851-0,765)
Se antaa tulokseksi -1,0655.

Eiköhän ohjelmani tunnista useampia sulkeita, vai mikä voi kusta noin pahasti?

ViestiLähetetty: 19 Elo 2012 15:44
Kirjoittaja Sigfrid
Jaska kirjoitti:
Eskous kirjoitti:=LOG10((0,851-0,765)/(A1-0,765))/LOG10(2)

Jos tuokaan ei pelitä, niin sinulla on joku ihme funktioista riisuttu Excel.

Ei anna enää virheilmoitusta, mutta ruutuun ilmestyy #LUKU! eikä lukua.

Kokeilin poistaa kamaa loppupäästä, ja tämä alkupätkä kyllä toimii:
=LOG10(0,851-0,765)
Se antaa tulokseksi -1,0655.

Eiköhän ohjelmani tunnista useampia sulkeita, vai mikä voi kusta noin pahasti?


Olisiko A1 kentän formaatti viärä?

ViestiLähetetty: 19 Elo 2012 19:17
Kirjoittaja Eskous
Sigfrid lienee oikeilla jäljillä. Sulkuja samassa lausekkeessa Excel kyllä handlaa vaikka kuinka paljon.

Kokeilun vuoksi kaavaan voi tietty kirjoittaa A1-soluviitteen sijaan suoraan vaikka arvon 0,8. Mutta pakkohan sen on toimia.

ViestiLähetetty: 19 Elo 2012 19:27
Kirjoittaja Jaska
Eskous kirjoitti:Sigfrid lienee oikeilla jäljillä. Sulkuja samassa lausekkeessa Excel kyllä handlaa vaikka kuinka paljon.

Kokeilun vuoksi kaavaan voi tietty kirjoittaa A1-soluviitteen sijaan suoraan vaikka arvon 0,8. Mutta pakkohan sen on toimia.

Kokeilin muuttaa numerosolun luvuksi ja laskennaksi, ei muutosta: virheilmoitus edelleen.

Myöskään soluviitteen korvaaminen 0,8:lla ei auta: virheilmoitus. Eli jostain syystä Excelini ei vain hyväksy tuollaista kaavaa. Kun poistan lopun, se toimii korvattuna:

=LOG10((0,851-0,765)/(0,8-0,765)) = 0,39043

Mutta typistettynäkään se ei hyväksy numerosoluviitteitä.

ViestiLähetetty: 19 Elo 2012 22:42
Kirjoittaja Eskous
Minä luovutan. Tämä on ihan ufoa. "There is a great disturbance in the Force", tai jotain.

Chuck Norris pitäisi nyt saada apuun. Sehän pystyy jakamaan jopa nollalla, niin että kaihan se nyt saisi vaikka kierrepotkulla sun Excelin jakamaan LOG10(2):llä!

ViestiLähetetty: 23 Elo 2012 19:36
Kirjoittaja Jaska
Eskous kirjoitti:Minä luovutan. Tämä on ihan ufoa. "There is a great disturbance in the Force", tai jotain.

Chuck Norris pitäisi nyt saada apuun. Sehän pystyy jakamaan jopa nollalla, niin että kaihan se nyt saisi vaikka kierrepotkulla sun Excelin jakamaan LOG10(2):llä!

Chuck auttoi, sain suomenkieliseen Exceliin valmiiksi kaavoitetun taulukon. Tuo on kyllä erittäin lupaava kaava joka selittää sukulaisten arvojen sitä suuremman nousun mitä läheisempi sukulaisuus, ja näyttää siltä, että kynnys 0,7650 on juuri se, jonka yläpuolella todellista sukulaisuutta alkaa ilmetä. Tosin jotkut yksilöt ovat lähellä lähes kaikkia ja toiset kaukana kaikista; epäilen tämän liittyvän homotsygoottisuuteen.

Eskous, minulla olisi lisätoive.

X-kromosomissa on sellainen mielenkiintoinen ilmiö, että kaikilla naisilla keskenään sen IBS on suurempi kuin miehillä keskenään, ihan kansallisuuteen katsomatta. Tämä johtunee jotenkin siitä, että miehillä genotyyppi on kahdennettu, koska heillä on vain yksi X-kromosomi, eli miehet ovat 100 % homotsygoottisia (molemmat alleelit aina samat). Kuitenkaan miesten ja naisten välisissä arvoissa ei ole havaittavissa mitään vääristymää, vaan arvot ovat samalla tasolla kuin miehillä keskenään.

Saisitko jotain tolkkua/kaavaa näiden pohjalta, kun X-kromosomi periytyy eri lailla miehillä ja naisilla:
http://freepages.genealogy.rootsweb.anc ... ration.pdf

Ongelmaksi voi tosin muodostua se, että naisilla X-kromosomi joko rekombinoituu tai sitten ei...
http://dnamatches.blogspot.fi/2012/07/u ... tance.html

Esimerkkidatasta olennaisia arvoja:

0,8694 äiti-tytär
0,8681 isän äiti-pojantytär
0,7844 suurin ei-sukulaisten naisten välinen arvo
0,7723 pienin naisten välinen arvo
(hajonta 0,0121)

0,7456 suurin miesten välinen arvo
0,7193 pienin miesten välinen arvo
(hajonta 0,0265)

Miesten hajonta on siis kaksinkertainen naisten hajontaan verrattuna, vaikka molemmissa ryhmissä on suomalaisia eri puolilta sekä muita eurooppalaisia.

ViestiLähetetty: 25 Elo 2012 01:42
Kirjoittaja Eskous
Mainiota että Chuck Norriskin tiedostaa miten tärkeää näitä juttuja on tutkia. ;)

Jep, olen jo vähän pohdiskellut noita X-kromosomituloksia ja niihin liittyviä laskuja. Ensimmäiset laskelmani näyttivät tuottavan ihan järjellisen oloisia tuloksia, mutta niistä on vielä matkaa johonkin yleisluontoisempaan kaavaan.

Muuten, hoksasin että autosomaaleissa minulle tuli sormillalaskufiba, kun väitin: "IBS 0,7651 vastaisi puolestaan noin 5th cousin once removed (n=11) tasoa". Eihän se oikeasti vastaa kuin 4th cousin once removed -tasoa.

ViestiLähetetty: 28 Elo 2012 02:37
Kirjoittaja Jaska
Millaisia tuloksia saisi jos lähtisi kaivelemaan alle 0,7650:n olevia arvoja; uusi kaava kaiketi pitäisi vääntää, mutta jos säilyisi sama suhde, niin voisi lähteä arvailemaan väestöjen erkaantumisaikoja. Tosin keksin heti pari ongelmakohtaa:

1. Myöhemmät geenivirrat sotkevat kuvaa;
2. Geneettinen ajautuminen saattaa nopeuttaa eriytymistä myös IBS-tasolla.

ViestiLähetetty: 09 Syys 2012 01:25
Kirjoittaja Jaska
Saatiin ensimmäinen serkusten välinen IBS-arvo: 0,7826.
Eskouksen laskuri antaa N=3 kun K=2, eli se olettaa näin korkeaa arvoa esim. sedän ja veljenpojan välille; serkusten eli N=4 arvo olisi sen mukaan 0,7802 ja sen alle.

Pienen hienosäädön voisi ehkä kaavaan tehdä tällä perusteella? Lupaavaa kyllä muuten, että oletettu serkkuraja oli kuitenkin noin lähellä. :)

Sisaruspareja on kaksi, ja hyvin tasaista on: yhden parin välinen arvo on 0,8511, toisen 0,8512. Mutta tätä lienee hankala ympätä kaavaan?

ViestiLähetetty: 25 Syys 2012 19:12
Kirjoittaja Jaska
Sattuisiko kellään olemaan hajua, voiko sellaisen kuin "Wards minimum variance" laskea Excelin avulla?