IBS-excelöintiä

Apuohjelmia eri tieteenaloille.

ViestiKirjoittaja Eskous » 18 Elo 2012 01:51

Analysoituani taulukon dataa minusta näyttää siltä, että jonkinlainen sukulaisuussignaali alkaa erottua taustasta noin arvosta 0,765 ylöspäin. Vanhempi-lapsi IBS keskiarvo puolestaan on aineistossa noin 0,851.

Hahmottelin seuraavanlaisen empiirisen kaavan datalle, liekö miten pätevä? Ainakin siinä on ennakoitu eksponentiaalisuus mukana.
IBS[sukulainen1, sukulainen2] ~= 0,765 + (0,851 - 0,765) / 2^(n-k+1)

Jossa n (>0) on sukulaisuussuhteeseen vaadittujen hedelmöitymisten määrä, ja k (1 tai 2) on yhteisten lähimpien esivanhempien määrä.

Eli IBS[vanhempi, lapsi] (n = 1, k = 2; vanhemman vanhemmat ovat yhteisiä) olisi keskimäärin noin 0,765 + (0,851 - 0,765) / 2^(1-2+1) = 0,765 + 0,086 = 0,851.

IBS[isovanhempi, lapsenlapsi] (n = 2, k = 2) olisi keskimäärin noin 0,765 + 0,086/2 = 0,808. Tulosten ka on 0,8049. - Aika hyvä?

Toisinpäin sovellettuna: IBS = 0,7774. Vähennetään 0,765, jää 0,0124, jaetaan 0,086:lla, saadaan ~ 0,1442, otetaan käänteisluku ja käänteisluvusta 2-kantainen logaritmi, saadaan ~ 2,8. Lähin kokonaislukuarvoinen n - k + 1 on siis 3, eli n - k = 2. Oletetaan että k = 2, saadaan n = 4. Johtopäätös olisi että IBS on suuruusluokaltaan serkusten tasoa.

IBS 0,7651 vastaisi puolestaan noin 5th cousin once removed (n=11) tasoa.
Eskous
Lipevä lappilainen
Lipevä lappilainen
 
Viestit: 480
Liittynyt: 31 Heinä 2012 00:05

ViestiKirjoittaja Jaska » 18 Elo 2012 08:36

Hei tuohan vaikuttaa pätevältä, Eskous!
Tosin logaritmien kohdalla putosin kärryiltä... Olisiko mahdollista saada taulukkomuotoisena tai listauksena aukikirjoitettuja esimerkkejä kaikista eri n-arvoista?
~ "Per aspera ad hominem - vaikeuksien kautta henkilökohtaisuuksiin" ~

Y-DNA: N1c1-YP1143 (Olavi Häkkinen 1620 Kuhmo? >> Juhani Häkkinen 1816 Eno)
mtDNA: H5a1e (Elina Mäkilä 1757 Kittilä >> Riitta Sassali 1843 Sodankylä)
Avatar
Jaska
Ylihärmiö
Ylihärmiö
 
Viestit: 10062
Liittynyt: 14 Helmi 2011 04:02

ViestiKirjoittaja Eskous » 18 Elo 2012 10:41

Ehkä on kätevämpää, jos saat kaavan suoraan omaan Excel-taulukkoosi. Tässä kaava lausekkeelle n - k + 1, jos sinulla on IBS arvo Excelin ruudussa A1:

=LN((0.851-0.765)/(A1-0.765))/LN(2)

eli jos k = 1 ("sukulaispuoli"), niin tuosta tulee suoraan n, ja jos k = 2, niin tuohon lisätään 1. Pyöristys k=2 lausekkeelle:

=ROUND(LN((0.851-0.765)/(A1-0.765))/LN(2); 0)+1

Kaavat eivät toimi IBS-arvoilla <= 0,765 (Excel antaa #DIV/0!). Suuremmat IBS:t kuin 0,851 ovat myös tavallaan määrittelyalueen ulkopuolella, mutta ei kaava heti 0,851:n yläpuolella hajoa.
Eskous
Lipevä lappilainen
Lipevä lappilainen
 
Viestit: 480
Liittynyt: 31 Heinä 2012 00:05

ViestiKirjoittaja Jaska » 18 Elo 2012 12:45

Eskous kirjoitti:Ehkä on kätevämpää, jos saat kaavan suoraan omaan Excel-taulukkoosi. Tässä kaava lausekkeelle n - k + 1, jos sinulla on IBS arvo Excelin ruudussa A1:

=LN((0.851-0.765)/(A1-0.765))/LN(2)

eli jos k = 1 ("sukulaispuoli"), niin tuosta tulee suoraan n, ja jos k = 2, niin tuohon lisätään 1. Pyöristys k=2 lausekkeelle:

=ROUND(LN((0.851-0.765)/(A1-0.765))/LN(2); 0)+1

Kaavat eivät toimi IBS-arvoilla <= 0,765 (Excel antaa #DIV/0!). Suuremmat IBS:t kuin 0,851 ovat myös tavallaan määrittelyalueen ulkopuolella, mutta ei kaava heti 0,851:n yläpuolella hajoa.

Kuulostaa kätevältä, mutta minun Excelilläni tuo ensimmäinen kaava ei toimi: se herjaa että kaavassa on virhe, ja kun muutin pisteet pilkuiksi, ruutuun ilmestyi vain #NIMI?
~ "Per aspera ad hominem - vaikeuksien kautta henkilökohtaisuuksiin" ~

Y-DNA: N1c1-YP1143 (Olavi Häkkinen 1620 Kuhmo? >> Juhani Häkkinen 1816 Eno)
mtDNA: H5a1e (Elina Mäkilä 1757 Kittilä >> Riitta Sassali 1843 Sodankylä)
Avatar
Jaska
Ylihärmiö
Ylihärmiö
 
Viestit: 10062
Liittynyt: 14 Helmi 2011 04:02

ViestiKirjoittaja Eskous » 18 Elo 2012 13:49

Excelisi on sitten kaiketi suomenkielinen? LN on vissiin suomenkielisessä versiossa LUONNLOG, eli

=LUONNLOG((0.851-0.765)/(A1-0.765))/LUONNLOG(2)

Kaksikantaista logaritmia käyttäen, myös suomiversiossa:

=LOG((0.851-0.765)/(A1-0.765);2)

mutta arvo on sama, matemaattisestikin.
Eskous
Lipevä lappilainen
Lipevä lappilainen
 
Viestit: 480
Liittynyt: 31 Heinä 2012 00:05

ViestiKirjoittaja Jaska » 18 Elo 2012 17:28

Eskous kirjoitti:Excelisi on sitten kaiketi suomenkielinen? LN on vissiin suomenkielisessä versiossa LUONNLOG, eli

=LUONNLOG((0.851-0.765)/(A1-0.765))/LUONNLOG(2)

Kaksikantaista logaritmia käyttäen, myös suomiversiossa:

=LOG((0.851-0.765)/(A1-0.765);2)

mutta arvo on sama, matemaattisestikin.

Suomenkielinen on, joo. Taas se herjaa virheeksi, mutta kun taas koitan muuttaa pisteet pilkuiksi, ruutuun ilmestyy #ARVO!
~ "Per aspera ad hominem - vaikeuksien kautta henkilökohtaisuuksiin" ~

Y-DNA: N1c1-YP1143 (Olavi Häkkinen 1620 Kuhmo? >> Juhani Häkkinen 1816 Eno)
mtDNA: H5a1e (Elina Mäkilä 1757 Kittilä >> Riitta Sassali 1843 Sodankylä)
Avatar
Jaska
Ylihärmiö
Ylihärmiö
 
Viestit: 10062
Liittynyt: 14 Helmi 2011 04:02

ViestiKirjoittaja Eskous » 18 Elo 2012 21:44

No sinulla ei sitten ole numeerista IBS arvoa solussa A1?
Eskous
Lipevä lappilainen
Lipevä lappilainen
 
Viestit: 480
Liittynyt: 31 Heinä 2012 00:05

ViestiKirjoittaja Sigfrid » 18 Elo 2012 21:46

Solu A1 arvo suattaapi olla viärä.
Sigfrid
SuuBaltti
SuuBaltti
 
Viestit: 6534
Liittynyt: 16 Helmi 2011 12:09

ViestiKirjoittaja Jaska » 19 Elo 2012 00:44

Kokeilin tietysti monella solulla joissa on numero. Kaava on vain väärä. Onkohan Excelistä eri versioita, joissa olisi eri koodilyhenteet tietyille funktioille?
~ "Per aspera ad hominem - vaikeuksien kautta henkilökohtaisuuksiin" ~

Y-DNA: N1c1-YP1143 (Olavi Häkkinen 1620 Kuhmo? >> Juhani Häkkinen 1816 Eno)
mtDNA: H5a1e (Elina Mäkilä 1757 Kittilä >> Riitta Sassali 1843 Sodankylä)
Avatar
Jaska
Ylihärmiö
Ylihärmiö
 
Viestit: 10062
Liittynyt: 14 Helmi 2011 04:02

ViestiKirjoittaja Eskous » 19 Elo 2012 01:09

=LOG10((0,851-0,765)/(A1-0,765))/LOG10(2)

Jos tuokaan ei pelitä, niin sinulla on joku ihme funktioista riisuttu Excel.
Eskous
Lipevä lappilainen
Lipevä lappilainen
 
Viestit: 480
Liittynyt: 31 Heinä 2012 00:05

ViestiKirjoittaja Jaska » 19 Elo 2012 14:38

Eskous kirjoitti:=LOG10((0,851-0,765)/(A1-0,765))/LOG10(2)

Jos tuokaan ei pelitä, niin sinulla on joku ihme funktioista riisuttu Excel.

Ei anna enää virheilmoitusta, mutta ruutuun ilmestyy #LUKU! eikä lukua.

Kokeilin poistaa kamaa loppupäästä, ja tämä alkupätkä kyllä toimii:
=LOG10(0,851-0,765)
Se antaa tulokseksi -1,0655.

Eiköhän ohjelmani tunnista useampia sulkeita, vai mikä voi kusta noin pahasti?
~ "Per aspera ad hominem - vaikeuksien kautta henkilökohtaisuuksiin" ~

Y-DNA: N1c1-YP1143 (Olavi Häkkinen 1620 Kuhmo? >> Juhani Häkkinen 1816 Eno)
mtDNA: H5a1e (Elina Mäkilä 1757 Kittilä >> Riitta Sassali 1843 Sodankylä)
Avatar
Jaska
Ylihärmiö
Ylihärmiö
 
Viestit: 10062
Liittynyt: 14 Helmi 2011 04:02

ViestiKirjoittaja Sigfrid » 19 Elo 2012 15:44

Jaska kirjoitti:
Eskous kirjoitti:=LOG10((0,851-0,765)/(A1-0,765))/LOG10(2)

Jos tuokaan ei pelitä, niin sinulla on joku ihme funktioista riisuttu Excel.

Ei anna enää virheilmoitusta, mutta ruutuun ilmestyy #LUKU! eikä lukua.

Kokeilin poistaa kamaa loppupäästä, ja tämä alkupätkä kyllä toimii:
=LOG10(0,851-0,765)
Se antaa tulokseksi -1,0655.

Eiköhän ohjelmani tunnista useampia sulkeita, vai mikä voi kusta noin pahasti?


Olisiko A1 kentän formaatti viärä?
Sigfrid
SuuBaltti
SuuBaltti
 
Viestit: 6534
Liittynyt: 16 Helmi 2011 12:09

ViestiKirjoittaja Eskous » 19 Elo 2012 19:17

Sigfrid lienee oikeilla jäljillä. Sulkuja samassa lausekkeessa Excel kyllä handlaa vaikka kuinka paljon.

Kokeilun vuoksi kaavaan voi tietty kirjoittaa A1-soluviitteen sijaan suoraan vaikka arvon 0,8. Mutta pakkohan sen on toimia.
Eskous
Lipevä lappilainen
Lipevä lappilainen
 
Viestit: 480
Liittynyt: 31 Heinä 2012 00:05

ViestiKirjoittaja Jaska » 19 Elo 2012 19:27

Eskous kirjoitti:Sigfrid lienee oikeilla jäljillä. Sulkuja samassa lausekkeessa Excel kyllä handlaa vaikka kuinka paljon.

Kokeilun vuoksi kaavaan voi tietty kirjoittaa A1-soluviitteen sijaan suoraan vaikka arvon 0,8. Mutta pakkohan sen on toimia.

Kokeilin muuttaa numerosolun luvuksi ja laskennaksi, ei muutosta: virheilmoitus edelleen.

Myöskään soluviitteen korvaaminen 0,8:lla ei auta: virheilmoitus. Eli jostain syystä Excelini ei vain hyväksy tuollaista kaavaa. Kun poistan lopun, se toimii korvattuna:

=LOG10((0,851-0,765)/(0,8-0,765)) = 0,39043

Mutta typistettynäkään se ei hyväksy numerosoluviitteitä.
~ "Per aspera ad hominem - vaikeuksien kautta henkilökohtaisuuksiin" ~

Y-DNA: N1c1-YP1143 (Olavi Häkkinen 1620 Kuhmo? >> Juhani Häkkinen 1816 Eno)
mtDNA: H5a1e (Elina Mäkilä 1757 Kittilä >> Riitta Sassali 1843 Sodankylä)
Avatar
Jaska
Ylihärmiö
Ylihärmiö
 
Viestit: 10062
Liittynyt: 14 Helmi 2011 04:02

ViestiKirjoittaja Eskous » 19 Elo 2012 22:42

Minä luovutan. Tämä on ihan ufoa. "There is a great disturbance in the Force", tai jotain.

Chuck Norris pitäisi nyt saada apuun. Sehän pystyy jakamaan jopa nollalla, niin että kaihan se nyt saisi vaikka kierrepotkulla sun Excelin jakamaan LOG10(2):llä!
Eskous
Lipevä lappilainen
Lipevä lappilainen
 
Viestit: 480
Liittynyt: 31 Heinä 2012 00:05

ViestiKirjoittaja Jaska » 23 Elo 2012 19:36

Eskous kirjoitti:Minä luovutan. Tämä on ihan ufoa. "There is a great disturbance in the Force", tai jotain.

Chuck Norris pitäisi nyt saada apuun. Sehän pystyy jakamaan jopa nollalla, niin että kaihan se nyt saisi vaikka kierrepotkulla sun Excelin jakamaan LOG10(2):llä!

Chuck auttoi, sain suomenkieliseen Exceliin valmiiksi kaavoitetun taulukon. Tuo on kyllä erittäin lupaava kaava joka selittää sukulaisten arvojen sitä suuremman nousun mitä läheisempi sukulaisuus, ja näyttää siltä, että kynnys 0,7650 on juuri se, jonka yläpuolella todellista sukulaisuutta alkaa ilmetä. Tosin jotkut yksilöt ovat lähellä lähes kaikkia ja toiset kaukana kaikista; epäilen tämän liittyvän homotsygoottisuuteen.

Eskous, minulla olisi lisätoive.

X-kromosomissa on sellainen mielenkiintoinen ilmiö, että kaikilla naisilla keskenään sen IBS on suurempi kuin miehillä keskenään, ihan kansallisuuteen katsomatta. Tämä johtunee jotenkin siitä, että miehillä genotyyppi on kahdennettu, koska heillä on vain yksi X-kromosomi, eli miehet ovat 100 % homotsygoottisia (molemmat alleelit aina samat). Kuitenkaan miesten ja naisten välisissä arvoissa ei ole havaittavissa mitään vääristymää, vaan arvot ovat samalla tasolla kuin miehillä keskenään.

Saisitko jotain tolkkua/kaavaa näiden pohjalta, kun X-kromosomi periytyy eri lailla miehillä ja naisilla:
http://freepages.genealogy.rootsweb.anc ... ration.pdf

Ongelmaksi voi tosin muodostua se, että naisilla X-kromosomi joko rekombinoituu tai sitten ei...
http://dnamatches.blogspot.fi/2012/07/u ... tance.html

Esimerkkidatasta olennaisia arvoja:

0,8694 äiti-tytär
0,8681 isän äiti-pojantytär
0,7844 suurin ei-sukulaisten naisten välinen arvo
0,7723 pienin naisten välinen arvo
(hajonta 0,0121)

0,7456 suurin miesten välinen arvo
0,7193 pienin miesten välinen arvo
(hajonta 0,0265)

Miesten hajonta on siis kaksinkertainen naisten hajontaan verrattuna, vaikka molemmissa ryhmissä on suomalaisia eri puolilta sekä muita eurooppalaisia.
~ "Per aspera ad hominem - vaikeuksien kautta henkilökohtaisuuksiin" ~

Y-DNA: N1c1-YP1143 (Olavi Häkkinen 1620 Kuhmo? >> Juhani Häkkinen 1816 Eno)
mtDNA: H5a1e (Elina Mäkilä 1757 Kittilä >> Riitta Sassali 1843 Sodankylä)
Avatar
Jaska
Ylihärmiö
Ylihärmiö
 
Viestit: 10062
Liittynyt: 14 Helmi 2011 04:02

ViestiKirjoittaja Eskous » 25 Elo 2012 01:42

Mainiota että Chuck Norriskin tiedostaa miten tärkeää näitä juttuja on tutkia. ;)

Jep, olen jo vähän pohdiskellut noita X-kromosomituloksia ja niihin liittyviä laskuja. Ensimmäiset laskelmani näyttivät tuottavan ihan järjellisen oloisia tuloksia, mutta niistä on vielä matkaa johonkin yleisluontoisempaan kaavaan.

Muuten, hoksasin että autosomaaleissa minulle tuli sormillalaskufiba, kun väitin: "IBS 0,7651 vastaisi puolestaan noin 5th cousin once removed (n=11) tasoa". Eihän se oikeasti vastaa kuin 4th cousin once removed -tasoa.
Eskous
Lipevä lappilainen
Lipevä lappilainen
 
Viestit: 480
Liittynyt: 31 Heinä 2012 00:05

ViestiKirjoittaja Jaska » 28 Elo 2012 02:37

Millaisia tuloksia saisi jos lähtisi kaivelemaan alle 0,7650:n olevia arvoja; uusi kaava kaiketi pitäisi vääntää, mutta jos säilyisi sama suhde, niin voisi lähteä arvailemaan väestöjen erkaantumisaikoja. Tosin keksin heti pari ongelmakohtaa:

1. Myöhemmät geenivirrat sotkevat kuvaa;
2. Geneettinen ajautuminen saattaa nopeuttaa eriytymistä myös IBS-tasolla.
~ "Per aspera ad hominem - vaikeuksien kautta henkilökohtaisuuksiin" ~

Y-DNA: N1c1-YP1143 (Olavi Häkkinen 1620 Kuhmo? >> Juhani Häkkinen 1816 Eno)
mtDNA: H5a1e (Elina Mäkilä 1757 Kittilä >> Riitta Sassali 1843 Sodankylä)
Avatar
Jaska
Ylihärmiö
Ylihärmiö
 
Viestit: 10062
Liittynyt: 14 Helmi 2011 04:02

ViestiKirjoittaja Jaska » 09 Syys 2012 01:25

Saatiin ensimmäinen serkusten välinen IBS-arvo: 0,7826.
Eskouksen laskuri antaa N=3 kun K=2, eli se olettaa näin korkeaa arvoa esim. sedän ja veljenpojan välille; serkusten eli N=4 arvo olisi sen mukaan 0,7802 ja sen alle.

Pienen hienosäädön voisi ehkä kaavaan tehdä tällä perusteella? Lupaavaa kyllä muuten, että oletettu serkkuraja oli kuitenkin noin lähellä. :)

Sisaruspareja on kaksi, ja hyvin tasaista on: yhden parin välinen arvo on 0,8511, toisen 0,8512. Mutta tätä lienee hankala ympätä kaavaan?
~ "Per aspera ad hominem - vaikeuksien kautta henkilökohtaisuuksiin" ~

Y-DNA: N1c1-YP1143 (Olavi Häkkinen 1620 Kuhmo? >> Juhani Häkkinen 1816 Eno)
mtDNA: H5a1e (Elina Mäkilä 1757 Kittilä >> Riitta Sassali 1843 Sodankylä)
Avatar
Jaska
Ylihärmiö
Ylihärmiö
 
Viestit: 10062
Liittynyt: 14 Helmi 2011 04:02

ViestiKirjoittaja Jaska » 25 Syys 2012 19:12

Sattuisiko kellään olemaan hajua, voiko sellaisen kuin "Wards minimum variance" laskea Excelin avulla?
~ "Per aspera ad hominem - vaikeuksien kautta henkilökohtaisuuksiin" ~

Y-DNA: N1c1-YP1143 (Olavi Häkkinen 1620 Kuhmo? >> Juhani Häkkinen 1816 Eno)
mtDNA: H5a1e (Elina Mäkilä 1757 Kittilä >> Riitta Sassali 1843 Sodankylä)
Avatar
Jaska
Ylihärmiö
Ylihärmiö
 
Viestit: 10062
Liittynyt: 14 Helmi 2011 04:02

Seuraava

Paluu Tietotekniikka

Paikallaolijat

Käyttäjiä lukemassa tätä aluetta: Ei rekisteröityneitä käyttäjiä ja 1 vierailijaa