R-ohjelma

Apuohjelmia eri tieteenaloille.

R-ohjelma

ViestiKirjoittaja Jaska » 19 Tammi 2015 20:33

Onkohan joku jo jossain täällä foorumilla laittanut ohjeita siihen, miten R-ohjelmalla ajetaan oma DNA-tiedosto eri DIY-laskureissa? (Kuten Sigfridin erinomaisessa Kalevassa.) "R" on liian lyhyt hakutoimintoon (minimi 3 kirjainta), ja "R-ohjelma" ei tuota tuloksia.

Jaksaisiko joku noita pyöritellyt laatia lyhyen ohjeistuksen tänne?
~ "Per aspera ad hominem - vaikeuksien kautta henkilökohtaisuuksiin" ~

Y-DNA: N1c1-YP1143 (Olavi Häkkinen 1620 Kuhmo? >> Juhani Häkkinen 1816 Eno)
mtDNA: H5a1e (Elina Mäkilä 1757 Kittilä >> Riitta Sassali 1843 Sodankylä)
Avatar
Jaska
Ylihärmiö
Ylihärmiö
 
Viestit: 11086
Liittynyt: 14 Helmi 2011 04:02

Re: R-ohjelma

ViestiKirjoittaja Kinaporin kalifi » 19 Tammi 2015 21:36

Sipin paketin mukana tuleva README sisältää aika hyvät ohjeet, katsoitko jo sitä?
Avatar
Kinaporin kalifi
SuuBaltti
SuuBaltti
 
Viestit: 6958
Liittynyt: 14 Helmi 2011 19:18

Re: R-ohjelma

ViestiKirjoittaja Giösta » 20 Tammi 2015 01:04

Imuroin R:än ja asensin
Imuroin DIYKALEVA.zip ja DIYDodecad2.1.rar ja purkasin ne tyhjään kansioon
Kopioin 23andme ja ftdna rawdatat tuonne samaan kansioon ja nimesin ne lyhyeksi
käynnistin R:än ja annoin nuo muutamat komennot:
setwd('c:\\users\\xxx\\Tyhjakansio')
source('standardize.r')

standardize('henkilo1.txt', company='23andMe')
system('DIYDodecadWin dv3.par')
ja copy-pastesin ikkunasta tulokset talteen

sitten seuraava henkilö
standardize('henkilo2.csv', company='ftdna')
system('DIYDodecadWin dv3.par')
jne

Onko tämä sellainen lopputulos kuin pitääkin? Eli tällaisia voisi postailla tuonne tuloksia eri projekteista -ketjuun?

----------------------------
FINAL ADMIXTURE PROPORTIONS:
----------------------------

30.15% East_European
48.07% West_European
13.09% Mediterranean
0.00% Neo_African
1.47% West_Asian
1.06% South_Asian
5.06% Northeast_Asian
1.09% Southeast_Asian
0.00% East_African
0.00% Southwest_Asian
0.00% Northwest_African
0.00% Palaeo_African
Avatar
Giösta
Lipevä lappilainen
Lipevä lappilainen
 
Viestit: 416
Liittynyt: 10 Touko 2013 04:50

Re: R-ohjelma

ViestiKirjoittaja Jaska » 20 Tammi 2015 01:49

Kinaporin kalifi kirjoitti:Sipin paketin mukana tuleva README sisältää aika hyvät ohjeet, katsoitko jo sitä?

Ymmärsin, että nuo DIY-dodecad-ohjeet ovat niille, jotka tekevät niitä laskureita... Ilmeisesti Giösta löysi sieltä sopivat kohdat niille, jotka haluavat ajattaa tulostiedostonsa.
~ "Per aspera ad hominem - vaikeuksien kautta henkilökohtaisuuksiin" ~

Y-DNA: N1c1-YP1143 (Olavi Häkkinen 1620 Kuhmo? >> Juhani Häkkinen 1816 Eno)
mtDNA: H5a1e (Elina Mäkilä 1757 Kittilä >> Riitta Sassali 1843 Sodankylä)
Avatar
Jaska
Ylihärmiö
Ylihärmiö
 
Viestit: 11086
Liittynyt: 14 Helmi 2011 04:02

Re: R-ohjelma

ViestiKirjoittaja Jaska » 20 Tammi 2015 02:38

Giösta kirjoitti:Imuroin R:än ja asensin
Imuroin DIYKALEVA.zip ja DIYDodecad2.1.rar ja purkasin ne tyhjään kansioon
Kopioin 23andme ja ftdna rawdatat tuonne samaan kansioon ja nimesin ne lyhyeksi
käynnistin R:än ja annoin nuo muutamat komennot:
setwd('c:\\users\\xxx\\Tyhjakansio')
source('standardize.r')

standardize('henkilo1.txt', company='23andMe')
system('DIYDodecadWin dv3.par')
ja copy-pastesin ikkunasta tulokset talteen

sitten seuraava henkilö
standardize('henkilo2.csv', company='ftdna')
system('DIYDodecadWin dv3.par')
jne

Onko tämä sellainen lopputulos kuin pitääkin? Eli tällaisia voisi postailla tuonne tuloksia eri projekteista -ketjuun?

----------------------------
FINAL ADMIXTURE PROPORTIONS:
----------------------------

30.15% East_European
48.07% West_European
13.09% Mediterranean
0.00% Neo_African
1.47% West_Asian
1.06% South_Asian
5.06% Northeast_Asian
1.09% Southeast_Asian
0.00% East_African
0.00% Southwest_Asian
0.00% Northwest_African
0.00% Palaeo_African

Sinulla se toimi! Meni siis oikein. Minulla ei toimi. Kolme ensimmäistä käskyä toimi:

1: setwd('c:\\Jaska\\Geenilaskurit\\Kaleva\\Kaleva2')
(se hakemisto, mihin diykaleva2.zip on purettu)

2: source('standardize.r')

3: standardize('Jaska.csv', company='ftdna')
(oma Family Finder -datatiedosto lyhyeksi nimettynä)

4: system('DIYDodecadWin') -- EI TOIMI
system('DIYDodecadWin.par') -- EI TOIMI
system('DIYDodecadWin dv3.par') -- EI TOIMI
system('K7a.par') -- EI TOIMI

"Warning message:
running command 'K7a.par' [tai 'DIYDodecadWin.par'] had status 127"

Eli mikä tässä menee pieleen? Tiedoston nimi kansiossa on kuten ekalla ja neljännellä rivillä. README-tiedosto ei auta tässä, sen mukaan noiden käskyjen pitäisi toimia.
~ "Per aspera ad hominem - vaikeuksien kautta henkilökohtaisuuksiin" ~

Y-DNA: N1c1-YP1143 (Olavi Häkkinen 1620 Kuhmo? >> Juhani Häkkinen 1816 Eno)
mtDNA: H5a1e (Elina Mäkilä 1757 Kittilä >> Riitta Sassali 1843 Sodankylä)
Avatar
Jaska
Ylihärmiö
Ylihärmiö
 
Viestit: 11086
Liittynyt: 14 Helmi 2011 04:02

Re: R-ohjelma

ViestiKirjoittaja Kinaporin kalifi » 20 Tammi 2015 10:06

Jaska kirjoitti:system('DIYDodecadWin dv3.par') -- EI TOIMI

Eli mikä tässä menee pieleen? Tiedoston nimi kansiossa on kuten ekalla ja neljännellä rivillä. README-tiedosto ei auta tässä, sen mukaan noiden käskyjen pitäisi toimia.

system('DIYDodecadWin k5a.par') ainakin näyttää ihan oikealta käskyltä? .... ja sitten system('DIYDodecadWin k6a.par') jne. Par-tiedoston pitää siis olla se par-tiedosto, jota haluat tutkia.
Avatar
Kinaporin kalifi
SuuBaltti
SuuBaltti
 
Viestit: 6958
Liittynyt: 14 Helmi 2011 19:18

Re: R-ohjelma

ViestiKirjoittaja Giösta » 20 Tammi 2015 12:47

Jaska kirjoitti:
Giösta kirjoitti:Imuroin R:än ja asensin
Imuroin DIYKALEVA.zip ja DIYDodecad2.1.rar ja purkasin ne tyhjään kansioon


Sinulla se toimi! Meni siis oikein. Minulla ei toimi. Kolme ensimmäistä käskyä toimi:

1: setwd('c:\\Jaska\\Geenilaskurit\\Kaleva\\Kaleva2')
(se hakemisto, mihin diykaleva2.zip on purettu)

2: source('standardize.r')

3: standardize('Jaska.csv', company='ftdna')
(oma Family Finder -datatiedosto lyhyeksi nimettynä)

4: system('DIYDodecadWin') -- EI TOIMI
system('DIYDodecadWin.par') -- EI TOIMI
system('DIYDodecadWin dv3.par') -- EI TOIMI
system('K7a.par') -- EI TOIMI

"Warning message:
running command 'K7a.par' [tai 'DIYDodecadWin.par'] had status 127"

Eli mikä tässä menee pieleen? Tiedoston nimi kansiossa on kuten ekalla ja neljännellä rivillä. README-tiedosto ei auta tässä, sen mukaan noiden käskyjen pitäisi toimia.


Kai otit sen DIYDodecad2.1.rar fileen myös ja purit senkin sinne hakemistoon, koska tuon rarrin sisällä on se DIYDodecadWin sekä dv3.par ja muutakin sälää
Avatar
Giösta
Lipevä lappilainen
Lipevä lappilainen
 
Viestit: 416
Liittynyt: 10 Touko 2013 04:50

Re: R-ohjelma

ViestiKirjoittaja Tuohikirje » 20 Tammi 2015 15:54

Ei kai kyse ole taas comma tai dot ongelmasta.
Tuohikirje
Kielevä karjalainen
Kielevä karjalainen
 
Viestit: 833
Liittynyt: 08 Tammi 2012 22:13

Re: R-ohjelma

ViestiKirjoittaja Eskous » 20 Tammi 2015 16:28

Eikö komennon pitänyt olla esim.
system('DIYDodecadWin k7a.par')
?

Minun läppärilläni varsinkin k7a -ajo kesti törkeän kauan. Olisin ollut varma että ohjelma jumiutui, ellei k5a olisi kestänyt vain jotain yhdeksisen minuuttia (mikä sekin tietysti herätti epäilyksiä).
Eskous
Lipevä lappilainen
Lipevä lappilainen
 
Viestit: 477
Liittynyt: 31 Heinä 2012 00:05

Re: R-ohjelma

ViestiKirjoittaja Jaska » 20 Tammi 2015 17:49

Giösta kirjoitti:Kai otit sen DIYDodecad2.1.rar fileen myös ja purit senkin sinne hakemistoon, koska tuon rarrin sisällä on se DIYDodecadWin sekä dv3.par ja muutakin sälää

En ottanut, kun Sigun sivulla sanottiin, että hänen pakettinsa sisältää kaiken tarvittavan. Jos haluaisin ajaa jonkin Dodecad-laskurin, sitten pitäisi varmaan ladata niitä.

Eskous kirjoitti:Eikö komennon pitänyt olla esim.
system('DIYDodecadWin k7a.par')

Tuonnimistä sovellusta ei Sigun paketissa ole, on vain joko DIYDodecadWin tai k7a.par jne.

Tuohikirje kirjoitti:Ei kai kyse ole taas comma tai dot ongelmasta.

Ei luulisi, koska tiedostojen nimissä on aina piste. Ja genotype-tiedoston se luo niin kuin luo, se onnistui, eikä siinä itse säädetty mitään pisteitä tai pilkkuja.

Eskous kirjoitti:Minun läppärilläni varsinkin k7a -ajo kesti törkeän kauan. Olisin ollut varma että ohjelma jumiutui, ellei k5a olisi kestänyt vain jotain yhdeksisen minuuttia (mikä sekin tietysti herätti epäilyksiä).

Tämä olisi muuten yksi vaihtoehto, mutta kun tuli heti se virheilmoitus.

Pitänee odottaa, onko itse pääpaholaisella asiaan ratkaisua. PDT_Armataz_01_01

Muokkelbergs: Google löysi tällaisen: "If the command could not be run for any reason, the value is 127."
http://stat.ethz.ch/R-manual/R-devel/li ... ystem.html

Voisiko kyse olla siitä, ettei vanhassa varaläppärissä riitä puhti ajamaan tuota, ja se herjaa siksi?
~ "Per aspera ad hominem - vaikeuksien kautta henkilökohtaisuuksiin" ~

Y-DNA: N1c1-YP1143 (Olavi Häkkinen 1620 Kuhmo? >> Juhani Häkkinen 1816 Eno)
mtDNA: H5a1e (Elina Mäkilä 1757 Kittilä >> Riitta Sassali 1843 Sodankylä)
Avatar
Jaska
Ylihärmiö
Ylihärmiö
 
Viestit: 11086
Liittynyt: 14 Helmi 2011 04:02

Re: R-ohjelma

ViestiKirjoittaja Eskous » 20 Tammi 2015 18:30

Jaska kirjoitti:
Eskous kirjoitti:Eikö komennon pitänyt olla esim.
system('DIYDodecadWin k7a.par')

Tuonnimistä sovellusta ei Sigun paketissa ole, on vain joko DIYDodecadWin tai k7a.par jne.

Kokeilitko edes? DIYDodecadWin(.exe) on se sovellus, joka saa syötteekseen parametritiedoston nimen.
Eskous
Lipevä lappilainen
Lipevä lappilainen
 
Viestit: 477
Liittynyt: 31 Heinä 2012 00:05

Re: R-ohjelma

ViestiKirjoittaja Kinaporin kalifi » 20 Tammi 2015 18:48

Jaska kirjoitti:system('DIYDodecadWin k7a.par')...Tuonnimistä sovellusta ei Sigun paketissa ole, on vain joko DIYDodecadWin tai k7a.par jne.

Komennossa viitataan kahteen tiedostoon, jotka molemmat löytyvät Sipin paketista.
Avatar
Kinaporin kalifi
SuuBaltti
SuuBaltti
 
Viestit: 6958
Liittynyt: 14 Helmi 2011 19:18

Re: R-ohjelma

ViestiKirjoittaja Giösta » 20 Tammi 2015 19:44

Ok se paketti on näköjään diykaleva8.zip, mistä löytyy nuo k5a k6a k7a.par fileet

K7a kesti täällä ajaa 153-370 sekuntia. Alla hieman lyhennelty tuloste mitä tuli tehtyä:

Koodi: Valitse kaikki
Type 'q()' to quit R.

> setwd('c:\\users\\Giosta\\Desktop\\R-kamat')
> source('standardize.r')
> standardize('henkilo1.txt', company='23andMe')
> system('DIYDodecadWin k5a.par')

 24.72%  West-Europe
 27.81%  North-Baltic
  8.14%  South-Europe
  9.77%  East-Europe&Volgaic
 29.56%  E-Cntral-Euro&S-Balt

> system('DIYDodecadWin k6a.par')

 24.11%  West-Europe
 27.47%  North-Baltic
  4.45%  South-Europe
  9.68%  East-Europe&Volgaic
 26.48%  E-Cntral-Euro&S-Balt
  7.81%  Southeast-Europe

> system('DIYDodecadWin k7a.par')

 23.33%  West-Europe
 26.06%  North-Baltic
  4.39%  South-Europe
 13.42%  North-Russia
  7.18%  East-Europe&Volgaic
 18.65%  E-Cntral-Euro&S-Balt
  6.97%  Southeast-Europe

>
Avatar
Giösta
Lipevä lappilainen
Lipevä lappilainen
 
Viestit: 416
Liittynyt: 10 Touko 2013 04:50

Re: R-ohjelma

ViestiKirjoittaja Jaska » 21 Tammi 2015 03:11

Kinaporin kalifi kirjoitti:
Jaska kirjoitti:system('DIYDodecadWin k7a.par')...Tuonnimistä sovellusta ei Sigun paketissa ole, on vain joko DIYDodecadWin tai k7a.par jne.

Komennossa viitataan kahteen tiedostoon, jotka molemmat löytyvät Sipin paketista.

Eli pitääkö ne molemmat laittaa samaan käskyyn? Testataanpa...

Joo, toimii! Hidasta, ja kone puuskuttaa, mutta toimii... PDT_Armataz_01_01
Kiitos kaikille neuvojille.
~ "Per aspera ad hominem - vaikeuksien kautta henkilökohtaisuuksiin" ~

Y-DNA: N1c1-YP1143 (Olavi Häkkinen 1620 Kuhmo? >> Juhani Häkkinen 1816 Eno)
mtDNA: H5a1e (Elina Mäkilä 1757 Kittilä >> Riitta Sassali 1843 Sodankylä)
Avatar
Jaska
Ylihärmiö
Ylihärmiö
 
Viestit: 11086
Liittynyt: 14 Helmi 2011 04:02

Re: R-ohjelma

ViestiKirjoittaja Giösta » 16 Huhti 2016 03:22

Tämmöinen osui silmiin

https://mran.microsoft.com/documents/rro/multithread/

Microsoftin versio R:stä joka saattaisi toimia nopeammin joillakin kuormilla, kunhan enabloi multithread-jutut käyttöön Linux- ja Windows-versioissa. Mac-versiossa ne ovat valmiiksi enabloitu.

https://mran.microsoft.com/open/
Avatar
Giösta
Lipevä lappilainen
Lipevä lappilainen
 
Viestit: 416
Liittynyt: 10 Touko 2013 04:50

Re: R-ohjelma

ViestiKirjoittaja Sigfrid » 16 Huhti 2016 22:32

Kiitos Giöstä. Hyvä vinkki, jolle voi joskus tulla tarvetta. Toistaiseksi ei ole ollut raskaita R-ajoja. Lähes kaikki geenianalyysit on tehty joko C:llä tai Java-tulkille ja toimivat multithreadissa. Toi Globetrotter taitaa olla R:llä. Se on vielä työjonossa.
Sigfrid
SuuBaltti
SuuBaltti
 
Viestit: 6532
Liittynyt: 16 Helmi 2011 12:09

Re: R-ohjelma

ViestiKirjoittaja Iiro R » 04 Elo 2018 12:28

Uusi mielenkiintoinen laskuri R:lle pitäisi löytyä tästä tutkimuksesta.
Fine-scale Inference of Ancestry Segments without Prior Knowledge of Admixing Groups
http://www.biorxiv.org/content/early/2018/07/25/376137
Y: N-Z1941+/CTS9175+ -> N-Y21575+ -> N-Y52469+ -> N-Y52617+ (LivingDNA: N-M46, N-Z1927)
Y: C-M8+, E-M75+, E-M78+, G-GG362+, G-M324+, I-BY3778+, I-Y11887+, J-Z1853+, J-M102+, K-M2335+, O-PK4+, R1b+, R-S47+, R2+, R-YP4141+
mt: H1a (H1a7)
Iiro R
Lipevä lappilainen
Lipevä lappilainen
 
Viestit: 409
Liittynyt: 30 Elo 2015 17:37

Re: R-ohjelma

ViestiKirjoittaja Sigfrid » 04 Elo 2018 14:49

Iiro R kirjoitti:Uusi mielenkiintoinen laskuri R:lle pitäisi löytyä tästä tutkimuksesta.
Fine-scale Inference of Ancestry Segments without Prior Knowledge of Admixing Groups
http://www.biorxiv.org/content/early/2018/07/25/376137


Mielenkiintoista. Pitääpä seurata tilannetta.
Sigfrid
SuuBaltti
SuuBaltti
 
Viestit: 6532
Liittynyt: 16 Helmi 2011 12:09

Re: R-ohjelma

ViestiKirjoittaja Iiro R » 04 Elo 2018 19:45

Siellä oli interaktiivinen kartta jossa pystyi katsomaan HGDP vertailutuloksia kyseisellä ohjelmalla, eli klikkaus väestöpisteeseen ja saa tuloksia (muista vierittää sivun loppuun asti, itse en heti tajunnut koko listaa).
Vaikutti mielestäni siltä, että vastuu vaikutussuunnasta jää taas tutkijalle, eli suomalainen kelpaa x-läisen esivanhemmaksi siinä kuin x-läinen suomalaisellekin jos koko referenssiryhmä on nykynäytteistä. Tapahtuuko sama jos osa on muinaisnäytteitä? Ohjelmaa pitäisi varmaan jonkun asiantuntevan testata tarkemmin. [edit] ymmärsin ehkä väärin ja ohjelma sittenkin huomioi vaikutussuunnat?

https://maths.ucd.ie/~mst/MOSAIC/HGDP_browser/
Y: N-Z1941+/CTS9175+ -> N-Y21575+ -> N-Y52469+ -> N-Y52617+ (LivingDNA: N-M46, N-Z1927)
Y: C-M8+, E-M75+, E-M78+, G-GG362+, G-M324+, I-BY3778+, I-Y11887+, J-Z1853+, J-M102+, K-M2335+, O-PK4+, R1b+, R-S47+, R2+, R-YP4141+
mt: H1a (H1a7)
Iiro R
Lipevä lappilainen
Lipevä lappilainen
 
Viestit: 409
Liittynyt: 30 Elo 2015 17:37

Re: R-ohjelma

ViestiKirjoittaja Sigfrid » 04 Elo 2018 21:34

Onhan se R-ohjelmakin siellä.
Sigfrid
SuuBaltti
SuuBaltti
 
Viestit: 6532
Liittynyt: 16 Helmi 2011 12:09

Seuraava

Paluu Tietotekniikka

Paikallaolijat

Käyttäjiä lukemassa tätä aluetta: Ei rekisteröityneitä käyttäjiä ja 1 vierailijaa