Dear Lennart, Maarten, All,<div><br></div><div>Lennart - thank you for drawing the attention to the problem of not being able to compile affecting the whole thing (I personally would never change the code of something I am not able to compile :) ). Maarten, thanks a lot for suggesting this elegant Jenkins solution - I was not aware of this system. </div>
<div><br></div><div>All together, I see two ways to proceed:</div><div><br></div><div>1) Solution based on Jenkins - the code is open, can be modified, bud build happens in 'private' environment</div><div><br></div>
<div>2) I replace the data sets we can not distribute with some small fake datasets. This will make the code technically compilable, though all the interpretation of the "results" will be screwed up</div><div><br>
</div><div>I like the solution (1) technically, but I do not like it because it does not really address the point behind: we can not share these datasets. In a way, people can look at these PDFs but people can not use these parts as tutorial, because they do not have the data sets! Therefore, if I had to choose, I would be inclined towards the solution (2). </div>
<div><br></div><div>But I think we do not need to choose. We could keep both the "full old PDF" together with "incomplete new" on the <a href="http://genabel.org">genabel.org</a>'s tutorial section. Next, I am going to try to construct a smarter Makefile, which could build both 'private' and 'public' version depending on the availability of data files. Then we could combine both solutions :) </div>
<div><br></div><div>I think the next steps are 1) for me to look up how many chapters in the GenA tutorial become crap when I remove these datasets 2) try to do smart Makefile - hopefully with your help</div><div><br></div>
<div>Let me know what you think, and I will keep you updated</div><div><br></div><div>best wishes,</div><div>Yurii<br><br><div class="gmail_quote">On Wed, Feb 20, 2013 at 10:40 PM, Maarten Kooyman <span dir="ltr"><<a href="mailto:kooyman@gmail.com" target="_blank">kooyman@gmail.com</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Dear All,<br>
<br>
I think on the long run replacing the data is the best thing to do. (although it will take quite some effort).<br>
<br>
As an temporary solution we could use a build server with jenkins (<a href="http://jenkins-ci.org/" target="_blank">http://jenkins-ci.org/</a>), that recreates the document after each alteration on svn and publish this on a public place(by coping it to a webserver). On this build server the datasets are secure in a trusted environment and the results are visible to the outer world. I use  Jenkins also  for monitoring Probabel, but the goal is the same: keep the quality of the code in check.<br>

<br>
This solution prevent coping binary files to svn and this can be done in a completely automated way.<br>
<br>
Kind regards,<br>
<br>
Maarten<div class="HOEnZb"><div class="h5"><br>
<br>
<br>
On 02/20/2013 06:54 PM, L.C. Karssen wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
Dear Yurii,<br>
<br>
Great idea. I'm all for putting the tutorials in SVN. They are already<br>
of high quality and together with our community we can make them even<br>
better.<br>
I do see the problem with the data sets, of course.<br>
<br>
You are using Sweave, right? I'm wondering how much not having the data<br>
will impact the possibility to tweak the document. Fixing small typos<br>
will be alright, but before you know it a typo can mess up the LaTeX or<br>
R code and since you can't compile the document to check it this may<br>
lead to a lot of bug hunting for you, once you recompile it again.<br>
That's the only potential problem I see.<br>
<br>
How about also including the latest PDF version of the tutorial (I know,<br>
this is against SVN's principles) each time you compile a version? This<br>
way people who don't have the data know what it is supposed to look like<br>
and could even help creating replacement data sets.<br>
<br>
<br>
Best,<br>
<br>
Lennart.<br>
<br>
On 02/20/2013 04:35 PM, Yurii Aulchenko wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
Dear All,<br>
<br>
For long time I was thinking that GenABEL tutorial(s) should be a part of<br>
the project - the same logic as with the code, with the same idea that in<br>
such case people can easily contribute by submitting patches and new<br>
pieces.<br>
<br>
The problem was (and still is) that the tutorial uses some data sets, which<br>
are not public domain, and it is quite awkward if we as the project start<br>
re-distributing them. Little by little I am trying to switch the whole<br>
thing to the use of only public and simulated data, but this is a lengthy<br>
process.<br>
<br>
So I thought that may be a good solution is to put the code of tutorials on<br>
our SVN; and put the data only if these are either public or simulated. Of<br>
cause in this way the tutorials will not be really "functional" (e.g. they<br>
would not compile right away), but this may become a starting point for<br>
others to build up something new and really<br>
free-for-all-to-use-and-<u></u>contribute.<br>
<br>
Let me know what you think,<br>
best regards,<br>
Yurii<br>
<br>
<br>
<br>
______________________________<u></u>_________________<br>
</blockquote></blockquote>
<br>
______________________________<u></u>_________________<br>
genabel-devel mailing list<br>
<a href="mailto:genabel-devel@lists.r-forge.r-project.org" target="_blank">genabel-devel@lists.r-forge.r-<u></u>project.org</a><br>
<a href="https://lists.r-forge.r-project.org/cgi-bin/mailman/listinfo/genabel-devel" target="_blank">https://lists.r-forge.r-<u></u>project.org/cgi-bin/mailman/<u></u>listinfo/genabel-devel</a><br>
</div></div></blockquote></div><br><br>
</div>