<html dir="ltr">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=Windows-1252">
<style>
<!--
@font-face
        {font-family:"Cambria Math"}
@font-face
        {font-family:Calibri}
@font-face
        {font-family:Tahoma}
@font-face
        {font-family:"Antique Olive"}
p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0in;
        margin-bottom:.0001pt;
        font-size:11.0pt;
        font-family:"Calibri","sans-serif"}
a:link, span.MsoHyperlink
        {color:blue;
        text-decoration:underline}
a:visited, span.MsoHyperlinkFollowed
        {color:purple;
        text-decoration:underline}
p
        {margin:0in;
        margin-bottom:.0001pt;
        font-size:12.0pt;
        font-family:"Times New Roman","serif"}
p.MsoAcetate, li.MsoAcetate, div.MsoAcetate
        {margin:0in;
        margin-bottom:.0001pt;
        font-size:8.0pt;
        font-family:"Tahoma","sans-serif"}
p.msochpdefault, li.msochpdefault, div.msochpdefault
        {margin:0in;
        margin-bottom:.0001pt;
        font-size:10.0pt;
        font-family:"Times New Roman","serif"}
span.emailstyle17
        {font-family:"Calibri","sans-serif";
        color:windowtext}
span.emailstyle18
        {font-family:"Calibri","sans-serif";
        color:#1F497D}
span.EmailStyle21
        {font-family:"Calibri","sans-serif";
        color:#1F497D}
span.BalloonTextChar
        {font-family:"Tahoma","sans-serif"}
.MsoChpDefault
        {font-size:10.0pt}
@page WordSection1
        {margin:1.0in 1.0in 1.0in 1.0in}
-->
</style><style id="owaParaStyle" type="text/css">P {margin-top:0;margin-bottom:0;}</style>
</head>
<body ocsi="0" fpstyle="1" lang="EN-US" link="blue" vlink="purple">
<div style="direction: ltr;font-family: Tahoma;color: #000000;font-size: 10pt;">Hello,
<br>
<br>
this is exactly what I got recently when investigating how big a dataset can be analysed on R 32 bits for windows. In your case, 32/64 bits does not make a lot of difference. I'm afraid 4GB is just not enough to convert your data. I think you did well using
 stringsAsFactor=FALSE, I doubt this is a problem.<br>
<br>
I need to investigate some possible optimization of df2genind, but don't think I'll have time for this any time soon.<br>
<br>
Cheers<br>
<br>
Thibaut<br>
<div style="font-family: Times New Roman; color: rgb(0, 0, 0); font-size: 16px;">
<hr tabindex="-1">
<div style="direction: ltr;" id="divRpF440747"><font color="#000000" face="Tahoma" size="2"><b>From:</b> Thomas, Evert (Bioversity-Colombia) [E.Thomas@CGIAR.ORG]<br>
<b>Sent:</b> 06 July 2011 13:44<br>
<b>To:</b> Jombart, Thibaut; adegenet-forum@r-forge.wu-wien.ac.at<br>
<b>Subject:</b> RE: [adegenet-forum] dataset too large? Follow-up<br>
</font><br>
</div>
<div></div>
<div>
<div class="WordSection1">
<p class="MsoNormal"><span style="color: rgb(31, 73, 125);">Dear Thibaut,</span></p>
<p class="MsoNormal"><span style="color: rgb(31, 73, 125);">&nbsp;</span></p>
<p class="MsoNormal"><span style="color: rgb(31, 73, 125);">Thanks for this. I have tried running several times overnight now but each time get the message:</span></p>
<p class="MsoNormal"><span style="color: rgb(31, 73, 125);"></span><img id="Picture_x0020_1" src="cid:image001.png@01CC3BB0.8AF35EF0" height="206" width="370"><span style="color: rgb(31, 73, 125);"></span></p>
<p class="MsoNormal"><span style="color: rgb(31, 73, 125);">&nbsp;</span></p>
<p class="MsoNormal"><span style="color: rgb(31, 73, 125);">I am running windows7 on a 64bit system with 4x 2.4GHz and 4Gb RAM, so I don’t think the problem is related to my PC?</span></p>
<p class="MsoNormal"><span style="color: rgb(31, 73, 125);">Many thanks for any suggestions you might have…</span></p>
<p class="MsoNormal"><span style="color: rgb(31, 73, 125);">&nbsp;</span></p>
<p class="MsoNormal"><span style="color: rgb(31, 73, 125);">Cheers Evert</span></p>
<p class="MsoNormal"><span style="color: rgb(31, 73, 125);">&nbsp;</span></p>
<p class="MsoNormal"><span style="color: rgb(31, 73, 125);">(PS when reading in my CSV is use “stringsAsFactor=F”, so that my marker data is read in as characters –could that be the problem?)</span></p>
<div>
<div style="border-width: 1pt medium medium; border-style: solid none none; border-color: rgb(181, 196, 223) -moz-use-text-color -moz-use-text-color; padding: 3pt 0in 0in;">
<p class="MsoNormal"><b><span style="font-size: 10pt; font-family: &quot;Tahoma&quot;,&quot;sans-serif&quot;;">From:</span></b><span style="font-size: 10pt; font-family: &quot;Tahoma&quot;,&quot;sans-serif&quot;;"> Jombart, Thibaut [mailto:t.jombart@imperial.ac.uk]
<br>
<b>Sent:</b> Monday, July 04, 2011 11:33 AM<br>
<b>To:</b> Thomas, Evert (Bioversity-Colombia); adegenet-forum@r-forge.wu-wien.ac.at<br>
<b>Subject:</b> RE: [adegenet-forum] dataset too large? Follow-up</span></p>
</div>
</div>
<p class="MsoNormal">&nbsp;</p>
<div>
<p class="MsoNormal" style="margin-bottom: 12pt;"><span style="font-size: 10pt; font-family: &quot;Tahoma&quot;,&quot;sans-serif&quot;; color: black;">Dear Thomas,
<br>
<br>
The algorithm for translating your data into individual frequencies is not linear. RAM saturation is likely to cause supplementary delays in any case, but windows is good at having applications freezing/crashing in such cases (&quot;R has stopped working...send
 a report&quot;) . How much memory do you have on your computer? In any case I would recommend running overnight to make sure it just doesn't take ages, but works.<br>
<br>
We are looking at a big dataset, but it is merely 2-3 times bigger than eHGDP, which was not such a pain to obtain.<br>
<br>
As for multicore, the package is not available for windows, unfortunately. <br>
<br>
Importing your data from STRUCTURE won't help, it will actually be longer and more RAM-demanding.<br>
<br>
On the bright side, once you'll have your data imported, analysis should be slightly less time-consuming.<br>
<br>
Best<br>
<br>
Thibaut</span></p>
<div>
<p class="MsoNormal" style="margin-bottom: 12pt;"><span style="font-size: 10pt; font-family: &quot;Tahoma&quot;,&quot;sans-serif&quot;; color: black;">&nbsp;</span></p>
</div>
<div>
<div class="MsoNormal" style="text-align: center;" align="center"><span style="font-size: 12pt; font-family: &quot;Times New Roman&quot;,&quot;serif&quot;; color: black;">
<hr size="2" width="100%" align="center">
</span></div>
<div id="divRpF760387">
<p class="MsoNormal" style="margin-bottom: 12pt;"><b><span style="font-size: 10pt; font-family: &quot;Tahoma&quot;,&quot;sans-serif&quot;; color: black;">From:</span></b><span style="font-size: 10pt; font-family: &quot;Tahoma&quot;,&quot;sans-serif&quot;; color: black;"> adegenet-forum-bounces@r-forge.wu-wien.ac.at
 [adegenet-forum-bounces@r-forge.wu-wien.ac.at] on behalf of Thomas, Evert (Bioversity-Colombia) [E.Thomas@CGIAR.ORG]<br>
<b>Sent:</b> 04 July 2011 16:18<br>
<b>To:</b> adegenet-forum@r-forge.wu-wien.ac.at<br>
<b>Subject:</b> Re: [adegenet-forum] dataset too large? Follow-up</span><span style="font-size: 12pt; font-family: &quot;Times New Roman&quot;,&quot;serif&quot;; color: black;"></span></p>
</div>
<div>
<div>
<p class="MsoNormal"><span style="color: rgb(31, 73, 125);">Dear,</span><span style="color: black;"></span></p>
<p class="MsoNormal"><span style="color: rgb(31, 73, 125);">&nbsp;</span><span style="color: black;"></span></p>
<p class="MsoNormal"><span style="color: rgb(31, 73, 125);">The problem does not seem to be related to my commands, since I do get results for subsets of my data (1000 individuals takes 40 seconds), but it does not seem to work for my entire dataset of &gt;25000
 individuals (should theoretically take 16.6 minutes, but after 4 hours still no result) … any suggestions? &nbsp;</span><span style="color: black;"></span></p>
<p class="MsoNormal"><span style="color: rgb(31, 73, 125);"><br>
many thanks in advance</span><span style="color: black;"></span></p>
<p class="MsoNormal"><span style="color: rgb(31, 73, 125);">&nbsp;</span><span style="color: black;"></span></p>
<p class="MsoNormal"><span style="color: rgb(31, 73, 125);">evert</span><span style="color: black;"></span></p>
<div>
<div style="border-width: 1pt medium medium; border-style: solid none none; border-color: windowtext -moz-use-text-color -moz-use-text-color; padding: 3pt 0in 0in;">
<p class="MsoNormal"><b><span style="font-size: 10pt; font-family: &quot;Tahoma&quot;,&quot;sans-serif&quot;; color: black;">From:</span></b><span style="font-size: 10pt; font-family: &quot;Tahoma&quot;,&quot;sans-serif&quot;; color: black;"> adegenet-forum-bounces@r-forge.wu-wien.ac.at [mailto:adegenet-forum-bounces@r-forge.wu-wien.ac.at]
<b>On Behalf Of </b>Thomas, Evert (Bioversity-Colombia)<br>
<b>Sent:</b> Friday, July 01, 2011 1:56 PM<br>
<b>To:</b> adegenet-forum@r-forge.wu-wien.ac.at<br>
<b>Subject:</b> [adegenet-forum] dataset too large?</span><span style="color: black;"></span></p>
</div>
</div>
<p class="MsoNormal"><span style="color: black;">&nbsp;</span></p>
<p class="MsoNormal"><span style="color: black;">Dear colleagues,</span></p>
<p class="MsoNormal"><span style="color: black;">&nbsp;</span></p>
<p class="MsoNormal"><span style="color: black;">I am new to R so apologies for my ignorance, but I have a couple of questions:
</span></p>
<p class="MsoNormal"><span style="color: black;">&nbsp;</span></p>
<p class="MsoNormal"><span style="color: black;">I am trying to use adegenet (on a 64bit system, windows7) for analyzing a SSR dataset. It consists 96 loci and I have &gt;25000 individuals (after resampling). I have loaded the database as a dataframe in R, but
 am not able to convert to genind format (PC physical memory becomes saturated, while only 10% of CPU is used) . Could this be related to the size of my dataset? Any suggestions?</span></p>
<p class="MsoNormal"><span style="color: black;">&nbsp;</span></p>
<p class="MsoNormal"><span style="color: black;">On another note: Alternatively, I tried importing my data to genind object from the corresponding file in Structure format. However, my version of Structure (2.3.3.) does not seem to generate .stru or .str files,
 any solution there?</span></p>
<p class="MsoNormal"><span style="color: black;">&nbsp;</span></p>
<p class="MsoNormal"><span style="color: black;">And a last point: I am unable to install/load the R application multicore because it is not among the packages list…</span></p>
<p class="MsoNormal"><span style="color: black;">&nbsp;</span></p>
<p class="MsoNormal"><span style="color: black;">This is what I have done:</span></p>
<p class="MsoNormal"><span style="color: black;">&nbsp;</span></p>
<p class="MsoNormal"><span style="color: black;">I did a read.csv with “header=T”, and then rownames&lt;-cacaoCSV[,1]</span></p>
<p class="MsoNormal"><span style="color: black;">&nbsp;</span></p>
<p class="MsoNormal"><span style="color: black;">The problems occurs with the following command</span></p>
<p class="MsoNormal"><span style="color: black;">cacao&lt;-df2genind(cacaoCSV, sep=&quot;/&quot;,ind.names=NULL, loc.names=NULL, pop=cacaoCSV[,2], missing=NA, ploidy=2, type=&quot;codom&quot;)</span></p>
<p class="MsoNormal"><span style="color: black;">&nbsp;</span></p>
<p class="MsoNormal"><span style="color: black;">&nbsp;</span></p>
<p class="MsoNormal"><span style="color: black;">Many thanks in advance for any advice or suggestion you might have!</span></p>
<p class="MsoNormal"><span style="color: black;">&nbsp;</span></p>
<p class="MsoNormal" style="margin-bottom: 12pt;"><span style="color: black;">Enjoy the weekend</span></p>
<p class="MsoNormal"><span style="font-size: 10pt; font-family: &quot;Antique Olive&quot;; color: black;">Evert Thomas,</span><i><span style="font-family: &quot;Antique Olive&quot;; color: black;"> PhD</span></i><span style="color: black;"></span></p>
<p class="MsoNormal"><i><span style="font-size: 10pt; font-family: &quot;Antique Olive&quot;; color: rgb(0, 112, 192);">Associate Expert, Conservation and Use of
</span></i><span style="color: black;"></span></p>
<p class="MsoNormal"><i><span style="font-size: 10pt; font-family: &quot;Antique Olive&quot;; color: rgb(0, 112, 192);">Forest Genetic Resources in Latin America</span></i><span style="color: black;"></span></p>
<p class="MsoNormal" style="text-align: justify;"><span style="font-size: 10pt; color: black;">&nbsp;</span><span style="color: black;"></span></p>
<p class="MsoNormal" style="text-align: justify;"><b><span style="font-size: 10pt; font-family: &quot;Antique Olive&quot;; color: rgb(0, 153, 0);" lang="EN-GB">Bioversity International</span></b><span style="color: black;"></span></p>
<p class="MsoNormal" style="text-align: justify;"><span style="font-size: 10pt; font-family: &quot;Antique Olive&quot;; color: black;" lang="EN-GB">Regional Office for the Americas</span><span style="color: black;"></span></p>
<p class="MsoNormal" style="text-align: justify;"><span style="font-size: 10pt; font-family: &quot;Antique Olive&quot;; color: black;" lang="IT">Recta Cali-Palmira Km 17 – CIAT</span><span style="color: black;"></span></p>
<p class="MsoNormal" style="text-align: justify;"><span style="font-size: 10pt; font-family: &quot;Antique Olive&quot;; color: black;" lang="IT">Cali, Colombia</span><span style="color: black;"></span></p>
<p class="MsoNormal" style="text-align: justify;"><span style="font-size: 10pt; font-family: &quot;Antique Olive&quot;; color: black;">P.O. Box 6713</span><span style="color: black;"></span></p>
<p class="MsoNormal" style="text-align: justify;"><span style="font-size: 10pt; font-family: &quot;Antique Olive&quot;; color: black;" lang="EN-GB">&nbsp;</span><span style="color: black;"></span></p>
<p class="MsoNormal" style="text-align: justify;"><b><span style="font-size: 10pt; font-family: &quot;Antique Olive&quot;; color: black;" lang="EN-GB">Tel</span></b><span style="font-size: 10pt; font-family: &quot;Antique Olive&quot;; color: black;" lang="EN-GB">. 57 2 4450048
 / 49 Ext 113</span><span style="color: black;"></span></p>
<p class="MsoNormal" style="text-align: justify;"><b><span style="font-size: 10pt; font-family: &quot;Antique Olive&quot;; color: black;" lang="FR">Fax</span></b><span style="font-size: 10pt; font-family: &quot;Antique Olive&quot;; color: black;" lang="FR"> 57 2 4450096</span><span style="color: black;"></span></p>
<p class="MsoNormal"><b><span style="font-size: 10pt; font-family: &quot;Antique Olive&quot;; color: black;" lang="FR">Email</span></b><span style="font-size: 10pt; font-family: &quot;Antique Olive&quot;; color: black;" lang="FR">:
<a href="mailto:e.thomas@cgiar.org" title="mailto:e.thomas@cgiar.org" target="_blank">
e.thomas@cgiar.org</a></span><span style="color: black;"></span></p>
<p class="MsoNormal"><b><span style="font-size: 10pt; font-family: &quot;Antique Olive&quot;; color: black;">Skype</span></b><span style="font-size: 10pt; font-family: &quot;Antique Olive&quot;; color: black;">: evertthomas</span><span style="color: black;"></span></p>
<p class="MsoNormal"><u><span style="font-size: 10pt; font-family: &quot;Antique Olive&quot;; color: green;" lang="EN-GB"><a href="UrlBlockedError.aspx" title="blocked::http://www.bioversityinternational.org/
http://www.bioversityinternational.org/" target="_blank">www.bioversityinternational.org</a></span></u><span style="color: black;"></span></p>
<p class="MsoNormal"><span style="font-size: 12pt; font-family: &quot;Times New Roman&quot;,&quot;serif&quot;; color: black;">&nbsp;</span><span style="color: black;"></span></p>
<p class="MsoNormal"><span style="color: black;">&nbsp;</span></p>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</body>
</html>