<div dir="ltr"><br><div>Good, so then the best choice sounds like the group otimization (rather than overall optim).</div><div><br></div><div>Best</div><div><br></div><div>Thibaut </div></div><div class="gmail_extra"><br clear="all"><div><div class="gmail_signature" data-smartmail="gmail_signature"><br>--<br>Dr Thibaut Jombart<br>Lecturer, Department of Infectious Disease Epidemiology, Imperial College London<br>Head of RECON: <a href="http://repidemicsconsortium.org" target="_blank">repidemicsconsortium.org</a><br>WHO Consultant - outbreak analysis<br><a href="http://sites.google.com/site/thibautjombart/" target="_blank">sites.google.com/site/thibautjombart/</a><br>Twitter: @TeebzR<br>+44(0)20 7594 3658</div></div>
<br><div class="gmail_quote">On 12 July 2017 at 16:02, Stephanie Coster <span dir="ltr"><<a href="mailto:stephanie.coster@gmail.com" target="_blank">stephanie.coster@gmail.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr">Yes, they do have different sizes. Thanks, that helps explain it.<span class="HOEnZb"><font color="#888888"><div><br></div><div>Stephanie</div></font></span></div><div class="HOEnZb"><div class="h5"><div class="gmail_extra"><br><div class="gmail_quote">On Wed, Jul 12, 2017 at 10:29 AM, Thibaut Jombart <span dir="ltr"><<a href="mailto:thibautjombart@gmail.com" target="_blank">thibautjombart@gmail.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr">Hi Stephanie, <div><br></div><div>do your groups have very different sizes? If so this would explain the discrepancy. When optimizing cross validation on each group, you basically make sure that every group is predicted as well as possible. When using overall classification, the largest group really is what gets optimized.</div><div><br></div><div>Best</div><div>Thibaut</div></div><div class="gmail_extra"><br clear="all"><div><div class="m_8324055161469373584m_-7613379485417003799gmail_signature" data-smartmail="gmail_signature"><br>--<br>Dr Thibaut Jombart<br>Lecturer, Department of Infectious Disease Epidemiology, Imperial College London<br>Head of RECON: <a href="http://repidemicsconsortium.org" target="_blank">repidemicsconsortium.org</a><br>WHO Consultant - outbreak analysis<br><a href="http://sites.google.com/site/thibautjombart/" target="_blank">sites.google.com/site/thibautj<wbr>ombart/</a><br>Twitter: @TeebzR<br><a href="tel:+44%2020%207594%203658" value="+442075943658" target="_blank">+44(0)20 7594 3658</a></div></div>
<br><div class="gmail_quote"><div><div class="m_8324055161469373584h5">On 29 June 2017 at 22:20, Stephanie Coster <span dir="ltr"><<a href="mailto:stephanie.coster@gmail.com" target="_blank">stephanie.coster@gmail.com</a>></span> wrote:<br></div></div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div><div class="m_8324055161469373584h5"><div dir="ltr"><p id="m_8324055161469373584m_-7613379485417003799m_-5157986422670281436gmail-yui_3_14_1_1_1498771173170_1480">Thanks in advance!</p>
<p>I have a dataset of genotypes from microsatellite loci and I'm looking to analyze population structure. Program STRUCTURE shows essentially no clusters, and I'd like to use DAPC to get another perspective.</p>
<p>I've run the 'find.clusters' code and the BIC suggests K=2, but the assignments are unreliable (equal assignments across all sites to both clusters). I am interpreting this to mean that K=1 and all samples likely form a single cluster.</p>
<p>Now, I'd like to use my apriori site groupings to draw a scatterplot and am using the DAPC web server to cross-validate and suggest the number of PCs to retain. I get notably different scatterplots depending on whether I choose 'group' or 'overall' to assess. The sites have more spatial differentiation when using 'group', and essentially all overlap when using 'overall'. I understand that success is calculated by my groups or overall depending on the choice, but what does this mean in application? Can someone help explain why these plots differ and which is better to use?</p>
<p>Many thanks!</p><span class="m_8324055161469373584m_-7613379485417003799HOEnZb"><font color="#888888"><p>Stephanie</p>
<br><br></font></span></div>
<br></div></div>______________________________<wbr>_________________<br>
adegenet-forum mailing list<br>
<a href="mailto:adegenet-forum@lists.r-forge.r-project.org" target="_blank">adegenet-forum@lists.r-forge.r<wbr>-project.org</a><br>
<a href="https://lists.r-forge.r-project.org/cgi-bin/mailman/listinfo/adegenet-forum" rel="noreferrer" target="_blank">https://lists.r-forge.r-projec<wbr>t.org/cgi-bin/mailman/listinfo<wbr>/adegenet-forum</a><br></blockquote></div><br></div>
</blockquote></div><br></div>
</div></div></blockquote></div><br></div>