<div dir="ltr">That makes total sense. Thank you for your answer! (And for taking the time to address all the questions and doubts in this forum. It's highly apprecciated! =)<div><br></div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">El lun., 13 de may. de 2019 a la(s) 08:36, Thibaut Jombart (<a href="mailto:thibautjombart@gmail.com">thibautjombart@gmail.com</a>) escribió:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div dir="ltr">Hi Lu, <div><br></div><div>you have a lot of variables for few individuals. Chances are when you retain too many PCs, you end up keeping a lot of random noise and Kmeans struggles to find meaningful centroids for your clusters. When keeping less PCs, you likely get rid of a lot of the noise, but the signal (group discrimination) stays.</div><div><br></div><div>Best</div><div>Thibaut<br clear="all"><div><div dir="ltr" class="gmail-m_9159279542284384855gmail_signature"><div dir="ltr"><div><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div><br></div><div><font face="arial, helvetica, sans-serif">--<br>Dr Thibaut Jombart<br>Associate Professor in Outbreak Analytics, London School of Hygiene and Tropical Medicine<br>Senior Lecturer in Genetic Analysis, Imperial College London</font></div><div><font face="arial, helvetica, sans-serif">President of RECON: <a href="http://repidemicsconsortium.org" target="_blank">repidemicsconsortium.org</a></font></div><div><font face="arial, helvetica, sans-serif"><a href="https://thibautjombart.netlify.com" style="letter-spacing:0.2px" target="_blank">https://thibautjombart.netlify.com</a><br></font></div><div><font face="arial, helvetica, sans-serif">Twitter: @TeebzR</font><br></div></div></div></div></div></div></div></div></div></div></div></div><br></div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Sun, 12 May 2019 at 18:00, Lu Maffey <<a href="mailto:lucia.maffey@gmail.com" target="_blank">lucia.maffey@gmail.com</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div dir="ltr">Hi everyone!<div>I'm performing DAPC analyses on radseq data from mosquitoes. When I run the previous find.clusters function, I get larger K values (that is more clusters) when I retain fewer PCs. For example, I have a data set of 40 individuals (with over 80.000 SNPS). When I retain 30-38 PCs, I get K=1 and when I choose to retain 15 PCs, I get K=3. Shouldn't it be the other way around? More PCs retained smaller K and vicecersa? When I run the same data in Structure I get  K=3 so I tend to think that I should retain fewer PCs in find.clusters but as the vignette explains that you should retain all of them, I'm worried I'm missing something here. I've been searching the archive but only found the same question unanswered. </div><div><br></div><div>Thanks in advance!!!</div><div><br></div><div>Lu</div></div>
_______________________________________________<br>
adegenet-forum mailing list<br>
<a href="mailto:adegenet-forum@lists.r-forge.r-project.org" target="_blank">adegenet-forum@lists.r-forge.r-project.org</a><br>
<a href="https://lists.r-forge.r-project.org/cgi-bin/mailman/listinfo/adegenet-forum" rel="noreferrer" target="_blank">https://lists.r-forge.r-project.org/cgi-bin/mailman/listinfo/adegenet-forum</a></blockquote></div>
</blockquote></div>