<div dir="ltr">Hi Ben <div><br></div><div>while I'm not aware of hard rules for numbers of individuals needed to detect a specific number of clusters, and I appreciate it will depend on how clear-cut differences are, I don't think it is realistic to look for 4 clusters amongst 7 observations. Even 2 clusters will already be a stretch, unless differences are really very obvious.</div><div><br></div><div>Cheers</div><div>Thibaut</div><div><br></div><div><br></div></div><div class="gmail_extra"><br clear="all"><div><div class="gmail_signature" data-smartmail="gmail_signature"><div dir="ltr"><div><br>--<br>Dr Thibaut Jombart<br>Lecturer, Department of Infectious Disease Epidemiology, Imperial College London<br>Head of RECON: <a href="http://repidemicsconsortium.org" target="_blank">repidemicsconsortium.org</a><br>WHO Consultant - outbreak analysis</div><div><a href="https://thibautjombart.netlify.com" target="_blank">https://thibautjombart.netlify.com</a><br>Twitter: @TeebzR<br>+44(0)20 7594 3658</div></div></div></div>
<br><div class="gmail_quote">On 2 February 2018 at 21:01, DAUPHIN Benjamin <span dir="ltr"><<a href="mailto:benjamin.dauphin@unine.ch" target="_blank">benjamin.dauphin@unine.ch</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Thanks Thibaut.<br>
Yes i have 7 pools (=7 rows or =7 individuals in the analysis), and i expect two clusters representing two already characterized lineages. I have found 4 likely clusters based on HCPC but i want to double check this, with a kmeans if possible.<br>
Best<br>
Ben<br>
______________________________<wbr>__________<br>
From: <a href="mailto:adegenet-forum-bounces@lists.r-forge.r-project.org">adegenet-forum-bounces@lists.<wbr>r-forge.r-project.org</a> [<a href="mailto:adegenet-forum-bounces@lists.r-forge.r-project.org">adegenet-forum-bounces@lists.<wbr>r-forge.r-project.org</a>] on behalf of Thibaut Jombart [<a href="mailto:thibautjombart@gmail.com">thibautjombart@gmail.com</a>]<br>
Sent: 02 February 2018 18:25<br>
To: Benjamin Dauphin<br>
Cc: <a href="mailto:adegenet-forum@lists.r-forge.r-project.org">adegenet-forum@lists.r-forge.<wbr>r-project.org</a><br>
Subject: Re: [adegenet-forum] Kmeans and DAPC on poolSeq data<br>
<span class=""><br>
Hi again,<br>
<br>
such plot typically indicates no clustering. Just to confirm: are we talking about 7 rows and 100,000 columns?<br>
<br>
If so, your pools are technically your statistical individuals, and the method explore clustering solutions for 1-6 clusters for 7 individuals, which won't go far - not enough individuals to detect clustering really. Apologies if I misunderstood.<br>
<br>
Best<br>
Thibaut<br>
<br>
<br>
--<br>
Dr Thibaut Jombart<br>
Lecturer, Department of Infectious Disease Epidemiology, Imperial College London<br>
</span>Head of RECON: <a href="http://repidemicsconsortium.org" rel="noreferrer" target="_blank">repidemicsconsortium.org</a><<a href="http://repidemicsconsortium.org" rel="noreferrer" target="_blank">http:<wbr>//repidemicsconsortium.org</a>><br>
<span class="">WHO Consultant - outbreak analysis<br>
<a href="https://thibautjombart.netlify.com" rel="noreferrer" target="_blank">https://thibautjombart.<wbr>netlify.com</a><br>
Twitter: @TeebzR<br>
<a href="tel:%2B44%280%2920%207594%203658" value="+442075943658">+44(0)20 7594 3658</a><br>
<br>
</span><span class="">On 2 February 2018 at 09:07, Benjamin Dauphin <<a href="mailto:benjamin.dauphin@wsl.ch">benjamin.dauphin@wsl.ch</a><<wbr>mailto:<a href="mailto:benjamin.dauphin@wsl.ch">benjamin.dauphin@wsl.ch</a><wbr>>> wrote:<br>
Hi Mark,<br>
<br>
Thanks for response. I’ve run find.clusters() with the matrix of allele frequencies as input file, and then run the DAPC using still the matrix (not the genind or genlight object) by assigning the group generated with kmeans (grp$grp). It works but I have a strange “inverted parabolic curve" for the kmean analysis.<br>
Is it a common picture for pooldseq data?<br>
<br>
Thanks,<br>
Ben<br>
<br>
<br>
<br>
<br>
</span><span class="">> On 1 Feb 2018, at 18:01, Mark Coulson <<a href="mailto:Mark.Coulson.ic@uhi.ac.uk">Mark.Coulson.ic@uhi.ac.uk</a><<wbr>mailto:<a href="mailto:Mark.Coulson.ic@uhi.ac.uk">Mark.Coulson.ic@uhi.ac.<wbr>uk</a>>> wrote:<br>
><br>
> Hi Ben,<br>
><br>
> I have used allelotype data with the input as a matrix of the frequency of the A allele in each group to run DAPC and it worked well. However, my groups were defined already but could the same type of input not be used to find.clusters?<br>
><br>
> Mark<br>
><br>
><br>
> -----Original Message-----<br>
</span><span class="">> From: <a href="mailto:adegenet-forum-bounces@lists.r-forge.r-project.org">adegenet-forum-bounces@lists.<wbr>r-forge.r-project.org</a><mailto:<a href="mailto:adegenet-forum-bounces@lists.r-forge.r-project.org">a<wbr>degenet-forum-bounces@lists.r-<wbr>forge.r-project.org</a>> [mailto:<a href="mailto:adegenet-forum-bounces@lists.r-forge.r-project.org">adegenet-forum-<wbr>bounces@lists.r-forge.r-<wbr>project.org</a><mailto:<a href="mailto:adegenet-forum-bounces@lists.r-forge.r-project.org">adegenet-<wbr>forum-bounces@lists.r-forge.r-<wbr>project.org</a>>] On Behalf Of Benjamin Dauphin<br>
> Sent: 31 January 2018 09:18<br>
</span><span class="">> To: <a href="mailto:adegenet-forum@lists.r-forge.r-project.org">adegenet-forum@lists.r-forge.<wbr>r-project.org</a><mailto:<a href="mailto:adegenet-forum@lists.r-forge.r-project.org">adegenet-<wbr>forum@lists.r-forge.r-project.<wbr>org</a>><br>
> Subject: [adegenet-forum] Kmeans and DAPC on poolSeq data<br>
><br>
> Dear all,<br>
><br>
> I am newly working on pool sequencing data and I simply wonder if I can use kmeans (find.cluster) and DAPC to investigate population structure from poolseq data (allele frequencies)? How find.clusters can deal with allele frequencies?<br>
><br>
> Dataset: 7 pools and 100’000 SNPs<br>
><br>
> Any comment or help would be much appreciated.<br>
> Best regards<br>
> Ben<br>
><br>
><br>
> ______________________________<wbr>_________________<br>
> adegenet-forum mailing list<br>
</span>> <a href="mailto:adegenet-forum@lists.r-forge.r-project.org">adegenet-forum@lists.r-forge.<wbr>r-project.org</a><mailto:<a href="mailto:adegenet-forum@lists.r-forge.r-project.org">adegenet-<wbr>forum@lists.r-forge.r-project.<wbr>org</a>><br>
> <a href="https://lists.r-forge.r-project.org/cgi-bin/mailman/listinfo/adegenet-forum" rel="noreferrer" target="_blank">https://lists.r-forge.r-<wbr>project.org/cgi-bin/mailman/<wbr>listinfo/adegenet-forum</a><br>
> Inverness College UHI, a partner in the University of the Highlands and Islands <a href="http://www.inverness.uhi.ac.uk" rel="noreferrer" target="_blank">www.inverness.uhi.ac.uk</a><<a href="http://www.inverness.uhi.ac.uk" rel="noreferrer" target="_blank">http:/<wbr>/www.inverness.uhi.ac.uk</a>> Board of Management of Inverness College (known as Inverness College UHI), Scottish Charity No SC021197.<br>
<br>
<br>
______________________________<wbr>_________________<br>
adegenet-forum mailing list<br>
<a href="mailto:adegenet-forum@lists.r-forge.r-project.org">adegenet-forum@lists.r-forge.<wbr>r-project.org</a><mailto:<a href="mailto:adegenet-forum@lists.r-forge.r-project.org">adegenet-<wbr>forum@lists.r-forge.r-project.<wbr>org</a>><br>
<a href="https://lists.r-forge.r-project.org/cgi-bin/mailman/listinfo/adegenet-forum" rel="noreferrer" target="_blank">https://lists.r-forge.r-<wbr>project.org/cgi-bin/mailman/<wbr>listinfo/adegenet-forum</a><br>
<br>
</blockquote></div><br></div>