<div dir="ltr">Hi Thibaut,<div><br></div><div style>thank you for your prompt reply, it was very clear. Just a quick question about optim.a.score: I had used it before, and this morning I tried again just to make sure I remembered the results correctly. For one dataset (N=109, 12 loci) it finds that 17 PCs is the best; for the other (N=83, 20 loci), retaining only 1 PC (not possible since PC=>2) gives the highest a score. This worries me. Do you think these data should not be used for DAPC? </div>

<div style><br></div><div style>Cheers</div><div style><br></div><div style>Stef</div></div><div class="gmail_extra"><br clear="all"><div><div><br></div><div>--------------------------</div><div>Stefano R. Montanari</div>

<div>PhD Candidate</div><div>James Cook University</div><div>School of Marine and Tropical Biology</div><div>ATSIP (Building 145 James Cook Drive)</div><div>4811 Townsville QLD</div><div><a href="mailto:stefanomontanari@gmail.com" target="_blank">stefanomontanari@gmail.com</a></div>

<div>Work: +61 7 4781 5441</div><div>Mob: +61 404 736 509</div></div>
<br><br><div class="gmail_quote">On 13 February 2013 01:12, Jombart, Thibaut <span dir="ltr"><<a href="mailto:t.jombart@imperial.ac.uk" target="_blank">t.jombart@imperial.ac.uk</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">

Hi Stefano,<br>
<br>
thanks for reposting on the forum. It gives me the chance to clarify an important point.<br>
<br>
For the first point, there is not a linear relationship between 'stability' of DAPC results and the number of PCs retained in the PCA step. 'xxx' PCs can represent 2% of the variance in one analysis and 60% in another. If the two data table have fairly comparable dimensions, it would be best to retain roughly the same proportion of variance. If their dimensions are very different, then the same number of PCs makes sense.<br>


<br>
STRUCTURE or similar approaches have a model which partitions genotypes into groups. It is basically a mixture distribution problem with a multinomial distribution for each locus and group. So the 'admixture' coefficient has a a straightforward biological interpretation.<br>


<br>
In DAPC, assignment of individuals to groups using the discriminant functions are based on a geometric criteria. In other words, "tell me where you are in the discriminant space, I will tell you the probability that you belong to groups xxx, yyy and zzz". This is of course dependent on the discriminant space. The more dimensions retained in the PCA step, the easier it is the find a space providing perfect discrimination. The obtained group membership probabilities can reflect admixture, but they do not represent the proportion of the genome assigned to a given group. In your case, use a smaller space, you may start seeing less clear-cut group definition. optim.a.score may help selecting the number of PCs.<br>


<br>
Cheers<br>
<br>
Thibaut.<br>
<br>
<br>
________________________________________<br>
From: <a href="mailto:adegenet-forum-bounces@lists.r-forge.r-project.org">adegenet-forum-bounces@lists.r-forge.r-project.org</a> [<a href="mailto:adegenet-forum-bounces@lists.r-forge.r-project.org">adegenet-forum-bounces@lists.r-forge.r-project.org</a>] on behalf of Stefano Montanari [<a href="mailto:stefanomontanari@gmail.com">stefanomontanari@gmail.com</a>]<br>


Sent: 11 February 2013 21:58<br>
To: <a href="mailto:adegenet-forum@lists.r-forge.r-project.org">adegenet-forum@lists.r-forge.r-project.org</a><br>
Subject: [adegenet-forum] compoplot, STRUCTURE, and the analysis of a hybrid zone<br>
<div><div class="h5"><br>
Dear Dr. Jombart,<br>
<br>
I hope this email finds you well. We have exchanged thoughts before, and I wish to thank you for having gotten back to me in the past.<br>
<br>
I have been going through your latest vignette about dapc in adegenet (Nov 2012). I have used dapc on a butterflyfish hybrid zone in the past (Montanari et al 2012, Ecology and Evolution), and now I am going through a second dataset, and would like to compare the 2. Hence, I have a couple of questions for you:<br>


<br>
- am I correct in thinking that I want the same level of stability between the 2 analyses if I am to compare the results? (eg, in both have retained PCs = N/3)<br>
<br>
- in your tutorial you mention that dapc$posterior used to construct compoplot are not the same as structure admixture coefficients. Could you point me in a direction that would allow me to understand how they are not? I have run the results through structure and the hybrids show up nicely as 50/50 clustred with parent 1 and 2 (k=2). adegenet also reckons that k=2 should be the best, but the compoplot shows no membership misassignment (even if the # of PCs is conservative). Do you have any suggestions as to why?<br>


<br>
Hoping to have been clear enough and not to have bored you senseless, I look forward to hearing back from you.<br>
<br>
Best regards,<br>
<br>
Stef<br>
<br>
--------------------------<br>
Stefano R. Montanari<br>
PhD Candidate<br>
James Cook University<br>
School of Marine and Tropical Biology<br>
ATSIP (Building 145 James Cook Drive)<br>
4811 Townsville QLD<br>
</div></div><a href="mailto:stefanomontanari@gmail.com">stefanomontanari@gmail.com</a><mailto:<a href="mailto:stefanomontanari@gmail.com">stefanomontanari@gmail.com</a>><br>
<div class="HOEnZb"><div class="h5">Work: <a href="tel:%2B61%207%204781%205441" value="+61747815441">+61 7 4781 5441</a><br>
Mob: <a href="tel:%2B61%20404%20736%20509" value="+61404736509">+61 404 736 509</a><br>
</div></div></blockquote></div><br></div>