<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1">
<meta name="Generator" content="Microsoft Word 14 (filtered medium)">
<style><!--
/* Font Definitions */
@font-face
        {font-family:"Cambria Math";
        panose-1:2 4 5 3 5 4 6 3 2 4;}
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
@font-face
        {font-family:Tahoma;
        panose-1:2 11 6 4 3 5 4 4 2 4;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0cm;
        margin-bottom:.0001pt;
        font-size:12.0pt;
        font-family:"Times New Roman","serif";}
a:link, span.MsoHyperlink
        {mso-style-priority:99;
        color:blue;
        text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
        {mso-style-priority:99;
        color:purple;
        text-decoration:underline;}
p.MsoAcetate, li.MsoAcetate, div.MsoAcetate
        {mso-style-priority:99;
        mso-style-link:"Balloon Text Char";
        margin:0cm;
        margin-bottom:.0001pt;
        font-size:8.0pt;
        font-family:"Tahoma","sans-serif";}
span.EmailStyle17
        {mso-style-type:personal-reply;
        font-family:"Calibri","sans-serif";
        color:#1F497D;}
span.BalloonTextChar
        {mso-style-name:"Balloon Text Char";
        mso-style-priority:99;
        mso-style-link:"Balloon Text";
        font-family:"Tahoma","sans-serif";}
.MsoChpDefault
        {mso-style-type:export-only;
        font-family:"Calibri","sans-serif";}
@page WordSection1
        {size:612.0pt 792.0pt;
        margin:72.0pt 72.0pt 72.0pt 72.0pt;}
div.WordSection1
        {page:WordSection1;}
--></style><!--[if gte mso 9]><xml>
<o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
<o:shapelayout v:ext="edit">
<o:idmap v:ext="edit" data="1" />
</o:shapelayout></xml><![endif]-->
</head>
<body lang="EN-US" link="blue" vlink="purple">
<div class="WordSection1">
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:#1F497D">Dear Thibaut and Varleria,<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:#1F497D"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:#1F497D">Many thanks for your kind reply and the very useful explanations and suggestions! I have actually performed the &#8216;sliding windows&#8217; approach but in a GIS environment
 with some interesting results&#8230; However, I have one new question: Is there any way to posteriorly determine to what cluster a plant individual that was not included in the k-means clustering is most associated?
<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:#1F497D"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:#1F497D">Thanks for everything!<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:#1F497D"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:#1F497D">Cheers evert<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;;color:#1F497D"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><b><span style="font-size:10.0pt;font-family:&quot;Tahoma&quot;,&quot;sans-serif&quot;">From:</span></b><span style="font-size:10.0pt;font-family:&quot;Tahoma&quot;,&quot;sans-serif&quot;"> valeria montano [mailto:mirainoshojo@gmail.com]
<br>
<b>Sent:</b> miércoles, 05 de octubre de 2011 06:00 a.m.<br>
<b>To:</b> Jombart, Thibaut<br>
<b>Cc:</b> Thomas, Evert (Bioversity-Colombia); adegenet-forum@r-forge.wu-wien.ac.at<br>
<b>Subject:</b> Re: [adegenet-forum] interpretation sPCA<o:p></o:p></span></p>
<p class="MsoNormal"><o:p>&nbsp;</o:p></p>
<p class="MsoNormal">Hi again,&nbsp;<o:p></o:p></p>
<div>
<p class="MsoNormal"><o:p>&nbsp;</o:p></p>
</div>
<div>
<p class="MsoNormal">I see what you mean, I was superficially considering the fact that a clear spatial structure result with the spca could actually lead to spatially defined clusters in the dapc, but of course there is no warranty at all for that. I know
 your point about the (somehow) biological meaningless of the clusters, but still they are the genetic optimization of a specific dataset and I think this is, let's say, the &quot;best achievable structure&quot; in the contingency of someone's dataset. In very truth,
 in my view population structure is almost a philosophic concept (as much as fitness) and it is also true that any result in population genetic is usually the &quot;dataset&quot;'s point of view (with the genuine intuition of the one interpreting, of course). As for
 the summary statistics, a part from Fst, there are other useful ones, at least to get to know your data and also to support main findings. Btw the geoGraph package is really interesting...<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p>&nbsp;</o:p></p>
</div>
<div>
<p class="MsoNormal">Cheers<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p>&nbsp;</o:p></p>
</div>
<div>
<p class="MsoNormal" style="margin-bottom:12.0pt">Valeria &nbsp;<o:p></o:p></p>
<div>
<p class="MsoNormal">On 5 October 2011 12:37, Jombart, Thibaut &lt;<a href="mailto:t.jombart@imperial.ac.uk">t.jombart@imperial.ac.uk</a>&gt; wrote:<o:p></o:p></p>
<p class="MsoNormal">Hello,<br>
<br>
thanks for jumping into the discussion.<br>
<br>
One has to be careful when playing with summary statistics derived from k-means. k-means finds groups which, by definition, maximise the Fst. So it is not clear how Fst values should be interpreted: real strong structuring, or indication or a good optimization
 procedure? In any case they cannot be tested, but that's not what's at stake here.<br>
<br>
The problem using non-geographically constrained groups while looking for an origin is: how do you define the location of say, the associated Hs? Barycentre may do, but these groups may well not be geographically organised at all. One alternative though, following
 this idea, would be using spatially-constrained clustering.<br>
<br>
True, moving windows are a bit arbitrary in that how the windows are defined is one's choice, but windows of say 3 different sizes could be defined and the results compared. Anyway I know of little spatial analyses which are not arbitrary (e.g. Neighbouring
 graphs in autocorrelation methods, data transformation in IBD/Mantel tests, etc.).<br>
<br>
Cheers<br>
<br>
Thibaut<br>
<br>
<br>
<br>
________________________________________<br>
From: valeria montano [<a href="mailto:mirainoshojo@gmail.com">mirainoshojo@gmail.com</a>]<br>
Sent: 05 October 2011 01:25<br>
To: Jombart, Thibaut<br>
Cc: Thomas, Evert (Bioversity-Colombia); <a href="mailto:adegenet-forum@r-forge.wu-wien.ac.at">
adegenet-forum@r-forge.wu-wien.ac.at</a><br>
Subject: Re: [adegenet-forum] interpretation sPCA<o:p></o:p></p>
<div>
<p class="MsoNormal" style="margin-bottom:12.0pt"><br>
Hi there,<br>
<br>
sorry for my usual gratuitous intervention. I just wanted to suggest the eventuality to use the dapc groups as an alternative to population labels (summary statistics of internal diversity on them would already help getting an idea of the overall situation).
 I actually think that at the intraspecific level previous grouping of individuals based on sample location criteria or whatever are usually quite biased. Genetic structure grouping might sound as a circular reasoning, but I have the feeling it is less arbitrary
 than any other approach. The &quot;sliding windows&quot; is definitely an alternative but still a bit arbitrary and maybe scheming, although it may be worth comparing the results of the both. Moreover, to individuate the most probable point of origin of the species,
 it may be useful to also explore the phylogeography as a support to the results obtained with the population approach.<br>
<br>
Best<br>
<br>
Valeria<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal">On 4 October 2011 14:37, Jombart, Thibaut &lt;<a href="mailto:t.jombart@imperial.ac.uk">t.jombart@imperial.ac.uk</a>&lt;mailto:<a href="mailto:t.jombart@imperial.ac.uk">t.jombart@imperial.ac.uk</a>&gt;&gt; wrote:<br>
Dear Evert,<br>
<br>
I don't think the existence of a cline can be used to infer the origin of an organism. Surely in this case the cline you obtain is compatible with a 'central' origin, but the origin could as well be at either extremities of the cline, or anywhere in between.
 All the pattern says is that gene flow is somehow negatively related to geographic distance. More generally, no multivariate analysis result is directional. It would be reassuring if the outcome of sPCA roughly match that of DAPC, although both methods are
 different. This can be easily checked by DAPC scores on the map. Discrepancies can be due to, for instance, the fact that non-spatial genetic structures are the strongest (then DAPC will pick that up first). Another one would be the absence of spatial structure.
 It is safer to perform a global.rtest (although it lacks power) and to check the screeplot of sPCA before interpreting structures.<br>
<br>
Test the origin of your populations would need population-level data. The idea is that within-population diversity decreases when we get away from the origin due to repeated bottlenecks. If you don't have population data, one workaround would be using moving
 windows to map diversity geographically, and then use a simple optimisation procedure to find the 'optimal' origin. I don't know if this has been done before, so it might be newish. I have developed a package &quot;geoGraph&quot; (on Rforge, not on CRAN:
<a href="https://r-forge.r-project.org/R/?group_id=348" target="_blank">https://r-forge.r-project.org/R/?group_id=348</a>) which does this (apart from the moving windows) and has a vignette illustrating the whole process.<br>
<br>
Cheers<br>
<br>
Thibaut.<br>
<br>
<br>
<br>
________________________________________<o:p></o:p></p>
</div>
<p class="MsoNormal">From: Thomas, Evert (Bioversity-Colombia) [<a href="mailto:E.Thomas@CGIAR.ORG">E.Thomas@CGIAR.ORG</a>&lt;mailto:<a href="mailto:E.Thomas@CGIAR.ORG">E.Thomas@CGIAR.ORG</a>&gt;]<o:p></o:p></p>
<div>
<p class="MsoNormal">Sent: 03 October 2011 21:48<o:p></o:p></p>
</div>
<p class="MsoNormal">To: Jombart, Thibaut; Linda Rutledge; <a href="mailto:adegenet-forum@r-forge.wu-wien.ac.at">
adegenet-forum@r-forge.wu-wien.ac.at</a>&lt;mailto:<a href="mailto:adegenet-forum@r-forge.wu-wien.ac.at">adegenet-forum@r-forge.wu-wien.ac.at</a>&gt;<o:p></o:p></p>
<div>
<p class="MsoNormal">Subject: interpretation sPCA<br>
<br>
Dear Thibaut,<br>
<br>
I have a question regarding the interpretation of the sPCA scores as visualized in a color plot or interpolated lagged scores. I am working with intraspecific species data at continental level and found a strong gradient in my data &nbsp;with a clear separation
 of a northern and southern group. Based on a number of grounds I believe that the center of origin of the species I am working with is located &nbsp;at the &quot;genotone&quot; (or what to call this, I mean the grey area between both groups where the genetic differentiation
 is the steepest) . Does this make sense with the theory behind sPCA? I think the species moved north and south from the putative center of origin and developed into different genotypes which becomes apparent in the visualization of the sPCA...<br>
<br>
And should the outcome of an sPCA be somewhat reflected in the outcomes of discriminant analysis of principal components or are these really two different methods? (I apologize for my ignorance)<br>
<br>
Many thanks in advance<br>
<br>
Evert<br>
_______________________________________________<br>
adegenet-forum mailing list<o:p></o:p></p>
</div>
<p class="MsoNormal" style="margin-bottom:12.0pt"><a href="mailto:adegenet-forum@lists.r-forge.r-project.org">adegenet-forum@lists.r-forge.r-project.org</a>&lt;mailto:<a href="mailto:adegenet-forum@lists.r-forge.r-project.org">adegenet-forum@lists.r-forge.r-project.org</a>&gt;<br>
<a href="https://lists.r-forge.r-project.org/cgi-bin/mailman/listinfo/adegenet-forum" target="_blank">https://lists.r-forge.r-project.org/cgi-bin/mailman/listinfo/adegenet-forum</a><o:p></o:p></p>
</div>
<p class="MsoNormal"><o:p>&nbsp;</o:p></p>
</div>
</div>
</body>
</html>