I agree that we might want to have these things in a package say RcppBase.<div>Then Rcpp can remain the R to cpp layer. And anybody who want to implement an R base function in cpp, can contribute it to RcppBase.</div><div>
<br></div><div>Willem</div><div class="gmail_extra"><br><br><div class="gmail_quote">On Fri, Nov 16, 2012 at 8:56 AM, Romain Francois <span dir="ltr"><<a href="mailto:romain@r-enthusiasts.com" target="_blank">romain@r-enthusiasts.com</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">We need to fond the right compromise between bloating Rcpp (which is already quite huge:<br>
<br>
wc src/* inst/include/**/** inst/include/* 2> /dev/null | tail -n1<br>
   66180  784183 6425152 total<br>
<br>
and support generic enough things.<br>
<br>
I can see things like union and setdiff being generic enough (we already have unique btw).<br>
<br>
<br>
Then for other things, being in another package is not that bad.<br>
An after all, this is what Rcpp really is about: give others the tools.<br>
<br>
Romain<br>
<br>
Le 15/11/12 20:07, Søren Højsgaard a écrit :<div class="HOEnZb"><div class="h5"><br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
Dear list<br>
<br>
[>>] I am not sure if Hadleys remark below was an invitation to make a "wishlish", but I'll take the risk:<br>
<br>
1) I have made several packages related to graphical models for multivariate data. Much of these packages deals with "book keeping": operations on sets of subsets of a finite set of variables, so in these packages there is much use of union(), setdiff(), etc and these function all heavily use match(). The same applies to unique() which is also based on match(). It would be very nice to have these in c++ form. Hence, with a c++ version of match() these should be low-hanging apples.<br>

<br>
2) Also of relevance to the graphical model packages is a c++ version of aperm() for permuting an array.<br>
<br>
3) There are operations on such arrays which I imagine could be conveniently made in the Rcpp-framwork. Consider a 2x2x2 contingency table with dimnames a,b,c. Call this table n(a,b,c). The all-two-factor log-linear model will have generators (a,b)(a,c)(c,b). Iterative proportional fitting works as follows: Let m(a,b,c) denotes the array of fitted values (at the current iteration). Then the update for the (c,b) generator is<br>

<br>
  m(a,b,c) <- m(a,b,c) n(c,b)/m(c,b)<br>
<br>
To do this one must have<br>
  marginalization: n(a,b,c) -> n(b,c)<br>
  permutation: n(b,c) -> n(c,b)<br>
  division: n(c,b)/m(c,b)<br>
  multiplication: m(a,b,c) * ( n(c,b)/m(c,b) )<br>
<br>
I am aware that iterative proportional fitting is already implemented in loglin, but there are other kind of (graphical) models where similar updates are needed. In connection with message passing in Bayesian networks, one operation often needed is<br>

<br>
  m(a,b,c) <- n(a,b) * n(c,b)<br>
<br>
which will result in an array with dimensions (a,b,c). All of this stuff is implemented in the gRbase backage as R functions, and it would be very convenient to have these operations as c++ functions. In the gRbase implementation it is required that the arrays do have dimnames, and I guess it must be so also in c++.<br>

<br>
I am perfectly aware that I should program these facilities in c++ using Rcpp, but I just can't resist to mention these wishes, in case they are "almost there" in c++.<br>
<br>
Best regards<br>
Søren<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
Hmmm - see <a href="http://cran.r-project.org/web/packages/fastmatch/index.html" target="_blank">http://cran.r-project.org/web/<u></u>packages/fastmatch/index.html</a><br>
<br>
Hadley<br>
<br>
PS.  Would you be interested in a set of R functions that from a quick skim of the R sources that I think could be much much faster if implemented in Rcpp?<br>
<br>
<br>
--<br>
RStudio / Rice University<br>
<a href="http://had.co.nz/" target="_blank">http://had.co.nz/</a><br>
<br>
</blockquote>
<br>
<br></div></div><div class="im HOEnZb">
-- <br>
Romain Francois<br>
Professional R Enthusiast<br>
<a href="tel:%2B33%280%29%206%2028%2091%2030%2030" value="+33628913030" target="_blank">+33(0) 6 28 91 30 30</a><br>
<br>
R Graph Gallery: <a href="http://gallery.r-enthusiasts.com" target="_blank">http://gallery.r-enthusiasts.<u></u>com</a><br>
`- <a href="http://bit.ly/SweN1Z" target="_blank">http://bit.ly/SweN1Z</a> : SuperStorm Sandy<br>
<br>
blog:            <a href="http://romainfrancois.blog.free.fr" target="_blank">http://romainfrancois.blog.<u></u>free.fr</a><br>
|- <a href="http://bit.ly/RE6sYH" target="_blank">http://bit.ly/RE6sYH</a> : OOP with Rcpp modules<br>
`- <a href="http://bit.ly/Thw7IK" target="_blank">http://bit.ly/Thw7IK</a> : Rcpp modules more flexible<br>
<br></div><div class="HOEnZb"><div class="h5">
______________________________<u></u>_________________<br>
Rcpp-devel mailing list<br>
<a href="mailto:Rcpp-devel@lists.r-forge.r-project.org" target="_blank">Rcpp-devel@lists.r-forge.r-<u></u>project.org</a><br>
<a href="https://lists.r-forge.r-project.org/cgi-bin/mailman/listinfo/rcpp-devel" target="_blank">https://lists.r-forge.r-<u></u>project.org/cgi-bin/mailman/<u></u>listinfo/rcpp-devel</a><br>
</div></div></blockquote></div><br></div>