<div>I don&#39;t do anything that mixes R and python so I can&#39;t comment on using the two interchangeably.</div>
<div> </div>
<div>There are some api&#39;s that I&#39;ve played around with that seem okay, but they probably buckle under a reasonable amount of preasure.<br><br></div>
<div class="gmail_quote">On Tue, Dec 7, 2010 at 10:47 AM, Santosh Srinivas <span dir="ltr">&lt;<a href="mailto:santosh.srinivas@gmail.com">santosh.srinivas@gmail.com</a>&gt;</span> wrote:<br>
<blockquote style="BORDER-LEFT: #ccc 1px solid; MARGIN: 0px 0px 0px 0.8ex; PADDING-LEFT: 1ex" class="gmail_quote">First ... thanks for data.table .... even I (with average R skills) am<br>able to do some cool stuff on large datasets and FAST!.<br>
<br>I&#39;ve heard that integrability with R is quite decent?<br>Python is next on my list but I hope my experience will be complementary<br>
<div>
<div></div>
<div class="h5"><br><br>On Tue, Dec 7, 2010 at 10:10 PM, Rob Forler &lt;<a href="mailto:rforler@uchicago.edu">rforler@uchicago.edu</a>&gt; wrote:<br>&gt; It&#39;s not a hard language to pick up, but definitely one of the challenges<br>
&gt; with replacing R with python is many of the stat and data packages that<br>&gt; exist in R.<br>&gt; Python has strong scientific and data packages, but I not at the same level.<br>&gt;<br>&gt; On the other hand python is much stronger from a language point of view<br>
&gt; (good oo etc), and has many more operational tools.<br>&gt;<br>&gt; -Rob<br>&gt;<br>&gt; On Tue, Dec 7, 2010 at 8:30 AM, Matthew Dowle &lt;<a href="mailto:mdowle@mdowle.plus.com">mdowle@mdowle.plus.com</a>&gt;<br>&gt; wrote:<br>
&gt;&gt;<br>&gt;&gt; Interesting. I don&#39;t know python but it&#39;s been on the radar a few times.<br>&gt;&gt;<br>&gt;&gt; &quot;Rob Forler&quot; &lt;<a href="mailto:rforler@uchicago.edu">rforler@uchicago.edu</a>&gt; wrote in message<br>
&gt;&gt; news:AANLkTikCZL=WhE_UoWiUvoQ+TLXj8dgrJ6iG4GhdOSdv@mail.gmail.com...<br>&gt;&gt; I&#39;m coding in python now. The group I&#39;m in now has a similar tool (closed<br>&gt;&gt; source)  to data.table but in python and is based on numpy.<br>
&gt;&gt;<br>&gt;&gt; The api isn&#39;t as beautiful as data.table&#39;s, but has similar functionality.<br>&gt;&gt;<br>&gt;&gt; -Rob<br>&gt;&gt;<br>&gt;&gt; On Tue, Dec 7, 2010 at 7:54 AM, Matthew Dowle &lt;<a href="mailto:mdowle@mdowle.plus.com">mdowle@mdowle.plus.com</a>&gt;<br>
&gt;&gt; wrote:<br>&gt;&gt;&gt;<br>&gt;&gt;&gt; Thanks Rob. That begs an obvious question then ... what are you coding in<br>&gt;&gt;&gt; now ?<br>&gt;&gt;&gt;<br>&gt;&gt;&gt; &quot;Rob Forler&quot; &lt;<a href="mailto:rforler@uchicago.edu">rforler@uchicago.edu</a>&gt; wrote in message<br>
&gt;&gt;&gt; news:AANLkTikSsoy8F6aKuQYXW5GWeMLiE+Y07D_3X+K7AeX=@mail.gmail.com...<br>&gt;&gt;&gt; I can attest that I used data.table very extensively for several months<br>&gt;&gt;&gt; on large datasets (financial). I was replacing a fair of poorly coded<br>
&gt;&gt;&gt; data/frame, sql, plyr, apply code, and was able to match the previous<br>&gt;&gt;&gt; numbers and do a significant amount of new analysis because of the ease of<br>&gt;&gt;&gt; using data.tables.<br>&gt;&gt;&gt;<br>
&gt;&gt;&gt; If I was still coding in R on a regular basis you can gauarauntee I&#39;d use<br>&gt;&gt;&gt; data.table every day.<br>&gt;&gt;&gt;<br>&gt;&gt;&gt; Thanks,<br>&gt;&gt;&gt; Rob<br>&gt;&gt;&gt;<br>&gt;&gt;&gt; On Tue, Dec 7, 2010 at 7:30 AM, Matthew Dowle &lt;<a href="mailto:mdowle@mdowle.plus.com">mdowle@mdowle.plus.com</a>&gt;<br>
&gt;&gt;&gt; wrote:<br>&gt;&gt;&gt;&gt;<br>&gt;&gt;&gt;&gt; Just to clarify also about the date of first release - March 2010? Any<br>&gt;&gt;&gt;&gt; chance Mel you looked at the CRAN archive page and read off the last<br>
&gt;&gt;&gt;&gt; row?<br>&gt;&gt;&gt;&gt; Oldest is first not last on that page :<br>&gt;&gt;&gt;&gt;<br>&gt;&gt;&gt;&gt; <a href="http://cran.r-project.org/src/contrib/Archive/data.table/" target="_blank">http://cran.r-project.org/src/contrib/Archive/data.table/</a><br>
&gt;&gt;&gt;&gt;<br>&gt;&gt;&gt;&gt; v1.0 was released April 2006 but that was removed from CRAN happily<br>&gt;&gt;&gt;&gt; because<br>&gt;&gt;&gt;&gt; base quickly (within weeks) included features that removed the need for<br>
&gt;&gt;&gt;&gt; data.table.  It was re-released in Aug 2008 with new functionality so<br>&gt;&gt;&gt;&gt; that&#39;s<br>&gt;&gt;&gt;&gt; the relevant release date for your purpose.<br>&gt;&gt;&gt;&gt;<br>&gt;&gt;&gt;&gt; Feel free to post the puzzling results. You&#39;ve done well to use it for 2<br>
&gt;&gt;&gt;&gt; weeks without posting, so you can probably tilt towards using this list<br>&gt;&gt;&gt;&gt; more<br>&gt;&gt;&gt;&gt; (on a new thread please). If we can get you over those hurdles first<br>&gt;&gt;&gt;&gt; then<br>
&gt;&gt;&gt;&gt; reconsider if the &#39;robustness&#39; question still stands.<br>&gt;&gt;&gt;&gt;<br>&gt;&gt;&gt;&gt; Other info which you may have not have found yet ...<br>&gt;&gt;&gt;&gt;<br>&gt;&gt;&gt;&gt; Crantastic has 5 detailed user reviews of data.table. It does state that<br>
&gt;&gt;&gt;&gt; v1.1 was released over 2 years ago, too, so leads me to guess you may<br>&gt;&gt;&gt;&gt; have<br>&gt;&gt;&gt;&gt; missed the link to crantastic on the data.table homepage.<br>&gt;&gt;&gt;&gt;<br>&gt;&gt;&gt;&gt; There are some oddities in the ranking formula but if you look at<br>
&gt;&gt;&gt;&gt; <a href="http://crantastic.org/popcon" target="_blank">http://crantastic.org/popcon</a> and realise that the batch near the bottom<br>&gt;&gt;&gt;&gt; starting with reshape, ggplot2 and plyr should be at the top (seems like<br>
&gt;&gt;&gt;&gt; a<br>&gt;&gt;&gt;&gt; bug, I&#39;ll let them know) then data.table appears to be around the 8th<br>&gt;&gt;&gt;&gt; most<br>&gt;&gt;&gt;&gt; popular CRAN package with average score 4.7/5 and 10 users, compared to<br>
&gt;&gt;&gt;&gt; ggplot2&#39;s 39 users.  So crantastic itself is not popular since everyone<br>&gt;&gt;&gt;&gt; knows that ggplot2 has many more than 39 users, and some very popular<br>&gt;&gt;&gt;&gt; and<br>&gt;&gt;&gt;&gt; stable packages don&#39;t have any votes at all. Even so perhaps this small<br>
&gt;&gt;&gt;&gt; amount of data may be useful in your assessment generally.  &quot;data.table&quot;<br>&gt;&gt;&gt;&gt; is<br>&gt;&gt;&gt;&gt; not the easiest to google for.<br>&gt;&gt;&gt;&gt;<br>&gt;&gt;&gt;&gt; The NEWS file (link on the homepage) says that v1.2 was released in Aug<br>
&gt;&gt;&gt;&gt; 2008, too, at the bottom, along with what changed in each release since<br>&gt;&gt;&gt;&gt; then.<br>&gt;&gt;&gt;&gt;<br>&gt;&gt;&gt;&gt; Matthew<br>&gt;&gt;&gt;&gt;<br>&gt;&gt;&gt;&gt; &quot;Tom Short&quot; &lt;<a href="mailto:tshort.rlists@gmail.com">tshort.rlists@gmail.com</a>&gt; wrote in message<br>
&gt;&gt;&gt;&gt; news:AANLkTik=0j5da9j8_zVaW4DZhygKg6oqRP1Pg+JG3TFg@mail.gmail.com...<br>&gt;&gt;&gt;&gt; &gt; On Mon, Dec 6, 2010 at 10:54 PM, mbacou &lt;<a href="mailto:mel@mbacou.com">mel@mbacou.com</a>&gt; wrote:<br>&gt;&gt;&gt;&gt; &gt;&gt; My question is: is data.table ready for production? Would you rely on<br>
&gt;&gt;&gt;&gt; &gt;&gt; it<br>&gt;&gt;&gt;&gt; &gt;&gt; for<br>&gt;&gt;&gt;&gt; &gt;&gt; sensitive publications?<br>&gt;&gt;&gt;&gt; &gt;<br>&gt;&gt;&gt;&gt; &gt; If you have tight time deadlines, you may want to go with what you<br>
&gt;&gt;&gt;&gt; &gt; have experience with, especially if it involves complicated queries or<br>&gt;&gt;&gt;&gt; &gt; manipulations. If you&#39;ve already tried the data.table features you&#39;ll<br>&gt;&gt;&gt;&gt; &gt; need for &quot;production&quot;, then using data.table may help you get things<br>
&gt;&gt;&gt;&gt; &gt; done faster.<br>&gt;&gt;&gt;&gt; &gt;<br>&gt;&gt;&gt;&gt; &gt; Data.table has been robust for me on 6-GB datasets on a machine with<br>&gt;&gt;&gt;&gt; &gt; 24 GB of ram. With data.table, as with most tools, user error is more<br>
&gt;&gt;&gt;&gt; &gt; likely than a tool bug, so you need to test/check your data and your<br>&gt;&gt;&gt;&gt; &gt; results.<br>&gt;&gt;&gt;&gt; &gt;<br>&gt;&gt;&gt;&gt; &gt; - Tom<br>&gt;&gt;&gt;&gt;<br>&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt;<br>&gt;&gt;&gt;&gt; _______________________________________________<br>&gt;&gt;&gt;&gt; datatable-help mailing list<br>&gt;&gt;&gt;&gt; <a href="mailto:datatable-help@lists.r-forge.r-project.org">datatable-help@lists.r-forge.r-project.org</a><br>
&gt;&gt;&gt;&gt;<br>&gt;&gt;&gt;&gt; <a href="https://lists.r-forge.r-project.org/cgi-bin/mailman/listinfo/datatable-help" target="_blank">https://lists.r-forge.r-project.org/cgi-bin/mailman/listinfo/datatable-help</a><br>
&gt;&gt;&gt;<br>&gt;&gt;&gt; ________________________________<br>&gt;&gt;&gt;<br>&gt;&gt;&gt; _______________________________________________<br>&gt;&gt;&gt; datatable-help mailing list<br>&gt;&gt;&gt; <a href="mailto:datatable-help@lists.r-forge.r-project.org">datatable-help@lists.r-forge.r-project.org</a><br>
&gt;&gt;&gt;<br>&gt;&gt;&gt; <a href="https://lists.r-forge.r-project.org/cgi-bin/mailman/listinfo/datatable-help" target="_blank">https://lists.r-forge.r-project.org/cgi-bin/mailman/listinfo/datatable-help</a><br>&gt;&gt;&gt;<br>
&gt;&gt;&gt; _______________________________________________<br>&gt;&gt;&gt; datatable-help mailing list<br>&gt;&gt;&gt; <a href="mailto:datatable-help@lists.r-forge.r-project.org">datatable-help@lists.r-forge.r-project.org</a><br>
&gt;&gt;&gt;<br>&gt;&gt;&gt; <a href="https://lists.r-forge.r-project.org/cgi-bin/mailman/listinfo/datatable-help" target="_blank">https://lists.r-forge.r-project.org/cgi-bin/mailman/listinfo/datatable-help</a><br>&gt;&gt;&gt;<br>
&gt;&gt;<br>&gt;&gt; ________________________________<br>&gt;&gt;<br>&gt;&gt; _______________________________________________<br>&gt;&gt; datatable-help mailing list<br>&gt;&gt; <a href="mailto:datatable-help@lists.r-forge.r-project.org">datatable-help@lists.r-forge.r-project.org</a><br>
&gt;&gt;<br>&gt;&gt; <a href="https://lists.r-forge.r-project.org/cgi-bin/mailman/listinfo/datatable-help" target="_blank">https://lists.r-forge.r-project.org/cgi-bin/mailman/listinfo/datatable-help</a><br>&gt;&gt;<br>&gt;&gt; _______________________________________________<br>
&gt;&gt; datatable-help mailing list<br>&gt;&gt; <a href="mailto:datatable-help@lists.r-forge.r-project.org">datatable-help@lists.r-forge.r-project.org</a><br>&gt;&gt;<br>&gt;&gt; <a href="https://lists.r-forge.r-project.org/cgi-bin/mailman/listinfo/datatable-help" target="_blank">https://lists.r-forge.r-project.org/cgi-bin/mailman/listinfo/datatable-help</a><br>
&gt;&gt;<br>&gt;<br>&gt;<br>&gt; _______________________________________________<br>&gt; datatable-help mailing list<br>&gt; <a href="mailto:datatable-help@lists.r-forge.r-project.org">datatable-help@lists.r-forge.r-project.org</a><br>
&gt; <a href="https://lists.r-forge.r-project.org/cgi-bin/mailman/listinfo/datatable-help" target="_blank">https://lists.r-forge.r-project.org/cgi-bin/mailman/listinfo/datatable-help</a><br>&gt;<br>&gt;<br>_______________________________________________<br>
datatable-help mailing list<br><a href="mailto:datatable-help@lists.r-forge.r-project.org">datatable-help@lists.r-forge.r-project.org</a><br><a href="https://lists.r-forge.r-project.org/cgi-bin/mailman/listinfo/datatable-help" target="_blank">https://lists.r-forge.r-project.org/cgi-bin/mailman/listinfo/datatable-help</a><br>
</div></div></blockquote></div><br>