<div dir="ltr"><span style="font-size:13px">fread() and in particular that you can paste content directly into the terminal i.e.  fread("ctrl-v")</span><div style="font-size:13px">fread() that it can read directly from a massive gzipped text file using a call to a system command, with no hassle i.e. fread("gunzip -c massive_file.txt")</div><div style="font-size:13px"><br></div><div style="font-size:13px">foverlaps() just that it exists and how quick it is for region overlaps (I do a lot of genomics)</div><div style="font-size:13px"><br></div><div style="font-size:13px">subset.data.table() allows negation of column selection i.e. subset(DT,select=-unwanted_column)</div><div style="font-size:13px"><br></div><div style="font-size:13px">data.table allows chaining of different selection statements DT[value<0.5][value>0.4][id %in% my_interesting_id_list]</div><div style="font-size:13px"><br></div><div style="font-size:13px">I discover more every time I use it, just thought some more complex examples (like the every-roof-in-the-uk machine learning example from your talk) would be helpful to illustrate the range of expressions you can supply to a data.table</div><div style="font-size:13px">The docs are very good and hugely comprehensive, just sometimes its best to start with a complex example and then take it apart</div></div><div class="gmail_extra"><br><div class="gmail_quote">On 8 December 2014 at 22:49, Matt Dowle <span dir="ltr"><<a href="mailto:mdowle@mdowle.plus.com" target="_blank">mdowle@mdowle.plus.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
  
    
  
  <div text="#000000" bgcolor="#FFFFFF">
    <div><br>
      James,<br>
      <br>
      Thanks. Just to avoid crossed-wires, which features do you mean
      exactly?<br>
      <br>
      Thanks, Matt<div><div class="h5"><br>
      <br>
      On 08/12/14 15:25, James Eales wrote:<br>
    </div></div></div><div><div class="h5">
    <blockquote type="cite">
      <div dir="ltr">
        <div>Matt,</div>
        Very impressive show of what data.table can do
        <div>
          <div>
            <div>It would be helpful to have a wider set of these more
              'advanced' data.table function calls in the FAQ</div>
            <div>I keep discovering more features, even after reading
              the FAQ, R-help and intro vignette multiple times (this is
              not a criticism of the docs, but praise for DT's
              flexibility)</div>
          </div>
        </div>
        <div>Learning by example, even if you don't understand it fully
          the first time, can be very powerful</div>
        <div>James</div>
      </div>
      <div class="gmail_extra"><br>
        <div class="gmail_quote">On 8 December 2014 at 15:03, Matt Dowle
          <span dir="ltr"><<a href="mailto:mdowle@mdowle.plus.com" target="_blank">mdowle@mdowle.plus.com</a>></span>
          wrote:<br>
          <blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><br>
            As a few have asked already, will upload slides later.  It
            was a collection of different files and part was just an R
            script. I'll need to merge together ...
            <div>
              <div><br>
                <br>
                On 08/12/14 14:44, Matt Dowle wrote:<br>
                <blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
                  Hi,<br>
                  <br>
                  A video of my talk at H2O World in San Francisco
                  recently :<br>
                  <br>
                     <a href="https://www.youtube.com/watch?v=MvH1eTdsekA" target="_blank">https://www.youtube.com/watch?v=MvH1eTdsekA</a><br>
                  <br>
                    0:00   Examples from two insurance companies using
                  data.table<br>
                  12:00   What is data.table, benchmarks dplyr and
                  pandas<br>
                  16:55   Overlap joins<br>
                  20:00   Rolling joins<br>
                  22:30   data.table radix sorting is better than
                  hashing (dplyr and pandas)<br>
                  23:00   H2O (just parallel file reading and grouping
                  as quick test)<br>
                  30:00   Quick rerun of talk at Bay Area R User Group
                  (sorting benchmark, automatic indexes flows through to
                  dplyr, numeric rounding)<br>
                  33:10   My status<br>
                  36:45   Questions<br>
                  49:26   End<br>
                  <br>
                  Comments/suggestions very welcome.<br>
                  <br>
                  Matt<br>
                  <br>
                  <br>
                </blockquote>
                <br>
                _______________________________________________<br>
                datatable-help mailing list<br>
                <a href="mailto:datatable-help@lists.r-forge.r-project.org" target="_blank">datatable-help@lists.r-forge.r-project.org</a><br>
                <a href="https://lists.r-forge.r-project.org/cgi-bin/mailman/listinfo/datatable-help" target="_blank">https://lists.r-forge.r-project.org/cgi-bin/mailman/listinfo/datatable-help</a><br>
              </div>
            </div>
          </blockquote>
        </div>
        <br>
      </div>
    </blockquote>
    <br>
  </div></div></div>

</blockquote></div><br></div>