[Sorvi-admin] Fwd: tilastokeskuksen avointen aineistojen url-listaus
Leo Lahti
leo.lahti at iki.fi
Wed May 9 16:22:25 CEST 2012
>> 1) Erotinongelma px-filessä, jota pxR-paketin funktiot ei (vielä) osaa
>> käsitellä, vaikka esim. PC Edit ilmeisesti osaa näitäkin lukea.
>
> pxR:n sorsia voisi vilkaista jos sieltä voisi vaikka itse muuttaa erottomia.
Koitin aiemmin, näyttää että vaatisi suht paljon px-formaatin
tuntemusta tai aikaavievaa koodin puljausta ennen kuin saa toimiin.
>> 2) Muistin loppuminen kesken isojen tiedostojen kohdalla (pari
>> erilaista ilmoitusta).
>
> Kokeilitko 64-bittisellä R:llä? Tämä ei varmaan ole raudasta kiinni?
Mulla on suht hyvä työkone, tämä ei näyttäisi olevan siitä kiinni.
pxR-paketin funktioitten osalta asiaa varmaan pystyis periaatteessa
kehittämään toimivammaksi.
> Kumpikaan em. korjauksista ei ole kovinkaan hyödyllinen jos tieto halutaan
> hakea soRvilla lennosta, mutta jos HSopeniin pitää toimittaa esim. csv:t
> niin voisi toimia.
Veikkaan et saadaan nykyisillä jo HSOpeniin riittävät, pitemmällä
tähtäimellä täytyy katsoa jos Tilastokeskukselta saisi vetoapua, tai
kerettäisiin itse perehtymään R:n osalta paremmin asiaan.
>> csv-formaatissa eivät tahdo dataa jakaa, koska metatiedot katoaisivat.
>
> Ihan fiksua, sorvinkin tapauksessa kai olisi parempi hakea tiedot nimenomaan
> px-olioina?
Tällä hetkellä haetaankin, read.px-funktiolla. Toistaiseksi olen
muuntanut nämä data.frameiksi kun metatiedoille ei ole ollut erityistä
käyttöä. Jatkon kannalta vois olla tosin hyödyllistä katsoa josko
näitä saisi R:ssä hyödynnetyksi.
Leo
More information about the Sorvi-admin
mailing list