[Sorvi-admin] Fwd: tilastokeskuksen avointen aineistojen url-listaus

Leo Lahti leo.lahti at iki.fi
Wed May 9 16:22:25 CEST 2012


>> 1) Erotinongelma px-filessä, jota pxR-paketin funktiot ei (vielä) osaa
>> käsitellä, vaikka esim. PC Edit ilmeisesti osaa näitäkin lukea.
>
> pxR:n sorsia voisi vilkaista jos sieltä voisi vaikka itse muuttaa erottomia.

Koitin aiemmin, näyttää että vaatisi suht paljon px-formaatin
tuntemusta tai aikaavievaa koodin puljausta ennen kuin saa toimiin.


>> 2) Muistin loppuminen kesken isojen tiedostojen kohdalla (pari
>> erilaista ilmoitusta).
>
> Kokeilitko 64-bittisellä R:llä? Tämä ei varmaan ole raudasta kiinni?

Mulla on suht hyvä työkone, tämä ei näyttäisi olevan siitä kiinni.
pxR-paketin funktioitten osalta asiaa varmaan pystyis periaatteessa
kehittämään toimivammaksi.

> Kumpikaan em. korjauksista ei ole kovinkaan hyödyllinen jos tieto halutaan
> hakea soRvilla lennosta, mutta jos HSopeniin pitää toimittaa esim. csv:t
> niin voisi toimia.

Veikkaan et saadaan nykyisillä jo HSOpeniin riittävät, pitemmällä
tähtäimellä täytyy katsoa jos Tilastokeskukselta saisi vetoapua, tai
kerettäisiin itse perehtymään R:n osalta paremmin asiaan.


>> csv-formaatissa eivät tahdo dataa jakaa, koska metatiedot katoaisivat.
>
> Ihan fiksua, sorvinkin tapauksessa kai olisi parempi hakea tiedot nimenomaan
> px-olioina?

Tällä hetkellä haetaankin, read.px-funktiolla. Toistaiseksi olen
muuntanut nämä data.frameiksi kun metatiedoille ei ole ollut erityistä
käyttöä. Jatkon kannalta vois olla tosin hyödyllistä katsoa josko
näitä saisi R:ssä hyödynnetyksi.

Leo


More information about the Sorvi-admin mailing list