[Sorvi-admin] Fwd: tilastokeskuksen avointen aineistojen url-listaus

Leo Lahti leo.lahti at iki.fi
Wed May 9 11:28:47 CEST 2012


>> Alla on tietoa Tilastokeskuksen kaavailemasta vaihtoehtoisesta
>> xdf-formaatista mikäli innostutte testaamaan josko näitä saisi
>> kätevästi R:n XML-toiminnoilla luettua. Päätin skipata toistaiseksi,
>> koska olen ymmärtänyt että suurin osa tiedoista ei olisi vielä tässä
>> formaatissa saatavilla.
>
>
> En lukenut speksejä, mutta onko tällä siis tarkoitus korvata nuo puhtaat PC
> Axis-formaatit? Vaikuttaa joustavammalta (ja monimutkaisemmalta) formaatilta
> kuvata tilastodataa.

Hans puhui, että ovat miettineet tällaista. Ja pyysi palautetta
aiheeseen liittyen. Epäselväksi jäi, onko tämä varmuudella tulossa, ja
tulisiko tämä PX:n rinnalle vai sijasta.

> Tuossa http://pxweb2.stat.fi/database/StatFin/StatFin_rap.csv listassa on
> ~2600 linkkiä, jäikö mitään käsitystä miksei ne toimi?

Siinä oli pääasiassa kolmea virhetyyppiä:
1) Erotinongelma px-filessä, jota pxR-paketin funktiot ei (vielä) osaa
käsitellä, vaikka esim. PC Edit ilmeisesti osaa näitäkin lukea.
2) Muistin loppuminen kesken isojen tiedostojen kohdalla (pari
erilaista ilmoitusta).

Pistin näistä Hansille lyhyen raportin esimerkkitiedostojen kanssa.
Eivät kuitenkaan varsinaisesti tue R:ää, joten pitää katsoa mitä
asialle saadaan tehdyksi. Oli myös juttua, että jos löytyy tiedostoja
joita ei ole talletettu täsmälleen sovitun standardiformaatin
mukaisesti (vääriä erottimia tms), niin nämä ainakin korjataan
pikaisesti. Tällaisten tiedostojen tunnistaminen noiden 2600 joukosta
on vähän hankalaa kun virhe voi olla myös pxR-paketin lukurutiineissa.
Ovat kai parhaillaan tsekkaamassa lähettämiäni esimerkkejä.

csv-formaatissa eivät tahdo dataa jakaa, koska metatiedot katoaisivat.

Leo


More information about the Sorvi-admin mailing list