[Sorvi-admin] soRvi Apps4Finland-työpajaan?

Leo Lahti leo.lahti at iki.fi
Sat Aug 25 11:58:25 CEST 2012


Moikka, ohjelma näyttää tosi hyvältä ja todella harmi että meillä ehti jo
olla liiat päällekkäisyydet tässä.

Meidän puolelta voi kertoa esim. sellaiset terveiset työpajaan, että
kehitämme avoimen datan ohjelmakirjastoja R:lle ja tulevaisuudessa
suunnitelmien mukaan muillekin kielille, kuten Pythonille. Valmiiden haku-
ja esikäsittelyrutiinien myötä on Tilastokeskuksen aineistoja ja muita
avoimen datan lähteitä voidaan sujuvasti hakea ja yhdistää ja louhia
vuorovaikutteisesti moderneilla analyysimenetelmillä. Ohjelmakirjastot on
sovitettu nimenomaan suomalaisen avoimen datan tarpeisiin samalla kun
verkostoja pidetään yllä vastaaviin paikallisiin hankkeisiin muissa
maissa.  Tavoitteena on luoda Suomeen avoimen datan koodi-infrastruktuuri,
joka palvelee erityisesti suomalaisia tutkijoita, järjestöjä,
datajournalisteja ja avoimen datan aktiiveja. Tilastokeskuksen aineistot on
keskeinen tietolähde, ja olemme mielellämme mukana edistämässä aineistojen
saatavuutta ja käyttöä omalta osaltamme.

Jos johonkin väliin sopii linkkejä, niin voi mainita seuraavat:
Suomalainen avoimen datan ohjelmakirjasto +  blogi: Louhos (
louhos.github.com)
Avoimen datan työkalupakki R-kielelle: soRvi (louhos.github.com/sorvi)

t. Leo


2012/8/25 Petri Kola <petri.kola at gmail.com>

> Moikka
>
> Sori kun tämän Apps-yhteistyökuvio ilmaantui niin lyhyellä varoitusajalla.
> Pidimme eilen kokouksen tilastokeskuksella, jossa löytiin lukkoon
> Stats4Finland-työpajan sisältö - ainakin pääpiirteissään. Jonkinlaiset
> terveiset ja soRviin tutustumisvinkit teiltä välittäisin mielelläni
> työpajaan, vaikka sitten parin nettilinkin muodossa.
>
> Työpajan ohjelma:
>
> 13:00 Olli Rinne (Apps4Finland 2012): Tervetuloa, GitHub-koodijaon esittely
>
> 13:20 Hami Kekkonen (Helsingin kaupungin tietokeskus): Helsinki etsii
> tilastodatan esittämistapoja
>
> 13:30 Jussi Melkas (Tilastokeskus): Tilastoalan peruskäsitteet ja teorian
> jäsentäminen
> Tilastokeskuksen tilastokoulu;
> http://tilastokeskus.fi/tup/verkkokoulu/index.html
> Euroopan tilastojärjestelmä, Suomen virallinen tilasto, Tilastokeskus
> tilastoalan peruskäsitteet
> case-esimerkki
>
> 14:15 Markku Huttunen (Tilastokeskus): Tilastokeskuksen aineistot
> StatFin-tietokannan aineistot
> aineistojen käyttöoikeudet
>
> 14:30 Veli-Matti Jantunen (Tilastokeskus): Tilastokeskuksen tilastodatan
> tiedostomuodot
> px-tiedostoformaatti ja metadata
> moniulotteinen tilastotaulukko (kuutiomalli)
> PX-Edit-ohjelma
> CSV ja XML-rajapinnat
>
> 15:15 tauko
>
> 15:35 Kim Huuhko (Tilastokeskus): case Eurostat
> Eurostatin rajapinta
> Case: Näin Tilastokeskus käyttää Eurostatin avoimia aineistoja
> muita kansainvälisiä tiedontarjoajia
>
> 16:10 Jussi Arpalahti (Tilastokeskus): Tilastokeskuksen avointen
> aineistojen hyödyntäminen; interaktiivisia esimerkkejä
> IPython
> Google Charts
>
> --
>
>
>
>
>
> - miten rahoitusta?
>
>
> Moikka, tnx -
>
> me ollaan oltu yhteydessä Tilastokeskuksen kanssa (lähinnä Hans
> Baumgarter) PC Axis-formaatin tiimoilta - siihen kun on kunnolla toimiva
> rajapinta saatavilla vain Windowsille. Unix-pohjaisilla järjestelmillä voi
> lukea automatisoidusti (esim. R:ään) vain alle puolet Tilastokeskuksen n.
> 2700 avoimesta datasetistä. Puhetta on ollut, että Tilastokeskus voisi ehkä
> tulevaisuudessa harkita XML-pohjaisen formaatin tarjoamista PCAxisin
> rinnalla. Tämä on yksi selkeä toive. Meitä on kysytty kokeilemaan ko.
> aineistoa, mutta kun teemme hommia vapaaehtoispohjalta, tähän ei ole
> toistaiseksi löytynyt aikaa. Olisi hienoa, jos Tilastokeskukselta irtoaisi
> henkilöresursseja selvittämään tuon XML-pohjaisen formaatin toimivuutta sen
> kannalta miten pystyy lukemaan suoraan R:n ja/tai Pythonin kaltaisiin
> kieliin.
>
> Ehkä asiaa voisi edistää, jos Tilastokeskuksella olisi virallinen
> yhteyshenkilö tms., mutta toistaiseksi on pärjätty hienosti Hansin kanssa.
>
> Pitkällä tähtäimellä olisi hyvä pyrkiä edistämään Tilastokeskuksen
> aineistojen koneluettavuutta verkon yli - siinä on nyt pullonkauloja joihin
> olemme törmänneet - osallistumme mielellämme tähän keskusteluun ja
> testailuun.
>
> Leo
>
>
> 2012/8/24 Petri Kola <petri.kola at gmail.com>
>
>> alkaa 20 min päästä?
>>
>> pistä mulle vaikka tähän privana mitä toivoisit tilastokeskukselta?
>> yhteyshenkilön? auttamaan missä?
>>
>>
>>
>> On 24.8.2012, at 11.34, Leo Lahti wrote:
>>
>> Ahh, olikos paltsu vielä käynnissä? Unohdin aamulle että mulla on tunti
>> aikaeroa tunti.
>>
>> Leo
>>
>> 2012/8/24 Petri Kola <petri.kola at gmail.com>
>>
>>>
>>> hyvä jos saadaan rakennettua kontaktia tilastokeskukseen päin - eli
>>> tulkaa ihmeessä mukaan skypeen
>>> mun tunnus on petrikola - pistäkää kontaktointeja tulemaan
>>>
>>> Moi, näyttää todella harmillisesti siltä että me ei pystytä saamaan
>>> sorvi/louhos-projektista ihmisiä 5.9. workshoppiin tällä aikataululla,
>>> mutta voitaisiin silti osallistua skypen/puhelimen kanssa perjantain
>>> suunnittelupalaveriin jos siitä on hyötyä.
>>>
>>> Leo
>>>
>>>
>>> 2012/8/23 Petri Kola <petri.kola at gmail.com>
>>>
>>>> tässä alustavaa työpajan sisällön luonnostelua mailikeskustelusta
>>>> kopsattuna
>>>>
>>>> Moikka
>>>>
>>>> 1) Katselin Maps4Finland (http://apps4finland.
>>>> fi/tapahtumat/maps4finland-tyopaja/) työpajan ohjelmaa. Se näyttää
>>>> olevan
>>>> englanniksi. Onko Stats4Finland työpajan esitys- ja keskustelukieli
>>>> englanti,
>>>> suomi vaiko molemmat?
>>>>
>>>>
>>>> Tässä täytynee mennä esiintyjien toiveiden mukaan. Englannin
>>>> käyttäminen olisi toivottavaa, mutta jos se on hankalaa ja sisältö kärsii
>>>> siitä on parempi käyttää suomea. Toiveemme on, että esitysmateriaalit
>>>> tehtäisiin kuitenkin englanniksi.
>>>>
>>>> 2) Varmaankin ohjelman sisältö tulisi ensivaiheessa päätasolla, joka jo
>>>> antaisi
>>>> kuvaa niistä asiosta mitä työpajassa käsitellään. Alla ajatuksia ja
>>>> heittoja
>>>> tilastoalan peruskäsitteet / teorian jäsentäminen osasta erityisesti
>>>> Jussi
>>>> M:lle. Muutama haastekin meille tilastokeskuslaisille koskien uutta
>>>> Verkkokoulua.
>>>>
>>>> Tilastoalan peruskäsitteet / teorian jäsentäminen (Jussi Melkas)
>>>> - voisiko tässä kohden hyödyntää Verkkokoulua jotenkin (
>>>> http://tilastokeskus.
>>>> fi/tup/verkkokoulu/index.html) ?
>>>>
>>>> - voidaanko verkkokoulu linkittää jo tilaisuuden ohjelman yhteyteen,
>>>> niin että
>>>> osallistujat pääsisivät tutustumaan Verkkokoulun itseopiskeluaineistoon
>>>> jo
>>>> etukäteen ennen työpajaa?
>>>> - Verkkokoulun sisältö on uudistumassa tämän syksyn aikana, olisiko
>>>> meillä
>>>> mahdollisuuksia saada uusittua aineistoa julkaistua kilpailun aikana
>>>> (kilpailutöiden jättöaika päättyy 28.10)?
>>>> - olisiko meillä mahdollisuuksia luoda uuteen Verkkokouluun osiota
>>>> avoimesta
>>>> datasta?
>>>>
>>>>
>>>> Verkkokoulu vaikuttaa hyvältä resurssilta jota kannattaa pitää esillä
>>>> työpajan viestinnässä ja itse työpajassa. Työpajassa asioita voisi
>>>> toivottavasti esittää mahdollisimman visuaalisesti ja arkikokemuksessa
>>>> kiinni olevien esimerkkien avulla, käsitteiden määrittelemisen sijaan. En
>>>> tiedä mitä pedagogit ovat mieltä, mutta mielestäni erilaisten
>>>> pieleenmenemisen mahdollisuuksien näyttäminen ja kertominen on hyödyllistä.
>>>> Sitähän se jäätele-hukkumiskuolemat-vertauskin on.
>>>>
>>>> Tiedon hankkiminen (?? ??)
>>>>
>>>>
>>>> Ehdotan, että tässä osiossa käytettäisiin Google Refinea (
>>>> http://code.google.com/p/google-refine/ ). Se on ns. datan
>>>> siivoustyökalu ja open sourcea. Sillä voi helposti muuntaa px-tiedostoja
>>>> csv:ksi tms ja tehdä unicode- ym. merkistömuunnoksia. Juuri testasin omalla
>>>> koneella. Tässä osiossa esiteltäisiin minkälaista tilastotietoa missäkin on
>>>> saatavilla (Tilastokeskus, Eurostats, Maailmanpankki, HRI, ym).
>>>>
>>>> Tekiskö Kim tämän? Voin perjantaina näyttää Refinea, jos siitä on
>>>> hyötyä.
>>>>
>>>> PX-tiedostojen hakemisen jälkeen voisi esitellä teidän tietokantaanne
>>>> tarkemmin ja sen XML-rajapintaa. Olisi mainiota, jos pystyisitte
>>>> vinkkaamaan hyvistä parsereista, joilla datan saa käyttöön omaan
>>>> ohjelmaansa.
>>>>
>>>> Kuulostaisko tää Hansin alueelta?
>>>>
>>>> Tiedon muokkaaminen (?? ??)
>>>>
>>>>
>>>> soRvi:n esittely voisi sopia tähän
>>>>
>>>> Tiedon julkaiseminen (?? ??)
>>>>
>>>>
>>>> Oli puhetta niistä aluevektoreista. Saadaanko niitä työpajaan?
>>>>
>>>> Tässä osiossa voisi esitellä Google Fusion Tablesin. Sillä saa nopeasti
>>>> aikaiseksi simppeleitä karttoja. Toinen kiinnostava väline olisi Googlen
>>>> Motion Chart. Googlelta löytyy myös välineet perusdiagrammien esittämiseen.
>>>>
>>>> Kuka tarttuisi tähän osioon? Olen noita jonkin verran kokeillut,
>>>> eivätkä ole hirveän vaikeita.
>>>>
>>>> Yhdistäminen muihin tietolähteisiin (?? ??)
>>>>
>>>>
>>>> Oli puhetta siitä mahdottomasta casesta - tyyliin "työttömien vaellus
>>>> Suomessa ja Euroopassa viime vuosisadalla". Onko Arpalahti edelleen
>>>> kiinnostunut. Voisiko casessa oikeasti hakea dataa ja käyttää esim Exceliä?
>>>>
>>>>
>>>> Yleiset ideat (?? ??)
>>>>
>>>>
>>>> Osana Apps-kisaa kokeillaan kahta valmiiksi speksattua "haastetta".
>>>> Helsingin kaupungin haaste liittyy tilastojen esittämiseen. Voisiko sen
>>>> esitellä tässä yhteydessä?
>>>> http://apps4finland.fi/helsingin-kaupunki-etsii-tilastotiedon-esittamistapoja/
>>>>
>>>> -- osallistumisohjeesta --
>>>>
>>>> Kaupungit kutsuvat kehittäjiä luomaan uusia tiedon esittämistapoja
>>>>
>>>> Aikaisempien vuosien palautteessa on toivottu lisäapua kilpailutöiden
>>>> ideoimiseen. Osa kilpailusta kiinnostuneista on jättänyt osallistumatta
>>>> tarpeeksi hyvän idean puuttumisen vuoksi. Tänä vuonna Helsingin ja Vantaan
>>>> kaupungit tarjoavat kahta tehtävää kilpailijoiden ratkottavaksi. Kummankin
>>>> tehtävän mielenkiintoisin ratkaisu palkitaan 1000 eurolla. Osallistuminen
>>>> tapahtuu ilmoittamalla kilpailutyö Apps4Finland-kilpailun Sovellus- tai
>>>> Visualisointikategoriaan.
>>>>
>>>> Helsingin kaupunki etsii tapoja tilastotiedon havainnolliseen
>>>> esittämiseen.
>>>> Vantaan kaupunki etsii uusia tapoja kaupungin talouden tarkastelemiseen
>>>> (yksityiskohdat julkistetaan pian).
>>>>
>>>> ----
>>>>
>>>>
>>>>
>>>>
>>>> On 22.8.2012, at 18.07, Leo Lahti wrote:
>>>>
>>>> Moikka Petri, meiltä pääsee joku tuohon perjantain miittiin ainakin
>>>> etänä, mutta vielä selvittelyn alla onnistutaanko järkkään aikaa tuohon
>>>> 5.9. Yritetään joka tapauksessa kovasti, olisi hyvä jatkaa keskustelua
>>>> Tilastokeskuksen kavereitten kanssa.
>>>>
>>>> Leo
>>>>
>>>> 2012/8/22 Petri Kola <petri.kola at gmail.com>
>>>>
>>>>> Moij
>>>>>
>>>>> Kyselisin vaan, että kerkeääkö kukaan teistä osallistumaan etänä tai
>>>>> paikanpäällä perjantaiseen palaveriimme klo 12 tilastokeskuksella?
>>>>>
>>>>> t'
>>>>>
>>>>> 2012/8/20 Petri Kola <petri.kola at gmail.com>
>>>>>
>>>>>> Mainiota! Ja toivotaan parasta.
>>>>>>
>>>>>> On 20.8.2012, at 15.42, Juuso Parkkinen wrote:
>>>>>>
>>>>>> Hei Petri ja muut,
>>>>>>
>>>>>> Lisään mukaan Juuso Haapasen, sorvi-tiimin neljännen jäsenen.
>>>>>>
>>>>>> Kiitoksia kutsusta, työpaja ja erityisesti yhteistyö Tilastokeskuksen
>>>>>> kanssa vaikuttaa erittäin mielenkiintoiselta! Ehdottomasti olisi hyvä saada
>>>>>> ainakin joku sorvista paikalle. Mulla itellä ainakin on vaan aikataulut
>>>>>> näin lomilta palattua todella tiukalla, enkä ole varma ehdinkö paikalle.
>>>>>> Keskustelemme asiasta ja palaamme asiaan piakkoin.
>>>>>>
>>>>>> t. Juuso
>>>>>>
>>>>>> 2012/8/20 Petri Kola <petri.kola at gmail.com>
>>>>>>
>>>>>>>
>>>>>>> Tapaamisajaksi on näillä näkymin tulossa klo 12:00
>>>>>>> tilastokeskuksella. Ilmoitelkaa pääseekö joku tai haluatteko osallistua
>>>>>>> esim. skypellä? Tai lähettää terveisiä.
>>>>>>>
>>>>>>> t'
>>>>>>>
>>>>>>> On 20.8.2012, at 13.46, Petri Kola wrote:
>>>>>>>
>>>>>>> Moikka
>>>>>>>
>>>>>>> Kiinnostaisiko teitä tulla mukaan opettamaan soRvia ja tilastodatan
>>>>>>> käyttöä Apps4Finland-työpajaan 5.9.
>>>>>>> http://apps4finland.fi/tapahtumat/stas4finland-tyopaja/ Tavoitteena
>>>>>>> on opettaa perustaitoja, jakaa koodia ja tuottaa materiaaleja
>>>>>>> itseopiskeluun. Olemme aloittaneet työpajan suunnittelun yhdessä
>>>>>>> Tilastokeskuksen porukan kanssa. Olemme tapaamassa loppuviikosta
>>>>>>> suunnittelutyöpajan merkeissä - mahdollisesti perjantaina iltapäivällä.
>>>>>>> Aloitimme suunnittelun viime viikolla ja totesimme soRvi-porukan saamisen
>>>>>>> tilastokeskustalaisten kanssa samaan pöytään aivan välttämättömäksi! :-)
>>>>>>>
>>>>>>> t' petri
>>>>>>>
>>>>>>>
>>>>>>>
>>>>>>
>>>>>>
>>>>>
>>>>>
>>>>> --
>>>>> petri.kola at gmail.com
>>>>> http://twitter.com/pe3
>>>>> +358401626525
>>>>>
>>>>
>>>>
>>>>
>>>
>>>
>>
>>
>
>
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://lists.r-forge.r-project.org/pipermail/sorvi-admin/attachments/20120825/5a5fd65f/attachment-0001.html>


More information about the Sorvi-admin mailing list