[Sorvi-admin] Louhos-projekti - tietokannat

Leo Lahti leo.lahti at iki.fi
Fri Mar 23 15:23:27 CET 2012


> olen mielenkiinnolla lueskellut louhos-projektista ja tekisi mieli olla
> auttamassa datankeruussa.

Terve Pekka. Suuret pahoittelut, emme ole aiemmin vastanneet. Viestisi
oli jäänyt jumiin sähköpostilistan filtteriin josta löysin sen eilen.

Kaikki apu on erittäin tervetullutta, projektissa olisi paljon hyvää
kehitettävää, jos tekijöitä löytyy.

> Katsellessani noita Todo-datasettejä jäin miettimään, oletteko jo tehneet
> jotakin ratkaisuja projektin tietokantaratkaisun suhteen.
> Pienen pohdinnan jälkeen tulin siihen tulokseen, että olisi järkevä
> mallintaa tietokannan fakta- ja dimensiotaulut ja syöttää sitten
> hakurutiinien kautta datat kantaan.
> Ehkä olette jo ehkä tehneet näin, mutta kuulisin mielellään lisää tältä
> puolelta.

Sorvin ideana on, että teemme R:lle haku-, esikäsittely- ja
analyysirutiineja avoimille datoille, ja julkaisemme käyttöesimerkkejä
ja visualisointeja lähdekoodeineen Louhos-blogissa. Emme ainakaan
toistaiseksi ole itse keränneet dataa tietokantaan, sillä ajatuksena
oli että käyttäjä voi sorvin valmiilla funktioilla hakea aina
ajankohtaisimman datan helposti alkuperäisestä lähteestä.

Joidenkin aineistojen kohdalla on tosin teknisiä ongelmia, sivu esim.
vaatii rekisteröitymistä ennnen kuin dataan pääsee käsiksi. Joissain
tapauksissa on ollut tarpeen tehdä ID-ristiintaulukointiin
ylimääräisiä tiedostoja manuaalisesti. Esim. tällaisten tapausten
varalta olemme ajatelleet sitäkin, että joku sorvia tukeva
datapankkikin voisi olla hyödyllinen. Avointa Suomi-dataa on kuitenkin
sen verran paljon erilaista, ettemme ole toistaiseksi ajatelleet
lähteä keräämään sitä keskitetysti. Jos hyviä ideoita tulee niin
suunnitelmia voi aina tietysti päivittää.

Taustasi kuulostaa oikein toimivalta näihin puuhiin. Konkreettisesti
liikkeelle pääsisi jos mielessäsi olisi tietty data tai aihepiiri,
jonka eteen päin viemistä voitaisiin yhdessä miettiä. Tällä hetkellä
olemme pyrkineet kattavaan kokoelmaan Suomi-datojen hakurutiineja ja
kiintoisia esimerkkianalyysejä. Olemme listanneet joitain
osallistumismahdollisuuksia tänne:
https://github.com/louhos/soRvi-dev/wiki/Osallistu Tuolta löytyy esim.
lista datoista joihin hakurutiineja ei vielä ole tehty.
Tietokantaosaamisesti voi joidenkin kohdalla olla hyvinkin apua. Ja
jos datojen jatkoanalysointi kiinnostaa, niin hyvät blogipostaukset
tuo myös nostetta projektille.

Jos R-puuhastelu aiheen parissa kiinnostaa, niin voisit tulla esim.
käymään !louhos-irkkikanavalla IRCnetissä niin voidaan miettiä
suunnitelmia lisää, tai voidaan jossain välissä tavatakin. Pistä
ihmeessä viestiä ja tule mukaan, osallistua voi vapaasti oman
aikataulun ja kiinnostuksenkohteiden mukaan.

Leo


More information about the Sorvi-admin mailing list