22. maaliskuuta 2011

Vaalirahoitus

HS openissa oli tarkoitus analysoida vaalirahoitusilmoituksia. Oli puhetta pdf-muotoisten ilmoitusten hakemista suoraan vaalit.fi-sivuilta ja parsimista kantaan. Toisaalta vaalit.fi-sivuilta löytyi helposti valmis Excel-sheet. Ensin kaikki varsinaiset ehdokkaat.





Huomatkaa, kuinka SDP näyttää laittaneen rahaa selkeästi Kokoomusta ja Kepua vähemmän. Tämän on illuusio joka johtuu siitä, että vain valittujen rahoitukset on listattu. Demarit hävisivät vaalit ja näin pääsi käymään.

Varaedustajien lisääminen kuvaan ei kauheasti auta.






Totuus on, että vaalirahoitusilmoitukset eivät kerro paljoakaan jos niiden tekeminen on vapaaehtoista. Kuka tahansa pelin päälle ymmärtävä puoluesihteeri saa kierrettyä rahaa ehdokkaille puolueen yhteisten mainoskampanjoiden ja selvästi läpipääsemättömien ehdokkaiden kautta.

Maa järisee

Osallistuin HS Open-tapahtumaan. Tarkoitus oli analysoida hesarin vaalikonedataa ja vaalirahailmoituksia. Meidän ryhmämme kuitenkin lähti tangentille noin toisen puheenvuoron kohdalla ja päädyimme tekemään täällä dokumentoidun kokovertailun maanjäristyksien uhreista kun joku löysi jännän lähteen.

Konseptointivaiheessa tein saman IBM:n Many Eyesin kokovertailupulikalla. Kuvassa siis kaikki maanjäristykset vuodesta 1900 lähtien (mutta ei vielä Japania, koska uhrimäärä ei ole tiedossa).



Many Eyes vaatii toimiakseen Javan selainpluggareita eikä läheskään aina näy hyvin.

Ibarin kilkkeessä kivaa on, että samalle kilkkeelle voi antaa monta saraketta dataa, tässä tapauksesa kuolonuhrit, kustannukset (miljoonaa USD) ja "total number of affected".

Data on saatu kansainvälisestä katastrofitietokannasta http://www.emdat.be/, joka on ilmeisesti WHO:n alla toimiva virasto. Datasta voisi näyttää paljon muutakin jännää.

20. lokakuuta 2010

KD vs. eroakirkosta.fi - perspektiiviä

KD iski napakymppiin lähettämällä Päivi Räsäsen Ylen homoiltaan.

Ajattelusta vapautetut riemuitsevat kirkosta eronneiden määrällä. Samalla KD:n puoluetuella maksettu pr-osasto yrittää pelastaa tilannetta.


Aivan oikein, kirkosta on eronnut melkein 3 kertaa KD:n jäsenmäärän verran ihmisiä.

Jotta valtionkirkon kannattajat eivät masentuisi, voi asiaa katsoa myös seuraavasti:


Pyydän anteeksi picasan laadutonta thumbnail-algoritmia joka sotkee tekstin. Klikkaamalla aukenee koko "komeudessaan".

Lähteet luvuille ovat ylläolevat linkit, wikipedia ja evl.fi. Jos nyt ihan liikaa kiinnostaa niin valmis ja pieni spreadsheet on täällä.

15. lokakuuta 2010

Kekä ja kusta?

Löysin pari päivää sitten Tilastokeskuksen aivan mahtavan palvelun. Tilastokeskus tuottaa joka vuosi järjettömän määrän dataa, joka jää tyhjän pantiksi roikkumaan ja jolla kukaan ei tee mitään.

Pikavilkaisulla löysin ekan mielenkiintoisen asian joka jaksaa kiinnostaa itseäni sen verran että vaivaudun vähän jalostamaan dadaa: opintoalojen jakautuminen yliopistoittain. Tilastokeskuksen data on aika karkeaa, mutta toisaalta siitä on helppo nähdä pääpiirteitä.

Ensimmäisessä kuvassa on piirrettyä treemap kaikista läsnäolevista opiskelijoista. Itseäni yllätti TTYY:n suhteellinen koko Aaltoon nähden. Olisin olettanut TTY:n olevan selkeämmin pienempi ja vastaavasti LTY:n vähän isompi. Kaikkea sitä.

On myös huojentavaa nähdä, että Suomella on vielä toivoa. Akateemiset amikset eli luonnontieteet, tekniika, lääketiede ja kauppatieteet jättävät ns. hippeilytieteet varjoonsa ja enemmistöstä yliopisto-opiskelijoita tulee yhteiskuntaa hyödyttäviä maistereita (vast).

Data on alunperin Tilastokeskukselta.





Toinen kuva kertoo vuoden 2009 sisäänottojen suhteen. Kuvat ovat samankokoisia, joten niitä vertaamalla voi löytää aloja, joilla opiskelu tapahtuu tavallista hitaammin tai nopeammin. Mikäli fukseja on vähemmän suhteessa koko pottiin kuin opiskelevia, tarkoittaa tämä sitä että opiskelijat ovat kauan kirjoilla. Tämä lähestyminen olettaa staattiset sisäänpääsykiintiöt vuosittain, mikä ei ole oikeastaan perusteltua.

Lääkiksen kohdalla kutistuminen selittyy sillä, että luvuissa ovat mukana myös jatko-opiskelijat. Kauppatieteiden tontti kasvaa, ja kaikki varmaan tietävät, että kauppiksesta viidessä vuodessa valmistuminen on merkki kognitio-, päihde tai asenneongelmasta.





Käyttämääni Google Docciin pääsee käsiksi täältä.

8. syyskuuta 2010

Kesäharjoittelu Microsoftilla

Tunnollinen blogin päivittäminen ei selkeästikään kuulu allekirjoittaneen ydinosaamiseen. Noh, ei saa pienestä hermostua. Palaammekin asiaan fiiliksillä allekirjoittaneen kesätyökeikasta Irlannin luonnonkauniilta (==sateiselta) saarelta.







Osa ilmiöistä lienee päivän selviä, mutta muutamat saattavat vaatia pientä selitystä:



  • Ennakko-oletukseni puljusta olivat varsin kovat, joten lasku todellisuuteenkin oli vastaavasti kova. Alun ihmettelyn jälkeen kuitenkin firma näyttäytyi miellyttävänä työnantajana, jolla voisi harkita uraa.

  • Kenellekään ei liene yllätys, että myös Microsoftilla syödään omaa koiranruokaa myös sharepointin suhteen. Sinänsä pari sharepoint-portaalia olisi ollut jees, mutta kynnys uusien luomiseen oli laskettu liian alas, jolloin eri sivustoja oli yksinkertaisesti liikaa.

  • Microsoft oli ensimmäisiä firmoja, jossa insinöörit nostettiin keskiöön. Tämä kostautu pahasti yrityskulttuurissa, jossa jokainen yli kolmikirjaiminen sana pitää lyhentää. Lyhenteet tietty olisivat yhä ok, mutta niiden overloadingia ei kontrolloida mitenkään.

  • Koiranruokaa syödään myös sähköpostiklienttien suhteen, ja löysin kesän aikana joka ikisen muistakin sähköpostiohjelmistoista löytyvän ominaisuuden Outlookista

  • "Would you like the both kinds of potato with that?" oli vakiokysymys työpaikkaruokalan perinneruokatiskillä. Juhlapäivinä oli pottua kolmessa eri muodossa lihakimpaleen kaveriksi.



Suosittelen lämpimästi keikkaa I-maassa kaikille, joita sää ei masenna. Kesän aikana satoi vähintään joka toinen päivä ja lämpötila ei koskaan oikeastaan noussut yli 20 asteen.

31. maaliskuuta 2010

Chartjunk

Tuften Ed lanseerasi hieman ennen syntymääni käsitteen chartjunk. Tiivistäen chartjunk tarkoittaa kaikkia niitä lisäkilkkeitä visualisoinnissa, jotka vaikeuttavat kokonaiskuvan saamista graafista. Chartjunk-käsite sinänsä ei ota kantaa tahallisuuteen tai tahattomuuteen.

Päivän Helsingin Sanomat antaa malliesimerkin chartjunkin käytöstä ja toisestakin graafeilla valehtelun kikasta (linkki varmaan happanee joskus). Vaaleansininen väri kuvaamaan tiettyjä mielipiteitä ja vaaleansininen tausta sulautuvat näppärästi yhteen.



Moniko panee merkille, että vaaleansininen ja punainen muuttavaat merkitystään vasemmalla ja oikealla olevissa barcharteissa? Vasemmalla punainen kuvastaa asenteita, jotka kannattavat maahanmuuton tiukennusta. Oikealla vastaavasti niitä, joiden mielestä maahanmuuttoa pitäisi keventää. Propsit graafin tehneelle Kaisa Roikoselle (HS). Harvoin näkee yhtä tyylipuhdasta suoritusta. Itsekään en olisi huomannut pikavilkaisulla tuota värien tarkoituksen flippausta, ellen olisi aikaisemmin lukenut itsensä Tohtori Vihan tulkintaa samasta aiheesta (tarkoitushakuista sekin).

30. maaliskuuta 2010

A day at the races

Entisessä TKK:ssa (requiescat in pace) Bolognan prosessi mokattiin varsin täydellisesti. Aikaisemmin keskimäärin 7,5 vuoden (mediaani n. 7 vuotta) opinnoista tehtiin yllättäen hallinnollisella päätöksellä 5 vuoden opinnot. Useimmat ala-asteikäiset ymmärtävät, että jos halutaan saada seitsemän vuoden tutkinto sellaiseksi, että useimmat suorittavat sen viidessä, on jotain leikattava pois. Harmittavasti nämä ala-asteikäiset olivat kypsempiä kuin TKK:un professorit, joista ilmeisesti kukaan ei halunnut oman alansa opetusta vähennettävän tutkinnossa, "joku muu varmaan leikkaa".

Lisäksi tutkintoon läiskäistiin "kevennyksien" lisäksi kandidaatintyö, joka ainakin omasta mielestäni oli poikkeuksellisen järkevä veto. Kandityön tekeminen vähentää dippatuskaa ja lievittää tyhjän paperin ongelmaa jopa siinä määrin, että uskon dippatöiden tekoaikojen vähenevän hieman 2-4 vuoden aikajänteellä. Vastapainoksi kandityö lisää jo valmiiksi ylitäyden tutkinnon työmäärää.

Satun itse kuulumaan 2005 fuksivuosikurssiin, jonka opintojen edistymistä seurattiin 3 vuoden ajan tutkinto-ohjelmittain. Oheinen motion chart sisältää tilastoja sisäänpääsyn vaikeudesta, tutkinto-ohjelmista ja referenssipisteen. Hämäävähkö hylkäysprosentti on yksinkertaisesti (1-sisäänpääsyprosenssi), joka on tehty siksi, että hylkäysprosenteissa suurin tarkoittaa kovinta koulutusohjelmaa. Tämä on harmoniassa sisäänpääsy- ja koepisteiden kanssa. Mittauspisteitä on vain yksi vuodessa, mutta juokseva päivämäärä alareunassa saa kivan kilpailufiiliksen aikaan, ja sitähän yliopisto-opiskelu pohjimmiltaan on: kilpajuoksi niille, jotka nuorena pärjäsivät matikassa paremmin kuin Hippo-kisoissa.

On your marks, get set, go!





Ainakin omasta mielestäni hieman permutoimalla voi nähdä, että TKK:n massa laahaa takana, ja muutamassa pienisisäänottoisessa ohjelmassa opinnot etenevät paremmin. On vaikea sanoa johtuuko eteneminen ohjelman pienuudesta (sosiaalinen tuki ja opetusresurssit parempia), vaikeammasta sisäänpääsystä (joka selkeästi korreloi) vaiko jostain muusta.

Käytetty data löytyy tästä Google Spreadsheetistä

Huomioita: Arkkitehtuurin ja maisema-arkkitehtuurin pisteet eivät ole samoja kuin muualla. Infon sisäänpääsyn vaikeus on vedetty hatusta, koska vertailupisteitä ei ole ja tilastojakin vaikea löytää. Mikäli jollakulla sattuisi olemaan TaiKin tai HSE:n vastaavia tilastoja, niin lisään ne mielelläni tähän.