Jarkko Harju, Tomi Kyyrä, Olli Kärkkäinen,  
Tuomas Matikka ja Lauri Ojala 
 

Työn tarjonnan mallintaminen osana  

talouspolitiikan vaikutusarviointia 

 
Marraskuu 2018 

Valtioneuvoston selvitys-  
ja tutkimustoiminnan 
julkaisusarja 72/2018 


KUVAILULEHTI 

 
Julkaisija ja julkaisuaika Valtioneuvoston kanslia, 28.11.2018 

Tekijät Jarkko Harju, Tomi Kyyrä, Olli Kärkkäinen, Tuomas Matikka ja Lauri 

Ojala 

Julkaisun nimi Työn tarjonnan mallintaminen osana talouspolitiikan vaikutusarviointia 

Julkaisusarjan nimi ja  

numero 

Valtioneuvoston selvitys- ja tutkimustoiminnan julkaisusarja 72/2018 

Asiasanat Työn tarjonta, diskreetti työn tarjonnan malli, työn tarjonnan jousto 

Julkaisuaika Marraskuu, 2018 Sivuja 22 Kieli Suomi 

Tiivistelmä 

Tässä raportissa käsittelemme työn tarjonnan mallintamista rakenteellisen diskreetin valinnan 

mallin avulla. Käymme läpi mallin estimointiin liittyviä haasteita ja raportoimme mallin avulla 

saatuja alustavia tuloksia suomalaisesta aineistosta. Diskreetti työn tarjonnan malli muodos-

taa koherentin ja johdonmukaisen välineen tutkia talouspolitiikan vaikutuksia työllisyyteen ja 

sitä kautta edelleen tulonjakoon. Mallin avulla voidaan myös arvioida politiikkapäätösten hy-

vinvointivaikutuksia. Rakenteellinen mallintaminen mahdollistaa myös sellaisten politiikka-

muutosten tarkastelun, joihin ei ole tarjolla luotettavaa kokeellista tai kvasi-kokeellista tutki-

musasetelmaa. Alustavien tulosten mukaan diskreetti työn tarjonnan malli kuvaa melko hyvin 

havaittuja työtunteja suomalaisessa aineistossa ja tulokset ovat melko hyvin linjassa kan-

sainvälisen tutkimuskirjallisuuden kanssa. Mallin jatkokehittämisen keskeisimpänä kohteena 

olisi saada SISU-mikrosimulointimalli toimimaan osana työn tarjonnan mallintamista, mikä 

merkittävästi laajentaisi mallin käytettävyyttä niin politiikkavalmistelussa kuin akateemisessa 

tutkimuksessakin. Vasta tämä mahdollistaisi politiikkamuutosten työllisyys- ja tulonjakovaiku-

tusten ex ante –arvioinnit. 

 
Tämä julkaisu on toteutettu osana valtioneuvoston vuoden 2018 selvitys- ja tutkimussuunnitelman 

toimeenpanoa (tietokayttoon.fi). 

Julkaisun sisällöstä vastaavat tiedon tuottajat, eikä tekstisisältö välttämättä edusta valtioneuvoston 

näkemystä. 


PRESENTATIONSBLAD 

 
Utgivare & utgivningsdatum Statsrådets kansli, 28.11.2018  

Författare Jarkko Harju, Tomi Kyyrä, Olli Kärkkäinen, Tuomas Matikka och Lauri 

Ojala 

Publikationens namn Modellering av arbetsutbudet som en del av bedömningen av den 

ekonomiska politikens konsekvenser 

Publikationsseriens namn  

och nummer 

Publikationsserie för statsrådets utrednings- och forskningsverksamhet 

72/2018 

Nyckelord Arbetsutbud, diskret modellering av arbetsutbud, flexibilitet i arbetsut-

budet 

Utgivningsdatum November, 2018 Sidantal 22 Språk Finska 

Sammandrag 

I rapporten beskriver vi modellering av arbetsutbudet med en modell som bygger på diskreta 

val. Vi redogör för utmaningar med estimeringen och rapporterar preliminära resultat som 

erhållits med modellen utifrån data från Finland. Diskret modellering av arbetsutbudet erbju-

der ett koherent och konsekvent verktyg för att analysera vilka effekter den ekonomiska poli-

tiken har på sysselsättningen och därigenom på inkomstfördelningen. Modellen kan också 

användas för analyser av vilka konsekvenser policybeslut får för välfärden. Med hjälp av 

strukturell modellering kan vi dessutom analysera sådana politikförändringar för vilka det 

saknas pålitliga experimentella eller kvasiexperimentella testupplägg. Enligt de preliminära 

resultaten beskriver den diskreta modellen av arbetsutbud de observerade arbetstimmarna i 

de finländska data relativt bra, och resultaten är relativt väl förenliga med internationell forsk-

ningslitteratur på området. Det viktigaste med tanke på den fortsatta utvecklingen är att inte-

grera mikrosimuleringsmodellen SISU i modelleringen av arbetsutbudet, vilket skulle göra 

modellen betydligt mer användbar för både policyberedning och akademisk forskning. Det 

behövs för att möjliggöra förhandskonsekvensanalyser av effekterna av policyändringar på 

sysselsättningen och inkomstfördelningen. 

 
Den här publikation är en del i genomförandet av statsrådets utrednings- och forskningsplan för 

2018 (tietokayttoon.fi/sv). 

De som producerar informationen ansvarar för innehållet i publikationen. Textinnehållet återspeglar 

inte nödvändigtvis statsrådets ståndpunkt 


DESCRIPTION 

 
Publisher and release date Prime Minister´s Office, 28.11.2018 

Authors Jarkko Harju, Tomi Kyyrä, Olli Kärkkäinen, Tuomas Matikka ja Lauri 

Ojala 

Title of publication Modeling labor supply as part of economic policy evaluations 

Name of series and number  

of publication 

Publications of  the Government´s analysis, assessment and research 

activities 72/2018 

Keywords Labor supply, discrete choice model, labor supply elasticity 

Release date November, 2018  Pages  22 Language Finnish 

Abstract 

In this report we discuss how to model labor supply using Finnish micro-level data, and report 

some preliminary results based on a structural discrete choice model. Structural labor supply 

models offer a coherent tool for analyzing the labor supply impact of economic policies, and 

their implications on, for example, the income distribution. In addition to policy analysis and 

preparation, these models can be used in academic research, and they provide a method to 

analyze the effects of policy changes for which there is no credible quasi-experimental or 

experimental variation available. We find that the discrete labor supply model describes Finn-

ish labor market conditions rather well, and preliminary results using Finnish data are broadly 

in line with previous literature. For future development of the model, we find that the most 

important step is to link the discrete labor supply model to the SISU-microsimulation model, 

which would enable a more straightforward policy preparation using the model, and increase 

the usability of the structural model in academic policy analysis. 

 
This publication is part of the implementation of the Government Plan for Analysis, Assessment and 

Research for 2018 (tietokayttoon.fi/en). 

The content is the responsibility of the producers of the information and does not necessarily repre-

sent the view of the Government. 


SISÄLLYSLUETTELO 

1. Johdanto ......................................................................................................................... 1 

2. Diskreetti työn tarjonnan malli ..................................................................................... 2 

2.1. Mallinnuksen perusidea ........................................................................................... 2 

2.2. Työn tarjonta -valintojen todennäköisyydet ............................................................. 3 

3. Käytettävä aineisto ........................................................................................................ 6 

3.1. Aineistolähteet ......................................................................................................... 6 

3.2. Aineiston kuvailu ja muokkaukset ............................................................................ 8 

4. Mallin sovittaminen ja työn tarjonnan joustot ............................................................ 9 

4.1. Mallinnusvalinnat ..................................................................................................... 9 

4.2. Mallin estimointi ja työn tarjonnan jouston arviointi ............................................... 12 

4.3. Heterogeenisuustuloksia ....................................................................................... 15 

5. Työn tarjonta ja SISU-malli ......................................................................................... 18 

6. Miten mallia voidaan tulevaisuudessa kehittää? ...................................................... 19 

7. Lähteitä ja tausta-aineistoja ........................................................................................ 22 
 

1 
 

1. JOHDANTO 

Tässä raportissa tarkastellaan työkaluja, joiden avulla voidaan tutkia politiikkamuutosten 

vaikutuksia työn tarjontaan ja sitä kautta tulonjakoon. Raportti on osa Talouspolitiikan käyt-

täytymisvaikutukset –tutkimushanketta. Hankkeessa tarkastellaan politiikkamuutosten työlli-

syysvaikutusten arviointia simulointimallien näkökulmasta sekä työllisyysvaikutusten huomi-

oon ottamisen vaikutusta tuloeromittareihin. Hankkeen ensimmäisen osan tulokset julkaistiin 

syyskuussa 2018 (Kärkkäinen ja Tervola 2018). Ensimmäisessä osassa kehitettiin mene-

telmä, jonka avulla työllisyysvaikutukset voidaan huomioida arvioitaessa talouspolitiikan 

tulonjakovaikutuksia mikrosimulointiympäristössä. Tarkasteluissa työn tarjonnan joustot 

kuitenkin otettiin annettuna. Tässä hankkeen toisessa osassa keskitytään työn tarjonnan 

mallintamiseen diskreetin valinnan mallin avulla.   

Työn tarjonnan ex ante -analyysit nojaavat yleensä talousteoriasta johdettuihin rakenteelli-

siin malleihin, joissa yksilöt tai kotitaloudet valitsevat kulutuksensa ja työn tarjontansa anne-

tuilla rajoitteilla (verot, tulonsiirrot yms.). Mallit voivat olla joko staattisia tai dynaamisia. 

Staattisissa malleissa työnteon taloudellisiin kannustimiin vaikuttavan politiikkamuutoksen 

jälkeen työn tarjonta sopeutuu välittömästi, eikä ajalla ole roolia. Sitä vastoin dynaamisissa 

malleissa mallinnetaan ja simuloidaan yksilöiden käyttäytymistä ja kohtaloita yli ajan eri 

politiikkaskenaarioissa. Dynaamisten mallien avulla voidaan tarkastella politiikkatoimenpitei-

den aiheuttamia muutoksia erikseen tietyn hetken tulojakaumassa ja elinkaarituloissa.  

Tässä raportissa rajoitutaan staattisiin työn tarjonnan rakennemalleihin. Näistä kansainväli-

sesti sovelletuin on niin kutsuttu diskreetin valinnan malli, jossa yksilö valitsee työn tarjon-

tansa pienestä joukosta eri vaihtoehtoja. Vaihtoehtoina voivat olla jättäytyminen työmarkki-

noiden ulkopuolelle, työttömyys, osa-aikainen työskentely eri tuntimäärillä, kokoaikainen 

työskentely ja ylityöt normaalin kokoaikatyön lisäksi. Työn tarjonta -päätöstä tehdessään 

yksilö huomioi sekä vapaa-ajan että käytettävissä olevat tulot eri vaihtoehdoissa.  

Tarkastelemme diskreetin työn tarjonnan mallin soveltamista suomalaiseen rekisteriaineis-

toon. Vastaavaa tarkastelua ei ole Suomen osalta tehty aiemmin. Diskreetti työn tarjonnan 

malli muodostaa koherentin ja johdonmukaisen välineen tutkia talouspolitiikan työllisyysvai-

kutuksia sekä niiden vaikutusta esimerkiksi tulonjakoon. Mallin avulla voidaan tarkastella 

myös politiikkapäätösten hyvinvointivaikutuksia. Lisäksi rakenteellinen mallintaminen mah-

dollistaa sellaisten tutkimuskysymysten tarkastelun, joihin ei ole tarjolla luotettavaa kokeel-

lista tai kvasi-kokeellista tutkimusasetelmaa.  

Raportin empiiriset tarkastellut perustuvat Löfflerin, Peichelin ja Sieglochin (2018) kehittä-

mään diskreetin valinnan rakennemalliin ja sen eri variaatioihin. Sovittamalla malli yksilöta-

son aineistoon käytettävissä olevista tuloista ja työtunneista saadaan arviot mallin tuntemat-

tomille parametreille. Tämän jälkeen voidaan simuloida työn tarjonta -päätöksiä halutulle 

populaatiolle vaihtoehtoisissa politiikkaskenaarioissa. Mallin avulla voidaan estimoida työn 

tarjonnan jousto palkan suhteen ja arvioida toteutettujen politiikkapäätösten työllisyysvaiku-

tuksia tai harkinnassa olevien vaihtoehtoisten politiikkamuutosten vaikutuksia työllisyyteen. 

Lisäksi voidaan simuloida politiikkatoimien vaikutuksia myös muihin mielenkiinnon kohteena 

oleviin tulemiin, kuten tulonjakoon.  

Vaikka Suomen kattavat yksilö- ja kotitalouskohtaiset rekisteriaineistot tarjoavatkin kansain-

välisesti vertaillen hyvän lähtökohdan mallinnukselle, asettavat saatavilla olevat tilastoai-

neistot rajoitteita mallin soveltamiselle. Esimerkiksi useat tulonsiirrot ja tulot havaitaan vain 


2 
 

vuositasolla, kun taas työtunnit havaitaan vuoden yhtenä ajankohtana. Nämä tekijät hanka-

loittavat budjettirajoitteiden estimointia. Mallin soveltaminen edellyttää myös useiden mallin-

nusvalintojen tekemistä. Mallin estimoimista varten pitää muun muassa määrittää yksilön 

hyötyfunktio ja puuttuvat tuntipalkat pitää ennustaa työttömille.  

Tässä raportissa arvioidaan, miten hyvin diskreetin valinnan malli kuvaa työn tarjontaa 

Suomen työmarkkinoilla ja kuinka herkkiä tulokset ovat erilaisille mallinnusvaihtoehdoille ja 

taustaoletuksille. Tarkastelemme mallin tuottamia tuloksia koko aineistolle sekä erikseen 

miehille ja naisille, ja nuorille ja vanhemmille työntekijöille. Lisäksi pohdimme, mihin suun-

taan rakenteellista analyysikehikkoa olisi syytä jatkossa kehittää, kun saatavilla olevien re-

kisteriaineistojen asettamat rajoitteet pidetään mielessä. Kehitettävä malli on dokumentoitu 

huolellisesti, ja sen soveltamisessa tarvittavat koodit ovat vapaasti hyödynnettävissä ja la-

dattavissa hankkeen Internet-sivuilta sekä SISU-mikrosimulointimallin etäkäytön käyttäjäfoo-

rumilta. Työn yhtenä tavoitteena on laajentaa suomalaisten rekisteriaineistojen ja SISU-

mallin käytettävyyttä työn tarjonnan tutkimisessa ja politiikka-arvioinnin työkaluna. 

Raportin rakenne on seuraava. Luvussa 2 tarkastellaan työn tarjonnan mallintamista dis-

kreetin valinnan mallin kehikossa sekä pohditaan tilastolliseen analyysiin liittyviä haasteita. 

Luvussa 3 esitellään mallin estimoinnissa käytettävät tilastoaineistot. Luvussa 4 esitellään 

käytännön mallinnuksen periaatteet ja keskustellaan mallinnukseen liittyvistä aineistovalin-

noista ja oletuksista, sekä esitellään mallin avulla saatuja ensimmäisiä alustavia tuloksia. 

Luvussa 5 keskustellaan SISU-mallin käytöstä mallinnuksessa. Luvussa 6 tehdään lyhyt 

yhteenveto ja pohditaan mallin jatkokehittämiseen liittyviä haasteita ja mahdollisuuksia. 

 
2. DISKREETTI TYÖN TARJONNAN MALLI 

2.1. Mallinnuksen perusidea 

Tässä luvussa tarjotaan lyhyt taustoitus työn tarjonnan mallinnuksen teoriaan ja ekonomet-

riaan. Lähtökohtana on yksilö, joka valitsee, montako tuntia hän työskentelee viikossa. Yksi-

lön hyvinvointi riippuu kulutuksesta ja vapaa-ajasta. Kulutus määräytyy työnteosta saatujen 

nettotulojen ja muiden mahdollisten tulojen perusteella. Vapaa-aika muodostuu ajasta, jota 

ei käytetä työskentelyyn. Kulutuksen ja vapaa-ajan välillä on luonnollisesti ristiriita: molem-

mat lisäävät hyvinvointia, mutta lisätäkseen kulutustaan on yksilön tingittävä vapaa-ajastaan 

(ja päinvastoin). Yksilö valitsee kulutuksen ja vapaa-ajan yhdistelmän, joka maksimoi hänen 

hyvinvointinsa annetulla budjettirajoitteella.  

Budjettirajoite riippuu tuntipalkasta, työtunneista sekä vero- ja tulonsiirtojärjestelmästä. Yksi-

lö ei voi vaikuttaa tuntipalkkaansa eikä tuntipalkka riipu valittujen työtuntien määrästä. Työ-

tunnit määräävät yksilön bruttoansiot annetulla tuntipalkalla. Verotus ja tulonsiirtojärjestelmä 

puolestaan vaikuttavat siihen, paljonko bruttoansioista jää käteen käytettäväksi kulutukseen. 

Näin ollen työtunnit määrittävät yksikäsitteisesti sekä kulutuksen että vapaa-ajan, joista yksi-

lön hyvinvointi riippuu. Siksi yksilön valintaongelma pelkistyy optimaalisten työtuntien valin-

taan. 

Yksilön oletetaan valitsevan työtuntinsa pienestä joukosta eri vaihtoehtoja. Yksi vaihtoehto 

on jättäytyä työttömäksi (tai työvoiman ulkopuolelle), jolloin vapaa-aikaa on paljon mutta 

rahaa kuluttamiseen vähän. Muut vaihtoehdot vastaavat osa-aikaista ja kokoaikaista työs-


3 
 

kentelyä. On syytä korostaa, että mallinnuksessa työtuntien valintajoukko rajataan pieneksi 

lähinnä teknisten syiden vuoksi. Verrattuna malliin, jossa yksilö voi valita työaikansa mieli-

valtaisen tarkasti (esim. minuutilleen), diskreetin valinnan mallin teoriakehikko on varsin 

yksinkertainen ja mallin sovittaminen dataan on helpompaa. 

Mallinnusta varten on arvioitava käytettävissä olevat tulot eri vaihtoehdoissa. Tämä edellyt-

tää sekä tietoa tuntipalkoista että vero- ja tulonsiirtojärjestelmän tarkkaa mallintamista. Op-

timaalinen työtuntien määrä vaihtelee yksilöiden välillä erilaisten lähtökohtien (ja mahdolli-

sesti erilaisten mieltymysten) vuoksi. Esimerkiksi korkeasti koulutetun työntekijän marginaa-

livero lisätyötunnista on korkeampi kuin heikosti koulutetun, koska hänen tuntipalkkansa on 

korkeampi ja tuloverotus on progressiivista. Osalla henkilöistä on työtunneista riippumatto-

mia pääomatuloja, osalla ei. Lisäksi tulonsiirtojärjestelmä kohtelee yksilöitä eri tavalla, koska 

tulonsiirrot riippuvat omien ansiotulojen ohella myös puolison tuloista, asumiskustannuksista 

ja lasten lukumäärästä.  

Teoreettisen mallin ennustamaa työn tarjontaa, eli hyvinvoinnin maksimoivaa työtuntien 

määrää, verrataan yksilöiden tekemiin todellisiin valintoihin, ja mallin tuntemattomat para-

metrit valitaan siten, että teoreettinen malli kuvaa aineistossa havaittuja työtunteja mahdolli-

simman hyvin. Tätä varten on teoreettisesta mallista johdettava todennäköisyydet yksilöiden 

havaituille työn tarjonta -päätöksille, mikä puolestaan edellyttää useiden mallinnusvalintojen 

tekemistä. Seuraavaksi käymme läpi näitä valintoja varsin teknisellä tasolla. Lukija, joka ei 

ole mallinnuksen teknisestä puolesta kiinnostunut, voi huoletta hypätä suoraan seuraavaan 

lukuun.  

2.2. Työn tarjonta -valintojen todennäköisyydet 

Mallinnusta varten on muun muassa valittava hyötyfunktio. Hyötyfunktio määrittää sen, mi-

ten yksilön kulutus ja vapaa-aika tuottavat hänelle hyvinvointia. Yksi mahdollinen valinta on 

kvadraattinen hyötyfunktio, joka voidaan esittää muodossa 

𝑣(𝐶, 𝐿) = 𝛼1𝐶 + 𝛼2𝐶2 + 𝛽1𝐿 + 𝛽2𝐿2 + 𝛿(𝐶 ∙ 𝐿), 

jossa C on kulutus ja L on vapaa-aika. Koska tässä yksinkertaisessa mallissa yksilö ei voi 

säästää eikä lainata, kulutus vastaa hänen nettotulojaan: 𝐶 = 𝑓(𝑤ℎ, 𝐼), jossa w on tuntipalk-

ka, h on työtunnit, I on työnteosta riippumattomat bruttotulot (esim. pääomatulot) ja 𝑓(∙) on 

funktio, joka muuntaa bruttotulot nettotuloksi. Keskeistä on pystyä mallintamaan vero- ja 

tulonsiirtojärjestelmä eli funktio 𝑓(∙) siten, että henkilön bruttotuloista saadaan muodostettua 

verojen ja tulonsiirtojen jälkeiset nettotulot vaihtoehtoisissa tiloissa. Apuna voidaan käyttää 

mikrosimulointia tai funktiota 𝑓(∙)  voidaan approksimoida tilastollisen regressiomallin avulla. 

Diskreetin valinnan mallissa keskeinen oletus on se, että yksilö valitsee työtuntinsa pienestä 

joukosta eri vaihtoehtoja: 0, ℎ1, ℎ2, … , 𝐻̅, jossa 0 vastaa työttömyyttä (tai työvoiman ulkopuo-

lella oloa) ja 𝐻̅ on maksimituntimäärä, joka on käytettävissä työntekoon viikossa. Työtuntien 

valinta h määrittää sekä kulutuksen C että vapaa-ajan L yksikäsitteisesti. Koska 𝐿 = 𝐻  − ℎ, 
voidaan L korvata h:lla hyötyfunktiossa. 

Yksilön valintaa mallinnettaessa hyötytasoon lisätään vielä stokastinen termi 𝑒ℎ, joten yksi-

lön optimaalinen valinta maksimoi summan 𝑣(𝑓(𝑤ℎ, 𝐼), ℎ) + 𝑒ℎ. Stokastinen termi voi kuvata 

optimointivirhettä tai eri vaihtoehtoihin liittyviä havaitsemattomia, hyötyyn vaikuttavia tekijöi-

tä. Stokastisesta termistä oletetaan, että se on identtisesti ja riippumattomasti jakautunut ja 


4 
 

että sen kertymäfunktio on muotoa Pr (𝑒ℎ ≤ 𝑒) = exp(− exp(𝑒)), jolloin työn tarjontaa anne-

tulla tuntipalkalla kuvaa tavanomainen multinomial logit –malli.  

Mallin estimointia varten tarvitaan tietoa työtunneista ja tuntipalkoista. Yksi vaihtoehto on 

käsitellä myös palkkaa endogeenisena muuttujana, ja mallintaa palkkojen määräytymistä 

simultaanisesti työtuntien kanssa. Tässä tapauksessa todennäköisyys sille, että henkilö on 

töissä ja hänen työtuntinsa ovat h ja palkkansa w, on  

Pr(𝐻 = ℎ, 𝑊 = 𝑤) =
exp{𝑣(𝑓(𝑤ℎ, 𝐼), ℎ)}

∑ exp{𝑣(𝑓(𝑤𝑠, 𝐼), 𝑠)}𝐻̅
𝑠=0

𝑔(𝑤|𝑥), 

jossa 𝑔(∙) on palkan tiheysfunktio ja x on yksilön palkkaan vaikuttavien havaittujen ominai-

suuksien (koulutus, ikä, sukupuoli jne.) vektori. Koska työttömien palkkaa ei havaita, pitää 

palkan suhteen ottaa odotusarvo, joten todennäköisyys olla työttömänä on  

Pr(𝐻 = 0) = 𝐸𝑊[Pr (𝐻 = 0, 𝑊 = 𝑤)] = ∫
exp{𝑣(𝑓(0, 𝐼), 0)}

∑ exp{𝑣(𝑓(𝑤𝑠, 𝐼), 𝑠)}𝐻̅
𝑠=0

𝑔(𝑤|𝑥)𝑑𝑤. 

Integraalitermi aineiston työttömille vaikeuttaa mallin estimointia huomattavasti etenkin jos 

nettotulot halutaan arvioida mikrosimulointimallin avulla, koska työttömyyden todennäköi-

syys pitää laskea lukuisilla eri palkan arvoilla mallin estimoinnissa käytetyn iterointiprosessin 

sisällä. Esimerkiksi Van Soest ym. (2002) sekä Blundell ja Shephard (2012) mallintavat 

palkkoja ja työtunteja simultaanisesti.  

Vaihtoehtoinen ja yleisemmin käytetty lähestymistapa on korvata puuttuvat palkkatiedot 

ennustetuilla tuntipalkoilla kaksivaiheisen menetelmän avulla. Ensimmäisessä vaiheessa 

estimoidaan erillinen palkkaregressio. Toisessa vaiheessa puuttuvat palkkatiedot (tai vaih-

toehtoisesti kaikkien palkat) korvataan mallin sovitteella ennen työn tarjonta -päätöksen 

mallintamista. Koska tässä tapauksessa palkka otetaan annettuna, todennäköisyys sille, 

että yksilön työtunnit ovat h, on muotoa 

Pr(𝐻 = ℎ| 𝑊 = 𝑤̂) =
exp{𝑣(𝑓(𝑤̂ℎ, 𝐼), ℎ)}

∑ exp{𝑣(𝑓(𝑤̂𝑠, 𝐼), 𝑠)}𝐻̅
𝑠=0

, 

jossa 𝑤̂ on palkan sovite mallinnuksen ensimmäisestä vaiheesta (ks. esim. Bargain ym. 

2014). Sama yhtälö pätee myös työttömyyden (h = 0) todennäköisyydelle. Taustalla on kui-

tenkin implisiittinen oletus siitä, että yksilön päätösten perustana oleva odotettu palkka kye-

tään arvioimaan ilman ennustevirhettä. Oletus ei ole kovin realistinen, koska yksilöllä on 

aina enemmän tietoa oman työpanoksensa markkina-arvosta kuin tutkijalla, jonka laatima 

palkkaennuste nojautuu saatavilla olevan tutkimusaineiston vajavaisiin tietoihin. Ennustevir-

he voidaan kuitenkin ottaa huomioon, jolloin valinnan h todennäköisyydeksi tulee  

Pr(𝐻 = ℎ| 𝑊 = 𝑤̂) = ∫
exp{𝑣(𝑓((𝑤̂ + 𝑢)ℎ, 𝐼), ℎ)}

∑ exp{𝑣(𝑓((𝑤̂ + 𝑢)𝑠, 𝐼), 𝑠)}𝐻̅
𝑠=0

𝑚(𝑢)𝑑𝑢, 

jossa u on ennustevirhe ja 𝑚(∙)  on ennustevirheen tiheysfunktio (ks. esim. Van Soest 1995, 

Thoresen ja Vattø 2015, Bargain ym. 2014 ja Löffler ym. 2018).  

Mallissa oletetaan, että yksilö voi valita vapaasti haluamansa työtunnit ja että hänen hyötyn-

sä riippuu vain kulutuksesta ja vapaa-ajasta. Molemmat ovat varsin vahvoja oletuksia. Esi-

merkiksi työttömyyteen voi liittyä häpeän tunne eli stigma, joka tekee siitä ikävän tilan sil-

loinkin, kun työttömyyden aikaiset tuet tarjoavat kohtuullisen kulutustason yhdistettynä mak-


5 
 

simaaliseen vapaa-aikaan. Stigman takia yksilö saattaa valita työssäkäynnin, vaikka se ei 

pelkän kulutuksen ja vapaa-ajan näkökulmasta olisikaan optimaalista. Toisaalta työttömäksi 

joudutaan usein itsestään riippumattomista syistä esimerkiksi irtisanomisen myötä. Uuden 

työpaikan löytäminen vie aikaa etenkin laskusuhdanteessa, jolloin avoimia työpaikkoja on 

vähän ja niistä kilpailee moni muukin. Siksi työttömyys tietyllä havaintohetkellä saattaa olla 

olosuhteiden sanelema tilapäinen tila eikä yksilön optimaalinen valinta. Näistä syistä johtuen 

työttömyyden ennustaminen pelkästään kulutuksen ja vapaa-ajan maksimoivana vaihtoeh-

tona on ongelmallista. 

Mallin perusversiolla on lisäksi taipumus aliarvioida työttömien osuutta ja yliarvioida osa-

aikatyötä tekevien osuutta. Useimmilla toimialoilla osa-aikaisten työntekijöiden osuus on 

varsin pieni. Mikäli tämä olisi suoraa seurausta työntekijöiden vapaa-ajan ja kulutuksen pre-

ferensseistä, mallin pitäisi pystyä ilmiö selittämään (olettaen, että valittu hyötyfunktio ap-

proksimoi preferenssejä riittävän hyvin). Mutta osa-aikaisen työskentelyn vähyys voi johtua 

myös muista syistä. Osa-aikainen työ voi olla työnantajille hankalaa tai kallista järjestää, 

jolloin osa-aikaisia töitä on vain vähän tarjolla. Jos vain harvat työnantajat tarjoavat osa-

aikaisia töitä, niiden löytäminen on vaikeaa. Lisäksi työssäkäyntiin liittyy kiinteitä kustannuk-

sia esimerkiksi työmatkoihin kuluvan ajan ja euromääräisten liikkumiskustannusten muo-

dossa. Tällaiset kustannukset tekevät lyhyiden työpäivien tekemisestä vähemmän houkutte-

levaa suhteessa työttömyyteen, mikä osaltaan vähentää osa-aikaisiin työpaikkoihin hakeu-

tumista.  

Kysyntäpuolen rajoitteiden vuoksi yksilö ei siis välttämättä pysty vapaasti valitsemaan sitä 

työtuntien määrää, joka maksimoisi hänen hyötytasonsa. Työttömyyteen liittyvä stigma ja 

työnteon kiinteät kustannukset puolestaan tarkoittavat sitä, että vain vapaa-ajasta ja kulu-

tuksesta riippuva hyötyfunktio ei välttämättä kuvaa todellisuutta kovin hyvin. Näitä tekijöitä 

voidaan epäsuorasti huomioida lisäämällä malliin valintakohtaisia kiinteitä vaikutuksia (joi-

den voidaan sallia vaihtelevan yksilön havaittujen ominaisuuksien mukaan). Tässä tapauk-

sessa yksilö siis valitsee vaihtoehdon, joka maksimoi summan 𝑣(𝑓(𝑤ℎ, 𝐼), ℎ) + 𝜇ℎ + 𝑒ℎ, jos-

sa 𝜇ℎ on valintakohtainen vakio (ks. esim. Van Soest 1995 ja Löffler ym. 2018). Tällaisia 

kiinteitä vaikutuksia lisätään työn tarjonta -malleihin usein ad hoc –pohjalta, jolloin niille ei 

voida antaa yksiselitteistä tulkintaa.  Tosin ne voidaan myös johtaa teoriakehikosta, jossa 

yksilö kohtaa kysyntärajoitteita ja tekee valintansa latenttien työpaikkojen joukosta (ks. 

Dagsvik ym. 2014). 

Mallia voidaan edelleen joustavoittaa olettamalla, että työnteon ja vapaa-ajan preferenssit 

vaihtelevat yksilöiden välillä. Preferenssien heterogeenisuus voidaan huomioida sallimalla 

hyötyfunktion parametrien vaihdella yksilön havaittujen ja/tai havaitsemattomien tekijöiden 

mukaan. Esimerkiksi hyötyfunktion parametri 𝛽1, joka kuvaa vapaa-ajan arvostusta, voi olla 

muotoa 

𝛽1 = 𝛽10 + 𝛽11𝑧 + 𝜗, 

jossa z on vektori yksilön havaituista ominaisuuksista ja satunnaistermi ϑ kuvaa havaitse-

mattomien ominaisuuksien vaikutusta (ks. esim. Van Soest 1995 ja Löffler ym. 2018). Sa-

tunnaistermille pitää olettaa jonkin jakauma ja eri valintojen todennäköisyyksiä johdettaessa 

satunnaistermin suhteen pitää ottaa odotusarvo, koska sen arvoa ei havaita. Tämä johtaa 

ylimääräiseen integraalitermiin todennäköisyyden yhtälössä.  

Yllä on esitelty diskreetin valinnan mallin eri variaatiota ja kuvailtu niiden tuottamia todennä-

köisyyksiä havaituille valinnoille. Nämä todennäköisyydet muodostavat mallin uskottavuus-

funktion. Koska kyseessä on epälineaarinen todennäköisyysmalli, on mallin tuntemattomat 


6 
 

parametrit ratkaistava maksimoimalla mallin uskottavuusfunktio jonkin iteratiivisen optimoin-

timenetelmän avulla. Tietyissä tapauksissa mallin estimointi onnistuu yleisesti käytettyjen 

tilastollisten ohjelmistojen valmiiden logit-mallioptioiden avulla.  

Jos valitaan hyötyfunktio, joka on lineaarinen parametriensa suhteen (kuten kvadraattinen 

hyötyfunktio), korvataan havaitsemattomat (tai kaikki) palkat regressiomallin sovitteilla ja 

jätetään ennustevirheet huomiotta, työn tarjonta -päätöstä kuvaa standardi multinominal 

logit –malli. Tällaisen mallin parametrit on helposti estimoitavissa lähes millä tahansa tilas-

tollisella ohjelmistolla, eikä kiinteiden vaikutusten tai havaitun heterogeenisuuden lisäämi-

nen hyötyfunktion parametreihin muuta tilannetta. Jos lisäksi oletetaan, että jotkin hyöty-

funktion parametrit ovat satunnaisia, kyseessä on standardi mixed logit –malli. Myös tällai-

sen mallin estimointi on kohtuullisen suoraviivaista useimpien tilastollisten ohjelmistojen 

avulla. Tilanne vaikeutuu huomattavasti, jos palkkaa käsitellään endogeenisena muuttujana 

tai jos palkkojen ennustevirheet huomioidaan kaksivaiheisen menetelmän tapauksessa. 

Näissä tapauksissa tarvitaan erikseen räätälöityjä työkaluja, kuten Löfflerin ym. (2018) kehit-

tämää Stata-ohjelmistoa.   

Kuten yllä olevista yhtälöistä nähdään, mallin uskottavuusfunktio saattaa sisältää useita 

integraalitermejä, mikä vaikeuttaa estimointia. Tällaisten mallien estimoinnissa turvaudutaan 

usein simuloidun suurimman uskottavuuden (simulated maximum likelihood) menetelmään, 

jonka avulla voidaan approksimoida mutkikkaita uskottavuusfunktioita, joilla ei ole suljetun 

muodon ratkaisua. Menetelmä on kuitenkin laskennallisesti raskas, joten pitkät estimointiajat 

asettavat omat rajoitteensa.  

Seuraavissa luvuissa käymme läpi Löfflerin ym. (2018) kehittämän mallikehikon soveltamis-

ta suomalaiseen aineistoon ja tarkastelemme, miten eri mallinnusvaihtoehdot sopivat työn 

tarjonnan arvioimiseen aineistorajoitteiden puitteissa. 

 
3. KÄYTETTÄVÄ AINEISTO 

3.1. Aineistolähteet 

Jotta työn tarjonnan tarkastelu olisi rakenteellisen mallin avulla mahdollista, tarvitaan luotet-

tava ja kattava aineisto henkilöiden työtunneista ja tuntipalkoista. Lisäksi on keskeistä pys-

tyä mallintamaan vero- ja tulonsiirtojärjestelmä siten, että henkilön hypoteettisista bruttotu-

loista saadaan muodostettua verojen ja tulonsiirtojen jälkeiset nettotulot. Koska tulonsiirrot 

riippuvat myös puolison tuloista, lasten lukumäärästä ja asuinkustannuksista, tarvitaan tie-

toa myös näistä tekijöitä. Nettotulot voidaan arvioida kahdella vaihtoehtoisella tavalla: (1) 

käytetään verot ja tulonsiirrot mallintavaa simulointimallia eli SISU-mallia tai (2) estimoidaan 

nettotulojen sovitteet henkilöille hyödyntämällä riittävän monipuolista aineistoa todellisista 

netto- ja bruttotuloista sekä verotuksen ja tulonsiirtojen kannalta olennaisista taustatekijöis-

tä. Luvussa 4 tehtävissä tarkasteluissa keskitytään jälkimmäiseen vaihtoehtoon, ja SISU-

mallin yhdistämisestä työn tarjonnan mallintamiseen keskustellaan tarkemmin luvussa 5. 

Mallinnuksessa voidaan lisäksi käyttää taustamuuttujia, joiden voidaan olettaa vaikuttavan 

työn ja vapaa-ajan välisiin valintoihin eli preferensseihin. Näitä muuttujia ovat esimerkiksi 

ikä, sukupuoli ja pienten lasten lukumäärä perheessä. Lisäksi tuntipalkkojen estimointi työt-

tömille on keskeinen osa työn tarjonnan mallintamista. Tätä varten tarvitaan tietoa sekä 


7 
 

tuntipalkoista että palkkoihin vaikuttavista tekijöistä, kuten koulutuksesta, iästä ja ammatista. 

Tuntipalkkojen estimointitarkkuuden voidaan yleisesti ottaen olettaa paranevan, mikäli käy-

tettävissä on tietoa myös henkilöiden palkka- ja työllisyyshistoriasta sekä aiemmasta toimi-

alasta. Palkkaregressiosta keskustelemme tarkemmin luvussa 4. 

Työn tarjonnan mallinnusta varten olemme joutuneet yhdistämään tietoja kolmesta Tilasto-

keskuksen aineistosta:   

 Palkkarakennetilastosta on poimittu tiedot tehdyistä viikkotyötunneista ja tuntipalkois-

ta. Tilastoa varten nämä tiedot on kerätty työllistäviltä yrityksiltä loka-joulukuussa ja jul-

kisen sektorin (kunta, valtio) toimijoilta lokakuulta. Tilastosta puuttuvat kaikki alle viiden 

hengen yritysten työntekijät, osa suurempien järjestäytymättömien yritysten työntekijöis-

tä sekä ne yksityisen sektorin palkansaajat, joiden palvelussuhde on alkanut tai loppu-

nut keskellä tilastointikuukautta.
1
 Aineisto käsittää tilastovuodesta riippuen noin 55–75 

prosenttia yksityisen sektorin työntekijöistä vuoden viimeisen neljänneksen ajalta. Palk-

karakennetilasto on kattava julkisen sektorin osalta, joten julkisen sektorin työntekijät 

ovat aineistossa yliedustettuja. Lisäksi aineistosta luonnollisesti puuttuvat tuntipalkat 

tarkasteluhetkenä työttömänä olleille henkilöille. Palaamme tähän ongelmaan ja sen 

vaikutukseen mallintamisessa tarkemmin seuraavassa alaluvussa. 

 Mikrosimulointimallin rekisteriaineisto on SISU-mallia varten koottu tutkimusaineisto, 

joka kattaa vuosittain noin 15 prosenttia Suomen asuntokunnista ja henkilöistä. Tämä 

aineisto muodostaa mallinnuksemme otoksen, johon yhdistämme tarvittavat lisätiedot 

Palkkarakenne- ja FLEED-aineistoista. SISU-aineisto on muodostettu yhdistämällä usei-

ta hallinnollisia rekistereitä ja se kuvaa henkilöiden vuoden aikana saamia palkka-, yrit-

täjä- ja omaisuustuloja sekä asuntokuntien saamia ja maksamia tulonsiirtoja. Näiden tu-

lojen perusteella muodostuu henkilön ja asuntokunnan käytettävissä olevat tulot. Asun-

tokunta muodostuu samassa asuinhuoneistossa vakituisesti asuvista henkilöistä. Henki-

lön budjettirajoitteen mallintamista varten poimimme tästä aineistosta henkilön omai-

suustulot ja puolison nettotulot. Lisäksi aineistosta saatavia taustatietoja, kuten ikää, ko-

tikuntaa ja siviilisäätyä, käytetään selittävinä tekijöinä tuntipalkkojen ennustamisessa.  

 FLEED-aineisto on useista eri hallinnollisista rekistereistä muodostettu linkitetty työnte-

kijä-työnantaja-aineisto. Se kattaa kaikki 15–70-vuotiaat Suomessa asuvat henkilöt (pl. 

Ahvenanmaalla asuvat). Aineisto sisältää tietoja henkilöiden perusominaisuuksista, per-

heestä, asumisesta, työsuhteista, työttömyysjaksoista ja koulutuksesta. Monet tiedoista 

ovat vuositasolla, mutta aineisto sisältää työ- ja työttömyysjaksojen alkamis- ja päätty-

mispäivämäärät. Näiden tietojen avulla tunnistamme henkilöt, jotka olivat työttömänä 

tiettynä ajankohtana. Lisäksi käytämme aineiston tietoja toimialasta ja työmarkkinahisto-

riasta, kun mallinnamme tuntipalkkojen määräytymistä. 

Tämän aineistokokonaisuuden avulla voimme muodostaa työn tarjonta -mallin kannalta 

keskeiset muuttujat sekä ottaa huomioon monia työn tarjonnan ja palkanmuodostuksen 

kannalta keskeisiä taustatekijöitä. Käyttämällä SISU-aineistoa mallinnuksen perusaineistona 

voimme melko vaivattomasti käyttää myös SISU-mallia käytettävissä olevien tulojen mallin-

tamiseen, sillä SISU-aineisto on valmiiksi siinä muodossa, jolla kyseinen simulointi voidaan 

toteuttaa. Tässä raportissa käytämme vuoden 2015 aineistoja.  

                                                      
1
 Järjestäytyneiden yritysten työntekijöiden tiedot pohjautuvat työnantajajärjestöjen kattaviin jäsenkyselyihin. Tilas-

tokeskus täydentää tilastoa poimimalla otoksen järjestäytymättömien yritysten työntekijöistä. 


8 
 

3.2. Aineiston kuvailu ja muokkaukset 

Ennen varsinaisen työn tarjonnan mallinnuksen toteuttamista on aineistoa rajattava sekä 

aineiston muuttujia muokattava joiltain osin. Aiempaa kirjallisuutta seuraten rajoitamme tar-

kastelun työikäisiin eli 20–65-vuotiaisiin henkilöihin. Lisäksi tiputamme eläkeläiset, opiskeli-

jat, työkyvyttömyyseläkkeellä olevat sekä yrittäjät aineistosta pois. Taulukkoon 1 on koottu 

mallinnuksessa käytettävän aineiston keskeisten muuttujien kuvailutiedot.  

Taulukko 1. Aineiston keskeisten muuttujien kuvailu (vuosi 2015) 

 Keskiarvo Keskihajonta 

Ikä 44,2 11,0 

Sukupuoli (1=nainen, 0=mies) 50 % 0.5 

Palkkatulot 31 684 29 056 

Ansiotulot 35 108 27 650 

Työtunnit per viikko (Palkkarakenneaineisto) 36,7 7,6 

Tuntipalkka (Palkkarakenneaineisto) 20,1 21,4 

Pääomatulot 1 807 52 806 

Saadut tulonsiirrot 4 259 6 801 

Saanut tulonsiirtoja (1=kyllä, 0=ei) 52 % 0.50 

Saanut asumistukea (1=kyllä, 0=ei) 9 % 0.29 

Saanut toimeentulotukea (1=kyllä, 0=ei) 6 % 0.23 

On alle 7-vuotiaita lapsia (1=kyllä, 0=ei) 20 % 0.40 

On alle 3-vuotiaita lapsia (1=kyllä, 0=ei) 10 % 0.39 

Rekisteripohjaisten tietojen osalta havaintojen lukumäärä on 342 937. Palkkarakenneaineiston havain-
tojen lukumäärä on 166 658. Havaintojen lukumääriä ei ole korotettu väestötasolle. Aineistot on rajattu 
20–65-vuotiaisiin henkilöihin. Lisäksi eläkeläiset (eläkekuukaudet=12), opiskelijat (opintotuki>0), työ-
kyvyttömät (työkyvyttömyyseläke>0) sekä yrittäjät (yritystulo>5000 euroa vuodessa) on rajattu pois 
aineistoista. 

Tehdyt viikkotyötunnit ja tuntipalkat ovat keskeisimmät mallinnuksessa käytettävät muuttu-

jat. Nämä muuttujat ovat osa Palkkarakennetilastoa. Kuten edellä todettiin, Palkkarakenneti-

lastosta puuttuvat kaikki alle viiden hengen yrityksissä työskentelevät sekä osa isompien 

yritysten työntekijöistä, joten julkisen sektorin työntekijät ovat yliedustettuja. Lisäksi aineis-

tosta luonnollisesti puuttuvat tuntipalkat tarkasteluhetkenä työttömille oleville henkilöille. 

Mallinnusta varten täytyy määritellä erikseen ne henkilöt, jotka ovat työttömiä. Työttömiksi ei 

voida automaattisesti luokitella kaikkia henkilöitä, joiden palkka- ja työtuntitietoja ei ole Palk-

karakennetilastosta saatavilla, sillä he saattavat työskennellä sellaisessa yrityksessä, joka ei 

toimita tietoja tilastoon. Lisäksi henkilö saattaa olla työssä pitkiäkin ajanjaksoja vuoden ai-

kana mutta on juuri Palkkarakennetilaston keräämisen aikaan työtön tai työvoiman ulkopuo-

lella. Tämä hankaloittaa tarkastelua, sillä mallinnuksessa käytetään useita vuositasolla mi-

tattuja tietoja. Tällöin työttömien taloudellinen tilanne voi aineiston perusteella muodostua 

liian hyväksi, mikäli määritämme työttömiksi vain Palkkarakennetilaston keräämisen aikaan 

työttöminä olleet. Toisaalta työttömien taustaominaisuudet ja taloudellinen tilanne voivat 

antaa vääristävän kuvan kaikista työttömistä, mikäli oletamme työttömiksi vain koko vuoden 

työttömänä olleet henkilöt. 

Työttömien määrittelyyn ei siis ole olemassa itsestään selvää ratkaisua. Mallinnuksen mah-

dollistamiseksi hyödynnämme FLEED-aineiston työttömyysjaksotietoja. Käytämme erilaisia 

työttömien määrittelyjä analyysissä, ja tarkastelemme simulointitulosten herkkyyttä näiden 

valintojen suhteen. Ensimmäisessä vaihtoehdossa määritämme työttömiksi kaikki ne henki-

löt, joille ei ole saatavilla palkka- ja työaikatietoja Palkkarakennetilastossa ja joilla on yli 300, 


9 
 

200 tai 100 työttömyyspäivää vuoden aikana. Toisessa vaihtoehdossa määritämme työttö-

miksi ne henkilöt, jotka ovat lokakuun aikana olleet työttöminä (vastaa karkeasti samaa 

ajanjaksoa kuin Palkkarakennetilaston tiedot). Luvussa 4 keskustelemme lyhyesti mallin 

herkkyydestä näiden valintojen suhteen. Keskustelemme myös muista työn tarjonnan mal-

lintamisen mahdollistavista aineistovaihtoehdoista lyhyesti luvussa 6. 

 
4. MALLIN SOVITTAMINEN JA TYÖN TARJONNAN 

JOUSTOT 

Tässä luvussa esitellään käyttämämme mallinnusvalinnat ja muut oletukset, verrataan mal-

lin ennustetta havaittuun työtuntien jakaumaan sekä tarkastellaan mallin avulla estimoituja 

ensimmäisiä ja alustavia työn tarjonnan joustoja. Lisäksi keskustellaan lyhyesti siitä, miten 

eri mallinnusvalinnat vaikuttavat arvioon mallin sovitteesta ja työn tarjonnan jouston koosta. 

4.1. Mallinnusvalinnat 

Rakenteellista työn tarjonnan mallia estimoitaessa on välttämätöntä tehdä useita eri oletuk-

sia, joihin ei ole olemassa selkeästi määriteltyä oikeaa ratkaisua. Alla keskustelemme muu-

tamista keskeisimmistä valinnoista ja niiden merkityksestä lyhyesti. Yksityiskohtaisemmin 

tehtyihin oletuksiin ja teknisiin mallinnusvalintoihin voi tutustua mallinnuskoodien avulla (ks. 

raportin lähdeluettelo). 

Palkkojen estimointi 

Jotta työn tarjonnan malli voidaan estimoida, täytyy tuntipalkat ennustaa ainakin työttömille 

henkilöille. Toisin sanoen tarvitaan estimaatti sille, mikä työttömän henkilön tuntipalkka olisi, 

mikäli hän työllistyisi. Tämä tieto tarvitaan, jotta voimme arvioida käytettävissä olevat tulot 

työttömille kaikissa eri mallin diskreeteissä vaihtoehdoissa. Estimoinnissa voi olla tärkeää 

ottaa myös valikoitumisharha huomioon eli se, että työttömien tuntipalkat ovat todennäköi-

sesti pienempiä kuin työssä olevien havaituilta ominaisuuksiltaan samankaltaisten henkilöi-

den. Tätä pyrimme ottamaan huomioon käyttämällä Heckmanin (1979) kehittämää kaksivai-

heista valikoitumisen huomioon ottavaa estimaattoria.  

Palkkaregressiossa otamme huomioon keskeiset palkkaan yleisesti vaikuttavat tekijät, kuten 

iän, sukupuolen, koulutuksen, äidinkielin, lasten lukumäärän, siviilisäädyn, koulutustason ja 

toimialan. Kattava paneeliaineisto mahdollistaa lisäksi sen, että voimme ottaa huomioon 

myös edellisten vuosien palkat, työ- ja työttömyyspäivät sekä toimialat, joilla henkilö on ai-

emmin työskennellyt. Työhistorian kontrollointi auttaa myös valikoitumisharhan huomioon 

ottamisessa, sillä on odotettavaa, että heikomman työhistorian omaavien henkilöiden tunti-

palkat ovat pidempään töissä olleita matalampia. Toisin sanoen työhistoriatiedot toimivat 

proxy-muuttujina havaitsemattomille tekijöille. 

Palkkayhtälön estimoinnin jälkeen on päätettävä, käytetäänkö palkkaregressiosta saatuja 

palkkaennusteita kaikille henkilöille vai pelkästään työttömille, joiden palkat puuttuvat aineis-

tosta. Molemmille valinnoille on omat perusteensa, eikä oletusvapaata yksiselitteistä valin-

taa ole olemassa. Havaittuja palkkoja käyttämällä saadaan luonnollisesti tarkempi kuva 

tämänhetkisestä palkkatasosta (annettuna mahdolliset virheet ja puutteet aineistossa). Toi-


10 
 

saalta tällöin myös oletetaan, että henkilöt tekevät työn tarjonta -päätöksensä omaan nykyi-

seen tuntipalkkaansa perustuen, vaikka se olisikin muita samankaltaisia ja samassa työssä 

olevia henkilöitä suurempi tai pienempi. Käyttämällä ennustettuja palkkoja vastaavasti olete-

taan, että henkilö päättää työn tarjonnastaan samankaltaisten ja samanlaisessa työssä ole-

vien henkilöiden keskimääräisen palkkatason perusteella, mitä yksittäinen työntekijä ei vält-

tämättä tiedä tai havaitse. Alla esiteltävässä analyysissä olemme käyttäneet kumpaakin 

vaihtoehtoa, ja keskustelemme näiden eroista tuloksien osalta. 

On myös syytä pohtia sitä, miten ennustevirheitä käsitellään mallinnuksessa. Ennustettujen 

ja havaittujen tuntipalkkojen erot voivat olla hyvin merkittäviä yksittäisten henkilöiden koh-

dalla, mikä voi johtaa osin epäjohdonmukaisiin tuloksiin. Tämä koskee työllisten lisäksi 

myös työttömille ennustettuja palkkoja, joskin työttömän todellinen palkkataso ei ole havait-

tavissa. Ennustevirheet voidaan kuitenkin ottaa huomioon mallinnuksessa, jolloin tästä on-

gelmasta voidaan ainakin osittain päästä eroon (ks. tarkemmin Löffler ym. 2018). Ennuste-

virheiden huomioon ottaminen tekee mallin estimoimisesta kuitenkin haastavampaa, mikä 

näkyy erityisesti merkittävästi pidempänä estimointiaikana. Tässä raportissa emme siksi 

tarkastele mallinnusvaihtoehtoa, jossa ennustevirheet olisivat eksplisiittisesti huomioitu.  

Diskreetin valintajoukon määrittäminen 

Mallin estimoimista varten täytyy myös määrittää oletettujen työtuntivaihtojen lukumäärä ja 

niiden väliset erot. Kirjallisuudessa on tyypillisesti käytetty jollain kriteerillä edustavaa dis-

kreettiä valintajoukkoa. Löffler ym. (2018) käyttävät mallissaan seitsemää mahdollista valin-

taa: työtön, 10, 20, 30, 40, 50 tai 60 työtuntia viikkoa kohti.   

Diskreetin valintajoukon määrittämiseen ei ole olemassa mitään yksiselitteistä ratkaisua.  

Valintajoukon määrittämisen apuna voi kuitenkin käyttää havaittua työtuntien jakaumaa. 

Kuviossa 1 on esitetty työtuntien jakauma palkkarakenneaineistossa mallinnuksessa käyte-

tylle otokselle, kun mallin työttömiksi on lisätty yli 300 päivää vuodessa työttöminä olleet 

henkilöt, jotka puuttuvat Palkkarakennetilaston otoksesta. Kuviossa käytetään yllä mainittua 

lähtöoletusta seitsemästä mahdollisesta valinnasta (yli 60 työtunnin valinnat on yhdistetty 60 

tunnin luokkaan). 

Työtuntien jakaumasta on havaittavissa, että tehdyt työtunnit keskittyvät melko selvästi täy-

siin viikkotyötuntien (36–40 tuntia/viikko) kohdalle. Osa-aikaisen työn (10–30 tuntia) tai yli-

työn (50–60 tuntia) tekeminen on melko harvinaista, muttei kuitenkaan täysin poikkeuksellis-

ta. On siis todennäköistä, että osa-aikaisen työnteon mallintaminen rakenteellisen työn tar-

jonta -mallin avulla on haastavaa, sillä vain harva henkilö tekee Palkkarakennetilaston pe-

rusteella osa-aikaista työtä. Keskustelemme tästä tarkemmin myöhemmin. 

Lisäksi on mahdollista, että työtunneissa ja tuntipalkoissa on enemmän tai vähemmän mit-

tausvirheitä, sillä aineiston työtunnit perustuvat työnantajan ilmoitukseen tehdyistä tunneis-

ta. Ilmoitetut tunnit eivät välttämättä vastaa todellisuudessa tehtyjä työtunteja, jolloin myös 

todellinen tuntipalkka poikkeaa nimellisestä tuntipalkasta. 

  
11 
 

Kuvio 1. Työtuntien havaittu jakauma (vuosi 2015) 

 
Käytettävissä olevien tulojen estimointi 

Rakenteellinen työn tarjonnan malli edellyttää, että määritämme henkilöiden käytettävissä 

olevat tulot kaikissa eri diskreetin valintajoukon tiloissa. Seitsemän mahdollisen valinnan 

mallissa tulee siis määrittää käytettävissä olevat tulot, mikäli henkilö olisi työtön (0 työtuntia), 

tai tekisi 10, 20, 30, 40, 50 tai 60 työtuntia viikkoa kohti. Käytämme kattavaa rekisteripoh-

jaista aineistoa käytettävissä olevien tulojen mallintamiseen. 

Ensivaiheen regressiomallissa käytämme SISU-rekisteriaineiston havaittuja keskimääräisiä 

kuukausipalkka- ja pääomatuloja, perheen muita tuloja sekä muita sosiaalietuuksiin ja vero-

tukseen vaikuttavia tekijöitä selittämään kuukausikohtaisia nettotuloja. Tämän regressiomal-

lin estimoitujen kertoimien avulla arvioimme käytettävissä olevat tulot henkilöille kaikissa 

mallin diskreeteissä tiloissa käyttämällä ennustettuja ja/tai havaittuja tuntipalkkatietoja (tun-

tipalkka x tehdyt työtunnit).  

Kokonaisuudessaan käytettävät mallit selittävät käytettävissä olevia tuloja varsin hyvin (seli-

tysasteet ovat tyypillisesti yli 0,9). Regressiopohjaista menetelmää käyttäen on kuitenkin 

hyvin vaikea arvioida suunniteltujen vero- ja sosiaaliturvamuutosten vaikutuksia, koska es-

timoitu tilastollinen malli kuvaa ainoastaan aineistovuoden vero- ja tulonsiirtojärjestelmää. 

Käytettävissä olevat tulot eri tiloissa on mahdollista estimoida myös käyttämällä tuntipalkka-

tietoja ja SISU-mallia. Mikrosimulointimallia käyttämällä on suoraviivaisempaa arvioida to-

dellisten tai erityisesti kuvitteellisten politiikkamuutosten vaikutuksia. Keskustelemme simu-

laatiopohjaisesta lähestymistavasta tarkemmin luvussa 5. 

  
12 
 

Hyötyfunktio ja muut siihen liittyvät valinnat 

Mitään yksiselitteistä sääntöä ei hyötyfunktion muodon valintaan ole olemassa. Kirjallisuu-

dessa on tyypillisesti käytetty Box-Cox, Translog tai kvadraattista hyötyfunktiota (Löffler et 

al. 2018). Estimoimme mallin kaikilla näillä spesifikaatioilla ja keskustelemme tämän valin-

nan vaikutuksesta tuloksiin. 

Kuten edellä todettiin, mallissa on lisäksi mahdollista ottaa huomioon muita tekijöitä, jotka 

vaikuttavat työtuntien valintaan. Tällaisia tekijöitä ovat mm. työttömyyteen tai sosiaalietuuk-

sien varassa elämiseen liittyvä häpeäntunne (stigma) sekä osa-aikaisten työmahdollisuuksi-

en vähyys johtuen kysyntäpuolen rajoitteista. Lisäksi käytämme spesifikaatiota, jossa huo-

mioidaan preferenssien (eli kulutuksen ja vapaa-ajan arvostuksen) heterogeenisuutta iän, 

sukupuolen, lasten lukumäärän ja koulutustason suhteen. Otamme näitä tekijöitä tietyissä 

mallispesifikaatioissa huomioon, ja tarkastelemme niiden vaikutusta tuloksiin.  

4.2. Mallin estimointi ja työn tarjonnan jouston arviointi 

Työn tarjonnan rakenteellinen mallintaminen on laskentateknisesti haastavaa, ja sen seura-

uksena mallien estimoiminen voi saatavilla olevan laskentakapasiteetin rajoissa kestää kau-

an. Tässä raportissa rajoitumme siksi käyttämään viiden prosentin otosta koko aineistosta, 

sekä rajoitamme logit-mallin iteraatiokierrokset maksimissaan 50 iterointiin. Lisäksi rajoi-

tumme tässä vaiheessa mallintamaan yksilötason valintoja. Malli on kuitenkin tarvittaessa 

laajennettavissa kotitaloustason tarkasteluun. 

Estimoimme työn tarjonnan mallin käyttämällä Löfflerin ym. (2018) kehittämää lslogit-Stata-

ohjelmaa. Tarkastelemme mallin herkkyyttä eri mallinnus- ja aineistovalinnoille estimoimalla 

suuren määrän erilaisia mallispesifikaatioita. Näiden perusteella pyrimme katsomaan, mitkä 

spesifikaatiot tuottavat havaittuun aineistoon verrattuna realistisimmat kuvan työn tarjonnas-

ta.   

Mallin empiiristä sopivuutta voidaan suuntaa-antavasti arvioida esimerkiksi vertaamalla mal-

lin tuottamaa työtuntien todennäköisyysjakaumaa havaittuun työtuntien jakaumaan. Yleisesti 

ottaen voidaan todeta, että mallin sovitteet vaihtelevat, kun käytämme eri aineisto- ja mallin-

nusoletuksia. Malli vaikuttaa sopivan aineistoon paremmin erityisesti silloin, kun otamme 

huomioon eri valintavaihtoehtoihin liittyvät kiinteät vaikutukset sekä työn ja vapaa-ajan valin-

taan liittyvän heterogeenisuuden erityyppisillä henkilöillä. Lisäksi mallin sovitteet ovat pa-

rempia silloin, kun oletamme yli viisi diskreettiä valintamahdollisuutta. Sen sijaan käytetyllä 

hyötyfunktiolla tai palkkojen ennustamiseen liittyvillä valinnoilla ei ole yhtä merkittävää vai-

kutusta mallin sovitteeseen, kun verrataan mallin ennustamia työtunteja havaittuihin työtun-

teihin. 

Kuviossa 2 on esitetty tyypillinen mallin mukainen estimoitu työtuntien todennäköisyysja-

kauma sekä todellinen työtuntien jakauma käyttämällä kvadraattista hyötyfunktiota sekä 

edellä mainittuja mallin sovitetta yleisesti parantavia oletuksia. Kuviosta havaitaan, että pys-

tymme mallintamaan työttömyyden sekä kokopäiväisen työnteon erittäin tarkasti. Sen sijaan 

osa-aika- ja ylityön kohdalla mallinnus ei ole aivan yhtä tarkkaa. Tämä johtuu todennäköi-

sesti siitä, että muuta kuin kokopäiväistä työtä tekevien osuus on pieni, jolloin tämäntyyppis-

ten valintojen mallintaminen on haastavaa melko yksinkertaisessa työn tarjonta -kehikossa. 

Toisaalta koska osa-aikatyön tekeminen on Suomessa melko harvinaista, tämä ei välttämät-

tä ratkaisevasti vaikuta mallin perusteella tehtyihin laskelmiin, sillä pääosa siirtymistä työ-

markkinoilla tapahtuu kokoaikaisen työn ja työttömyyden välillä. Joustava seitsemän dis-


13 
 

kreetin vaihtoehdon malli kuitenkin mahdollistaa sen, että budjettirajoitteen muuttuessa 

myös osa-aika- tai ylityöhön siirtyminen on mallissa mahdollista. 

Kuvio 2. Ennustetut ja havaitut työtuntijakaumat 

 
Rakenteellisen mallin avulla voimme arvioida työn tarjonnan jouston suuruutta suhteessa 

palkoissa tapahtuviin muutoksiin. Kuvioissa 3 on esitetty mallin tuottamia työtuntien aggre-

gaattijoustoestimaatteja tuntipalkan suhteen eri mallinnusoletuksilla. Kuviossa rajoitutaan 

malleihin, joissa käytetään seitsemää diskreettiä valintaa. Sen sijaan funktiomuodon, palk-

kojen ennustamisen, työttömien määritelmän sekä kiinteiden vaikutusten ja heterogeenisten 

preferenssien oletuksia vaihdellaan eri mallien välillä. Jousto on käytännössä estimoitu niin, 

että korotamme kaikkien henkilöiden tuntipalkkoja 10 prosenttia, ja tutkimme, miten tämä 

muutos vaikuttaa työn tarjontaan. Jousto saadaan täten laskettua suhteuttamalla työtun-

neissa tapahtuva muutos 10 prosentin muutokseen tuntipalkassa. 

Kuvioista nähdään, että eri mallinnusvalintojen tuottamat joustoestimaatit vaihtelevat välillä 

0–0,5. Eri mallinnusvaihtoehdoista laskettu keskimääräinen työn tarjonnan jousto oman 

bruttotuntipalkan suhteen on 0,27, mikä vastaa melko hyvin aiemman tutkimuskirjallisuuden 

arvioita työn tarjonnan joustosta muissa maissa (ks. Löffler et al. 2018). Keskimääräinen 

jousto on myös mittaluokaltaan sama, jota Kärkkäinen ja Tervola (2018) käyttivät hankkeen 

ensimmäisen osan raportissaan lähtöoletuksena työn tarjonnan joustosta Suomessa. Halu-

amme kuitenkin korostaa, että arviot joustoista ovat vielä hyvin alustavia, eikä niitä tulisi 

tulkita kuvaavan keskimääräistä työn tarjonnan joustoa Suomessa. Tarkempi ja luotetta-

vampi arviointi edellyttää estimoinnissa käytettävän aineiston laajentamista sekä mallin ole-

tusten ja niiden vaikutusten perusteellisempaa tutkimista, johon ei tämän raportin puitteissa 

ollut vielä mahdollista ryhtyä. Alla keskustelemme muutamista keskeisistä joustoon vaikut-

tavista oletuksista.   

  
0
.2

.4
.6

.8

P
ro

s
e
n
tt
ia

0 10 20 30 40 50 60

Havaitut vs. ennustetut työtunnit

Havaittu Ennustettu


14 
 

Kuvio 3. Estimoitujen joustojen jakauma eri mallinnusoletuksilla 

 
Kuvio 4. Joustoestimaatit eri oletuksilla ennustetuista palkoista 

 
15 
 

Estimoidut joustot ovat keskimäärin samansuuruisia eri hyötyfunktiomuoto-oletuksilla sekä 

silloin, kun mallissa otetaan kiinteät kustannukset ja heterogeenisuus huomioon. Joustoes-

timaatit kuitenkin vaihtelevat merkittävästi, kun muutetaan oletusta palkkojen estimoinnista. 

Kuviossa 4 on esitetty joustoestimaatit silloin, kun palkat ennustetaan kaikille, sekä silloin, 

kun tuntipalkat estimoidaan vain mallin työttömille. Kuviosta nähdään, että joustot ovat sel-

västi pienemmät, kun palkat estimoidaan vain työttömille (keskiarvo 0,14), verrattuna siihen, 

jos oletetaan kaikkien palkkojen perustuvan palkkaregression sovitteeseen (keskiarvo 0,40). 

Erot estimaateissa johtuvat todennäköisesti siitä, että sovitteeseen perustuvien ennustettu-

jen palkkojen hajonta on pienempi kuin todellisten palkkojen. Tällöin tuntipalkkojen 10 pro-

sentin korottamisen myötä tulevat käyttäytymisvaikutukset tuottavat mekaanisesti suurem-

man jouston kuin silloin, kun käytetään havaittuja palkkoja työllisten osalta.  

Palkkojen estimointiin liittyvään valintaan ei kuitenkaan ole olemassa selkeästi määritettä-

vää oikeaa lähestymistapaa, ja valintaa on usein pohdittava tapauskohtaisesti. On kuitenkin 

hyvä huomioida, että tämä valinta todennäköisesti vaikuttaa joustoestimaattiin merkittävästi. 

On lisäksi oletettavaa, että joustoestimaatit muuttuisivat, jos palkkaestimoinnin ennustevir-

heet otettaisiin mallissa eksplisiittisesti huomioon. Tämä vaikuttaa todennäköisesti erityisesti 

silloin, kun palkkaestimaatteja käytetään kaikille henkilöille. Ennustevirheiden huomioimisen 

merkitystä ei kuitenkaan tarkastella tässä raportissa. 

4.3. Heterogeenisuustuloksia 

Tarkastelemme lyhyesti tulosten heterogeenisuutta sukupuolen ja iän suhteen. Kuviossa 5 

on esitetty toteutunut työtuntijakauma sekä mallilla estimoitu työtuntijakauma miehille (yllä) 

ja naisille (alla).
2
 Kuviosta nähdään, että jakaumat saadaan molemmille ryhmille estimoitua 

melko hyvin, mutta sekä ennustetuissa että havaituissa jakaumissa on kuitenkin nähtävissä 

se, että osa-aikainen työnteko on naisilla odotetusti hieman yleisempää kuin miehillä. 

Kuviossa 6 vertaamme mallin tuottamaa työtuntijakaumaa toteutuneeseen työtuntijakau-

maan yli 44-vuotiaille ja sitä nuoremmille. Kuviosta nähdään, että pystymme mallintamaa 

työntuntien todennäköisyysjakauman melko tarkasti myös eri ikäryhmille. 

Mallin sovitteiden ohella myös työn tarjonta -joustot palkan suhteen voivat vaihdella erityyp-

pisillä henkilöillä. Tiivistetysti voimme todeta, että työn tarjonnan joustot ovat keskimäärin 

suurempia naisilla (0,207) kuin miehillä (0,012), ja että yli 44-vuotiaiden henkilöiden joustot 

(0,113) ovat suurempia kuin tätä nuorempien (0,032). Laskenta-ajan pienentämiseksi 

olemme näille ryhmille estimoineet joustot käyttämällä suppeampaa joukkoa eri malleja. 

Tällöin koko populaation keskimääräiset joustot poikkeavat siitä, mitä edellä esitettiin. Ryh-

mäkohtaiset keskimääräiset joustot perustuvat malleihin, joissa on seitsemän diskreettiä 

valintaa, työttömiksi oletetaan yli 200 päivää vuoden aikana työttöminä olleet ja palkat en-

nustetaan vain työttömille. Hyötyfunktion muoto sekä oletukset kiinteiden kustannusten 

huomioimisesta vaihtelevat eri malleissa. 

  
2
 Kuviossa käytetään samaa mallispesifikaatiota kuin kuviossa 2 edellä.  


16 
 

Kuvio 5. Ennustetut ja havaitut työtuntijakaumat sukupuolen mukaan 

 
0
.2

.4
.6

.8

P
ro

s
e
n
tt
ia

0 10 20 30 40 50 60

Havaitut vs. ennustetut työtunnit: miehet

Havaittu Ennustettu

0
.2

.4
.6

.8

P
ro

s
e
n
tt
ia

0 10 20 30 40 50 60

Havaitut vs. ennustetut työtunnit: naiset

Havaittu Ennustettu


17 
 

Kuvio 6. Ennustetut ja havaitut työtuntijakaumat iän mukaan 

 
0
.2

.4
.6

.8

P
ro

s
e
n
tt
ia

0 10 20 30 40 50 60

Havaitut vs. ennustetut työtunnit: alle 45 vuotiaat

Havaittu Ennustettu

0
.2

.4
.6

.8

P
ro

s
e
n
tt
ia

0 10 20 30 40 50 60

Havaitut vs. ennustetut työtunnit: yli 44 vuotiaat

Havaittu Ennustettu


18 
 

5. TYÖN TARJONTA JA SISU-MALLI 

Käytettävissä olevat tulot eri työtuntivaihtoehdoissa voidaan estimoida regressiomallia hyö-

dyntäen, kuten teimme edellisessä luvussa. Käytettävissä olevien tulojen arvioinnissa voi-

daan kuitenkin käyttää vaihtoehtoisesti apuna mikrosimulointimallia. Mikrosimulointimallin 

hyödyntämisen etuna on se, että mikrosimuloinnin avulla voidaan suoraan arvioida eri lain-

säädäntömuutosten vaikutuksia käytettävissä oleviin tuloihin. Koska tämän raportin laskel-

missa aineisto on rakennettu SISU-mallin rekisteriaineistoa hyödyntäen, voidaan SISU-

mallia hyödyntää käytettävissä olevien tulojen simuloinnissa.   

Käytettävissä olevien tulojen simulointi voidaan toteuttaa käytännössä siten, että tuntipalk-

kojen estimoimisen jälkeen viemme SISU-malliin tiedon henkilöiden bruttopalkasta eri työ-

tuntivaihtoehdoissa. Tämän jälkeen korvaamme SISU-mallin tausta-aineistossa aineiston 

palkkatiedon estimoidulla bruttopalkalla ja nollaamme muut tulot (mm. muut palkkatulot, 

yrittäjätulot, eläketulot ja työttömyysturvaetuudet). Vaihtoehdossa, jossa henkilö on työtön, 

palkkatulot nollataan ja henkilö määritellään koko vuodeksi työttömäksi. Työttömänä henki-

lölle simuloidaan joko ansiosidonnaista päivärahaa, peruspäivärahaa tai työmarkkinatukea 

riippuen siitä, mihin etuuteen hän on oikeutettu. Osa-aikatyövaihtoehdoissa, joissa viikkotyö-

tunteja on 10, 20 tai 30, oletamme käytettävissä olevien tulojen simuloinnissa henkilöiden 

olevan oikeutettuja soviteltuun päivärahaan.
3
 Käytettävissä olevien tulojen simulointi eri 

vaihtoehdoissa vastaa menetelmällisesti ja oletuksiltaan suurelta osin työllistymisveroastei-

den laskennassa SISU-malliin kehitettyjä menetelmiä (ks. Kärkkäinen ja Tervola 2018). 

Koska mm. asumistuen ja toimeentulotuen määrä riippuu kotitalouden kaikkien jäsenten 

tuloista, teimme käytettävissä olevien tulojen simuloinnin kahden tulonsaajan kotitalouksissa 

erikseen kummallekin puolisolle. Käytännössä simuloimme käytettävissä olevat tulot eri 

vaihtoehdoissa kummallekin puolisolle erikseen oletuksella, että toisen puolison status ei 

muutu. 

Koska diskreetti työn tarjonnan malli estimoidaan Stata-ympäristössä ja SISU-malli toimii 

SAS-ympäristössä, tarvitaan mallinnuksessa molempia ohjelmistoja. Ensin Stata-

ympäristössä estimoidaan tuntipalkat. Estimoitujen tuntipalkkojen avulla lasketut bruttopal-

kat viedään tämän jälkeen SISU-malliin ja simuloidaan käytettävissä olevat tulot eri työtunti-

vaihtoehdoissa. Lopulta simuloidut käytettävissä olevat tulot viedään takaisin Stata-

ympäristöön ja näitä tietoja hyödyntäen estimoidaan työn tarjonnan malli.  

Työn tarjonnan mallin estimoimat työllisyysvaikutukset voidaan viedä takaisin SISU-mallin 

tausta-aineistoon ja muokata siinä henkilöiden työllisyysstatusta estimointitulosten mukai-

seksi. Tätä työllisyysvaikutuksilla muokattua aineistoa hyödyntämällä voidaan simuloida 

lainsäädäntömuutosten tulonjakovaikutuksia siten, että laskelmissa huomioidaan myös re-

formien vaikutukset työn tarjontaan. 

Mikrosimuloinnin hyödyntäminen on laskennallisesti haastavampaa kuin käytettävissä olevi-

en tulojen estimointi regressiomallin avulla. Esimerkiksi seitsemällä eri diskreetillä vaihtoeh-

dolla käytettävissä olevien tulojen laskenta vaatii 14 simulointiajoa, kun simuloinnit ajetaan 

puolisoille erikseen. Kun käytettävissä olevat tulot lasketaan vielä uudestaan joustojen arvi-

oimiseksi, tarvitaan simulointiajoja yhteensä 28. 

                                                      
3
 Tämä oletus ei ole ihan sopusoinnussa taustalla olevan teoriamallin kanssa, jonka mukaan osa-aikainen työsken-

tely on vapaaehtoinen valinta, sillä soviteltu päiväraha on tarkoitettu vain niille osa-aikaisesti (tai pätkätyösuhteissa) 
työskenteleville henkilöille, jotka haluaisivat työskennellä kokoaikaisesti.  


19 
 

Rakensimme ja testasimme SISU-mallin ja työn tarjonnan mallin välisen yhteyden. Yhteys 

toimii ja työn tarjonnan malli on mahdollista estimoida SISU-simulointia hyödyntäen. Käytet-

tävissä olevien tulojen simuloinnissa tulee kuitenkin tehdä vielä enemmän testaus- ja kehi-

tystyötä ennen kuin se voidaan sellaisenaan sisällyttää rakennemallin estimointiin. Tällä 

hetkellä mikrosimulointimallia hyödyntävä työn tarjonnan malli ei vielä tuota yhtä luotettavia 

tuloksia kuin regressiomallia hyödyntävä versio. Lisäkehitystyötä tarvitaan mm. sen määrit-

tämiseen, milloin ja millä ehdoilla henkilö saa soviteltua päivärahaa, ja miten henkilöiden 

muita kuin palkkatuloja käsitellään simuloinnissa. 

 
6. MITEN MALLIA VOIDAAN TULEVAISUUDESSA 

KEHITTÄÄ? 

Tässä raportissa esittelimme diskreetin valinnan kehikkoon perustuvan työn tarjonnan mal-

lintamisen perusperiaatteita ja sovelsimme mallia Suomen aineistoon. Alustavien tulosten 

perusteella voidaan todeta, että malli kuvaa melko hyvin työn tarjontaa Suomen työmarkki-

noilla ja että tulokset ovat melko hyvin linjassa kansainvälisen tutkimuskirjallisuuden kanssa. 

Toisaalta tulokset ovat sensitiivisiä eräiden keskeisten mallinnusvalintojen suhteen. Kiintei-

den vaikutusten lisääminen malliin parantaa selvästi mallin ennustaman työtuntijakauman 

osuvuutta. Mallista johdetut työn tarjonnan joustot riippuvat palkkojen käsittelystä. Joustot 

ovat selvästi suurempia silloin, kun ennustettuja palkkoja käytetään kaikille henkilöille eikä 

pelkästään aineiston työttömille.  

Mallintamista varten jouduttiin yhdistämään tietoja useista eri rekistereistä. Vaikka yhdistetty 

aineisto on laaja ja monipuolinen, se ei tarjoa edustavaa otosta työvoimasta, mikä vaikeut-

taa tulosten tulkintaa. On myös syytä korostaa, että aikataulullisista syistä ja laskentakapasi-

teetin rajoitteista johtuen rakennemallin monipuolisimmat versiot jouduttiin rajaamaan tämän 

raportin tarkasteluiden ulkopuolelle. Näistä syistä johtuen raportissa esitetyt tulokset ovat 

vasta alustavia ja suuntaa-antavia. Luotettavien työn tarjonta -vaikutusten estimointi edellyt-

tää vielä jatkotyötä.  

Mallin jatkokehittämisen ehkä keskeisimpänä kohteena on saada SISU-malli toimimaan 

osana työn tarjonnan mallintamista, mikä merkittävästi laajentaisi mallin käytettävyyttä niin 

politiikkavalmistelussa kuin akateemisessa tutkimuksessakin. Vasta tämä mahdollistaisi 

politiikkamuutosten työllisyys- ja tulonjakovaikutusten ex ante -arvioinnit.  

Lopuksi esitämme lyhyesti muutamia mallintamiseen ja siinä käytettäviin aineistoihin liittyviä 

kehittämisehdotuksia sekä suuntaviivoja työn tarjonnan mallintamisen kehittämiseksi tästä 

eteenpäin. 

Työvoimatutkimuksen hyödyntäminen. Työvoimatutkimus on otokseen perustuva haas-

tattelututkimus, jossa otoshenkilöiltä tiedustellaan puhelimitse heidän toiminnastaan haas-

tatteluviikon aikana. Sen lisäksi, että tutkimuksessa kysytään tietoja tehdyistä työtunneista, 

siinä myös kysytään, montako työntuntia haastateltava haluasi työskennellä ja onko henkilö 

etsinyt toista työtä. Vertaamalla toteutuneita ja toivottujen työtuntien määriä voitaisiin arvioi-

da, missä määrin työvoiman kysyntä rajoittaa työtuntivalintoja. Työttömiltä puolestaan tie-

dustellaan heidän työnhaustaan. Näiden vastaustensa avulla voitaisiin arvioida vapaaehtoi-

sen työttömyyden yleisyyttä. Työvoimatutkimus kattaa noin 12 000 henkilöä kuukausittain ja 

se kostuu viidestä rotaatioryhmästä. Otoshenkilöt osallistuvat tutkimukseen viisi kertaa, 

joten aineisto mahdollistaisi myös pitkittäistarkastelut. Työvoimatutkimuksen käsitteet ja 


20 
 

määritelmät noudattavat kansainvälisiä suosituksia, mikä helpottaisi tutkimustulosten vertail-

tavuutta muiden maiden tuloksiin. Toisaalta aineisto ei ilmeisesti sisällä tietoja palkasta, 

jotka pitäisi edelleen poimia palkkarakennetilastosta, joten lopullinen otoskoko yhdistelyn 

jälkeen jäisi suhteellisen pieneksi. 

Palkkarakennetilastosta puuttuvien työllisten huomioiminen. Yksi ongelma tämän ra-

portin tarkasteluissa oli se, ettei käytetty otos työllisistä ollut edustava: kaikki julkisen sekto-

rin työntekijät olivat mukana, mutta merkittävä osa yksityisen sektorin työntekijöistä jäi pois, 

koska heidän työnantajansa eivät kuuluneet Palkkarakennetilaston tietojenkeruun piiriin. 

Ongelmaan on kaksi mahdollista ratkaisua. Koska FLEED-aineiston avulla voidaan tunnis-

taa henkilöt, jotka olivat töissä vuoden viimeisen neljänneksen aikana mutta eivät sisälty-

neet Palkkarakennetilastoon, olisi mahdollista laskea eri työllisten ryhmille otospainot. Palk-

karakennetilaston aliedustettujen työntekijäryhmien edustajat saisivat suuremman painon 

mallin estimoinnissa ja muissa tarkasteluissa. Painottamisen avulla ei kuitenkaan voida 

huomioida työllisten ryhmiä, joita Palkkarakennetilasto ei ollenkaan kata, eli alle viiden hen-

gen yrityksissä työskenteleviä. Toinen tapa olisi poimia puuttuvat työlliset FLEED-

aineistosta ja lisätä ne estimoinnissa käytettävään otokseen. Näiden henkilöiden puuttuville 

palkoille voidaan laskea sovite aivan kuten työttömienkin puuttuville palkoille. Mutta heidän 

kontribuutionsa uskottavuusfunktioon poikkeaa muista työllisistä, koska heidän työtuntejaan 

ei havaita. Periaatteessa tämän joukon huomioiminen mallinnuksessa olisi suoraviivaista, 

sillä todennäköisyys olla työllinen ilman tietoa työtunneista on yksi miinus todennäköisyys 

olla työttömänä. Vaikka teoriatasolla muutos olisikin pieni, edellyttäisi se kuitenkin estimoin-

tikoodin osittaista uudelleen kirjoittamista, koska Löfflerin ym. (2018) mallikehikko ei tällaista 

otosongelmaa tunnista.  

Paneeliaineiston käyttö. Tarkasteluissa hyödynnettiin vain vuoden 2015 tietoja, jotka olivat 

tuoreimmat saatavilla olevat tiedot hankkeen alkaessa. Tarvittavat rekisteriaineistot ovat 

kuitenkin saatavilla myös joiltain aiemmilta vuosilta ja tulevat olemaan saatavilla myös myö-

hemmille vuosille. Luonteva laajennus olisikin yhdistää tietoja useammalta vuodelta. Koska 

henkilöt havaittaisiin useampana ajankohtana, pitkittäisaineisto mahdollistaisi diskreetin 

valinnan mallin paneeliversioiden estimoinnin. Aikadimensio edesauttaa havaitsemattomien 

tekijöiden mallintamista ja siten sallisi useampien satunnaiskomponenttien sisällyttämisen 

malliin. Tietyissä tapauksissa tällaisten paneelimallien estimointi voisi nojautua tilastollisten 

ohjelmistojen valmiiden paneeli mixed logit –mallien estimointiproseduureille.
4
 Poikkileik-

kausaineiston tapauksessa iso osa mallin identifioivasta vaihtelusta tulee vero- ja sosiaali-

turvajärjestelmästä, joka kohtelee erilaisia kotitalouksia eri tavalla. Toisaalta erityyppiset 

kotitaloudet (esim. sen mukaan onko perheessä pieniä lapsia vai ei) saattavat myös arvos-

taa vapaa-aikaa eri tavoin, eli hyötyfunktion parametrit voivat vaihdella samojen tekijöiden 

mukaan, jotka tuovat vaihtelua käteen jääviin tuloihin. Yhdistämällä aineistoja eri vuosilta, 

joiden aikana vero- tai tulonsiirtojärjestelmä on muuttunut, saataisiin käytettävissä oleviin 

tuloihin reformeista johtuvaa, yksilöiden preferensseistä riippumatonta vaihtelua, mikä pa-

rantaisi mallin identifikaation uskottavuutta. Tällaisen variaation hyödyntäminen ei välttämät-

tä edellyttäisi edes diskreetin valinnan mallien paneeliversioiden estimointia, vaan pitkittäis-

aineistoa voidaan käsitellä poolattuna poikkileikkausaineistona ja jättää huomiotta se, että 

osa yksilöistä esiintyy aineistossa useammin kuin kerran.  

Tulorekisteriaineiston hyödyntäminen. Tällä hetkellä kattavat tiedot tuloista ja tulonsiir-

roista on saatavilla ainoastaan vuositasolla. Tulevan tulorekisterin avulla pitäisi olla mahdol-

lista muodostaa melko kattava kuukausikohtainen paneeliaineisto työtuloista ja maksetuista 

etuuksista. Tulorekisterin hyödynnettävyyttä pystytään kuitenkin arvioimaan tarkemmin vas-

                                                      
4
 Tämä edellyttäisi hyötyfunktiota, joka on lineaarinen parametriensa suhteen, sekä palkkojen imputointia ilman 

ennustevirheen huomioimista. 


21 
 

ta kun aineistoa on olemassa sekä ansiotulojen että etuustulojen osalta riittävän pitkältä 

ajanjaksolta.  

Mallin SISU-linkitys ja SISU-rekisteriaineiston täydentäminen. Työn tarjonta -mallin 

SISU-linkitystä ja sen käytettävyyttä osana SISU-mallin kokonaisuutta edistäisi merkittävästi 

se, että työn tarjonnan mallinnuksessa tarvittavat keskeiset rekisterimuuttujat olisivat osa 

nykyistä SISU-rekisteriaineistoa. Käytännössä tämä tarkoittaisi pääasiassa Palkkarakenneti-

laston työtunti- ja tuntipalkkatietoja sekä jaksotietoja tämänhetkisistä ja menneistä työ- ja 

työttömyysjaksoista. Viimeksi mainituista on olemassa jo jonkin verran tietoa vuoden 2016 

SISU-aineistossa, eli merkittävin muutos tämän suhteen olisi Palkkarakennetilaston tietojen 

tuominen osittain osaksi SISU-aineistoa. 

Mallin käyttö politiikkavalmistelussa. Työn tarjonta -mallien ja mikrosimulointimallien 

hyödyntäminen talouspolitiikan työllisyysvaikutusten arvioinnissa vaatii tasapainottelua tie-

teellisen uskottavuuden ja käytettävyyden välillä. Rakenteellisen työn tarjonnan mallien es-

timointi on laskentateknisesti raskasta ja etenkin mikrosimulointia hyödynnettäessä mallin 

estimointi vie paljon aikaa. Esimerkiksi jo pelkkä SISU-mallin simulointi koko aineistolla kes-

tää 15–20 minuuttia. Kun simulointikertoja tarvitaan yhteensä 28, vie jo pelkkä käytettävissä 

olevien tulojen simulointi 7–9 tuntia laskenta-aikaa. Laskennallisesti näin raskas malli ei 

välttämättä sovellu kovin hyvin talouspolitiikan valmistelutyöhön, jossa yksittäisistä refor-

meista pitää arvioida jopa useita kymmeniä vaihtoehtoja. Toisaalta mallia voidaan soveltaa 

pienempiin otoksiin koko aineistosta, jolloin myös simulointiaikaa saadaan vähennettyä. 

Yksi vaihtoehto on käyttää rakenteellista mallia vain työn tarjonnan joustojen tuottamiseen ja 

tehdä politiikkasimulaatiot hankkeen ensimmäisessä osassa kehitellyn menetelmän avulla 

hyödyntäen rakennemallin tuottamia joustoestimaatteja.   

 
22 
 

7. LÄHTEITÄ JA TAUSTA-AINEISTOJA 

Bargain, O., Dolls, M., Neumann, D., Peichl, A. & Siegloch, S. (2014). “Comparing Inequality Aversion 

ccross Countries when Labor Supply Responses Differ”, International Tax and Public Finance 21, 845-

873. 

Bargain, O., Orsini, K., & Peichl, A. (2014). ”Comparing Labor Supply Elasticities in Europe and the 

United States”, The Journal of Human Resources 49, 723-838. 

Blundell, R. & Shephard, A. (2012). “Employment, Hours of Work and the Optimal Taxation of Low-

Income Families”, Review of Economic Studies 79, 481-510.  

Dagsvik, J. K, Jia, Z., Kornstad, T. & Thoresen, T. O. (2014). ”Theoretical and Practical Arguments for 

Modeling Labor Supply as a Choice among Latent Jobs”, Journal of Economic Survey 28, 134-151. 

Heckman, J. J. (1979). ”Sample Selection Bias as a Specification Error”, Econometrica 47, 153-161. 

Kärkkäinen, O. & Tervola, J. (2018). Talouspolitiikan vaikutukset tuloeroihin ja työllisyyteen 2015–

2018, Valtioneuvoston selvitys- ja tutkimustoiminnan julkaisusarja, 59/2018. 

Löffler, M., Peichl, A. & Siegloch, S. (2018). The Sensitivity of Structural Labor Supply Estimations to 

Modeling Assumptions, ifo Working Papers 259/2018. 

Van Soest, A. (1995).  “Structural Models of Family Labor Supply – A Discrete Choice Approach”, The 

Journal of Human Resources 30, 63-88. 

Van Soest, A., Das, M. & Gong, X. (2002). ”A Structural Labor Supply Model with Flexible Prefer-

ences”, Journal of Econometrics 107, 345-374. 

Thoresen, T. O. & Vattø, T. E. (2015). “Validation of the Discrete Choice Labor Supply Model by 

Methods of the New Tax Responsiveness Literature”, Labour Economics 37, 38-53. 

 
MALLIKOODIT: https://vatt.fi/tyontarjonta

https://vatt.fi/tyontarjonta


VALTIONEUVOSTON 
SELVITYS- JA TUTKIMUSTOIMINTA 

tietokayttoon.fi 

ISSN 2342-6799 (pdf) 
ISBN 978-952-287-623-2 (pdf)