
Osaamistarvekompassi sisältää tilasto- ja rekisteridataa sekä jalostettua osaamisen ennakointitietoa.
Datalähteet
Tällä sivulla on kuvattu Osaamistarvekompassissa hyödynnetyn datan lähteet. Käytössä ovat seuraavat lähteet:
- Osaamisdata: työpaikkailmoitukset, investointidata, tiede- ja tutkimusjulkaisut, suuren kielimallin data (OpenAI)
- Tilastokeskuksen tilastoaineistot
- Koski-tietovaranto, Virta-opintotietopalvelu ja ePerusteet.
Osaamiset
Osaamistarvekompassin osaamisdata on työelämän osaamistarpeista kertovaa tietoa, jota on louhittu ja jalostettu big datasta tekoälyn avulla. Osaamisdataa löytyy Osaamiset-osion Power BI -raporteilta sekä ammattialojen sivuilta Ammattialat-osiosta. Osaamisdata päivittyy kerran vuodessa keväällä.
Datalähteinä on käytetty
- työpaikkailmoituksia
- investointidataa
- tiede- ja tutkimusjulkaisuja
- suuren kielimallin dataa (OpenAI).
Työpaikkailmoitukset on koottu Työmarkkinatorilta ja Duunitorista. Käytettävissä on yli 4,5 miljoonaa ilmoitusta vuodesta 2018 alkaen. Työpaikkailmoitukset kuvaavat, millaista osaamista työelämässä tarvitaan tällä hetkellä.
Investointidatan lähteinä on käytetty
- EU-investointien ja -hankintojen tietoja julkisesta EU Open Data -portaalista (yli 50 000 investointia)
- Suomen ja Ruotsin investointien tietoja kansallisista avoimen datan portaaleista (Business Finland / Vinnova, yli 40 000 investointia).
Investointidataa on käytettävissä vuodesta 2008 alkaen. Tieto investoinneista on usein abstraktia, mutta sen avulla voidaan ennakoida osaamistarpeita melko tarkasti 1–3 vuoden päähän.
Tiedejulkaisudatan lähteinä on käytetty
- Directory of Open Access Journal -rekisteristä saatavissa olevia avoimia julkaisuja. Käytettävissä on yli 20 000 lehteä ja 10 miljoonaa julkaisua vuodesta 2010 alkaen.
- Tiede&Tutkimus-tietopalvelun artikkelien dataa (yli 800 000 artikkelia).
Tiedejulkaisuista saadaan tietoa keskipitkän ja pitkän aikavälin osaamistarpeista.
OpenAI:n suuri kielimalli auttaa luomaan kokonaiskuvaa siitä, mitä osaamista eri aloilla tarvitaan. Se pystyy käsittelemään valtavia määriä erilaista aineistoa, kuten työpaikkailmoituksia, tutkimuksia, tiedettä ja uutisia. Kielimalli löytää aineistosta toistuvia teemoja ja usein yhdessä esiintyvien osaamisten joukkoja eli klustereita. Suuren kielimallin data täydentää tietoa osaamistarpeista erityisesti aloilla, joilla julkaistaan vain vähän työpaikkailmoituksia.
Osaamistarvekompassin osaamisdata kootaan vuosittain viimeisten 12 kuukauden aikana julkaistusta aineistosta. Pidemmän aikavälin aineistoja hyödynnetään datan käsittelyn ja jalostamisen tukena.
Osaamisdatan louhinnan ja jalostamisen on tehnyt HeadAI.
Osaamisten sovellettavuus
Osaamiset on luokiteltu myös sovellettavuuden mukaan. Luokittelu perustuu siihen, kuinka monella alalla osaaminen esiintyy Osaamistarvekompassin datassa.
Alakohtaiset osaamiset liittyvät tyypillisesti tietyn ammatin harjoittamiseen. Ne esiintyvät Osaamistarvekompassissa vain yhdellä ammattialalla.
Melko alakohtaiset osaamiset esiintyvät 2–5:llä eri ammattialalla.
Laajasti sovellettavat osaamiset esiintyvät Osaamistarvekompassissa useammalla kuin viidellä ammattialalla. Niitä ovat esimerkiksi viestintä- ja vuorovaikutustaidot sekä digitaalinen osaaminen, joista on hyötyä lähes kaikissa työtehtävissä.
Ammattialat
Ammattialat-osiossa on yleiskuvauksia aloista, tietoa alojen työtehtävistä sekä alojen työllisten tunnuslukuja ja tarvittavia osaamisia.
Ammattialat perustuvat Osaamisen ennakointifoorumin (OEF) ammattialaluokitukseen. Luokituksessa on kolme tasoa. Esimerkiksi:
- Taso 1: 2 Tekniikan ja luonnontieteiden asiantuntijat
- Taso 2: 2.1 Teollisuuden ja kaivostoiminnan tuotantojohtajat ja asiantuntijat
- Taso 3: 2.1.1 Teollisuuden tuotantojohtajat ja asiantuntijat.
Ammattialojen työllisten tietoja voi tarkastella ikäryhmittäin, toimialoittain, koulutusaloittain, koulutusasteittain ja maakunnittain. Tietoja on joillakin ammattialoilla karkeistettu OEF-ammattialaluokituksen tasoon 2, jolloin ne sisältävät useamman ammattialan tunnusluvut. Karkeistus on tehty Tilastokeskuksen julkaisuehtojen mukaan.
Tunnusluvuissa on hyödynnetty Tilastokeskuksen erillisaineistoja:
- työlliset toimialan, ammatin ja koulutuksen mukaan
- työlliset maakunnittain
- eläkkeelle siirtyneiden ja kuolleiden ammatit vuotta ja kahta vuotta aiemmin
- väestön ammattisiirtymät 5-vuotisjaksoittain.
Tilastokeskus on laatinut erillisaineistot perustilastoistaan:
- tutkintorekisteri
- työlliset, työssäkäyntiaineisto
- väestöaineisto.
Ammattialasivujen Työmarkkinasiirtymät-kaavioissa voi esiintyä ammattialana "Ammatti tuntematon". Tämä tarkoittaa, että Tilastokeskuksella ei ole tietoa henkilön ammatista tai henkilön työnkuvaan kuuluu ammatteihin luokittelemattomia tehtäviä.
Kaavioissa työmarkkinasiirtymän lopputuloksena voi myös olla "Tuntematon". Tähän luokkaan Tilastokeskus sisällyttää sellaisessa sosioekonomisessa tilanteessa olevat henkilöt, joita ei ole voitu sijoittaa työllisten, työttömien, opiskelijoiden tai työvoiman ulkopuolella olevien luokkiin tai joiden toiminta ei ole tiedossa.
Tutkinnot
Tutkinnot-osion Power BI -raportit tarjoavat säännöllisesti päivittyvää tietoa ammatillisen koulutuksen ja korkeakoulutuksen tutkintosuorituksista sekä kuluvan vuoden loppuun ulottuvat ennusteet tulevista tutkintosuorituksista.
Ammatillisen koulutuksen raporttien tiedot perustuvat Opetushallituksen ylläpitämään Koski-tietovarantoon, johon koulutuksen järjestäjät tallentavat tiedot opiskelijoiden opinto-oikeuksista, tutkintosuorituksista ja tutkinnon osien suorituksista. Osaamistarvekompassin Power BI -raporttien tiedot päivittyvät kuukausittain.
Korkeakoulutuksen raportit perustuvat Virta-opintotietopalvelun tietoihin ammattikorkeakoulujen ja yliopistojen opinto-oikeuksista ja tutkintosuorituksista. Virta-palvelu sisältää 37 suomalaisen korkeakoulun eli yhteensä 1,5 miljoonan tutkinto-opiskelijan opinto-oikeus- ja suoritustiedot. Tiedot julkaistaan yhteenvetoina, eivätkä ne sisällä tietoa yksittäisten henkilöiden tarkkuudella. Tiedot päivittyvät raporteille kaksi kertaa vuodessa, helmikuussa ja lokakuussa.
Tutkintoennusteet on mallinnettu opinto-oikeus- ja suoritusdatan perusteella XGBoost (eXtreme Gradient Boosting) -koneoppimismallia hyödyntäen.
Tutkintojen tuottama osaaminen
Tutkintojen tuottamasta osaamisesta kertovat raportit perustuvat
- ammatillisen koulutuksen valtakunnallisiin tutkintojen perusteisiin, tutkintojen osaamisvaatimuksiin sekä hyväksyttyjen suoritusten kuvauksiin, jotka on julkaistu ePerusteet-palvelussa
- yliopistojen ja ammattikorkeakoulujen kurssikuvauksiin ja opetussuunnitelmiin, jotka on julkaistu koneluettavassa muodossa Peppi- tai Sisu-opintohallintojärjestelmissä.
Korkeakoulutusta koskeva data on osittain puutteellista. Kaikki korkeakoulut eivät julkaise tietoja koneluettavassa muodossa tai lainkaan. Tutkinto ja siihen liittyvä osaaminen löytyvät raportilta, jos vähintään yksi koulutusta järjestävä korkeakoulu on julkaissut tiedot.
Jos tietoa on saatavilla vain yhdestä korkeakoulusta, data voi olla vinoutunutta eli se ei täysin edusta todellista tilannetta. Tämä johtuu siitä, että korkeakoulut päättävät opetussuunnitelmistaan itsenäisesti ja painottavat usein eri asioita. Samaan tutkintoon johtavan koulutuksen sisältö voi vaihdella korkeakouluittain.
Tutkintojen tuottaman osaamisen datan louhinnan ja jalostamisen on tehnyt HeadAI.
Raportit-osion sisällöt
Raportit-osioon on koottu kaikki Osaamistarvekompassin Power BI -raportit ja muut tietosisällöt. Osaamistarpeita ja tutkintokoulutusta koskevat raportit on koottu myös omiksi teemakokonaisuuksiksi Osaamiset- ja Tutkinnot-osioihin. Näiden raporttien datalähteet on kuvattu yllä.
Työmarkkinasiirtymät-osio sisältää Power BI-raportteja ja visualisoitua tilastotietoa työmarkkinasiirtymistä ja ammattialojen työllisistä. Tiedot perustuvat Tilastokeskuksen erillisaineistoihin vuodesta 2015 alkaen. Aineistot on kuvattu tarkemmin Ammattialat-väliotsikon alla.
Alakohtaisiin tilannekuviin on koottu havaintoja erityisesti työvoimapulasta ja kohtaanto-ongelmasta kärsivien ammattialojen tilanteesta. Tiedot perustuvat seuraaviin lähteisiin:
- Osaamistarvekompassi
- Työmarkkinatorin Työvoiman saatavuus ja kohtaanto -raportti
- Opetushallituksen ja Osaamisen ennakointifoorumin (OEF) kohtaantotarkastelu.
Sivu on päivitetty 20.10.2025