Avoin data
Jatkuvan oppimisen ja työllisyyden palvelukeskuksen vuosittain päivittyvä osaamisdata on saatavana avoimena tietoaineistona. Tällä sivulla on aineiston kuvaus. Datan saa käyttöönsä täyttämällä tietopyyntölomakkeen Jotpan asiointipalvelussa.
Aineiston kuvaus – osaamistarpeet ammattialoittain
Data on julkaistu raportilla Osaamistarpeet ammattialoittain. Ladattava aineisto on pilkuin eroteltu csv-tiedosto.
Aineisto sisältää työpaikkailmoituksista ja suuren kielimallin datasta louhittua ja tekoälyavusteisesti jalostettua dataa työelämän osaamistarpeista. Data päivittyy Osaamistarvekompassiin kerran vuodessa.
Työpaikkailmoitukset ovat peräisin Työmarkkinatorin ja Duunitorin ilmoitusdatasta vuosilta 2018–2024.
Suuret kielimallit (LLM) sisältävät lähes koko internetin, mukaan lukien sosiaalisen median alustat ja saavutettavissa olevat tietokannat. Osaamisdata on analysoitu OpenAI:n kielimallien 3.5 ja 4 sisältämästä datasta.
Ammattialaluokitus
Datasta analysoidut osaamistermit on luokiteltu ammattialoittain. Ammattialaluokituksena käytetään Osaamisen ennakointifoorumin (OEF) ammattialakoodistoa. Luokituksessa on kolme tasoa. Esimerkiksi:
- Taso 1: 2 Tekniikan ja luonnontieteiden asiantuntijat
- Taso 2: 2.1 Teollisuuden ja kaivostoiminnan tuotantojohtajat ja asiantuntijat
- Taso 3: 2.1.1 Teollisuuden tuotantojohtajat ja asiantuntijat
Ammattialaluokitus perustuu Tilastokeskuksen 2010 ammattiluokitukseen.
Osaamisluokitus ja osaamisten sovellettavuus
Osaamisista on laskettu myös osaamisen sovellettavuus. Luokittelu perustuu siihen, kuinka monella alalla osaaminen esiintyy Osaamistarvekompassin datassa.
Alakohtaisella osaamisella (engl. occupational competency) viitataan sellaisiin taitoihin, tietoihin, arvoihin ja asenteisiin, jotka ovat keskeisiä ammatin harjoittamiselle ja joiden tarve esiintyy tyypillisesti vain kyseisen alan tehtävissä. Tällaisia osaamisia ovat Osaamistarvekompassissa ne, jotka datassa esiintyvät vain yhdellä ammattialalla.
Melko alakohtaiseksi on määritelty osaaminen, joka esiintyy osaamisdatassa 2–5 eri ammattialalla.
Laajasti sovellettavalla osaamisella (engl. transversal competency) tarkoitetaan sellaisia taitoja, tietoja, arvoja ja asenteita, joiden tarve esiintyy yli ammatti- ja toimialarajojen. Tällaisia osaamisia ovat esimerkiksi viestintä- ja ryhmätyötaidot sekä digitaalinen osaaminen, joista on hyötyä lähes kaikissa työtehtävissä. Laajasti sovellettaviin osaamisiin on Osaamistarvekompassissa lajiteltu osaamiset, jotka esiintyvät osaamisdatassa useammalla kuin viidellä ammattialalla.
Osaamistarvekompassin datassa sovellettu osaamisten luokittelu pohjautuu Opetushallituksen kehittämään osaamisluokitukseen.
Osaamiset – lähiosaamiset
Osaamistermi on datassa esiintyvä termi. Lähiosaaminen on termin datassa esiintyvä konteksti. Samalla osaamistermillä voi olla eri konteksti varsinkin eri ammattialoilla. Konteksti kertoo usein siitä tavoitteesta, johon ammattialalla osaamisen avulla pyritään.
Esimerkki
- Osaaminen: ”Viestintä- ja vuorovaikutustaidot”
- Lähiosaamiset eli konteksti sosiaalialan ohjaajalla: asiakkaan kohtaamisen taidot, osallisuuden vahvistaminen, päivittäisten toimintojen organisointi, palveluiden kehittäminen
- Lähiosaamiset eli konteksti konetekniikan asiantuntijalla: tekninen suunnittelu, testitulosten analysointi, tuotantoprosessin analysointi.
Muuttujat datassa
- Ammattialan koodi - oef-luokka, taso 3, koodi
- Ammattiala - oef-luokka, taso 3, nimi
- Aineisto (datalähde)
- Alkuperäinen osaamistermi
- Muokattu osaamistermi
- Löydösten lukumäärä
- Alakohtaisuus
- Lähiosaamiset
Aineiston kuvaus – osaamistarpeiden vuosikatsaus
Data on julkaistu raportilla Osaamistarpeiden vuosikatsaus. Ladattava aineisto on pilkuin eroteltu csv-tiedosto.
Aineisto sisältää työpaikkailmoituksista, suuren kielimallin datasta sekä investointi- ja tiedejulkaisudatasta louhittua ja tekoälyavusteisesti jalostettua dataa työelämän osaamistarpeista. Data päivittyy Osaamistarvekompassiin kerran vuodessa.
Investointidata on luettu julkisesta EU Open Data -portaalista (EU-investoinnit ja hankinnat) niiltä osin kuin tieto on ollut saatavilla (50 000 investointia). Suomen ja Ruotsin investointien tiedot on saatu kansallisista avoimen datan portaaleista (Business Finland / Vinnova, 40 000 investointia). Käytettävissä olevat investoinnit ovat vuosilta 2008–2024.
Tiedejulkaisut eli saatavissa olevat open access -julkaisut on luettu DOAJ-portaalista. Data sisältää noin 20 000 lehteä ja 10 000 000 julkaisua vuosilta 2010–2024. Aineiston metadata on laadittu hyvin, jolloin sen avulla voidaan rajata luotettavasti analyysiin päätyvää lopullista hakujoukkoa. Tiede ja Tutkimus -portaalin API on käyttöönottovaiheessa. Data sisältää lähes 800 000 artikkelia metadatoineen ja lähdeviitteineen sekä artikkeleiden tiivistelmät.
Työpaikkailmoitukset ovat peräisin Työmarkkinatorin ja Duunitorin ilmoitusdatasta vuosilta 2018–2024.
Suuret kielimallit (LLM) sisältävät lähes koko internetin, mukaan lukien sosiaalisen median alustat ja saavutettavissa olevat tietokannat. Osaamisdata on analysoitu OpenAI:n kielimallien 3.5 ja 4 sisältämästä datasta.
Osaamiset – lähiosaamiset
Osaamistermi on datassa esiintyvä termi. Lähiosaaminen on termin datassa esiintyvä konteksti. Samalla osaamistermillä voi olla eri konteksti varsinkin eri ammattialoilla. Konteksti kertoo usein siitä tavoitteesta, johon ammattialalla osaamisen avulla pyritään.
Osaamisluokitus
Osaamistarvekompassin datassa sovellettu osaamisten luokittelu pohjautuu Opetushallituksen kehittämään osaamisluokitukseen.
Muuttujat datassa
- Aineisto (datalähde)
- Alkuperäinen osaamistermi
- Muokattu osaamistermi
- Löydösten lukumäärä
- Ammatillinen_erityisosaaminen (0=ei, 1=kyllä)
- Yleinen_osaaminen (0=ei, 1=kyllä)
- Vihrea_osaaminen (0=ei, 1=kyllä)
- Klusterin_summa
- Lähiosaamiset
Osaamisdatan käyttöehdot
Jatkuvan oppimisen ja työllisyyden palvelukeskuksen avointa osaamisdataa voi käyttää vapaasti kaikin mahdollisin tavoin edellyttäen, että lähde mainitaan: ”Jatkuvan oppimisen ja työllisyyden palvelukeskus” ja aineiston nimi: ”Osaamistarpeiden vuosikatsaus (vuosiluku)” / ”Osaamistarpeet ammattialoittain (vuosiluku)”.
Datan lataaminen
Data on saatavana Jotpan asiointipalvelusta. Valitse haluamasi tiedosto ja täytä tietopyyntölomake. Saat sähköpostiisi kertakäyttöisen linkin, josta pääset lataamaan datatiedoston. Linkki on voimassa vuorokauden.
Tietopyyntölomakkeella annettuja tietoja (sähköpostiosoite, nimike, organisaatio, toimiala, tietojen käyttötarkoitus) käytetään vain latauslinkin lähettämiseen sekä datan latausmäärien ja käyttötarkoitusten seurantaan.
Tietosuojaselosteen voit lukea Jotpan verkkosivuilta.