Andmetest otsusteni. Kuidas aitab Statistikaamet Eesti ühiskonda targemaks muuta?
- Olemasolevad registriandmed on hea alus ühiskondlike probleemide ja nähtuste kulutõhusaks analüüsiks, mis pakub tuge nii poliitikakujundamisele kui ka praktilistele lahendustele. Küsitlustega saab koguda andmeid eelkõige hoiakute, arvamuste, hinnangute või tunnete kohta.
- Statistikaametilt on võimalik peale riikliku statistika tellida ka konkreetse rõhuasetusega uurimistöid, samuti saab Statistikaameti andmeid kasutada teadustöö tegemiseks.
- Andmete kiiremaks ja efektiivsemaks taaskasutamiseks on vaja tõhustada andmehaldust ja edendada andmetarkust.
SISSEJUHATUS
Eestis tekib iga päev tohutu hulk andmeid – koolides, ettevõtetes, ametiasutustes ja igapäevaelus. Ometi jääb nende potentsiaal sageli kasutamata, sest puudub teadmine, millised andmed on olemas ja kuidas neid targalt rakendada. Statistikaametil on tähtis roll – riikliku statistika tegijana ühendab amet eri valdkondade andmeid, et luua terviklik ja usaldusväärne pilt Eesti ühiskonna toimimisest. Hariduse näitel on näha, kuidas andmete sidumine ja analüüsimine aitab kujundada teaduspõhiseid poliitikaid, planeerida tööturgu ning suurendada kogu ühiskonna heaolu. Artiklis vaadeldakse, kuidas andmeid kasutatakse, miks neid on vaja väärindada ja kuidas Statistikaamet aitab muuta andmepõhise otsustamise riigijuhtimise igapäevaseks osaks.
Siinse inimarengu aruande keskmes on haridus – valdkond, mis puudutab meid kõiki mitmel tasandil alates riiklikust hariduspoliitikast kuni igaühe haridusteeni kogu elukaare jooksul. Haridussüsteemis kogutakse andmeid õpilaste, õpetajate, õppekavade, koolivõrgu ja haridustasemete kohta. Kui neid andmeid omavahel ja teiste registritega – näiteks rahvastiku-, tööhõive- või sotsiaalandmetega – siduda, on võimalik uurida, millised haridusteed viivad kõrgemalt tasustatud töökohtadeni, kuidas haridustase mõjutab rännet või millistes piirkondades on suurim puudus õpetajatest ja tugispetsialistidest. Selline andmete ühendamine loob tervikliku ja ajakohase ülevaate Eesti haridusmaastikust ning aitab teha targemaid otsuseid hariduspoliitika ja tööturu planeerimisel. Need omakorda mõjutavad otseselt meie majandusedu ja ühiskonna üldist heaolu.
Infoküllases maailmas on lisaks inimeste endi kriitilisele mõtlemisele oluline ka usaldusväärsete andmete selgus ja kättesaadavus. Just siin tuleb mängu Statistikaamet, kelle ülesanneteks riikliku statistika tegijana on nii erinevate nähtuste kirjeldamine kui ka andmetarkuse edendamine. Eesmärk on aidata Eesti inimestel paremini mõista, milliseid andmeid on olemas ja kuidas neid targalt kasutada. Oluline on märkida, et riikliku statistika tegijaid on Eestis vaid kaks, lisaks Statistikaametile ka Eesti Pank. Riikliku statistika tegemist reguleerib riikliku statistika seadus, mis kehtestab kohustused ja õigused, reeglid ja põhimõtted, mida riikliku statistika tegijad peavad järgima. Selle eesmärk on anda kasutajatele kindlus, et andmed on usaldusväärsed. Statistikaameti roll paneb talle ühiskonna ees ka suure vastutuse.
Riiklik statistika annab usaldusväärse ülevaate ühiskonna olukorrast ja muutustest ning varustab otsustajaid rahvastiku, sotsiaalvaldkonna, majanduse ja keskkonna arengut kirjeldava teabega. Statistikaameti kogutud andmeid kasutatakse arengukavade ja prognooside koostamisel, poliitikakujundamisel, teadus- ja rakendusuuringutes ning teadmuspõhiste otsuste langetamisel.
REGISTRITE JA TEISTE ANDMEKOGUDE KASUTAMINE RIIKLIKUS STATISTIKAS
Riiklikku statistikaprogrammi jõuavad ainult kõige olulisemad ja hästi põhjendatud statistikatööd, mis on vajalikud ühiskonnas toimuvate muudatuste regulaarseks jälgimiseks. Statistikaprogrammi alusel valmivad näiteks Statistikaameti andmebaasis ja rakendustes avaldatavad andmed, infograafikud ning Euroopa statistikasüsteemi juhtorganile Eurostatile edastatav statistika. Neid andmeid kasutavad poliitikakujundajad ja teised ühiskonna sidusrühmad meie elu mõjutavate otsuste tegemisel.
Statistikaamet võib riikliku statistika seadusele tuginedes küsida andmeid eri registritest, et kasutada neid statistikategevustes, mis kuuluvad riiklikku statistikaprogrammi. Vajalikud tunnused fikseeritakse lepingutes, mis sõlmitakse Statistikaameti ja andmekogu omaniku vahel. Seejuures lähtutakse minimaalsuse põhimõttest – registripidaja annab välja ainult need andmed, mis on konkreetse statistikatöö tegemiseks hädavajalikud.
Lisaks kogub Statistikaamet andmeid ka erinevate valdkondlike uuringute kaudu. Kokkuvõttes on ameti käsutuses väga ulatuslik andmevara, mis hõlmab erinevaid valdkondi ja ajaperioode ning mida saab kasutada ka teadustööde tegemiseks.
Riiklikud registrid pakuvad märkimisväärselt laiemat kasutuspotentsiaali kui vaid riiklik statistika, mille ulatus on piiratud Euroopa Liidu määruste ja riigiasutuste andmevajadustega. Seetõttu tuleks riikliku statistika tegemisel andmeid kogudes ning registritesse investeerides alati kaaluda ka nende võimalikku taaskasutust – ka sellist, mida Statistikaamet ise ei pruugi ette näha, kuid mis võib olla väärtuslik mõnele teisele avaliku sektori asutusele, teadlastele, erasektorile või ühiskonnale laiemalt.
REGISTRIPÕHISE LOENDUSE EELIS ON KIIRUS
Heaks näiteks registriandmete laialdasest kasutamisest on 2021. aasta rahva ja eluruumide loendus, mille Euroopa määrusest tulenevad kohustuslikud tunnused (nt elukoht, haridustase) saadi riiklikes registrites olevatest andmetest. Tänu sellele jäi ära pikk küsimustik, mis oli kasutusel 2000. ja 2011. aasta loendustel. Sellega liikus Eesti Põhjamaade eeskujul registripõhise loenduse suunas, sama teed läksid ka teised Balti riigid.
Registripõhise loenduse eelis on kiirus: andmed avaldati aasta jooksul pärast loendushetke, samas kui 2011. aastal kulus avaldamiseni ligi kaks aastat. Tänapäeval, kui andmeid soovitakse kiiresti, oleks nii pikk ooteaeg mõeldamatu. Registripõhisus võimaldab loendusega kogutavat infot uuendada igal aastal, ilma et oleks vaja inimesi uuesti küsitleda – mitte ainult kord kümnendis, nagu varasematel loendustel. Samas on oluline rõhutada, et registriandmete kasutamine ei tähenda järeleandmisi andmete kvaliteedis.
Rahvaloenduse jaoks vajalikud tunnused ei olnud siiski registrites olemas üks ühele, enamik tuli kokku panna mitmest allikast. Näiteks elukoha määramisel kasutati ligikaudu 20 erinevat andmeallikat. See näitab, kui paindlik on registriandmete taaskasutus võrreldes üksikute uuringute kaudu kogutud andmetega, mis sageli hiljem enam kasutust ei leia.
HARIDUSANDMEID KASUTATAKSE MITMEKÜLGSELT
Haridusstatistikas on hea näide andmete kombineerimisest rahvastiku kõrgeima haridustaseme arvutamine. Selle tunnuse koostamisel kombineeritakse andmeid muu hulgas Eesti Hariduse Infosüsteemist (EHIS), mis sisaldab dokumendiandmeid, ning rahvastikuregistrist, mille andmed põhinevad elanike endi ütlustel. Kuigi eelistatakse dokumendipõhiseid allikaid, on rahvastikuregistri andmed väärtuslikud juhtudel, kui inimene on hariduse omandanud väljaspool Eesti haridussüsteemi ning tema andmed ei kajastu täielikult EHISes.
EHIS on aluseks ka teistele haridusstatistika valdkondadele, nagu alushariduse, üldhariduse, kutsehariduse ja kõrghariduse statistika. Sarnast teavet avaldab ka EHISe omanik Haridus- ja Teadusministeerium oma keskkonnas Haridussilm. Statistikaameti koostatud ja avaldatud statistika eeliseks on aga see, et andmeid saab kombineerida teiste valdkondade, näiteks rahvastikustatistika tunnustega, nagu emakeel või sotsiaalmajanduslik taust.
Lisaks kogutakse hariduse andmeid näiteks tööjõuuuringus, mis on aluseks Eurostati haridusega seotud indikaatorite arvutamisele.1 Uuringute tegemisel pööratakse üha enam tähelepanu halduskoormuse vähendamisele ja olemasolevate andmete taaskasutamisele. Näiteks Eesti tööjõuuuringus kasutatakse EHISe andmeid selleks, et saada teavet isikute käimasolevate õpingute kohta. Tänu sellele ei pea vastajad üldjuhul oma õpingute kohta ise vastama.
Lisaks iga-aastastele haridusstatistika näitajatele viiakse Eurostati juhtimisel iga viie kuni kuue aasta järel läbi põhjalikumaid täiskasvanute koolituse uuringuid nii isiku- kui ka ettevõtlusuuringutena (AES, Adult Education Survey; CVTS, Continuing Vocational Training Survey). Nende kaudu saadakse teavet täiskasvanuhariduse ja tööalase koolituse ulatuse, iseloomu ja arengusuundade kohta.
AES uurib, kui palju ja millistes vormides täiskasvanud õpivad, sealhulgas nii formaalses, mitteformaalses kui ka informaalses õppes. Uuring annab ka infot hariduses osalemise motiivide ja takistuste kohta, mis täiskasvanute haridusteed mõjutavad.
CVTS keskendub ettevõtete korraldatavale tööalasele koolitusele. Selle abil kogutakse andmeid ettevõtete koolitustegevuse ulatuse, töötajate osaluse, koolitustele tehtud kulutuste ning kasutatavate koolitusvormide kohta. Uuringu tulemused aitavad hinnata tööandjate panust töötajate oskuste arendamisse.
KUI RIIKLIKUST STATISTIKAST EI PIISA
Riigi juhtimisel ja eri asutuste töös on sageli vaja teadmisi, mida riiklik statistika ei paku. Ühiskond on pidevas muutumises – tekivad uued nähtused ja vaja on lahendada probleeme, mida varem ei ole esinenud või mille analüüsimiseks tavapärasest statistikast ei piisa. Mõnikord on vajalik ka ühekordne ja põhjalikum analüüs, et mõnda teemat süvitsi käsitleda. Heaks näiteks on COVID-19 kriisiaeg, mil uurimisküsimusteks kujunesid kaugtöö, inimeste liikumine ning kiire suremuse ja haiglate täituvuse statistika.
Üha enam lisandub ka uusi andmeallikaid ning statistika tegemise ja analüüsi meetodeid. Samuti võivad erinevad huvirühmad vajada andmeid kitsamate sihtrühmade kohta, kui seda riiklikul tasemel tavaliselt tehakse.
Kui statistika avaldamistabelites vajalikku lõiget ei ole, kuid vastavad andmed on olemas, on võimalik tellida analüüs tasulise programmivälise statistikatööna. Selliste tellimuste esitajateks võivad olla teadlased, seadusemuudatuste ettevalmistajad, ettevõtted (nt uuringufirmad) või huvigruppide esindajad (nt põllumeeste organisatsioonid). Nii on võimalik kombineerida erinevaid andmeallikaid ja teha analüüse, mida riikliku statistika raames ei koostata ega avaldata.
Programmiväline statistikatöö võib hõlmata ka tellimusuuringuid. Näiteks viib Statistikaamet Haridus- ja Teadusministeeriumi (HTM) tellimusel läbi täiskasvanute oskuste uuringut (PIAAC)2.
Sarnaselt riikliku statistika koostamisega kasutati ka selles uuringus registriandmeid küsimustiku osaliseks eeltäitmiseks. Vastajal oli alati võimalus eeltäidetud andmeid kontrollida ja parandada. Eeltäidetud andmete hulka kuulusid näiteks sünniaasta ja -kuu, sugu, kõrgeim lõpetatud haridustase ning ametinimetus ja ametiala, mille kohta saadi infot töötamise registrist.
Statistikaamet on asutuste tellimusel koostanud analüüse, kasutades riigis olemasolevaid või varem kogutud andmeid. Seejuures võivad kasutatavad andmed olla nii registriandmed kui ka uuringuandmed. Näiteks välisüliõpilaste majandusliku mõju analüüsis3 ühendati hariduse ja töötamise andmed, samas kui noorte ettevõtjate analüüsis4 uuriti tegureid, mis mõjutavad noorte ettevõtjaks saamist.
Hariduse valdkonna poliitikakujundamine on saanud märkimisväärset tuge võimalusest tellida Statistikaametilt uuringuid ja analüüse. Nende tööde kaudu on loodud terve hulk teadmisi haridusvaldkonna kohta – teadmisi, mida ilma ulatuslike registriandmete kasutamiseta ei oleks olnud võimalik koguda. Vaadakem lähemalt viimaste aastate näiteid haridusega seotud tellimustöödest.
NÄIDE 1. Kutseõppe tasuliseks muutmise mõju. Täiskasvanud õppija kutsehariduses ja elukestvas õppes
Täiskasvanute kutsehariduse tasemeõppes ning elukestvas õppes osalemise analüüsis5 uuriti, kuidas mõjutab kutseõppe tasuliseks muutmine täiskasvanud õppijaid ning millised alternatiivid pakuvad võimalusi kutseõppele, näiteks erinevad koolitused. Selleks kombineeriti Eesti Hariduse Infosüsteemi, rahvastiku statistilise registri, Maksu- ja Tolliameti töötamise registri ning Eesti tööjõu-uuringu andmeid. Analüüs hõlmas aastatel 2019–2024 kutsehariduses õppinud vähemalt 20-aastaseid täiskasvanuid ja täiendkoolitustes osalejaid.
Uuring toetab riiki kutsehariduse reformi kavandamisel, mille tulemusel lisandub tasemeõppesse arvestatav hulk noori õppijaid. Nii jääb riigieelarvelisi vahendeid tasuta õppekohtade loomiseks täiskasvanud õppijatele vähem.
Analüüs tõi välja kolm peamist riskirühma:
- Ida-Virumaa venekeelsed inimesed, kelle varasem haridus võib olla praeguse tööturu vajadusi arvestades aegunud;
- töötuse kogemusega inimesed, kes ei ole saanud koguda piisavalt raha tasulistel koolitustel osalemiseks, kuid võivad olla hiljuti lõpetanud õpingud mõnel teisel erialal;
- vanemad õppijad, kes sooviksid keskenduda õpingutele ja mitte töötada nende kõrvalt, kuid kelle varasematest õpingutest on möödunud liiga vähe aega, et uue õppega alustada.
NÄIDE 2. Välisüliõpilaste majandusliku mõju igaaastane analüüs
Haridus- ja Noorteameti tellimusel on Statistikaamet juba kuus korda analüüsinud, kui palju tulu toovad riigile Eestis õppivad ja töötavad välisüliõpilased6. Kõige viimane uuring näitas, et 2023/2024. õppeaastal töötas ligi pool Eestis õppinud 4336 välisüliõpilasest, kes maksid riigile kokku tulumaksu 5,4 miljonit ja sotsiaalmaksu 10,3 miljonit eurot. Välisüliõpilaste keskmine kuupalk oli kohalike töötavate üliõpilastega võrreldes sama suur – pisut üle 1600 euro kuus. Sellele lisanduvad veel Eestis õpingud lõpetanud ja tööle jäänud välismaa noored – lõpetamisele järgneval aastal jäid Eestisse tööle tervelt pooled vilistlastest. Õpingute kõrvalt töötavad ennekõike tehnika, tootmise ja ehituse ning hariduse valdkonnas õppivad välismaa noored. Samas kõige sagedamini jäävad Eestisse lõpetamise järel tööle info- ja kommunikatsioonitehnoloogia ning tehnika, tootmise ja ehituse valdkonna vilistlased. Ilmselt soodustab seda nende valdkondade lõpetajate jaoks sobilike rahvusvahelise töökeskkonnaga ettevõtete rohkus.
NÄIDE 3. Kuhu kaovad noored õpetajad? Analüüs aastatest 2015–2022
Aktuaalse õpetajate puuduse kontekstis viidi 2022. aastal läbi ka analüüs „Õpetajate elukaar aastatel 2015–2022“7. Uurisime, kuhu kaovad noored õpetajad. Analüüsi käigus vaadati 2019. aastal õpetajana töötanud inimeste karjääriteed ja selle muutusi. Erilist tähelepanu pöörati noortele, kes alles õpetajatööd alustasid.
Leiti, et noored õpetajad püsisid tegelikult nii ühe kui ka kahe aasta jooksul oma töökohal stabiilsemalt kui muudes ametites töötavad noored. Kolme aasta järel oli endiselt samal töökohal 60% õpetajatest, samas kui pooled muud ametit pidanud sama vanad noored olid juba edasi liikunud. Töökohtade vahetamine on omane noortele üldiselt ja õpetajad ei paista siin kuidagi negatiivselt silma.
NÄIDE 4. Täiskasvanuhariduse sihtrühmade analüüs Eestis
Täiskasvanuhariduse prioriteetsete sihtrühmade analüüsist saab teada, millised rahvastikurühmad osalevad aktiivsemalt täiskasvanuhariduses ja kuidas on täiskasvanuhariduse peamised rahvastikurühmad jaotunud maakonniti, Tallinnas ja Tartu linnas. Analüüs andis ülevaate täiskasvanuhariduse peamistest sihtrühmadest Eestis. Ka see analüüs vajas väga suure hulga andmete kasutamist (Statistikaameti rahvastiku statistiline register, rändeandmed, Eesti tööjõu-uuring, ettevõtete demograafia statistika, poliitikamõjude hindamise andmed, Sotsiaalkindlustusameti andmed, töötamise register, Maksu- ja Tolliameti andmed).
Lisaks hariduse teemadele on Statistikaamet analüüsidega toetanud ka teiste teemade poliitikakujundamist näiteks tervise, tööpoliitika, turismi ja ettevõtluse valdkonnas. Riiklike andmekogude kasutamine on hoidnud kokku väga palju aega ja ressursse, mis oleks läinud küsitlusuuringute tegemisele. Sealjuures võimaldavad registriandmed palju detailsemat analüüsi, kuna paljudele küsimustele vastamiseks ei saa ükski valimipõhine küsitlus anda sedavõrd rikkalikku infot kui registriandmed.
ANDMED TEADUSTÖÖKS
Teadusuuringute puhul on tavaline andmete kasutamine Statistikaameti turvalisel töökohal, kus teadlased saavad Andmekaitse Inspektsiooni ja eetikakomitee vajalike lubade olemasolul ligipääsu üksikandmetele, mida nad saavad analüüsida kindlaid andmekaitse reegleid järgides. Vajalikud andmed valmistavad ette Statistikaameti töötajad ning üksikud isikud nendes andmetes otseselt tuvastatavad pole (andmed on pseudonüümitud). Samuti on võimalik Statistikaametis puuduvaid andmeid saata turvalisel töökohal kasutamiseks. Sel viisil on nii Eesti kui ka teiste riikide teadlased analüüsinud näiteks sündimuse trende, palgalõhet, regionaalset sissetulekute ebavõrdsust, kaasava hariduskorralduse tõhusust ja paljusid muid teemasid.
OOTUSED STATISTIKAAMETILE ANDMETE PAREMAKS VÄÄRINDAMISEKS
Eestis on viimastel aastatel nii valitsus kui ka huvirühmad rõhutanud juba olemasolevate andmete paremat ja kiiremat taaskasutust, et parandada poliitikakujundamiseks vajalike andmete kättesaadavust ning vähendada halduskoormust. Ka Euroopa Liidus ja mujal maailmas on andmeid hakatud käsitlema mitte kui kõrvaltoodet, vaid kui vara, mida on võimalik ka majanduse hüvanguks kasutada. Andmemajanduse potentsiaali peetakse suureks, kuid selle edendamiseks on vajalik kvaliteetsete andmete kättesaadavus ning oskuslik andmete kasutamine ehk andmetarkus.
Kuigi andmete ühekordse küsimise printsiip on meie avalikus sektoris juba ammu tuntud kontseptsioon, on tehisaru ajajärk selle rakendamise olulisust veelgi suurendanud. Kvaliteetsed andmed on tehisaru rakendamise aluseks ning viimane on juba praegu (mitte enam tulevikus) nii ühiskondlikus kui ka majanduslikus vaates ülemaailmses konkurentsis püsimiseks hädavajalik.
See tähendab, et ka ootused statistikaametitele on Euroopas kui ka maailmas laiemalt on suurenemas. Kuna Statistikaameti kätte on riikliku statistika tegemiseks koondunud eri valdkondade andmed, võib õigustatult eeldada, et ameti käes on parim teadmine, kompetents ja võime andmeid hallata. Alates 2019. aastast on Eesti Statistikaametil statistikaseadusest tulenev ülesanne koordineerida riigi andmehaldust. Sellest ajast on välja antud juhiseid ning pakutud paljudele riigiasutustele nõustamisteenust, kuidas andmeid paremini hallata ning need ristkasutuskõlblikuks teha.
Statistikaameti arengukavas 2023–2030 on üheks peamiseks valdkondlikuks ja organisatsiooniüleseks eesmärgiks seatud ka andmekirjaoskuse edendamine. Statistikaameti eesmärk on, et andmeid kasutatakse õigesti ja oskuslikult ning et Statistikaamet oleks Eestit puudutavate andmete peamine ja usaldusväärne allikas. Andmepädevuse tõstmiseks teeb Statistikaamet aktiivset teavitustööd oma koostööpartnerite hulgas. Samuti on Statistikaamet oma kodulehele kokku kogunud nõuandeid, mida andmete tarbimisel tähele panna, lisaks on võimalik tellida ka andmekoolitusi. Andmete paremaks selgitamiseks on kättesaadavad erinevad andmelood ja rakendused (nt juhtimislauad8 ja palgarakendus9), kus andmeid on lihtsasti ja haaravalt visualiseeritud. Seega on Statistikaamet juba astunud samme uutele ootustele vastamise suunas.
KOKKUVÕTE
Andmete tõhusam taaskasutus eeldab tugevat andmehaldust ning andmetarkust kogu ühiskonnas. Ühendades eri allikatest pärit andmeid, on Statistikaametil riikliku statistika tegijana võtmeroll Eesti ühiskonnale usaldusväärsete teadmiste pakkumisel ja andmete muutmisel igapäevaseks osaks riigi juhtimises. Hariduse valdkonna näitel on kõnekalt näha, et eriliigiliste andmete sidumine ja analüüsimine aitab kujundada teaduspõhiseid poliitikaid, planeerida tööturgu ning suurendada kogu ühiskonna heaolu.
