Vypracovanie Analýzy zverejňovania datasetov ústredných orgánov štátnej správy na portáli otvorených dát (ďalej len “analýza”) vyplýva z úloh Akčných plánov Iniciatívy pre otvorené vládnutie v SR, konkrétne na základe úlohy B.10 Akčného plánu Iniciatívy pre otvorené vládnutie v Slovenskej republike na roky 2017 – 2019 a Akčného plánu Iniciatívy pre otvorené vládnutie v Slovenskej republike na roky 2020 – 2021.
Analýza sa venuje datasetom ústredných orgánov štátnej správy (napr. ministerstvá, Štatistický úrad SR, Úrad pre verejné obstarávanie a ďalšie) na centrálnom portáli otvorených dát data.gov.sk.
Tento rok sa na príprave analýzy podieľalo aj OZ Alvaria, v spolupráci s Úradom splnomocnenca vlády SR pre rozvoj občianskej spoločnosti a Martinom Šechným (SOIT). V porovnaní s minulými rokmi bola pridaná kapitola venovaná používaniu ústredného portálu otvorených dát data.gov.sk, rozšírený priestor je venovaný aktivitám a iniciatívam spojeným so zverejňovaním otvorených dát.
Analýza má 4 základné kapitoly:
- Kvantitatívna analýzy datasetov
- Kvalitatívna analýza datasetov
- Používanie portálu
- Štandardy a iniciatívy v oblasti otvorených dát
Kapitola Kvantitatívna analýza datasetov sa venuje tradične prehľadu datasetov podľa rôznych metadát – licencia, tag, formát, perióda aktualizácie, publikujúca organizácie (OVM) a celkovému počtu datasetov v porovnaní s minulými rokmi.
Kapitola Kvalitatívna analýza datasetov má ambíciu analyzovať aj kvalitu datasetov. Na to slúži hodnotenie datasetov podľa hviezdičiek, čo je medzinárodný štandard otvorených dát. Taktiež kapitola obsahuje zoznam najčastejších problémov ktoré znižujú kvalitu a použiteľnosť datasetov. V kapitole čitateľ nájde aj informácie o medzinárodných rebríčkoch hodnotenia kvality otvorených dát, ako napr. Open Data Maturity alebo OECD OURdata Index.
Kapitola Používanie portálu prináša informácie o tom ako portál používajú producenti a konzumenti dát. Kapitola stojí na dátach zistených od prevádzkovateľa portálu – Národná agentúra pre sieťové a elektronické služby (NASES). Ide o počet používateľov podľa krajín, počet zobrazení podľa rokov, najpopulárnejšie datasety podľa počtu zobrazení. Taktiež sú v kapitole aj údaje o registrovanom počte používateľov na portáli.
Kapitola Štandardy a Iniciatívy v oblasti zverejňovania otvorených dát prináša prehľad významných aktivít, ktoré sa týkajú používania otvorených dát. Z oblasti štandardov je reč o publikačnom minime štátnej správy a datasetoch s vysokou pridanou hodnotou (high-value datasety), dôležité materiály sú Národná koncepcia informatizácie verejnej správy a Akčný plán Iniciatívy pre otvorené vládnutie na roky 2022-2024. Dôležité aktivity sú Zverejňovanie datasetov s vysokou pridanou hodnotou, Národný projekt Otvorené údaje 2.0, Výzva Manažment údajov inštitúcie verejnej správy a Prieskum dopytu verejnosti po najžiadanejších datasetoch a API. Zahrnuté sú tiež aktivity občianskej spoločnosti – najmä OZ Alvaria.
Dôležitou časťou analýzu sú odporúčania, ktoré majú zlepšiť národný portál otvorených dát a posilniť využívanie otvorených dát.
Nové odporúčania sme rozdelili do skupín:
Zverejňovanie datasetov a API, prieskumy dopytu
- Zabezpečiť prioritné zverejnenie datasetov a API, ktoré vzišli z prieskumov dopytu verejnosti po najžiadanejších datasetoch a API.
- Realizovať ďalší prieskum dopytu verejnosti po najžiadanejších datasetoch a API po splnení predchádzajúcej úlohy minimálne na 75 %.
- Pravidelne vyhodnocovať úroveň zverejnenia najžiadanejších datasetov a API.
- Pri realizácii prieskumu dopytu verejnosti po najžiadanejších datasetoch umožniť OVM a dátovým kurátorom kontaktovať respondentov, ktorí dobrovoľne na seba uvedú kontakt, v prípade nejasností.
- Vyhodnocovať dopyt verejnosti po datasetoch a API územnej samosprávy.
Sledovanie dopadu otvorených dát
- Sledovať využívanie (dopad) datasetov zverejnených na základe publikačného minima štátnej správy.
- Zaviesť technický spôsob, ako rozlíšiť datasety s vysokou pridanou hodnotou na portáli od ostatných, napr. špeciálnym príznakom alebo tagom.
Otvorenosť portálu
- Zverejniť návrhy na zverejnenie údajov na portáli otvorených dát v anonymizovanej podobe ako dataset v pravidelnej periodicite najmenej raz ročne.
- Publikovať manuál a/alebo videonávod ako napojiť existujúce portály otvorených dát automatizovane na centrálny portál a v prípade záujmu OVM k tomuto usporiadať workshop.
- Umožniť automatickú konverziu formátov na portáli, t.j. nahraný súbor bude možné stiahnuť aj v inom formáte. Toto je dôležité pre pohodlie používateľov aj OVM. Niektorí používatelia nevedia pracovať s formátmi ako sú JSON, CSV, XML, pre nich je vhodné umožniť aj stiahnutie vo formáte XLSX/XLS/ODS.
- Umožniť používateľovi podať návrh na zverejnenie údajov na portáli otvorených dát aj formou e-mailu alebo vo formulári bez nutnosti elektronického podpisu.
- Umožniť používateľom filtrovať datasety aj podľa periódy aktualizácie.
Kvalita datasetov
- Znižovať podiel datasetov bez uvedenia licencie (hodnota „iná“), datasetov s nedostatočne otvorenou licenciou (napr. CC-SA, CC-NC), okrem odôvodnených prípadov.
- Zaviesť striktné požiadavky na zverejnené datasety – portál data.gov.sk by mal umožniť zverejnenie len tých datasetov, ktoré splnia aspoň 3 hviezdičky kvality. Odporúčame ponechať OVM dostatočne dlhé prechodné obdobie, v ktorom by nevyhovujúce datasety boli nahradené vyhovujúcimi, aby sa tak žiadne údaje nestratili a neznižoval sa počet datasetov.
- Umožniť používateľovi tlačidlom a formulárom bez nutnosti elektronického podpisu nahlásiť chybu pri datasete. Oznamy by sa mali odosielať dátovým kurátorom.
Analýzu si môžete stiahnuť na webovej stránke Úradu splnomocnenca vlády SR pre rozvoj občianskej spoločnosti.
K analýze bol vytvorený prehľadný dashboard, kde je možné si pozrieť a vyfiltrovať údaje z grafov.
Podkladové údaje k analýze vo formáte XLSX a CSV si môžete stiahnuť na tejto adrese. Údaje boli získané z portálu data.gov.sk, jeho API a od NASESu, prevádzkovateľa portálu.
Našli ste chybu ale nám chcete dať feedback k analýze? Ozvite sa na info@alvaria.sk.