Táto roadmapa sa venuje problematike otvorených údajov v prostredí samosprávy. Jej cieľom je načrtnúť, ako sa posunúť z bodu A (žiadne zverejňované datasety) do bodu B (systematické a pravidelné zverejňovanie datasetov). Predstavuje prehľad rámcových a najdôležitejších krokov na dosiahnutie cieľa.
Najdôležitejšie kroky sú vizualizované v schéme nižšie. Jednotlivé kroky sú bližšie popísané v texte Road Mapy.
Cieľovou skupinou sú pracovníci územnej samosprávy (mestá, VÚC), ktorých sa tematika otvorených dát týka: na úrovni vedenia (primátor, prednosta, poslanec), ale aj implementácie (IT sekcia, “vecniari”). Text je prehľadom krokov a nerieši technické detaily.
Open Data Road Mapa v schéme
Inštitúcie štátnej a verejnej správy zhromažďujú, spracúvajú a zverejňujú množstvo dát v rôznych oblastiach – životné prostredie, doprava, financovanie, sociálne služby, vzdelávanie a i.. Verejnosť má možnosť s týmito dátami efektívne pracovať, pokiaľ sú zverejnené v strojovo spracovateľnej forme – technická otvorenosť a pod otvorenými licenciami – licenčná otvorenosť. Hovoríme o otvorených dátach (z angl. Open data), ktorých technické štandardy definuje § 52 Výnosu Ministerstva Financií SR č. 55/2014 Z.z. o štandardoch pre informačné systémy verejnej správy.
Na hlbšie pochopenie otvorených dát je možné pozrieť si nasledujúce zdroje:
Transparentnosť a verejná kontrola je pre kľúčová pre fungovanie demokratickej spoločnosti.
Legislatívne dôvody
V článku 26 Ústavy SR sa píše: “ Orgány verejnej moci majú povinnosť primeraným spôsobom poskytovať informácie o svojej činnosti v štátnom jazyku. Podmienky a spôsob vykonania ustanoví zákon.” V modernej dobe sa množstvo informácií spracúva v počítači v informačných systémoch, preto možno argumentovať, že “primeraný spôsob”, o ktorom hovorí Ústava, pri nich znamená “strojovo spracovateľné údaje”.
Ako kľúčový je potrebné chápať Zákon č. 211/2000 Z. z. o slobodnom prístupe k informáciám a o zmene a doplnení niektorých zákonov (zákon o slobode informácií), tiež známy ako “infozákon”. Ten nastavuje legislatívny a právny rámec zverejňovania informácií vo verejnej správe vo všeobecnej rovine. Pre otvorené údaje je dôležitý aj Výnos o štandardoch č. 55/2014 Z. z., ktorý (okrem iného) explicitne rieši problematiku otvorených údajov (paragrafy 51-53) a súvisiace technické štandardy a právne štandardy (definícia otvorených údajov). Zverejňovaniu údajov sa venujú aj dokumenty prijaté na úrovni vlády, napr. Národná koncepcia informatizácie verejnej správy (NKIVS), akčné plány Partnerstva pre otvorené vládnutie (Open Government Partnership / OGP) a ďalšie. Zverejňovanie viacerých typov údajov je vo viacerých prípadoch zákonná povinnosť, ktorej dodržiavanie kontroluje NKÚ (Najvyšší kontrolný úrad), preto by jej orgány verejnej správy mali venovať náležitú pozornosť.
Spoločensko ekonomické dôvody
Dôležitým dôvodom zverejňovania údajov je aj ich ekonomický alebo spoločenský prínos: nad údajmi môžu vznikať aplikácie, ktoré vytvárajú ekonomickú hodnotu alebo zvyšujú všeobecnú informovanosť. Sú príklady samospráv, ktoré začali aktívne pracovať s údajmi, ktorými disponujú a dokázali tak zlepšiť svoje vlastné fungovanie a skvalitnili služby, ktoré poskytujú občanom.
Príklady zverejňovaných údajov a spôsoby ich využitia postupne pribúdajú na webe http://www.alvaria.sk v sekcii “Články a analýzy”.
K dispozícii je aj video (v slovenčine), kde je téma hodnoty otvorených dát diskutovaná podrobnejšie: https://www.youtube.com/watch?v=QmadvJLsBqs (16 min.).
Dátový audit je prehľad všetkých údajov, ktoré má samospráva k dispozícii. Ak chce samospráva efektívne spravovať zeleň či chodníky, musí si najprv vykonať ich pasportizáciu. V manažmente je známe, že len to, čo sa dá merať, sa dá riadiť. Tak, ako samospráva musí zvládnuť riadenie svojich financií, je potrebné, aby porozumela fungovaniu dátového manažmentu.
Audit údajov by mal odpovedať na otázky:
- Aké údaje má daná samospráva k dispozícii? — Aké údaje vznikajú priamo v samospráve (a samospráva je teda autoritatívnym zdrojom)? Aké sa používajú informačné systémy a čo sa v nich nachádza? Aké údaje sa preberajú od tretích strán a samospráva ich len využíva? (Napr. katastrálne dáta.) Aké sú právne podmienky ďalšieho využívania, remixu (kombinovania s vlastnými údajmi) a zverejňovania pri údajoch, ktoré pochádzajú od tretích strán?
- Kde sa údaje nachádzajú? — Aké databázy, excelové tabuľky, ale aj neštruktúrované súbory (napr. wordové dokumenty) a nedigitálne informácie (papierové zošity, kartotéky) uchovávajú údaje, s ktorými samospráva pracuje? (Je dôležité mať dobrý prehľad, a to aj kvôli zabezpečeniu údajov, ich zálohovaniu a archivácii.)
- Aká je kvalita údajov? — Kto je zodpovedný za ich správnosť a aktuálnosť? Ktoré informácie chýbajú?
Dátový audit je vlastne zber “údajov o údajoch”, čiže metadát. Je užitočné, aby sa pri ňom zbierali aj metadáta, ktoré pri následnom publikovaní vyžaduje Výnos č. 55/2013 v paragrafe 53: https://www.slov-lex.sk/pravne-predpisy/SK/ZZ/2014/55/#paragraf-53 (informácie o platnosti údajov, časovej periodicite ich aktualizácie a pod.).
Niektoré samosprávy realizovali audit tak, že zaslali dotazník na všetky odbory so žiadosťou o popis, aké dáta majú. Jednotná šablóna pre audit v súčasnosti neexistuje, ale ako východisko môže slúžiť postup riešenia auditu z Akčného plánu OGP: https://github.com/otvorenavlada/akcnyplan2015/tree/master/uloha-01 (časť “Postup riešenia”).
Dôležité je urobiť audit *všetkých* údajov, s ktorými samospráva disponuje. Až po starostlivom zmapovaní všetkých údajov je možné zamyslieť sa nad riadením údajov (ktoré údaje má význam prioritne digitalizovať alebo čistiť?), rozhodnúť, ktoré je možné zverejniť ďalej, a ktoré sa zverejňovať nebudú.
Napríklad nemá zmysel zverejňovať tie údaje, ktoré už publikuje iná inštitúcia (napr. Štatistický úrad SR, Ministerstvo financií SR), pokiaľ údaje tretích strán neboli nejakým spôsobom obohatené. Je potrebné posúdiť technologické a právne prekážky (napr. existujúce zmluvy, legislatíva) a najmä posúdiť súlad pripravovaných datasetov s ochranou osobných údajov.
Údaje spadajú z pohľadu zverejňovania do niekoľkých kategórií:
- Nie je možné dáta zverejniť: Z pohľadu samospráv je potrebné dať pozor najmä na ochranu osobných údajov, zverejňovanie musí byť v súlade s Nariadením GDPR, ochranou obchodného tajomstva, daňového tajomstva a podobne.
- Povinne zverejňované dáta: Existuje povinnost dáta zverejniť zo zákona, napríklad schválený rozpočet mesta a obce, všeobecne záväzné nariadenia, zmluvy, objednávky, faktúry, evidencie a registre a ďalšie. Prehľad informačných povinností samospráv je k dispozícii na webe: http://www.alvaria.sk/informacne-povinnosti-samosprav/
- Dobrovoľné podľa uváženia: Je na individuálnom zvážení obce, aké ďalšie dáta, okrem povinne zverejňovaných, zverejní ako otvorené dáta. Napríklad môže zverejniť mapové údaje z mestského GIS systému, údaje o parkovaní, činnosti mestskej polície, aktuálnej polohy MHD a ďalšie.
V procese rozhodovania sa môžu mestá a obce inšpirovať príkladmi z ČR, Španielska a USA, ktoré sme popísali v tomto článku.
Pri výbere dát je možné sa inšpirovať aj odporúčaniami OECD, ktoré najväčší potenciál na komerčné využitie otvorených dát vidia v geografických, meteorologických, environmentálnych informáciách, a naopak, najmenší v dátach z oblasti kultúry.
Zdroj: OECD (2016): Digital broadband content: Public Sector Information and Content. Paris: Directorate for Science, Technology and Industry. Dostupné na http://www.oecd.org/sti/36481524.pdf . Obrázok prevzatý z prezentácie MV ČR: Úvod k otevřením datum. Dostupná na https://opendata.gov.cz/_media/edu:sk0_uvod_k_otev%C5%99en%C3%BDm_dat%C5%AFm_praha_27_09_2018_web.pdf
Obce a mestá často nakladajú s osobnými údajmi pri výkone verejnej moci a pri zabezpečovaní služieb obyvateľom a návštevníkom. Povinnosťou mesta a obce je prijať vhodné technické a organizačné opatrenia, ktoré dokazujú že spracovanie osobných dát vykonáva v súlade s Nariadením GDPR.
Pri identifikovaní osobných údajov v datasete je možné pomôcť si týmito otázkami:
- Spadá informácia do niektorej kategórie osobných údajov?
- Je informácia o konkrétnej fyzickej osobe?
- Vzťahuje sa účel spracúvania na konkrétnu fyzickú osobu?
- Má spracúvanie údajov dopad na konkrétnu fyzickú osobu?
- Sú spracúvané informácie aktuálne?
- Viete zo samostatnej informácia identifikovať konkrétnu fyzickú osobu?
- Poznáte jeden alebo viacero identifikátorov, na základe ktorých je osoba určiteľná?
- A i.
Vo vzťahu k zverejňovaniu otvorených dát je z pohľadu miest a obcí kľúčové zabezpečiť ochranu súkromia dotknutých osôb ale zároveň aj zabezpečiť zverejňovanie informácií v zmysle Infozákona.
Ochranu osobných údajov je potrebné riadiť prostredníctvom vypracovaného systému riadenia ochrany osobných údajov. Tento systém by mal zahŕňať tak právne, ako aj organizačné a bezpečnostné opatrenia.
Dobrá prax hovorí aj o viacstupňovej kontrole, keď dataset plánovaný na zverejnenia posudzuje z hľadiska súladu GDPR zodpovedná osoba v zmysle GDPR, gestor dát, odbor dátovej politiky a právne oddelenie. Až následne je vykonané rozhodnutie, či dataset bude zverejnený vo formáte otvorených dát, príp. akým spôsobom, a v akom rozsahu budú citlivé údaje anonymizované.
Rozhodnúť sa aké dáta zverejniť
Po spracovaní auditu je potrebné prijať rozhodnutie, ktoré údaje zverejniť a v akom rozsahu a v akej časovej postupnosti. V SR zatiaľ nebolo prijaté oficiálne publikačné minimum samospráv, ktoré by definovalo minimalistický zoznam dát vhodných na zverejnenie ako otvorené dát, no platí, že niektoré údaje majú vyššiu prioritu (najmä tie, ktorých zverejňovanie vyžaduje zákon alebo ktoré žiadajú občania). Príklady prioritizácie datasetov z ČR, Španielska a USA boli zverejnené na webe Alvarie: http://www.alvaria.sk/chybajuce-publikacne-open-data-minimum/
Vybrať platformu na zverejňovanie otvorených dát
Dáta je možné zverejniť rôznymi spôsobmi:
- Umiestniť dáta priamo na webovom sídle mesta alebo obce: V prípade, že dát je len malé množstvo (napr. jednotky alebo nanajvýš niekoľko desiatok datasetov), najjednoduchšie je vyexportovať dáta a umiestniť súbory priamo na webovom sídle mesta, spolu s podstránkou s metaúdajmi (zoznam datasetov + názov, popis, licencia, link). Tým vznikne jednoduchý open data katalóg. Niektoré mestá toto riešia “in house”, teda publikovanie priamo na stránke realizuje IT oddelenie. Ak vnútorné IT kapacity nie sú k dispozícii, je potrebné osloviť dodávateľa informačného systému. Príklad jednoduchého mestského open data katalógu: https://egov.presov.sk/
- Špecializovaný softvér na manažovanie katalógu otvorených údajov: Ak počet datasetov narastie na viacero desiatok prípadne stovky, je potrebné zvážiť prechod na špecializovaný softvér na manažovanie katalógu otvorených údajov. Príkladom je open data portál mesta Bratislava: https://opendata.bratislava.sk/ — Softvér, na ktorom beží bratislavský open data katalóg, je k dispozícii online: https://github.com/magistrat-bratislava/opendata — hoci v súčasnosti nie je pripojená konkrétna voľná licencia, mesto Bratislava deklarovalo, že ostatné samosprávy môžu zdrojový kód voľne použiť: https://zive.aktuality.sk/clanok/143507/bratislava-zverejnila-zdrojove-kody-k-svojmu-portalu-otvorenych-dat-ma-aj-dalsie-novinky/
- Katalogizovať alebo umiestniť dáta na data.gov.sk: Data.gov.sk je národný open data katalóg, ktorý využívajú ministerstvá a inštitúcie na národnej úrovni. Výhodou data.gov.sk je, že sú otvorené dáta viacerých inštitúcií na jednom mieste. Nevýhodou je, že proces registrácie organizácie (mesta a obce) a katalogizovanie datasetov je pomerne náročný proces z hľadiska byrokracie a času. Datasety je možné priamo (fyzicky) nahrať alebo len katalogizovať zverejnené datasety napr. na webovom sídle organizácie.
Čo sa týka formátov súborov, používa sa ich viacero, najmä v závislosti od typu dát a ich použitia. Na tabuľkové dáta sa preferuje formát CSV (je vhodnejší ako formát XLS, pretože na XLS je proprietárny a nie otvorený formát), pre dopravné dáta sa preferuje formát GTFS a podobne. Niektoré dáta ako napr. poloha vozidiel MHD sa nebudú zverejňovať ako tabuľky na stiahnutie, ale prostredníctvom API, kde môže používateľ prostredníctvom API volania zistiť polohu vybraných vozidiel v danom okamihu.
Pri výbere riešenia (API vs. súbory na stiahnutie) a konkrétnych formátov je potrebné posúdiť, či informačný systém mesta už obsahuje preddefinované zostavy exportu dát. Ak áno, je potrebné v spolupráci s IT oddelením a dodávateľom zvážiť, či z pohľadu publikovania vyhovujú alebo je ich potrebné prispôsobiť. Rozumným prístupom je využiť maximum toho, čo daný systém už ponúka a minimalizovať náklady.
Zverejniť dáta v súlade s technickými a licenčnými štandardmi
Výnos MF SR č. 55/2013 definuje technické štandardy otvorených dát. Otvorené dáta sa podobne ako hotely označujú systémom hviezdičiek: https://5stardata.info/cs/, pričom jedna hviezdička znamená najnižšiu kvalitu (napr. dáta v PDF neštruktúrovanom formáte) a päť hviezdičiek najvyššiu. Cieľom je mať aspoň tri hviezdičky (napr. CSV, XML alebo JSON súbory).
Nie je potrebné aby sa samosprávy snažili hneď o dosiahnutie piatich hviezdičiek. Je lepšie zverejniť dáta radšej menej dokonalým spôsobom ako vôbec. Dôležité je pripojiť otvorenú licenciu, ideálne “Creative Commons Zero” (CC0) alebo “Creative Commons Attribution” (CC-BY 4.0, CC “uvedenie autora”).
Je úplne v poriadku použiť súbor CSV s dobrým metadátovým popisom, aby bolo jasné, čo ktorý stĺpec znamená, ku ktorému času sú údaje platné a na koho sa obrátiť s ďalšími otázkami či s nahlásením prípadných chýb. Celý proces sa môže postupne zlepšovať.
Je vhodné informovať verejnosť o tom, že sú k dispozícii nové dáta. Dáta by sa mali zaregistrovať na ústrednom Open Data portáli https://data.gov.sk/ — takto sa o ňom dozvedia aj ďalší záujemcovia zo Slovenska. Vďaka tomu, že niektoré dátové portály si medzi sebou vymieňajú údaje, dostane sa informácia o datasete aj ďalej, napr. na dátový portál EÚ.
V rôznych mestách Slovenska pôsobia open data odborníci, ktorí sa neformálne združujú v Open Data Iniciatíve, ktorá je aj na Facebooku. S cieľom získať ich spätnú väzbu na dáta a nové nápady je dobré sa na nich obrátiť.
Samosprávy môžu pri informovaní využívať už overené komunikačné kanály, ktoré využívajú v styku s verejnosťou: sociálne siete, webová stránka.
Po pilotnom zverejnení údajov na open data katalógu je dobré vyladiť chyby, maximum procesov zautomatizovať (nové údaje by sa v ideálnom prípade mali periodicky aktualizovať automatizovaným spôsobom, čím sa zníži administratívne zaťaženie aj chybovosť).
Prijatie strategických a metodických dokumentov
Niektoré podporné aktivity môžu byť politického charakteru (vo forme verejného vyhlásenia, všeobecne záväzného nariadenia, open data smernice, stratégie, definovania dátovej politiky mesta a podobne).
Politická podpora môže pomôcť v dlhodobej kontinuite, pri odôvodnení investovania zdrojov do zvyšovania kvality dát a podobne. Takáto podpora môže byť užitočná, no nie je v prvej fáze nevyhnutná. Je množstvo samospráv, ktoré údaje začali zverejňovať a efektívne využívať aj bez toho, aby sa tvorili nové stratégie.
Z pohľadu vedenia samosprávy (primátor, prednosta) je užitočnejšie, aby zabezpečili alokovania zdrojov, najmä určenie zodpovednej osoby so základným rámcom plnenia úloh a delegovanou autoritou. Je dôležité, aby tento mestský dátový kurátor mal aspoň nejakú voľnú časovú kapacitu riešiť túto problematiku. Úlohou vedenia je predovšetkým nastavenie kultúry a zabezpečenie zdrojov.
Vzdelávanie zamestnancov a osveta
Dôležité je realizovať osvetu, vzdelávať interných zamestnancov, vysvetľovať dôležitosť kvalitného spracovania údajov na vstupe do informačného systému, dôležitosť dobre postavených zmlúv s dodávateľmi (žiaľ, často sú podpísané zmluvy, kedy mesto nemôže bez súhlasu dodávateľa voľne využívať dáta, ktoré sa v ňom zbierajú).
Zapojenie komunity do využívania dát
Je potrebné komunikovať s používateľmi údajov (občanmi), zbierať spätnú väzbu a priebežne ju zapracovať. Niektoré mestá realizujú hackathony či stretnutia s open data komunitou.
Častou bariérou sú zmluvné vzťahy. Bratislavský magistrát pripravil šablónu Dátovej doložky, ktorá sa podpisuje pri každej zmluve s dodávateľom informačného systému a rieši ďalšie využitie dát.
Ďalšia bariéra je slabé povedomie zamestnancov, ktoré sa rieši cez tréningy a školenia.
Veľmi častý je nedostatok finančných zdrojov. Toto sa dá riešiť minimalizáciou nákladov (dohoda s dodávateľom — zdieľanie nákladov s inými mestami, ktoré využívajú rovnaký informačný systém, využitie open source komponentov), automatizáciou exportu dát namiesto opakovaného ručného spracovania, zdieľanie niektorých IT kapacít so susediacou samosprávou, využitím projektov (vrátane eurofondov), naplánovanie výdavkov do budúcnosti.